Sei sulla pagina 1di 678

j >Z7 .

5- '700 2-- 1 0
O '/...F WuV . /2 S ljs_
? 1¡0
SvV:..

INVESTIGACIÓN CUANTITATIVA
,
EN PSICOLOGIA
Del diseño experimental al reporte de investigación

Traducción
Eloy Pineda Rojas
Yazmín Juárez Parra

Revisión técnica
Florente López Rodríguez
Profesor titular de tiempo completo
Facultad de Psicología
División de Estudios de Posgrado
- UNAM

OXFORD
UNIVERSITY PRESS
?-
1
UXFORD
VNIVERSITY P R ESS
Antonio Caso 142, San Rafael,
Delegación Cuauhtémoc, C.P. 06470, México, D.F.
Tel.: 5592 4 277, Fax: 5705 3738, e-mail: oxford@oupmcx.co m.mx
Oxford University Press es un departamento de la Universidad de Oxford.
Promuev~ 1 objetivo de la Uni\·ersidad relativo a la excelencia en la in,·estigación, erudición
.- Y educación mediante publicaciones en todo el mundo en

~ Oxford México
Auckland Bangko k Buenos Aires Calcuta C hcnnai
~hciad del Cabo Dar-es-Salaam Delhi Estambul Hong Kong
J(l,, ·'' Kuala Lumpur Madrid Melboume Mumbai Nairobi Nueva York
~o Paulo Shanghai Singapur Taipei Tokio Toronto
Con compañías afiliadas en Bcrifn
O xford es una marca registrada de O xford Univcrsity Press en el Reino U nido y otros países.
Publicado en México por O xford U nivcrsity Press México, S.A. de C.V.
División: Profesional
Area: Psicología y Educación
Sp1msor editor: Diana Scrv!n Chávcz
Edici611: Ester Ali1.cri Fernández
Sergio Gerardo Lópcz Hernández
Prodtteci611: Claudia Celia Martínez An1igón
Portada: Perla Alejandra López Romo
INVESTIGACIÓN CUANTITATIVA EN PSI COLOGÍA
Del diseno experimental al repo rte de investigación
Todos los derechos reservados © 2002, respecto a la primera edición e n español por
Oxford University Prcss México, S.A. de C.V.
Ninguna parte de esta publicación puede reproducirse, almacenarse en un sistema
de recuperación o transmitirse, en ninguna forma ni por ningún medio,
~-
sin la autorización previa y por escrito de
O xford University Press México, S.A. de C. V.
Las consultas relativas a la reproducción deben enviarse al Departamento de Pc_rmisos
y Derechos de Oxford Univcrsity Press México, S.A. de C.V.,
al domicilio que se señala en la parte superior de esta página.
Miembro de la Cámara Nacional de la Industria
Editorial Mexicana, registro número 723

ISBN 9 70 -ó13·701 ·7

Traducido de la primera edición en inglés de


D oing Quantitative Psychological Research: from design to report
Cop)Tight C 1997 by Psychology Press Lrd, a member ofthe Taylor & Francis Group
ISBN 0 -8ó377-789-9

All Rights Rcserved. Authorized translation from English language edition published by Psychology Prcss,
a member of the Taylor & Francis Group.

Impreso en M~xico Printed in Mexico


1234567890 Oó05040302
En la composición de esta obra,
realizada por Paula López Solís,
Península Indostmica No. 25,
Col. El Rosario 11,
54090, Thln~tlo, Edo. de M<x.,
se: uSJron tipos Trcbuehet (9.5/11.5, 22/28 pts ) r
Tomes New Roman ( 10.5/13 pts.).
Se terminó de imprimir en el mes
de mayo de 2002 en
Impresora y Editora Rodriguez
CaJJe \r,,,:ros de la Colirul "t'o. 352
Col. Vil-eros ck la Loma
54080, Thlne¡nntla, Edo. ck Méx.
sobre papel Bond Editor Al~ Opacidad de 75 g.

El úraje fue de 2 000 ejemplares.

~ 3 1 MAY 2013 LET


Contenido

Prefacio xxv
Glosario de símbolos xx1x

Introducción
l. Los métodos utilizados en la investigación psicológica 1

___,.•· Elección del tema, las mediciones y el diseño de investigación


! 2. Las etapas preliminares de la investigación 18
3. Las variables y la validez de los diseños de investigación 34
4. Diseños de investigación y su validez interna 46

Métodos
5. Planteamiento de preguntas 1: entrevistas y encuestas 72
6. Planteamiento de preguntas II: medición de actitudes y significado 87
. 7. Observación y análisis de contenido 99

Datos y análisis
8. Escalas de medición 108
9. Resumen y descripción de datos 115
10. Más allá de la descripción 146

vii
~L________________________c_o_n t_e_ni_d_o____________________________

11. Muestras y poblaciones 157


12. Análisis de diferencias entre una sola muestra y una población 168
13. Tamaño del efecto y poder 186
14. Pruebas paramétricas y no paramétricas 195
15. Análisis de diferencias entre dos niveles de una variable independiente 205
16. Análisis preliminar de diseños con una VI de más de dos niveles 229
17. Análisis de diseños con más de una variable independiente 253
18. Análisis subsiguiente después del ANOVA o de x2 272
19. Análisis de relaciones I: correlación 298
20. Análisis de relaciones II: regresión 329
21. Análisis multivariado 350
22. Metaanálisis 363 .....i
,
Divulgación de resultados
23. Cómo presentar la investigación 372

Apéndices
l. Estadísticas descriptivas 394
TI. Muestreo e intervalos de confianza para proporciones 405
III. Comparación de la muestra con la población 4 11
IV. Poder de la prueba z en un solo grupo 416
V. Transformación de datos y pruebas de bondad del ajuste 420
VI. Búsqueda de diferencias entre dos niveles de una variable independiente 428
VII. Búsqueda de diferencias entre más de dos niveles de una variable independiente 445
VIII. Análisis de diseños con más de una variable independiente 467
IX. Análisis posterior al ANOVA o a x_2 483
X. Correlación y confiabilidad 504
XI. Regresión 522
XII. Análisis de reactivos y discriminativo con las escalas de Likert 533
XIII. Metaanálisis 535
XIV. Tablas de probabilidad 548
XV. Tablas de poder 583
XVI. Tablas diversas 618
Bibliografía 627
Índice onomástico 631
Índice analítico 633
,
1ndice de .contenido

Prefacio xxv
Glosario de símbolos xxix

1. Los métodos utilizados en la investigación psicológica


Introducción 1
¿Cuál es el propósito de la investigación? 1
¿Qué es un método? 2
¿Por qué se tiene un método? 2
Tensión entre control y validez ecológica 3
Distinciones entre los métodos cuantitativos y los cualitativos 3
Métodos cuantitativos 3
Métodos cualitativos 9
¿La psicología es una ciencia? 11
Temas éticos en la investigación psicológica 13
Obligaciones 13
Beneficios 17
Resumen 17

2. Las etapas preliminares de la investigación 18


Introducción 18

.- ix
~ Índice de contenido
X ~~---------------------------------------------
Elección de un tema 18
Revisión de la bibliografía 19
Concentración en un área específica de investigación 22
Elección del método 23
Elección de una hipótesis 24
Elección del diseño de investigación 24
Medición en psicología 24
Conducta no verbal abierta 24
Conducta verbal 25
Conducta encubierta 25
La elección del sistema de medición 25
Confiabilidad 26
Validez 27
Efectos de piso y de techo 29
Elección del análisis 30
Elección de los participantes: la muestra 30
El procedimiento 31
Estudios piloto 32
Resumen 33

3. Las variables y la validez de los diseños de investigación 34


Introducción 34
Variables 34
Variables independientes 34
Variables dependientes 36
Otros tipos de variables 36
La validez de los diseños de investigación 37
Validez externa 3 7
Amenazas a la validez externa 37
Mejoramiento de la validez externa 39
Validez interna 39
Amenazas a la validez interna 40
Mejoramiento de la validez interna 44
La elección de la hipótesis 44
Resumen 45

4. Diseños de investigación y su validez interna 46


Introducción 46
----------------------------~Ín~d~ic~e~d~e~co~n~te~n~i~do~------------------~~
Tipos de diseños 46
Terminología 48
Réplica 49
Asignación de participantes 49
Ejemplos específicos de diseños de investigación 54
Diseños con variable de un nivel 54
Diseños con una variable independiente de dos niveles 56
Diseños con VI de más de dos niveles 60
Diseños con más de una VI y sólo una VD 64
Resumen 70

5. Planteamiento de preguntas 1: entrevistas y encuestas 72


Introducción 72
Temas para preguntas 72
Preguntas demográficas 72
Preguntas sobre comportamiento 72
Preguntas acerca de opiniones, creencias y actitudes 73
Los formatos para plantear preguntas 73
Entrevistas/cuestionarios estructurados 73
Entrevistas semiestructuradas 73
Entrevistas libres o no estructuradas 73
Elección entre formatos 73
Los ambientes para plantear preguntas 74
Entrevistas personales 74
Cuestionarios autoadministrados 74
Entrevistas telefónicas 75
Los méritos relativos de los distintos ambientes 75
La elección del ambiente 80
Elección de los participantes 80
Qué preguntas incluir 81
Tipos de preguntas 81
El diseño gráfico del cuestionario 84
El estudio piloto 85
Resumen 85

6. Planteamiento de preguntas 11: medición de actitudes y significado 87


Introducción 87
Confiabilidad de los sistemas de medición 87

-
~~--------------------ín_d_ic_e_d_e_c_o_nt_e_nl_'d_o__________________________

Dimensiones 88
Escalas de actitud 89
Escala de Thurstone 89
Escala de Guttman 90
Escala de Likert 91
Técnicas para medir significado 94
Metodología Q 94
El diferencial semántico 96
Cuadrículas de repertorio 97
Resumen 98

7. Observación y análisis de contenido 99


Introducción 99
Observación 100
¿Cuándo es aplicable? 100
Tipos de observación 100
Obtención de acceso 101
Métodos de grabación 102
Temas compartidos entre la observación y el análisis de contenido 103
Transcripción 104
Tipos de datos 105
Muestreo 105
Observación estructurada l 05
Análisis de proceso de interacción de Bales 106
Análisis de contenido 106
Resumen 107

8. Escalas de medición 108


Introducción 108
Ejemplos de mediciones 108
Escalas de medición 109
Nominal 109
Ordinal 109
De intervalo 109
De razón 110
La relevancia de las cuatro escalas 11 O
Indicadores 112
Especialistas en estadística y escalas 112
Resumen 114
co_n_te_n_i_do____________________~~
_____________________________ín_d_ic_e_d_e__

9. Resumen y descripción de datos 115


Introducción 115
Métodos numéricos 115
Datos de razón, de intervalo u ordinales 115
Datos nominales 121
Métodos gráficos 123
Graficación de totales y subtotales 123
Graficaciones de una variable dependiente 127
Gráficas de puntuaciones individuales 129
Graficación de medias 132
Gráficas de medias y dispersión 136
La distribución de datos 139
La distribución normal 140
Sesgo 140
Curtosis 142
Gráficas de cuantil-cuantil normal 144
Resumen 144

10. Más allá de la descripción 146


Introducción 146
Prueba de hipótesis 146
Probabilidad 147
Significación estadística 151
Tipos de error 151
Cálculo de la probabilidad del resultado de la investigación 152
Pruebas de una y de dos colas 154
Resumen 156

11. Muestras y poblaciones 157


Introducción 157
Estadísticas 157
Parámetros 157
Elección de una muestra 158
Muestras aleatorias 159
Otros métodos de muestreo aleatorio 160
Muestras no aleatorias 162
Las ventajas de una muestra aleatoria 163

-
~~----------------------Ín_d_ic_e_d_e_c_o_n_te_n_id_o___________________________

Intervalos de confianza 163


Efecto de la proporción en el intervalo de confianza 164
Efecto del tamaño de la muestra en el intervalo de confianza 165
Efecto del tamaño de la muestra como una proporción de la población 166
Efecto del grado de confianza en el tamaño del intervalo de confianza 167
Resumen 167

12. Análisis de diferencias entre una sola muestra y una población 168
Introducción 168
Pruebas z 168
Lectura de tablas z 172
Prueba de la significación de una sola puntuación cuando se conocen la media y la
desviación estándar de la población 173
Búsqueda de la significación estadística de una puntuación z 174
Examen de la diferencia entre la media de una muestra y la de una población 175
Pruebas t de un grupo 176
Evaluación de la media de una sola muestra cuando se conoce la media de la
población, pero no la desviación estándar de la población 176
Intervalos de confianza para medias 181
Gráficas adicionales 181
Gráficas de línea con medias y error estándar de la media 181
Gráficas de línea con medias e intervalos de confianza 182
Diagramas de caja con muescas 183
Identificación de extremos con puntuaciones estandarizadas 184
Resumen 185

13. Tamaño del efecto y poder 186


Introducción 186
Limitaciones de la prueba de significación estadística 186
Tamaño del efecto 187
Importancia del tamaño de un efecto 188
Poder estadístico 188
Elección del tamaño del efecto antes de realizar un estudio 190
El poder de una prueba z de un grupo 190
El poder de una prueba t de un grupo 192
Análisis de poder retrospectivo 193
Resumen 194
Índice de cont enido
----------------------~~~~~--------------~~
r-xY
AV

14. Pruebas paramétricas y no paramétricas 195


lotroducción 195
Pruebas paramétricas 195
Supuestos de las pruebas paramétricas 195
Robustez 197
Transformación de datos 198
Pruebas no paramétricas para diseños de un grupo 199
Por lo menos datos ordinales 199
Datos nominales 199
Resumen 204

15. Análisis de diferencias entre dos niveles de una


variable independiente 205
Introducción 205
Pruebas paramétricas 205
Dis~ribución de la diferencia entre dos medias 205
Pruebas t para evaluar la diferencia entre las medias de dos muestras 206
Análisis de poder 207
Tamaño del efecto 208
Búsqueda de la significación estadística de una prueba t entre sujetos 209
Diseños intrasujetos o equiparados 211
Pruebas no paramétricas 215
Pruebas para evaluar la diferencia entre dos niveles de una variable independiente:
por lo menos escala ordinal 215
Pruebas para evaluar la diferencia entre dos niveles de una variable independiente:
escala nominal 220
Resumen 228

16. Análisis preliminar de diseños con una VI de más de dos niveles 229

Introducción 229
Pruebas paramétricas 229
Diseños entre sujetos · 232
Diseños intrasujetos 236
Los supuestos del ANO VA 241
La robustez del ANO VA 242
Diseños intrasujetos 243
Tamaño del efecto y ANO VA 246

-
~L--------------------~Ín~d_ic~e_d~e~c~o~n~te~n~id~o~-------------------------
Cálculo del poder de un ANO VA paramétrico de una vía 246
La relación entre t y F 247
Equivalentes no paramétricos del ANOVA 247
Por lo menos datos ordinales -247
Datos nominales 250
Resumen 252

17. Análisis de diseños con más de una variable independiente 253


Introducción 253
Interacciones entre variables independientes 253
Pruebas paramétricas 255
Dos variables independientes entre sujetos 255
Dos variables independientes intrasujetos 262
Diseños mixtos (esquema dividido o mezclado) 266
Diseños con más de dos variables independientes 270
Tamaño del efecto y ANOVA 271
Poder y ANO VA 271
Pruebas no paramétricas 271
Resumen 271

18. Análisis subsiguiente después del ANOVA o de x2 272


Introducción 272
Contrastes 272
Pruebas paramétricas 272
Pruebas no paramétricas 283
Pruebas de tendencia 284
Efectos simples 288
Diseños entre sujetos 289
Diseños con variables intrasujetos 292
Una advertencia sobre los errores tipo 1 296
Resumen 296

19. Análisis de relaciones 1: correlación 298


Introducción 298
Correlación 298
Covarianza 299
Coeficientes de correlación 300
Importancia estadística de un coeficiente de correlación 300
----------------------------~Ín~d~ic=e~d=e~c=o~n~te=n~id=o~------------------~~
Interpretación de r 302
Naturaleza de la correlación 303
Tamaño del efecto y correlación 307
Poder y correlación 307
Los supuestos de la correlación producto momento de Pearson 308
Correlación de punto biserial 309
Correlación biserial 31 O
Correlación no paramétrica 311
Por lo menos datos ordinales 311
Correlación y datos nominales 315
Cálculo de la probabilidad de correlaciones basada en datos categóricos 316
Tamaño del efecto y reconsideración de X: 316
Resumen de métodos de correlación 317
Otros usos de la correlación 317
Correlaciones parcial y semiparcial 317
Diferencia entre dos correlaciones 321
Diferencia entre la correlación de una muestra y la de una población (cuando H 0 no
es p= O) 322
Intervalos de confianza y correlación 323
Medidas de acuerdo entre más de dos personas 324
Uso de correlación para evaluar confiabilidad y validez de las medias 325
Confiabilidad 325
Validez 328
Resumen 328

20. Análisis de relaciones 11: regresión 329


Introducción 329
Regresión simple 329
Prueba de la significación estadística del análisis de regresión 332
Interpretación de la tabla de resumen de una regresión simple 333
Vínculos entre correlación y regresión simple 334
Regresión múltiple 334
¿Por qué se necesita la regresión múltiple? 334
Tipos de regresión múltiple 336
Interpretación de la regresión múltiple 340
Tamaño de muestra recomendado 341
Validación del modelo 342
Verificaciones del diagnóstico 343

-
~L--------------------~fn~d~ic~e~d~e~c~o~nt=e~n~~-d~o__________________________

Similitud entre el ANOVA y la regresión múltiple 346


Resumen 348

21. Análisis multivariado 350


Introducción 350
¿Por qué usar técnicas multivariadas? 351
En busca de una diferencia 351
Análisis de varianza multivariado (MANO VA) 352
Control de los covariados 353
Identificación de la base de la diferencia 354
Exploración de relaciones 355
Relaciones entre las variables observadas 355
En busca de variables latentes 357
Resumen 361

22. Metaanálisis 363


Introducción 363
Elección del tema del metaanálisis 363
Identificación de la investigación 364
Elección de la hipótesis por comprobar 364
Extracción de la información necesaria 365
Cómo trabajar con estudios presentados incorrectamente 365
El problema del archivero 365
Clasificación de estudios anteriores 366
Ponderación de los estudios 366
Combinación de los resultados de los estudios 367
Tamaño del efecto 367
Probabilidad 367
Homogeneidad 368
Intervalos de confianza 369
Cómo manejar el problema del archivero 369
Comparación centrada 369
Presentación de los resultados del metaanálisis 370
Resumen 371

23. Cómo presentar la investigación 372


Introducción 372
Lenguaje no sexista 373
____________________________fn_d_ic_e_d_e_c_o_nt_e_nJ_·d_o__________________~¡-XiX

Informe escrito 373


Informes académicos escritos de experimentos o cuasiexperimentos 373
El artículo para una revista académica 382
Variaciones en la presentación de otros métodos de investigación 383
Presentación verbal 384
Preparación de la exposición 384
Cómo exponer 385
Ilustración de la exposición 386
Presentación mural (cartel) 389
Ensayo de la presentación 390
Resumen 391

Apéndices
l. Estadísticas descri ptivas 394
Cálculo de la media (X) 394
Cálculo de la varianza (s2) 394
Cálculo de la desviación estándar (s) 395
Cálculo de la media y la mediana a partir de distribuciones de frecuencia 396
Medias 396
Medianas 397
Creación de una gráfica de pastel 398
Creación de un diagrama de caja 399
La mediana 400
Lugar de la bisagra 400
Rango H 400
Bardas interiores 400
Bardas exteriores 401
Índices de sesgo y curtosis 402
Sesgo 403
Curtosis 403

11. Muestreo e intervalos de confianza para proporciones 405


Cálculo del intervalo de confianza para una proporción 405
Margen de error 407
Tamaño relativo de la muestra y de la población 407
Estimación del tamaño de la muestra necesario 408
Cuando no hay datos previos que sirvan como guía 408
Cuando hay datos previos que sirven como guía 408


~xx fndice de contenido
~ IL--------------~~~~==-------------------

Cuando las submuestras son de interés 409


Efecto en el margen de error de aumentar efgrado de confianza 409

111. Comparación de la muestra con la población 411


Una sola puntuación comparada con la media de una población (se conoce la DE
de ésta) 411
Media de una muestra comparada con la de una población 412
Cuando se conoce la desviación estándar de la población 412
Cuando se desconoce la desviación estándar de la población 412
Intervalos de confianza de las medias 413
Tamaño de la muestra de por lo menos 30 413
Tamaño de la muestra menor de 30 414
Intervalos de confianza de las medianas 415

IV. Poder de la prueba z en un solo grupo 416


Análisis de poder de la prueba z de un solo grupo 416
Elección del tamaño de la muestra 418

V. Transformación de datos y pruebas de bondad del ajuste 420


Transformación de datos 420
Datos univariados 421
Datos bivariados 423
Pruebas de bondad del ajuste 424
Prueba de una sola muestra de Kolmogorov-Smimov 424
Prueba de bondad del ajuste de x2 425

VI. Búsqueda de diferencias entre dos niveles de una


variable independiente 428
Pruebas paramétricas 428
La prueba t 428
Pruebas no paramétricas 434
Prueba U de Mann-Whitney 434
Prueba de rangos con signo de Wilcoxon para pares equiparados 437
Cálculo dt:l tamaño del efecto a partir de una puntuación z en las pruebas U de
Mann-Whitney o de Wilcoxon 440
Prueba x! para el análisis de una tabla de contingencias de dos entradas 440
Prueba de probabilidad exacta de Fisher 443
Índice de contenido [XXi
------------------------------------------------~--------_J

VIl. Búsqueda de diferencias entre más de dos niveles de una variable


independiente 445
Pruebas paramétricas 445
ANO VA de una vía entre sujetos 445
ANOVA de una vía intrasujetos 450
Pruebas no paramétricas 458
Medida por lo menos ordinal 458
Datos nominales 464

VIII. Análisis de diseños con más de una variable independiente 467


ANOVA de dos vías entre sujetos 467
Suma total de cuadrados 468
Suma de cuadrados entre grupos para VI1 468
Suma de cuadrados entre grupos para VI2 469
Suma de cuadrados de la interacción (SCAB) 469
Suma de cuadrados intragrupos (residual) 470
ANO VA de dos vías intrasuj etos 471
Suma total de cuadrados 472
Suma de cuadrados entre sujetos 472
Suma de cuadrados de VI1 (SCA) 472
Suma de cuadrados de VI1 por sujetos (SCAs) 473
Suma de cuadrados de VI2 (SC8 ) 474
Suma de cuadrados de VI2 por sujetos (SC8 s) 475
Suma de cuadrados de la interacción de VI1 por VI2 (SCA 8 ) 476
Suma de cuadrados por sujetos de VI1 por VI2 477
ANOVA de dos vías mixto 478
Suma total de cuadrados (SCtota¡) 479
Suma de cuadrados entre sujetos 479
Suma de cuadrados de VI1 {SC) 480
Suma de cuadrados de los sujetos intragrupos {SCS(gruposY 480
Suma de cuadrados de VI2 (SCsJ 480
Suma de cuadrados de VI1 por VI2 (SCAsJ 481
Suma de cuadrados de VI2 por sujetos intragrupos (SC8 por S(gruposY 481

IX. Análisis posterior al ANOVA o a 2 x 483


Ajuste de Bonferroni 483
Contrastes 484
Pruebas paramétricas 484
~L_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ín_d_ic_e_d_e_c_o_n_te_n_id_o___________________________

Otras versiones de la prueba de Scheffé 488


Pruebas de contraste por pares 490
Ortogonalidad 492
Pruebas no paramétricas 493
Datos categóricos: particiones en tablas de contingencia 497
Pruebas de tendencia 500
Ecuación general para el análisis de tendencias 501
Ajuste para intervalos desiguales 503

X. Correlación y confiabilidad 504


Correlación no paramétrica: datos por lo menos ordinales 504
Rho de Spearman 505
Tau de Kendall 506
Correlación parcial 509
Correlación parcial de orden mayor 51 O
Método para calcular la probabilidad de r parcial 51 O
Diferencia entre dos coeficientes de correlación 51O
Grupos no independientes 511
Intervalos de confianza de r 513
Coeficiente de concordancia de Kendall 514
Corrección de empates 515
Confiabilidad 516
Ecuación de Spearman-Brown de confiabilidad de mitad dividida 516
Coeficiente alfa de Cronbach 517
Coeficiente de confiabilidad 20 de Kuder-Richardson 517
Error estándar de medición 518
Confiabilidad entre jueces: kappa de Cohen 519
Error estándar de la estimación 520

XI . Regresión 522
Regresión lineal simple 522
Cálculo de la significación estadística de un análisis de regresión 524
Vínculos adicionales entre la correlación y la regresión lineal simple 526
R2 ajustada 528
Error estándar de un coeficiente de regresión 528
Prueba de la significación estadística de un coeficiente de regresión 531
Cálculo de un intervalo de confianza para un coeficiente de regresión 531
--------------------------~Ín~d~ic=e~d=e~c=o~nt=e~n~id~o__________________~JXXifi

XII. Análisis de reactivos y discriminativo con las escalas de Likert 533


Realización de un análisis de reactivos 533
Análisis del poder discriminatorio 534

XIII. Metaanálisis 535


Introducción 535
Los estudios 535
Cálculo de una estadística del tamaño del efecto común 536
Cálculo de una estadística de probabilidad común 538
Heterogeneidad 540
Heterogeneidad del tamaño del efecto 540
Heterogeneidad de la probabilidad 542
Combinación del tamaño del efecto 543
Combinación de la probabilidad 544
Intervalo de confianza 545
El problema del archivero 546
Número crítico de estudios para el problema del archivero 546
Presentación del informe del metaanálisis 547

XIV. Tablas de probabilidad 548


Cálculo de la probabilidad de una estadística para gl que no aparecen en las tablas 548
Interpolación lineal 549
Probabilidades de z, la distribución normal estandarizada 549
Cálculo de un valor z para una probabilidad concreta 550
Probabilidades de dos colas 550
Búsqueda de valores z negativos 550
Probabilidades de las distribuciones de x2 554
Probabilidades de las distribuciones F 561

XV. Tablas de poder 583


Introducción 583
Tamaño de la muestra ajustado para las tablas de poder
cuando se usan tamaños de muestras desiguales 583
Interpolación 584
Tamaño del efecto en una prueba t intrasujetos 585
Explicación de las tablas para el ANO VA y la regresión múltiple 586
~L______________________ín_d_ic_e_d_e_c_o_n_te_n_id_o___________________________

ANO VA multifactorial entre sujetos 586


Poder del ANO VA intrasujetos 587

XVI. Tablas diversas 618


Coeficientes para pruebas de tendencia 620
Cálculo de coeficientes lineales 620
Cálculo de las ponderaciones para contrastes por pares con tamaños de muestra
desiguales 623
Conversión de r en r' (transformación de Fisher) 624
Conversión de r' en r 625
Bibliografia 627
Índice onomástico 631
Índice analítico 633
Prefacio

El presente libro está diseñado para Uevar al lector a recorrer todas las etapas de la inves-
tigación: desde la elección del método por emplear hasta el reporte de los resultados co-
rrespondientes, pasando por los aspectos del diseño, la realización y el análisis. Aunque la
obra ofrece una revisión general de todos los métodos que los psicólogos aplican en su es-
tudio, se centra en la práctica de los cuantitativos.
Sin embargo, lo anterior no significa que el texto rebose de ecuaciones. Su objetivo es
explicar la manera de investigar, no de estimar a mano o con una simple calculadora técni-
cas estadísticas. Se supone que el lector tendrá acceso a una computadora y a programas
estadísticos apropiados para realizar los cálculos necesarios. De acuerdo con ello, las ecua-
ciones se presentan a fin de mejorar la comprensión de la técnica que se describe. No obstan-
te, en los apéndices se incluyen las ecuaciones y los ejemplos desarrollados para técnicas
específicas para los lectores con más inclinación matemática que deseen comprobar los
cálculos y para las ocasiones en que no se dispone de computadora con la cual llevar a cabo
los análisis. Además, en los apéndices se abordan algunas de las ideas más complejas.

Estructura del libro


Un libro sobre métodos de investigación debe cumplir varias funciones: al principio, se pre-
sentan a los investigadores los conceptos y las técnicas básicos; una vez que se dominan, se
tratan algunos más complejos. Por último, sirve como obra de consulta: a menudo, el in-
vestigador experimentado está consciente de que hay un método o bien restricciones en la
aplicad ón de una técnica estadística, pero necesita abordar los detalles exactos.

XXV
~~--------------------------Pr_e_fa_c_io_______________________________

El libro se estructura de manera tal, que quienes no están familiarizados con el tema
pueden leer ciertas partes de capítulos específicos. Por tanto, los universitarios de niveles
iniciales precisan una reseña general de los métodos utilizados en la psicología, de los prin-
cipios de su uso y de los aspectos éticos de tal investigación. Observarán después las eta-
pas de la investigación, seguidas por un análisis de las variables y una explicación general
de los diseños de investigación y su validez interna. Luego, según los métodos por aplicar,
leerán partes selectas de los capítulos acerca de métodos de investigación específicos. A fin
de analizar los datos, deben estudiar temas relacionados con escalas de medición y cómo
explorar y resumir información. A continuación, intentarán extraer inferencias a partir de
los datos: cuán probable es que sus resultados se hayan debido al azar. Estarán conscientes
acerca de la manera en que pueden elegirse muestras para que participen en un estudio y
de cómo se comparan los resultados de una muestra con los de una población.
Reviste importancia que, además de averiguar cuán probable es que sus resultados se
deban al azar, sepan cómo establecer el tamaño de cualquier efecto que detecten y cómo
quizá detectarían un efecto real, si existe. Han de conocer las limitaciones del tipo de da-
tos que ciertas pruebas estadísticas pueden manejar y de otras pruebas disponibles sin tales
limitaciones. Pueden restringir el análisis a situaciones relacionadas con la observación de
diferencias entre dos condiciones y el simple análisis de los vínculos entre dos medidas.
Por último, deben aprender a informar sobre su investigación como un reporte de labora-
torio. Por tanto, un curso de nivel introductorio incluiría los capítulos y partes de capítulos
siguientes:
l. Los métodos utilizados en la investigación psicológica.
2. Las etapas preliminares de la investigación.
3. Las variables y la validez de los diseños de investigación.
La sección sobre tipos de diseño y terminologia en
4. Diseños de investigación y su validez interna.
Uno o más acerca de
5. Planteamiento de preguntas I: entrevistas y encuestas.
6. Planteamiento de preguntas II: medición de actitudes y significado.
7. Observación y análisis de contenido.
Luego
8. Escalas de medición.
9. Resumen y descripción de datos.
1O. Más allá de la descripción.
Las secciones sobre estadística, parámetros y elección de una muestra a partir de
11. Muestras y poblaciones.
\
_________________________________P_re_f_ac_io________________________~~

Las secciones sobre pruebas z y pruebas t en


12. Análisis de diferencias entre una sola muestra y una población.
13. Tamaño del efecto y poder.
14. Pruebas paramétricas y no paramétricas.
15. Análisis de diferencias entre dos niveles de una variable independiente.
La primera sección en
19. Análisis de relaciones 1: correlación.
Posiblemente, la sección sobre regresión simple en
20. Análisis de relaciones 11: regresión.
La sección sobre lenguaje no sexista y el reporte escrito en
23. Cómo presentar la investigación.

Los estudiantes de segundo nivel deben aprender diseños más complejos. Por ello necesi-
tan ahondar en los métodos, el diseño y su análisis. Han de estudiar con detenimiento el
análisis de relaciones y estar conscientes de otras formas de reporte de ~vestígaciones. En
consecuencia, es probable que consideren:
La sección sobre ejemplos específicos de diseños de investigación en
4. Diseños de investigación y su validez interna.
Algo que no hayan leído en
5. Planteamiento de preguntas 1: entrevistas y encuestas.
6. Planteamiento de preguntas 11: medición de actitudes y significado.
7. Observación y análisis de contenido.
La sección sobre intervalos de confianza en
11. Muestras y poblaciones.
16. Análisis preliminar de diseños con una VI de más de dos niveles.
17. Análisis de diseños con más de una VI.
Por lo menos, la sección sobre contrastes en
18. Análisis subsecuente después del ANOVA.
El material restante en
19. Análisis de relaciones I: correlación.

En niveles posteriores cabe esperar que los estudiantes aprendan otras maneras de analizar
los datos -tras realizar un análisis de varianza- , que estudien la de regresión múltiple y
el metaanálisis y que conozcan los diversos tipos de análisis de multivarianza.
~~------------------------P_re_f_a_ci_o_______________________________

Como psicólogos, tenemos que considerar los métodos como herramientas que nos
ayudan a realizar nuestra investigación, no como fines en sí mismos. Sin embargo, debe-
mos estar conscientes respecto al uso correcto de los métodos y a sus limitaciones. Sobre
todas las cosas que espero que los lectores obtengan tras llevar a cabo y analizar la inves-
tigación se encuentra el entusiasmo de tomar una idea, de diseñar una manera de probarla
empíricamente y de ver si los hechos son congruentes con la idea original.

Una nota para el profesor


Los profesores notarán que he tratado de poner en la potencia estadística, el tamaño del
efecto y los intervalos de confianza un interés superior al que suele obrar en los textos de
estadística orientados a los psicólogos. Sin tales herramientas, éstos correrían el peligro
de producir hallazgos carentes de la posibilidad de generalización porque son profesiona-
les muy dependientes de lo que se ha convertido en la estadística inferencia! convencional.
No he dado ejemplos específicos de cómo realizar análisis particulares mediante algún
paquete de cómputo debido a que falta espacio, a que no deseo que el libro esté unido a
cierto programa o a que las diversas generaciones de programas implican diferentes mane-
ras de lograr el mismo análisis.

Agradecimientos
Quisiera dar las gracias a las personas que me iniciaron en la carrera de investigador y, en
particular, a Jobn Valentine, Ray Meddis ·y Jobn Wilding, quienes me introdujeron en el di-
seño de investigación y en la estadística. He aprendido mucho de gran número de personas
en años recientes, sin dejar de mencionar a todos los colegas y estudiantes cuyas pregun-
tas me han obligado a aclarar mis propios pensamientos. También me gustaría agradecer a
Marian Pitts, que me estimuló cuando empecé a considerar la idea dy 'escribir este libro.
Con frecuencia, lan Watts y Julie Adams, de los Servicios de Tecnologta de la Información
de la Universidad de Staffordshire, me aconsejaron sobre cómo usar las numerosas gene-
raciones de mi paquete de procesamiento de palabras para lograr lo que quería. Rache!
Windwood, Rohays Perry, Paul Dukes, Kathryn James y Kirsten Buchanan, de Psychology
Press, me apoyaron y aconsejaron a medida que el libro pasaba de lá' idea original al texto
listo para la impresión.
Paul Kinnear, Sandy Lovie y John Valentine me hicieron comentarios muy útiles en
una versión preliminar del libro. Tess y Steve Moore me iniciaron en algunos de los mis-
terios de la impresión en color. Anne Clark-Carter me indicó cuándo tomaba la explicación
ininteligible. Este esfuerzo resultó especialmente heroico por su aversión a la estadística.
Además, ella, Tim y Rebecca toleraron, con distintos grados de ecuanimidad, que estuviera
con frecuencia pegado a una computadora. A pesar de los esfuerzos de otros, cualquier
error cometido en el libro es responsabilidad mía.
Glosario de simbolos

Con el alfabeto latino


d tamaño del efecto en diseños que miden la diferencia entre dos niveles de una VI
F estadística usada en ANOVA paramétricos cuando se comparan más de dos niveles de
una VI, o más de una VI
nh tamaño de la muestra de la media armónica
r coeficiente de la correlación producto momento de Pearson de una muestra
?- medida del tamaño del efecto en correlación (la proporción de varianza de una varia-
ble que puede explicarse por la varianza de una segunda variable con la que se corre-
laciona la primera)
R coeficiente de correlación múltiple para la regresión múltiple
R 2 tamaño del efecto en el análisis de regresión (la proporción de varianza en una varia-
ble que puede explicarse por la varianza de un conjunto de variables de pronóstico)
s desviación estándar de una variable en una muestra
s 2 varianza de una variable en una muestra
t estadística paramétrica utilizada en diseños en los que se comparan dos niveles de
una VI
w tamaño del efecto en datos nominales
uc:;1u x ·media de la variable de una muestra
lll:lll!:::a..

----------------------------------------------------------------~xxix
~L_____________________G~l~o~sa~r~io~d~e~s~ím~bo~l~os~-------------------------
Con el alfabeto griego
a alfa probabilidad de cometer un error tipo 1
~ beta probabilidad de cometer un error tipo II
ll2 eta cuadrada tamaño del efecto en el ANOVA
x2 chi cuadrada estadística para datos nominales
!.l. mi media de una variable en la población
3t pi proporción de la población (por ejemplo, la proporción de
fumadores)
p rho coeficiente de correlación de una relación en la población
o sigma desviación estándar de una variable en la población
o2 sigma cuadrada varianza de una variable en la población
INVESTIGACIÓN CUANTITATIVA EN PSICOLOGÍA
pz

1
Los métodos utilizados
en la investigación psicológica

Introducción
En este capítulo se tratan los propósitos de la investigación psicológica. Se explica por qué
quienes la realizan emplean en ella un método determinado y se describe la diversidad de
los procedimientos que utilizan. Se responde la pregunta de si la psicología es una ciencia.
Por último, se abordan las cuestiones éticas relacionadas con dicha investigación.

¿Cuál es el propósito de la investigación?


El propósito de la investigación psicológica consiste en aumentar nuestro conocimiento
acerca de los seres humanos. Suele afirmarse que la investigación en general tiene uno de
cuatro objetivos, los cuales pueden considerarse etapas: la primera es describir; la segun-
da, comprender, lleva a la tercera, predecir, y luego -finalmente- a controlar. En el ca-
so de los estudios en psicología, conviene ver la fase final como si se tratara de intervenir
para mejorar la vida humana. Citemos el caso de la comunicación no verbal, donde --en
primer lugar- los psicólogos podrían describir sus diversos tipos, como contacto visual,
postura corporal y ademanes. A continuación, intentarían comprender las funciones de esos
tipos para predecir qué sucederá cuando la gente despliegue modos atípicos de comunica-
ción no verbal, como hacer muy poco contacto visual o acercarse demasiado a los demás.
Por último, podrían diseñar un medio para capacitar a esas personas a fin de mejorar su
comunicación no verbal. En esta última etapa también se incluiría cierta evaluación del
éxito de la capacitación.
~L________________In_v~e~st~ig~a_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s~ic~o~lo~g~ía~--------------------

¿Qué es un método?"
Un método es una aproximación sistemática a un segmento de investigación. Los psicólo-
gos utilizan una gran diversidad de métodos, los cuales se clasifican de varias maneras. Se
establece una distinción común entre los cuantitativos y los cualitativos: como el nombre
lo sugiere, los primeros incluyen cierto tipo de medición numérica, mientras que los segun-
dos se relacionan con la descripción verbal.

¿Por qué se tiene un método?


La respuesta más simple a la pregunta de por qué se tiene un método es que, sin él, la in-
vestigación del psicólogo no resulta mejor que la especulación de quien carece de conoci-
mientos sobre psicología. Sin un método, hay protección escasa contra la posibilidad de
que nuestras corazonadas determinen cuál información está disponible y cómo la interpre-
tamos. Además, sin un método nuestra investigación no estaría abierta al escrutinio de otros
psicólogos. Como ejemplo de los peligros de no emplear un método exploraré la idea de
que el consumo nocturno de café produce insomnio.
Cuento con muchas pruebas que soportan esa idea. En primer lugar, tengo- experiencia
propia de la relación entre el consumo de café y el insomnio. En segundo lugar, las perso-
nas con quienes lo he analizado confirman que poseen la misma experiencia. En tercer lugar,
sé que la cafeína es un estimu1ante y, por tanto, parece perfectamente razonable la suposición
de que me mantendrá despierto.
Mi hipótesis presenta varios defectos. Primero, como conozco mi predicción, el resul-
tado podría ser en realidad una consecuencia de ese conocimiento. Para controlar tal posi-
bilidad debo estudiar a sujetos que no sepan de la predicción. Como alternativa, he de dar
a algunos de éstos lo .que se denomina placebo (una sustancia que no se distingue de la que
se prueba, pero que no produce los mismos efectos fisicos), en este caso una bebida que se-
gún ellos contiene cafeína. Segundo, debido a mi predicción, tiendo a evitar la ingestión
nocturna de café; lo consumo sólo en ocasiones especiales y podría ser que otros aspectos
de esas ocasiones contribuyan a mi falta de sueño.
Bebo café cuando ceno en un restaurante, si estoy en casa de amigos o -si éstos me vi-
sitan. Es probable que coma diferente en esos casos: tendré una cena más larga o más rica
y comeré después de lo habitual. Asimismo, podría ingerir alcohol y esas ocasiones son
más estimulantes porque hablamos de cosas de mayor interés; podría incluso alterar mis
pautas de sueño por permanecer despierto más tarde de lo normal. Por último, no he veri-
ficado la naturaleza de mi sueño cuando no consumo café; no tengo un criterio base para
la comparación.
Por tanto, varios factores pueden contribuir a mi insomnio; debo controlarlos si voy a es-
tudiar apropiadamente la relación entre éste y el consumo de café. La aplicación de un mé-
todo a la investigación me permite probar de manera más sistemática y completa mis ideas.
Los métodos utilizados en la investigación psicológica ~
----------------------------~--~~------~' ~

Tensión entre control y validez ecológica


En la ciencia hay una tensión entre dos métodos. Uno consiste en investigar un fenómeno
en el aislamiento o, por lo menos, con un mínimo de factores externos cuya presencia pueda
afectarlo. Por ejemplo, podría aislar el consumo de cafeína como el factor que contribuye
al insomnio. El otro método consiste en estudiar el fenómeno en su ambiente natural. Podría
investigar cómo afecta mi sueño la ingestión de café en su contexto habitual. Hay buenas
razones para adoptar estos métodos.
Al minimizar el número de factores presente, los investigadores ejercen control sobre
la situación. Por consiguiente, si modifican un aspecto a la vez y observan algún cambio,
tienen la posibilidad de identificar las relaciones entre los factores. Así, podría demostrar
que la sola cafeína no es la causa de mi insomnio. Los psicólogos realizan a menudo inves-
tigación en un laboratorio para minimizar la variación que sus sujetos de estudio experi-
mentan.
Sin embargo, a menudo un fenómeno cambia cuando se saca de su ambiente natural.
Podría ser resultado de un gran número de factores que trabajan en conjunto o, al realizar
mi investigación en un laboratorio, quizá lo hice tan artificial que no tiene relación con el
mundo real. El término validez ecológica se refiere al estudio relacionado con eventos rea-
les. Por tanto, el investigador adoptará un método que maximice el control sin perder de
vista el problema de la artificialidad.

Distinciones entre los métodos


cuantitativos y los cualitativos
La distinción entre los métodos cuantitativos y los cualitativos podría ser fa lsa, pues tal vez
haya dos procedimientos para estudiar el mismo fenómeno. O quizá existen dos etapas en
la misma pieza de investigación, y entonces un método cualitativo arroja ideas que pueden
examinarse después con uno cuantitativo. El problema surge cuando proporcionan diferen-
tes respuestas. No obstante, la distinción puede ser una ficción útil para clasificar métodos;
los describiré con estos rótulos.

Métodos cuantitativos
Una manera de clasificar los métodos cuantitativos consiste en designarlos con los rótulos
de experimentación, planteamiento de preguntas y observación. La distinción principal en-
tre ellos es que, en el método experimental, los investigadores manipulan ciertos aspectos
ir:ll:·· de la situación y miden los efectos supuestos de tales manipulaciones. Los métodos de pre-
gunta y observación se relacionan con mediciones sin manipulación. El planteamiento de
¡------,
~
Investigación cuantitativa en psicología
'~------------~--------~~~---------------
preguntas requiere inquirir a la gente sobre detalles como su comportamiento, sus creencias
y sus actitudes. Los métodos de observación atañen a la observación del comportamiento
humano, lo cual no resulta sorprendente.
Por tanto, en un experimento para investigar la relación entre la ingestión de café y las
pautas de sueño podría hacer que un grupo se abstenga de beberlo, mientras que a otro con-
junto le daría una taza de café común y a un tercero, descafeinado; luego mediría cuánto
durmió cada grupo. Como alternativa, podría preguntar a un conjunto acerca de sus pautas
de sueño y de consumo de café; en un estudio de observación me quedaría con un grupo de
personas durante una semana, anotaría el consumo de café de cada cual y luego, con un sis-
tema de televisión de circuito cerrado, observaría cómo durmieron cada noche.
Una vez más, la distinción entre los tres métodos es artificial porque las medidas uti-
lizadas en un experimento podrían implicar el planteamiento de preguntas o la realización
de observaciones. Antes de que explique los tres descritos, quiero mencionar un método
que a menudo se pasa por alto y que confiere al investigador mayor control: la modelación.

Modelación e inteligencia art;[icial


Modelación. El término modelación se refiere aquí al desarrollo de teorías mediante la
construcción de modelos para explicar los resultados de una investigación y explorar de
manera más completa las consecuencias de la teoría. Éstas podrían sujetarse entonces a in-
vestigación empírica para probar con cuánta similitud el modelo representa la realidad. Los
modelos pueden adoptar muchas formas. A menudo se han basado en metáforas tomadas
de otras disciplinas. Por ejemplo, puede considerarse que el modelo de procesamiento de
la infonnación del conocimiento humano se funda en el cómputo. Como señala Gregg
(1986), Platón vio la memoria humana como si fuera una tablilla de cera, donde el olvido
se debía a que el trazo se gastaba o borraba.
La modelación puede cobrar la forma del equivalente de los diagramas de flujo, como
en el modelo de la memoria humana de Atkinson y Sbiffrin ( 1971 ), donde se le considera
formada por tres partes: inmediata, de corto plazo y de largo plazo. Como alternativa, puede
expresarse como fórmulas matemáticas, como los modelos del aprendizaje animal y huma-
no de Hu ll (véase Estes, 1993).
Con la llegada de las computadoras, ahora es posible examinar los modelos mediante
programas de cómputo. Por ejemplo, Newell y Simon (1972) exploraron el razonamiento
humano con tales máquinas; ese método para modelar se denomina simulación por compu-
tadora. Miller (1985) tiene una explicación valiosa sobre la naturaleza de dicha simulación.
Inteligencia artificial. Es necesario distinguir entre simulación por computadora e inteli-
gencia artificial: el objetivo de la primera consiste en imitar al máximo en una computado-
ra el comportamiento humano; el de la segunda, en utilizar ésta para realizar tareas con toda
Los métodos utilizados en la investigación psicológica
----------------------------~--~~------~~
r-----s~
eficiencia y no necesariamente como las personas las efectuarían. No obstante, los resulta-
dos de la simulación por computadora y los de la inteligencia artificial pueden retroalimen-
tarse entre sí, de modo que una sugiera maneras de mejo~ar la otra. Consulte a Boden (1987)
para obtener una explicación acerca de la inteligencia artificial.

El expedmento
Los experimentos cobran muchas formas, como se verá en el capítulo 4, "Diseños de in-
vestigación y su validez interna". Por el momento, sólo quiero recalcar una vez más que
e]_experimentador manipula un aspecto de la situación y mide lo que se supone son las con-
secuencias de tales manipulaciones. Uso el término supone porque un tema importante en
la investigación es el intento de identificar las relaciones causales entre los fenómenos. Co-
mo ya se explicó, puedo tener problemas de sueño cuando bebo café, pero tal vez éste no
sea la causa de mi insomnio; más bien podría ocurrir cuando también se hallan presentes
otros aspectos de la situación que perturban mi sueño. Se tiene la idea de que el experimen-
to diseñado apropiadamente es la mejor manera de identificar las relaciones causales.
Con experimento diseñado apropiadamente me refiero a uno en que todos los aspec-
tos relevantes de la simulación se controlan de alguna forma. En el capítulo 4 se explican
los diferentes medios de control que los investigadores pueden utilizar.

El cuasiexperimento
El cuasiexperimento puede considerarse una versión menos rigurosa del experimento. Por
ejemplo, donde el investigador no manipula un aspecto de la situación, como el consumo de
café, pero asigna sujetos a distintos grupos con base en su consumo o en la falta de él, y lue-
go compara las pautas de sueño de los grupos. El cuasiexperimento es menos controlado
que un experimento, por lo cual la identificación de las relaciones causales llega a resul-
tar más problemática. No obstante, este método se utiliza por al menos dos buenas razones:
primera, cuando no es posible manipular la situación; segunda, cuando tiene mejor validez
ecológica que el equivalente experimental.

Planteamiento de preguntas
Hay por lo menos tres formatos para plantear preguntas: entrevistas no estructuradas (o li-
bres), entrevistas semiestructuradas y cuestionarios estructurados; y por lo menos tres ma-
neras en que pueden presentarse y responderse: personalmente, por teléfono o mediante
cuestionario escrito. Las entrevistas a personas emplean en general algún método de plan-
teamiento de preguntas.
6
o
'~~------------~--------~--~--------------
Investigación cuantitativa en psicología

Entrevistas no estructuradas. Es probable que una entrevista no estructurada incluya uno


o varios temas específicos por estudiar, pero el entrevistador no tiene una redacción fija
en mente y se siente satisfecho con dejar que la conversación se desvíe del tema original si
se toca material potencialmente interesante. Tal técnica podría utilizarse cuando un inves-
tigador explora inicialmente un área con la idea de diseñar un formato más estructurado
para u:.v posterior. Además, se emplea a fin de producir los datos para un análisis de con-
tenido (véase más adelante) o incluso para un método cuantitativo, como el análisis del dis-
curso (véase más adelante).

Entrevistas semieslructuradas. Las entrevistas semiestructuradas se utilizan cuando el in-


vestigador tiene una idea más clara sobre las preguntas por formular, pero no le preocupa
necesariamente la redacción exacta o el orden en que se plantearán. Es probable que el en-
trevistador tenga una lista de interrogantes por presentar en el curso de la sesión. Asimis-
mo, permitirá que la conversación fluya con libertad relativa, mas tenderá a orientarfa de
manera que pueda introducir preguntas específicas cuando surja la oportunidad. Un ejem-
plo de entrevista semiestructurada es la típica entrevista de trabajo.
El cuestionario estructurado. El cuestionario estructurado se usa cuando los investigado-
res tienen una idea clara acerca de la diversidad de posibles respuestas que desean obtener.
Requiere una redacción precisa de las preguntas, que se plantearán en un orden fijo y que tal
vez lleven al entrevistado a elegir una de varias opciones que se le presentan. Por ejemplo:

No se debería permitir a la gente tener animales como mascotas:

muy de de acuerdo no tiene opinión en desacuerdo muy en


acuerdo desacuerdo

Hay varias ventajas en ese método de plantear preguntas. En primer lugar, los entrevistados
podrían resolver por sí mismos el cuestionario, lo cual significa que ahorrarán tiempo al in-
vestigador tanto en la entrevista como en el traslado al lugar donde viven. En segundo sitio,
un formato estándar reduce al máximo el efecto que la manera de plantear las preguntas
tiene en el entrevistado y en sus respuestas. Sin tal verificación, cualquier diferencia encon-
trada entre las respuestas de las personas podría deberse a cómo se formuló la pregunta más
que a cualquier diferencia inherente entre los entrevistados. Una tercera ventaja radica en que
las respuestas pueden cuantificarse de inmediato. En el ejemplo anterior. se diría al entrevista-
do que alcanzó una puntuación de 1 si dijo que estaba muy de acuerdo y de 5 si afirmó estar
muy en desacuerdo.
Los cuestionarios estructurados se aplican principalmente en psicología de salud y so-
cial; recurren a e!Jos los investigadores de mercado y quienes levantan encuestas de opi-
nión. Las entrevistas y las encuestas se estudian en los capítulos 5 y 6.
Los métodos utilizados en la investigación psicológica ¡-----¡
----------------------------~~~~~----~' 1

Métodos de observación
A menudo se supone que la observación no es en realidad un método porque un investiga-
dor puede simplemente observar a una persona o un grupo de individuos y anotar lo que
sucedió. Sin embargo, si una observación empezó con ese procedimiento, pronto resultará
evidente para el observador que, a menos que se presente poco comportamiento, será difi-
cil apuntar todo.
Hay por lo menos tres opciones para tratar ese problema. La primera consiste en de-
pender de la memoria y anotar después lo observado, pero presenta el problema evidente
de la selectividad y la mala retención nemotécnica. Un segundo método estriba en utilizar
algún aparato de grabación perma~ente, como audio o vídeo, que permita escuchar y ob-
servar de manera repetida. Si ello no es posible, la tercera posibilidad radicaría en decidir
de antemano en cuál aspecto de la situación concentrarse. A tal efecto, será de ayuda ela-
borar un sistema de codificación para el comportamiento y preparar anticipadamente una
lista de puntos por revisar.
Usted podría decir que ello sería prejuzgar lo que observará. Sin embargo, advierta que,
aun cuando no prepara una observación, lo que se anote será a costa de otros aspectos que
se omitan. Está siendo selectivo y esa selectividad se determina por cierta noción implíci-
ta suya sobre lo que resulta relevante. Como etapa preliminar, puede observar sin la lista de
puntos por revisar y luego diseñarla como resultado de la observación inicial, mas no pue-
de escapar del proceso selectivo, ni siquiera durante la etapa inicial, a menos que utilice un
medio de grabación permanente de los hechos. Eme_ero, recuerde que incluso una videocá-
mara se apuntará en una dirección determinada y así podrían pasarse por alto algunas cosas.
Los métodos que suponen el planteamiento de preguntas y los métodos de observación
abarcan la división cuantitativa-cualitativa (consulte etnografía y etogénica, más adelante).
Observación estructurada. La observación estructurada comprende un conjunto de cla-
sificaciones del comportamiento y el uso de una lista de puntos por revisar a fin de regis-
trar éste. Una versión inicial, aún utilizada para observar grupos pequeños, es el análisis
de proceso de interacción (API), diseñado por Bales - 1950- (véase Hewstone, Stroebe
y Stephenson, 1996).
Con dicha técnica, el comportamiento verbal se clasifica según ciertas categorías, como
"Ofrece sugerencias e instrucciones, lo cual implica autonomía" . Los observadores regis-
tran en su lista de puntos por revisar, con sólo marcar la casilla apropiada cada vez que se
dice algo, la naturaleza del comportamiento y hacia quién va dirigido. El API pierde gran
parte de la información ·original, pues se diseñó a partir de una teoría particular de compor-
tamiento grupal. En este caso, los grupos crean líderes, quienes pueden ser de dos tipos;
ambos pueden coexistir en el mismo grupo y las interacciones con ellos serán de un tipo
concreto. Un sistema más complejo se relaciona con símbolos para tipos específicos de com-
portamientos, incluido alguno de índole no verbal.
~
o
Investigación cuantitativa en psicología
IL----------~~~~----~~~---------------

La observación estructurada tiene que usarse no sólo cuando se está presente en el


evento original. A menudo se utiliza también para resumir la información de una cinta de
vídeo o de audio. Tiene la ventaja de que prepara la información para el análisis estadísti-
co cuantitativo.
Un punto crítico respecto a la observación estructurada, y a cualquier sistema de medi-
ción que requiere un juicio subjetivo, es que el observador (de preferencia los observadores)
debe tener claro el sistema de clasificación antes de aplicarlo. En el apartado "Confiabili-
dad" del capítulo 2 retomaré el tema. Por ahora basta recalcar que un observador clasificará
la misma pieza de comportamiento de igual modo en todas las ocasiones. De lo c0ntrario,
cualquier intento por cuantificar el comportamiento estará sujeto a error, lo cual a su vez
afectará los resultados de la investigación. Los observadores han de pasar por una fase de
capacitación hasta que puedan clasificar con gran exactitud el comportamiento. Es pre-
ferible tener más de un observador, pues un desacuerdo en la clasificación mostrará que es
poco clara y que debe defmirse un poco más. La observación estructurada se explica en el
capítulo 7.

Análisis de contenido
El análisis de contenido es una técnica empleada para cuantificar aspectos de discursos, de
textos o de algún tipo de representación visual. El papel del analista consiste en decidir so-
bre la unidad de medición y luego en aplicarla al texto u otra forma de representación. Por
ejemplo, Pitts y Jackson (1989) observaron la presencia de artículos sobre el tema del sida
en periódicos de Zimbabwe a fm de descubrir si había cambios con una campaña guberna-
mental diseñada para crear conciencia y si alguno de éstos resultó sostenido. En otro estu-
dio, Manstead y McCulloch ( 1981) observaron cómo se representaba a hombres y mujeres
en los anuncios televisivos. El análisis de contenido se aborda en el capítulo 7.

Metaanálisis
El metaanálisis es un medio para revisar cuantitativamente los resultados de la investiga-
ción en cierta área provenientes de varios investigadores. Permite al revisor aprovechar el
hecho de que estudiosos individuales hayan usado muestras pequeñas en su investigación
para basar su revisión general en varias de éstas. Por tanto, si distintas partes de la investi-
gación llegan a conclusiones diferentes, la revisión general mostrará la dirección en que
apunta la tendencia general de la investigación relevante. Se han diseñado técnicas que per-
miten al revisor sobreponerse al hecho de que las piezas individuales de investigación tal
vez hayan empleado diferentes procedimientos estadísticos al crear el resumen. Un examen
más completo se encontrará en el capítulo 22.
___________________
Lo_s_m_e_
' t_od
__ os__ in_v_e_st~ig~a_c_ió_n~p_s_ic_o_ló~g~ic_a___ ~
ut_íl_iz_a_d_o_s_e_n_la__

Estudios de caso
Los estudios de caso son análisis profundos acerca de un individuo o, posiblemente, de una
institución u organización. En sentido estricto, no representan un método distinto sino que
emplean otros métodos para investigar lo individual. Por tanto, un estudio de caso puede
implicar entrevistas y experimentos. Por lo general se utilizan cuando un sujeto resulta poco
típico; por ejemplo, si alguno tiene una habilidad particular, digamos una memoria fenome-
nal (véase Luria, 1975a). Como opción, se usan cuando un individuo tiene un déficit, como
un tipo de afasia, que es un deterioro de la memoria (véase Luria, 1975b). Con frecuencia
los neuropsicólogos cognitivos emplean estudios de caso con discapacitados para ayudar a
comprender el funcionamiento de la cognición normal (véase Humphreys y Riddoch, 1987).

Métodos cualitativos
Existen dos interpretaciones erróneas del enfoque cualitativo de investigación: en primer
lugar, que carece de un método; en segundo, que reviste mayor facilidad que el cuantitati-
vo. Si bien esto $ería cierto en una investigación deficiente, la cualitativa adecuada será tan
rigurosa como la buena investigación cuantitativa. Muchos tipos de investigación cualita-
tiva parten del punto de vista de que el comportamiento de quienes realizan las med1cio.1es
y sus conceptos no pueden llegar a la esen.c!a de lo humano. Restringir aspectos de la psi ..
colegía humana a números es, do.:: acuerdo con esta noción, adoptar un enfoque reduccio-
nista y positivista para entender a las personas.
El reduccionismo supone la reducción - valga la taut0logía-- del objeto de estudio a
su forma más simple. Los críticos del reduccionismo sostendrían, por ejc111plo, que usted
no puede comprender la memoria humana dando a los participantes listas de palatras sin
relación, midiendo las que recuerdan y buscando un desempeño pn)medio. En cambio, ha
de comprender la naturaleza de la memoria en el contexto más amplío de la experiencia de
los individuos, incluida su interacción con otros. El positivismo se funda en un concepto
mecánico de los seres humanos que busca la comprensión a partir de relaciones causa-efec-
to, en lugar de considerar los significados para los individuos. Lo impo1tante radica en que la
misma pieza de compo1tamiento s ignifica cosas diferentes para personas distintas e inclu-
so para una misma en diversos contextos. Por tanto, un apretón de manos puede representar
un saludo, una despedida, la conclusión de un concurso o el cierre de un trato. Para entender
l -:- que el significado de cierta pieza de comportamiento el investigador debe conocer qué signifi-
~ per­ ca para los participantes. La manera más extrema de positivismo aplicado en psicología es
::: tal el enfoque conductista.
[ !1:..-nen
~~----------------ln_v_e_st_ig~a_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________

Reseña narrativa
La reseiia narrativa es una manera de resumir el trabajo en un área de investigación espe-
c ífica. Desempeña un papel s imilar a un ensayo o a la introducción de un informe de inves-
tigación, pues compara )os hallazgos de diferentes piezas de investigación para producir una
resei1a general de un ámbito. Como la introducción de un infonne de investigación, puede
identificar dónde debe concentrarse la investigación para obtener mayor conocimiento en
cierta área. Por lo menos una revista (Psychological Review) está dedicada a los artículos
de reseña.
Se ha desarrollado metaanális is a parti r del deseo de cuantificar los resultados de va-
rias piezas relacionadas de investigación en lugar de depender de la reseña narrativa.

Etnografia
La etnografia es, como su ctro nombre lo indica (observación participante), un método en
que el investigador efectúa observaciOnes mientras forma parle de un grupo u organización.
Por ejemplo, guíen desee aprender acerca de una empresa podría un irse a ella y lleyar a cabo
su investigación desde e l interior. Se ha sugerido que si son parte de la organización, en lu-
gar de observadores externos, resulta más probable que los investigadores aprendan qué
significan comportamientos específicos prora los pa1ticipaotes. Un observador externo podría
c::.tar limitado a describir el comp011amiento sin comprender cabalmente lo que significa
para Jos participamc~.
Asimismo, la etnografta puede emprendersc de diferentes maneras. P uede ser totalmen-
te ~:m: ub i erta, de modo que nadie en el gmpo sepa que se realiza la investigación. Como
op..:ión, una 1:amiJG~~ lim 1tada de personas puede gozar de la confianza del estudioso o todos
los participantes pueden estar conscientes del papel de dicha persona. La elección tiene un
lado élico: ¿es lcgíti!no observar a la gente sin su permiso-:> Consulte más adelante el exa-
men acerca de !n ética en la realización de investigaciones. Un argumento e n contra de re-
velar sus intenciones mdica en que tal conocimiento puede alterar el comportamiento de la
gente, con lo cual se perdería la validez ecológica del método. Además, es un asunto de prác-
tica. Si resulta poco probabie que obtenga el permiso, podría sentir la necesidad de efectuar
la investigación clandestinamente. No recomiendo a los estudiantes realizar ese tipo de in-
vestigación encub ierta. Antes de considerar ese método, analice los temas con el supervisor
de su investigación. ·
Para una explicación clara sobre la etnografia, consulte Hammcrsley y Atkinson (1983).

Et ogénica
Diseñada por Rom Hané y sus colegas, la etogénica combina formas de observación y en-
trevista para explorar los significados y las intenciones que los individuos tienen acerca de
su comportamiento.
__________________L_os_m
__ét_o_d_
os_u_t_il_iz_a_do_s_e_n_l_a_i_nv_e_st_ig~a_c_ió_n~p_s_
ic_o_
ló~g_ic_a________~¡-11

La pieza más completa de investigación que ha usado el método ctogénico es la de


Marsh, Rosser y Harré ( 1978), quienes examinaron la naturaleza de la violencia que los afi-
cionados al fútbol han desplegado. Marsh y colaboradores (op. cit.) entrevistaron indivi-
dual y colectivamente a aficionados, mediante una entrevista no estructurada, y observaron
su compo1tamiento. Harré (1977) dio una explicación del método etogénico, mientras que
Schlenker (1977) proporcionó en el mismo volumen una crítica sobre el método.

Análisis del discurso


El análisis del discurso puede considerarse el equivalente cualitativo del de contenido. Por
tanto, su sujeto puede ser un texto escrito u oral o incluso una representación visual, digamos
un ammcio. Dicho análisis parte de la premisa de que ninguna expresión de un concepto
contiene hechos puros desprovistos de intentos de persuadir al lector, oyente o espectador.
El uso de cada palabra o imagen ha llegado a ser el resultado de una elección entre opcio-
nes. Aun en áreas aparentemente objetivas, como los artículos científicos, el escritor elige
té1minos y frases diseñados para convencer al lector de la naturaleza valiosa de la investi-
gación y de los hallazgos.
El analista del discurso pretende identificar la función de una palabra o de cierta ima-
gen en una pieza discursiva. Además, busca pautas en el discurso que un sujeto utiliza en
varias ocasiones y entre individuos. Soyland (1994) da un ejemplo de análisis del discur-
so. Analiza el texto proporcionado en el inusual libro de Eysenck y Kamin (1981). Escribie-
ron éste dos protagonistas que debatían si la inteligencia se hereda o no. Cada cual redactó
una pieza en parte de la discusión que luego mostró al otro. Luego ambos formularon una
respuesta a la explicación del otro. El libro compara las explicaciones onginales y las res-
puestas. Éstas resultan particularmente interesantes desde el punto de vista del análisis del
discurso.
Potter y Wetherall (1 987) ofrecen un recuento valioso del punto de vista teórico y de
las etapas inherentes al proceso del análisis del discurso.

¿La psicología es una ciencia?


El concepto clásico que se tiene de la ciencia es que se realiza en varias etapas. En primer
lugar, el investigador identifica una hipótesis que desea probar. El término hipótesis se de-
riva del prefijo griego hipo-, que significa "menos que", "debajo de" o "escasez de"; y de
thesis, "teoría". Por tanto, la hipótesis representa una declaración tentativa que no tiene aún
el est~tus de teoría. Por ejemplo, creo que quien consume café por la noche padece insom-
nio. En general, la hipótesis se derivará de trabajo previo en el área o de algunas observacio-
nes del investigador. Popper (1972) indica que, respecto al proceso de la ciencia, la fuente
de la hipótesis es en realidad inmaterial. Si bien ello resulta cierto, quien evalúe una inves-
tigación no la calificará de manera favorable si parece que se originó sin justificación.
~L_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_
og~í_a____________________

La etapa siguiente consiste en elegir un método apropiado. Tras escogerlo, el investi-


gador diseña una manera particular de conducirlo y lo aplica. Luego analiza los resultados del
estudio y la hipótesis se apoya con las pruebas, se abandona a la luz de ésta o se modifica
para tomar en cuenta cualquier contraevidencia. Esto se describe como método hipotético-
deductivo y se deriva de cómo se considera que las ciencias naturales (como la física) rea-
lizan la investigación.
La afirmación de que la psicología es una ciencia se ha discutido con gran detalle. Los
lectores interesados pueden ahondar si consultan a Valentine (I 992). El argumento usual
para considerarla ciencia estriba en que practica el método hipotético-deductivo y que es-
to da lugar a una ciencia. Popper (1974) sostiene que para que una disciplina sea una cien-
cia, la hipótesis que genera debe tener la capacidad de falsearse mediante los hechos. En
otras palabras, si mi hipótesis permanece intacta sin importar el resultado de cualquier pieza
de investigación diseñada para evaluarla, no practico ciencia. Popper ha atacado el psicoaná-
lisis y el marxismo sobre tales bases, pues no los considera científicos. En lugar de explicar
los contraargumentos de Popper, quiero preguntar si el uso del método hipotético-deducti-
vo defme una disciplina como ciencia. Regresaré al método de Popper en el capítulo 1O,
cuando explique cómo probamos de manera estadística las hipótesis.
Putnam (1_979) señala que aun en la fisica hay por lo menos otras dos maneras en que
la ciencia se conduce. En la primera, la teoria no puede explicar un fenómeno concreto. En
lugar de descartar la teoria, Jos investigadores buscan las condiciones especiales que expli-
quen el fenómeno. Putnam utiliza el ejemplo de que la órbita de Urano no se adecuaba a la
teoría de la gravedad de Newton; la condición especial era la presencia de otro planeta,
Neptuno, que distorsionaba la órbita de Urano. Una vez que los investigadores llegaron a la
hipótesis de que había otro planeta, procedieron a buscarlo. En el segundo método, que no
resulta hipotético-deductivo, existe una teoria, pero las predicciones derivadas de ella no se
han explorado del todo. Aquí se tienen que aplicar las matemáticas para dilucidar las pre-
dicciones y sólo tras ello puede probarse la hipótesis.
La moraleja que los psicólogos extraerían del argumento de Putnam consiste en que
hay más de un método aceptado como científico y en que, en sus intentos por ser científica,
la psicología simplemente debe seguir uno. La modelación constituye un ejemplo de cómo la
psicología también lleva a cabo investigación en la ausencia del método hipotético-deduc-
tivo. Los neuropsicólogos cognitivos construyen modelos del conocimiento humano a partir
de los resultados de sus experimentos con individuos y postulan áreas del cerebro que po-
drían explicar fenómenos particulares; por ejemplo, cuando se encuentra que alguien tiene
un déficit específico de memoria o reconocimiento, como la incapacidad para reconocer
rostros. La simulación por computadora es la extensión de la exploración matemática de
una teoría para generar y probar las hipótesis.
------------------~Lo~s_m~ét~o~d~o~s~ut~i~liz=a=d=o~s=e~n~la~in~v=e=st~ig~a=c~ió~n~p=s=ic=o=ló~g~ic=a~------~¡--13

Temas éticos en la investigación psicológica


Sea cual fuere el método de investigación elegido, ciertos principios deben guiar la manera
en que se trata a las personas a quienes se acerca para que tomen parte en la investigación
y, en particular, a quienes ya participan en ella. Además, ciertos principios han de gobernar
el modo en que se comporta con sus colegas psicólogos.
La BPS (British Psychological Society, 1993) y la APA (American Psychological As-
sociation, 1992) han escrito directrices sobre cómo llevar a cabo una investigación apegada
a la ética. Shaughnessy y Zechmeister (1994) delinean los criterios de la APA e incluyen
un comentario acerca de sus implicaciones para los investigadores.
Para destacar que el comportamiento ético puede tener beneficios, además de obliga-
ciones, he resumido los temas con los encabezados "Obligaciones" y "Beneficios". He sub-
dividido aún más las obligaciones en las etapas de planeación, realización y reporte de la
investigación. Muchos de los temas cubiertos están sujetos a debate, de modo que depen-
de del contexto si un comportamiento resulta ético o no.

Obligaciones
Planeación
Como investigadores, debemos valorar la relación entre riesgos y beneficios, es decir, he-
mos de revisar si los beneficios que el estudio podría mostrar superan cualquier riesgo psi-
cológico al que pretendamos exponer a los participantes. Por tanto, si fuéramos a explorar
un posible medio pára aliviar el sufrimiento psicológico, estaríamos dispuestos a poner a
nuestros participantes en un riesgo mayor que si tratáramos de satisfacer la curiosidad in-
telectual sobre un tema sin beneficios evidentes para la población.
La noción de lo que constituye un riesgo se relaciona con lo anterior. E1 término riesgo
mínimo describe el nivel de riesgo que cierto participante podría tener en su vida cotidia-
na. Por consiguiente, si la investigación no requiere más que este mínimo de riesgo, lo más
probable es que se considere éticamente aceptable que si excede tal mínimo.
Siempre es una práctica atinada conocer, antes de conducir una pieza de investigación, lo
que otros estudiosos han hecho en el área. Ello nos evitará realizar una que constituya una ré-
plica innecesaria de un trabajo previo y podría revelar otras técnicas que resultarían menos
cuestionables éticamente. También es una buena idea, sobre todo como investigador novato,
buscar el consejo de colegas más experimentados. Esto s.erá más importante aún si propone
la práctica de una investigación con personas de un grupo especial, como las que padecen
una incapacidad sensorial. Esto lo alertaría sobre temas éticos particulares para el grupo.
Además, evitaría que usted cometiera errores básicos que darían al estudio un aspecto me-
nos profesional y que quizá propiciaría que los sujetos se mostraran menos cooperativos.
~~--------------~ln~v~e~st~ig~a~c_io~·n_c~u~a~n~ti~ta~t~iv~a_e_n_p~s~ic~o~lo~g~ía~--------------------
La determinación de lo que constituye un riesgo que vale la pena correr también depen-
de del investigador. Es probable que uno experimentado obtenga mayores beneficios que un
novato.
Si están implicados riesgos que superan el mínimo, los investigadores deben poner sal-
vaguardas, como tener consejo a la mano.

Ejecudón
Trabaje en su propio ámbito de competencia; es decir, si no está clínicamente capacitado y
busca investigar en ese campo, tenga en su equipo a quien sí lo esté.
Acérquese a los posibles participantes sin olvidar que tienen derecho pleno a rehusar-
se; aproxímeseles de manera cortés y acepte con gracia el rechazo. En segundo lugar, siem-
pre trate con respeto a sus participantes, quienes se han mostrado dispuestos a tomar parte
en su trabajo y usted les debe la cortesía común de no tratarlos como materia de estudio,
precipitándose a incluirlos y desechándolos cuando haya terminado con ellos. Tal vez esté
aburrido de seguir innumerables veces el mismo procedimiento, pero piense en cómo se
siente cuando se le trata como a un objeto en la banda de montaje.
Los pat1icipantes pueden sentirse ansiosos acerca de su desempeño y verse a sí mis-
mos como sujetos de prueba. Si es apropiado, garanticeles que no observará el desempeño
individual sino el de la gente en general.
Resista la tentación de comentar su desempeño mientras participan en el estudio; ello
puede ser un peligro, sobre todo cuando hay más de un investigador. Recuerdo con horror
el trabajo con un colega que había invertido mucho en un resultado en particular y que ha-
blaba en voz alta sobre los participantes que no estaban desempeñándose bien con relación
a la hipótesis.
Obtenga un consentimiento informado. En otras palabras: cuando sea posible, obtenga el
acuerdo de cada participante para tomar parte, con el conocimiento pleno acerca del mayor
riesgo posible que el investigador podría suponer. En algunos casos se necesitada la
aquiescencia del padre, del tutor o incluso de quien estuviere actuando in loco parentis (en
el papel de padre; por ejemplo, un maestro).
Evidentemente, en ciertas situaciones será dificil, acaso contraproducente, obtener
tal consentimiento. Por ejemplo, si realiza una observación en un ambiente natural. Si el
comportamiento se da en un lugar público, la investigación resultaría menos cuestionable
desde el punto de vista ético que si tuviera que utilizar equipo de especialistas para obtener
los datos.
Aunque sería idóneo que obtuviera un consentimiento informado, no revele por anticipa-
do la hipótesis a sus participantes, ni explícitamente al decirla de manera directa al princi-
pio ni implícitamente mediante su comportamiento durante el experimento. Esto afectaría su
comportamiento de una de dos maneras. Por una parte, podrían tratar de ser amables con
--------~---------
Lo_s_m_e_'t_o_d_os__ut_il_iz_a_d_o_s _e_n _la__in_v_es_t~ig~a_cJ_ó._n~p_s_ic_o_ló~g-ic_a________~¡--15

_u sted y de darle los resultados predichos. Por otra, podrían mostrarse determinados a no
comportarse como usted lo predijo; ello resulta cierto sobre todo si investiga un aspecto de
la debilidad humana como el conformismo.
Si no está utilizando una historia para encubrimiento, basta ofrecer una descripción ge-
neral del área de la investigación, como la de un experimento sobre la memoria. Evite que
su propio comportamiento señale .inadvertidamente el comportamiento esperado. Recuerde
la historia del caballo El inteligente Hans, que parecía tener la capacidad de realizar cálculos
matemáticos porque daba la respuesta al golpear con su pezuña; se descubrió que sólo reac-
cionaba a las señales inconscientes que su entrenador le enviaba (Pfungst, 1911). Una ma-
nera de evitar dicho peligro estriba en hacer que conduzca la investigación alguien que no
conozca la hipótesis o el tratamiento particular que ha recibido un grupo determinado y, por
tanto, desconoce la respuesta esperada (una condición de ciego).
No aplique presión indebida a la gente para que participe. Ello representaría un proble-
ma, sobre todo si los individuos a quienes estudia se encuentran en algún tipo de institu-
ción, digamos una prisión o un hospital psiquiátrico. No deben tener la impresión de que
se les sancionará de cierta manera si no colaboran en la investigación. Por otra parte, ningu-
no de ustedes ha de ofrecer alicientes innecesariamente grandes, como cantidades de dinero
desproporcionadas. He visto participantes que sólo. estaban interesados en el dinero que se
ofreció y que completaban una tarea de manera artificial nada más para terminarla y obte-
ner la recompensa.
Asegure a los sujetos que habrá confidencialidad, que no revelará a otros lo aprendido
sobre sus participantes individuales. Si es menester dar a la gente seguimiento posterior, tal
vez deba identificar a quién corresponde cada dato. Si éste es el caso, utilice un código para
identificar a las personas y luego, en un lugar separado de los datos, tradúzcalo a su mane-
ra para encontrar quién proporcionó los datos específicos. De esta forma, si alguien llega a
toparse con, digamos, un cuestionario confidencial, no podrá identificar al individuo cuyas
respuestas se muestran.
Si no necesita dar seguimiento a sus participantes, éstos pueden permanecer anónimos.
Ello cabe, por ejemplo, si·realiza una encuesta de opinión y recopila la información de con-
sultados que reunió en las afueras de un supermercado.
Aclare a los participantes que tienen derecho a retirarse de la investigación en cual-
quier momento y, además, a decir que usted no puede utilizar información recopilada hasta
ese punto.
Si en la investigación advierte algo relacionado con un participante que pudiera reves-
tir importancia para él, está obligado a informárselo. Por ejemplo, si mientras la realiza en-
cuentra que alguien parece sufrir de ceguera al color, debe decírselo. Evidentemente, dará
de manera cortés tales noticias. Además, manténgase en su ámbito de competencia. En el
ejemplo anterior, recomiende que vea a un oftalmólogo. No realice diagnósticos en un área
donde no tenga capacitación.
~L--------------~'~"v~e~s~ti~ga~c~io~·n~c~u~a~nt~it~a~ti~v~a~e~n~p~si~co~l~og~í~a____________________

Hay un detalle relacionado con las pruebas psicométricas (como pruebas de perso-
nalidad): sólo alguien capacitado plenamente debe utilizarlas para diagnóstico. Sin embar-
go, un investigador puede usarlas si no habla a los demás acerca de los resultados de casos
individuales.
En estudios donde participa más de un investigador es responsabilidad colectiva garan-
tizar que se conduzcan dentro de directrices éticas. Por tanto, si sospecha que alguien del
equipo no se comporta éticamente, es su responsabilidad alinearlo.
Debe recapitular la investigación con los participantes, es decir, tras terminar su parti-
cipación, ha de comentarla con ellos. Tal vez no quiera realizar esto de manera completa ni
de inmediato, pues no desea que otros conozcan sus intenciones; sin embargo, en tales cir-
cunstancias, ofrezca que se hablará de manera más completa una vez recolectados los da-
tos de todos los participantes.

Reporte
Sea honesto con lo que encontró. Si altera los datos - por ejemplo, si elimina las califica-
ciones de algunos parti~ipantes-, explique lo que hizo y por qué.
Mantenga la confidencialidad. Si está reportando sólo estadísticas de resumen, como
promedios de un grupo, y no detalles individuales, ello ayudará a evitar que se identifique
a participantes. Sin embargo, -si trabaja con grupos especiales -por ejemplo, una escuela úni-
ca o personas con memoria prodigiosa- o incluso con estudio de casos individuales, tal vez
la confidencialidad se dificulte. Donde sea posible, el uso de nombres o iniciales falsos la me-
jorará. Sin embargo, en algunos casos los sujetos necesitarán conocer la posibilidad de que
se les identifique; aquí ha de dárseles la oportunidad de vetar la publicación.
Hay muchas obligaciones con los colegas psicólogos.
Si, después de reportar los resultados de la investigación, encuentra que ha cometido
errores importantes, debe darlos a conocer a quienes tengan acceso a ella. En el caso de un
artículo publicado en una revista, es preciso escribir al editor.
No utilice el trabajo de otros como propio; evite los plagios. De igual manera, si cono-
ció los resultados de otro investigador antes de que se hayan publicado, repórtelos sólo si .
recibió el permiso correspondiente. Una vez publicados, son de dominio público y pueden
discutirse con libertad, pero ha de darse el crédito adecuado. También dará el debido cré-
dito a quienes trabajaron con usted en el estudio. Ello puede incluir la autoría conjunta, si
la contribución fue suficientemente importante. Como alternativa, un reconocimiento sería
lo apropiado.
Una vez que publicó su investigación y ya no espera analizar más los datos, deberá es-
tar dispuesto a compartirlos con otros psicólogos. Tal vez desearán examinarlos desde otro
ángulo.
... ___________________
Lo_s_m_e_'t_o_d_os__ in_v_es_t~ig~a_ct_
ut_i_ln_a_d_o_s_e_n_La__ .ó_n~p_s_
ic_
o_ _J¡--17
ló~g~ic_a________

1 Beneficios
Además de todas las obligaciones, una actuación ética puede producir beneficios para el in-
vestigador.
De tratar a los participantes como seres humanos que están a su nivel y que sostienen
opiniones de importancia, quizá reciba mayor cooperación. Asimismo, si se muestra por
demás abierto, dentro de las restricciones de no divulgar sus expectativas antes de que los
participantes hayan finalizado su actuación, el trabajo tendrá más significado para ellos y
esto podría evitar que busquen alguna motivación oculta en el trasfondo. Así, su compor-
tamiento se vería menos afectado por una sospecha sobre el tema de la investigación y los
resultados tendrían más validez.
Si empleó una historia para encubrimiento, puede utilizar la oportunidad a fin de reve-
lar las verdaderas intenciones de la investigación, de descubrir cuán convincente fue dicha
historia y de analizar cómo se sintieron los participantes. Ello reviste importancia especial
si requirió que se comportaran de una manera que pudo preocupados. Por ejemplo, en ex-
perimentos de Milgram (1974) donde los participant..:s pensaban que se aplicaban choques
eléctricos a otros, se dio a Jos primeros una larga explicación retrospectiva.
Otro aspecto útil de la explicación retrospectiva es que Jos participantes pueden revelar
estrategias que emplearon para realizar tareas, como una técnica nemotécnica particular en
una investigación relacionada con la memoria. Tal información puede ayudar a explicar la
variación entre participantes en sus resultados y proporcionar mayor conocimiento acerca
del comportamiento humano en el área que estudia.

Resumen
El propósito de la investigación psicológica es avanzar en el conocimiento acerca de los se-
res humanos porque describe, predice y permite a la postre la intervención para ayudar a
las personas. La psicología puede verse de manera legítima como una ciencia, pues emplea
métodos rigurosos en su investigación, a fin de evitar las meras conjeturas y de permitir
que los colegas psicólogos evalúen la investigación. Sin embargo, en común con las cien-
cias naturales, como la física, los psicólogos emplean un amplio conjunto de métodos en
su trabajo. Éstos varían en el grado de control que el estudioso tiene sobre la situación y en la
medida en que el contexto se relaciona con la vida diaria de las personas. Esta investigación
se clasifica a menudo como si fuera cuantitativa (relacionada con la recolección de datos
numéricos) o cualitativa (afma las cualidades de la situación).
En todo el proceso de investigación, los psicólogos han de tener en cuenta que deben
comportarse de manera ética con los participantes y con sus colegas.
En el capítulo siguiente se defmen las etapas preliminares de la investigación.
- --

2
Las etapas preliminares
d,é la investigación
1

Introducción
En el presente capítulo- se describen las etapas preliminares que los investigadores deben
recoJTer antes de llevar a cabo su estudio con participantes. Además, se resaltan las deci-
siones que han de tomar en cada fase y se recalca la necesidad de verificar, mediante una
prueba (un estudio piloto), que la investigación esté bien diseñada.
Es necesario recoJTer varias etapas antes de recolectar los datos. Usted debe elegir un
tema, leer acerca de él, centrarse en uno de sus aspectos particulares y optar por un método.
Donde resulte apropiado, elegirá su hipótesis. También ha de escoger un diseño, su sistema
(o sistemas) de medición y cómo analizará los resultados. Además, seleccionará a las per-
sonas a las que va a estudiar.

Elección de un tema
Lo primero que debe guiar su elección del tema de estudio es su interés. Si el tema no le
atrae, no disfrutará la experiencia de investigar. Un segundo elemento de su selección será
la ética al realizar el trabajo. El relacionado con seres humanos o con animales debe seguir
un minucioso análisis de costos y de beneficios. Es decir, ha de tener claro que si los par-
ticipantes pagan un costo, como ser engañados o enfrentar una experiencia poco placentera,
los beneficios derivados de la indagación deben sobrepasar los costos. La observancia de tal

18
______________________La~s~e~ta~p~a=s~p~re=l~im=l=·n=a~re=s~d~e_l~a_in=v~e=s=ti~ga=a=·o~·n~----------~~
·•
criterio significa que la investigación no diseñada para aumentar el conocimiento del ser
humano, incluida la mayor parte de los proyectos estudiantiles, debe mostrar la máxima
consideración por los participantes. En el capítulo 1 se brinda una explicación más com-
pleta de los temas éticos.
Un tercer punto debe ser la factibilidad de im·estigar en el área elegida. En cíertos cam-
pos, las dificultades para efectuar investigación empírica. como estudiante, son evidentes. Por
ejemplo. tal vez le interese de manera particular la elaboración de un perfil de delincuen-
tes a partir de la psicología forense. pero resulta improbable. a menos que tenga contactos
especiales, que realice algo más que una inYestigación bibliográfica en ese ámbito. Sin em-
bargo, antes de que decida si sería práctico conducir una im·estigación en un área determi-
nada, tendrá que leer el trabajo de otros y concentrarse luego en un aspecto específico del
campo que le atrae.

Revisión de la bibliografía
Antes de lleYar a cabo cualquier investigación necesita estar al tanto de lo que otros han
hecho en el área. Aunque trate de replicar cierta parte de un estudio para comprobar sus re-
sultados, habrá de conocer cómo se realizaron trabajos previos. Además. tal vez piense que
un método es original en un área, en cuyo caso aconsejaría comprobar que lo es.
Hay dos maneras rápidas de conocer cuáles investigaciones se han realizado en el área:
preguntar a un experto en el campo o usar alg(m tipo de base de datos de trabajos anteriores.

Consulta con un experto


En primer lugar, identifique quiénes son los expertos en el campo elegido. Para ello, pida
consejo a colegas más experimentados en su departamento o busque en las bases de datos
a que se le remita o en Internet. Una vez identificado el experto. piense qué le preguntará.
He recibido con mucha frecuencia cartas cuyos autores dicen que quieren emprender un es-
tudio en el área de la ceguera y luego me piden información que les resulte útil. Se trata de
una solicitud muy abierta. No tengo idea de cuál aspecto de la ceguera desean indagar y, por
tanto, sólo puedo ofrecerles que me visiten o me llamen por teléfono para analizar el tema.
Hay mayores probabilidades de que los investigadores respondan si puede darles una idea
clara sobre lo que le interesa investigar. A menos que sea suficientemente específico, le re-
comiendo explorar la bibliografía mediante una base de datos de investigaciones.

Lugares donde se presentan investigaciones


Los psicólogos tienen tres maneras principales de presentar su investigación: conferencias,
artículos de revistas y libros. Conferencia es el foro donde se informa sobre los trabajos que
~~----------------ln_v_e_st_ig~a_c_io_
·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

no se han publicado, por lo cual tienden a constituir las fuentes más actualiz.adas de inves-
tigación. Sin embargo, cuando los estudiosos se vuelven más preeminentes, se les invita a
presentar en las conferencias reseñas de sus hallazgos.
Las conferencias son de dos tipos: genéricas, como las anuales de la British Psycbolo-
gical Society o la American Psychological Association, donde psicólogos de muchos tipos
presentan trabajos; y de especialistas, dedicadas a un área más específica de la disciplina,
como la psicología cognitiva o la del desarrollo. Sin embargo, aun en las conferencias más
generales suele haber simposios que contienen varios artículos sobre un mismo tema.
Hay problemas con el uso de conferencias como fuente de información. En primer lugar,
tienden a ser anuales y, por tanto, tal vez no coincidan con el momento én que necesita los
datos. Un inconveniente mayor estriba en que quizá no tengan artículos sobre el área de in-
terés. Sin embargo, los extractos de las conferencias anteriores resultan útiles para identificar
quiénes son los investigadores activos en un área determinada. Una tercera contra_!iedad: a
menudo, otros psicólogos expertos en el área no han evaluado el trabajo que se reporta en
una conferencia; por lo mismo, debe tratarse con mayor cuidado.
De acuerdo con lo expuesto, es más probable que encuentre información acerca de in-
vestigaciones previas en artículos de revistas académicas o en libros. Los psicólogos tienden
a seguir lo que se realiza en otras ciencias y publican primero su estudio como artículos.
Por lo general, otros investigadores revisan los artículos y se publican solamente los que se
consideran bien hechos y de interés.
Una vez que se han vuelto suficientemente reconocidos, los investigadores pueden ser
invitados a contribuir con el capítulo de un libro sobre el tema. Cuando han realizado inves-
tigación suficiente, pueden producir un libro dedicado a su propio trabajo (a lo cual suele
llamarse monografia de investigación). Otra posibilidad consiste en que escriban una obra
general que presente su estudio y el de otros colegas en su área de interés. La fuente más ge-
neral será un libro de texto dedicado a un campo más amplio de la disciplina, como la psico-
logía social, o incluso uno de texto general atinente a todas las áreas de la psicología.
Casi todos los libros requieren cierto tiempo para publicarse y, en consecuencia, tienden
a presentar investigación ligeramente anacrónica. Si bien hay un periodo entre la remisión
de un artículo a una revista y su publicación, las revistas son la mejor fuente para los estu-
dios más actualizados.
Las revistas, igual que las conferencias, pueden ser generales --como la Brltish Jour-
nal of Psychology o el Psychological Bulletin- o más específicas -por ejemplo, Cog-
nition y Memory and Language. Algunos artículos están disponibles en Internet, lo cual
quizá sea un fenómeno creciente una vez que se resuelvan los problemas sobre derechos .
de autor.
Es posible identificar la investigación relevante si se busca en ejemplares de revistas,
pero una estrategia más eficiente consiste en utilizar algún tipo de base de datos de inves-
tigaciones.
. --
_____________________L_a_s_e_ta~p_a_s~p_re_li_m_in_a_r_
es_d_e__
la_i_nv_e_s_
ti~ga_c_ió_n____________~¡-21

Bases de datos de investigaciones previas


Las principales bases de datos de investigación psicológica son Psychological Abstracts,
PsychLit, Social Science Citation Index (SSCI) y Curren! Contents.

PsychologicalAbstracts. Extracto es un resumen de cierta investigación (una descripción


más completa se da en el capítulo 23). Psychological Abstracts, publicación mensual, pre-
senta una lista de los trabajos publicados sobre psicología. Además, cada año se produce
una sola versión de la investigación reportada en ese periodo. Aproximadamente cada de-
cenio se compilan los estudios publicados durante la década anterior. Para consultar Psy-
chological Abstracts puede utilizar un índice de temas (a fin de encontrar lo publicado en
el área) o uno de autores (así hallará lo que cada autor publicó en el periodo respectivo). A
cada pieza de investigación se da un número único y ambas maneras de consultar Psycho-
logical Abstracts hacen referencia a esos números. Con éstos puede buscar entonces en una
tercera parte que contiene el nombre del autor o autores, la referencia a la revista y un ex-
tracto de la investigación. Aquí puede decidir si desea leer la versión completa de cualquier
referencia.
La desventaja de Psychological Abstracts. es quSL_c_E.gg_do no tenga usteauna versión
compilada de la década o del año, deberá buscar en varios ejemplares. Además, puede bus-
car sólo por una palabra clave a la vez.
PsychLit. PsychLit es la versión para computadora de una compilación de Psychological
Abstracts. Se incluye en un solo disco compacto y se actualiza cuatro veces al año. Por .
ejemplo, tal vez le interese el sida en países africanos. Si busca sólo artículos acerca del pa-
decimiento, se le presentarán miles de referencias. Si busca las que incluyan esa enferme-
dad y África, reducirá el número de referencias ofrecidas. Una vez que haya efectuado su
investigación, puede buscar cada referencia donde se le proporcionarán los mismos deta-
lles comprendidos en Psychological Abstracts: el autor o los autores, la revista y un extracto
del artículo. Luego tiene la opción de marcar cada referencia que desee seguir para que
cuando termine de revisarlos tenga una impresión de las referencias marcadas, junto con
sus extractos. De nuevo, puede utilizar después dicha información para encontrar el origi-
nal de cualquier artículo del que desee más detalles.
Empero, PsychLit tiene por lo menos dos desventajas. Primera, debido a que se elabo-
ra con menos frecuencia que Psychological Abstracts, no se le darán las referencias más re-
cientes. Para evitarlo, realice una búsqueda complementaria en PsychLit con las palabras
clave Curren! Contents (consulte más adelante). Una segunda inconveniencia estriba en
que depende del acceso a una computadora con lector de disco compacto. Por tanto, aunque
su biblioteca tenga un equipo, éste podría hallarse ocupado, en cuyo caso tendría que apar-
tarlo por un periodo limitado; o, peor aún, tal vez la máquina no funcione.

1
- -
~L--------------~'~nv~e~s~ti~ga~c~io~
·n~c~u=a~nt~it~a~ti~v~a~e~n~p~si~co~t=og~í=a____________________

Social Science Citation Jndex. Social Science Citation lnde.r: (SSCI) se publica mensual-
mente y permite hallar referencias como en Psychological Abstracrs (salvo que no propor-
ciona extractos, sólo las fuentes del material). Sin embargo. tiene el beneficio adicional de
que usted puede encontrar quién ha citado un trabajo en particular en sus referencias. De esa
manera, si localizó un estudio y desea ide,ntificar quién ha trabajado también en el área,
puede utilizar tal estudio a fin de dar con otros trabajos en el mismo campo.
Como Psychological Abstracts, hay versiones impresas y en disco compacto del SSCI.
También se tiene Science Citation lndex (SCI), que podría resultar útil.
Curren! Contents. Hay varias versiones de Curren! Contents para diferentes grupos de disci-
plinas. La más relevante para los psicólogos es la de ciencias sociales y del comportamiento,
que incluye ámbitos como psicología, educación, psiquiatría, sociología y antr?pología.
Curren/ Contents se publica semanalmente y es una lista de las páginas de los índices de
contenido de las revistas académicas y algunos libros recién publicados.
Hay una versión para computadora disponible para Macintosh y computadoras compa-
tibles con IBM. La primera le permite buscar por palabras clave y le proporciona la dirección
de la persona de quien se obtuvo el artículo. La opción adicional (Request-a-print) !e per-
mite imprimir una trujeta posta} para el autor donde le pide una reimpresión del artículo.
1

Préstamos interbibUotecarios
. En ocasiones identificará un artículo o un libro que su biblioteca no tiene. En algunas bi-
bliotecas es posible pedir prestado un ejemplar de dicho texto mediante lo que se denomi-
na préstamo interbibliotecario. Consulte con el bibliotecario si la opción está disponible y
cuáles restricciones existen con relación al número que puede tener. si debe pagar por ellos
y, de ser así, cuánto le costarán.

Concentración en un área
especifica de investigación
Quizá en el proceso de búsqueda de investigación previa deba ampliar su conocimiento de
un área. no sólo del asunto de interés sino también de los tipos de métodos y diseños emplea-
dos. Ello ha de ayudarle a centrarse en un aspecto específico del ámbito que le atrae y que
juzga preciso explorar. Además, ahora se encuentra en mejor posición para considerar la fac-
tibilidad de investigar en el área. Habrá \'isto \'arios aspectos del estudio que podrían restrin-
girlo: la posible necesidad de equipo especializado. como un registrador de movimientos
oculares, y el número de participantes que se considera imprescindible para cierta pieza de
investigación. Además. tendrá una idea del tiempo que se requerirá para llevarla a cabo.
______________________L_a_s_e_ta~p_a_s~p_
re_l_
im_i_n_
ar_e_s_d_e_l_
a _in_v_e_st~ig~a_c_ió_n____________~¡-:23

Una consideración adicional que debe motivarlo a estrechar su atención radica en que,
si busca incluir demasiados aspectos de un área en una parte de una investigación, estará co-
metiendo un error de novatos. Si pretende abarcar mucho, dificultará la interpretación de
los resultados. Por lo general, un proyecto de investigación de gran escala requiere varias pie-
zas de pequeña escala que, al integrarse, comprenden un ámbito mayor. Por ello, le sugie-
ro que no se tome demasiado ambicioso; vale más una pieza de investigación simple, bien
hecha y fácil de interpretar que una muy ambiciosa que no arroje resultados claros; el co-
nocimiento científico crece en incrementos pequeños.

Elección del método


Consulte en el capítulo 1 una descripción de la variedad de métodos que emplean Jos psi-
cólogos.
En la elección de un método ha de considerar varios factores . El primero debe ser
las expectativas que tiene acerca de la investigación. Ya se recalcó en dicho capítulo que
necesita equilibrar las ventajas de un mayor control contra la correspondiente pérdida de
validez ecológica. Por tanto, si su objeto consiste en refinar el conocimiento en un área ya
investigada de manera muy completa, entonces podría utilizar un diseño experimental fuer- /
temente controlado. No obstante, si entra en un ámbito nuevo, podría utilizar un método
más exploratorio, como uno de los cualitativos. De igual manera, si se interesa en el com-
portamiento de la gente pero no en sus creencias e intenciones, lo apropiado sería un expe-
rimento. Mientras tanto, si desea conocer el significado que tiene cierto comportamiento
para los participantes, podría utilizar un método como el etogénico o el etnográfico.
Vale la pena destacar que si se utilizan varios métodos para centrarse en la misma área
de investigación (lo cual suele denominarse triangulación) y todos indican un resultado si-
milar, la reputación de los hallazgos mejorará. En otras palabras, no se sienta totalmente
restringido a emplear el método usado en los estudios que ha leído . La aplicación de un mé-
todo fresco en un campo puede agregar algo a nuestro conocimiento respecto a éste.
Una vez más, no debe dejar al final las consideraciones acerca de la factibilidad de la
situación. Tal vez desea tener el control de un experimento, pero está forzado a utilizar un •
método cuasiexperimental porque un experimento se antojaría poco práctico. Por ejemplo,
acaso desee comparar dos formas de enseñar a los niños a leer. Sin embargo, si tiene tiempo
limitado se vería obligado a comparar a pequeños de diferentes escuelas donde ya se han
usado ambas técnicas, en lugar de enseñarles usted mismo. No obstante, debe estar cons-
ciente de los problemas que podrían existir por la interpretación de tal diseño (consulte el
capítulo 4).
~L--------------~I~nv~e~s~ti~ga=c~ió~n~c=u=a~nt~it~a~ti~va~e~np~si~co=l~og~í~a___________________

Elección de una hipótesis


Una señal de que cierta pieza de investigación está claramente delimitada consiste en que
usted hace predicciones específicas de los resultados, es decir, establece una hipótesis. E llo
le ayudará a dirigir la atención a aspectos particulares de la investigación y a elegir el di-
seño y el sistema de medición. La redacción de la hipótesis se vincula de forma insepara-
ble con la manera en que se prueba, lo cual se explorará en el capítulo 10.

Elección del diseño de investigación


En el capítulo 4 se describen los diseños de investigación que los psicólogos utilizan con
más frecuencia.
Tras elegir un-método debe considerar si busca un hallazgo que podría generalizarse a
otros m~dios, en cuyo caso escogerá un diseño apropiado y de buena validez externa (con-
sulte el capítulo 3). De manera similar, sí explora las relaciones de causa y efecto en su in-
vestigación, requerirá un diseño no sólo apropiado para el área de análisis sino con amplía
validez interna (consulte los capítulos 3 y 4). Una vez más, son probables ciertas restric-
ciones en el tipo de diseño que podría emplear. Por ejemplo, si tiene menos de un año para
realizar el estudio y quiere aplicar investigación longitudinal, podrá realizarlo así sólo con
algún fenómeno que tenga ciclo de vida inferior a un año.
Un aspecto de su diseño será el sistema o los sistemas de medición que aplique en su
trabajo. En el apartado siguiente se abordan los tipos de sistemas de medición disponibles
para los psicólogos y los factores por considerar al elegir alguno de ellos.

Medición en psicología
Podría considerarse que los fenómenos que mide el psicólogo se agrupan en tres catego-
rías: conducta no verbal abierta, verbal y no verbal encubierta.

Conducta no verbal abierta


Con el término conducta no verbal abierta me refiero a la observable directamente, que
cobra al menos dos formas. En primer lugar, un observador puede anotar la conducta a dis-
tancia; por ejemplo, la que se relaciona con la comunicación no verbal, como gestos y ade-
manes. Pueden tomarse asimismo mediciones más próximas; por ejemplo, la velocidad con
que un participante formula un juicio abierto acerca del reconocimiento de una cara (tiem-
pos de reacción).
_____________________L_a_
s _e_ta~p_a_s~p_
re_li_m_in_a_re_s_d_e__
la_i_nv_e_s_ti~ga_c_ió_n____________~¡-25

Conducta verbal
La conducta verbal puede tener diversas formas. Los investigadores pueden grabar el lengua-
je que se da de modo natural. Como opción, pueden obtenerlo en forma oral de una entre-
vista o escrita mediante un cuestionario o una prueba de personalidad.

Conducta encubierta
Conducta encubierta se refiere a la no observable directamente; por ejemplo, respuestas
psicológicas (como el ritmo cardiaco).
Como psicólogos, nos interesa toda la diversidad de la experiencia humana: conduc-
ta, pensamiento y emoción. Sin embargo. las mediciones que he delineado se hallan des-
provistas de pensamiento y emoción. Podemos inferir la existencia y la naturaleza de tales
factores sólo a partir de nuestras mediciones. Por ejemplo, podríamos utilizar el ritmo cardia-
co para medir la tensión psicológica de nuestros participantes. Empero, no estaremos seguros
de que hayamos medido en realidad las entidades de nuestro interés, pues no hay una
relación perfecta, uno a uno, entre tales sistemas de medición y la emoción o los pensa-
mientos. Por ejemplo, el ritmo cardiaco también indica el nivel del ejercicio fisico de una
persona.
Podria considerarse que al medir la conducta verbal nos acercamos al pensamiento y a la
emoción. Sin embargo, dicha conducta ha de tratarse con cuidado. Aun cuando la gente trate
de ser honesta, hay por lo menos dos tipos de conducta verbal sospechosos. En primer lugar,
si pedimos a los participantes que confíen en su memoria, la información que proporcionen
podría provenir de recuerdos no claros. En segundo sitio, hay formas de conocimiento, lla-
mado a veces conocimiento de procedimientos, a las que no tenemos acceso directo.
Por citar un caso, como ciclista no puedo decirle cómo andar en bicicleta. Cuando qui-
se enseñar a mis hijos no les di una plática ilustrada y luego esperé que subieran a sus ve-
hículos y supieran conducirlos. La única manera en que aprendieron fue que yo corriera
junto a ellos, los soltara por un momento y permitiera que trataran de mantener el equili-
brio. A medida que los periodos se prolongaban, sus cuerpos empezaron a aprender a andar
en bicicleta. Por ello, disponer de un aceptable sistema de medición de conducta verbal se
relaciona por lo general con el presente y con el conocimiento a qu e los participantes tie-
nen acceso (consulte Nisbett y Wilson, 1977; y Ericsson y Simon, 1980).

La elección del sistema de medición


Los sistemas de medición que elija estarán determinados evidentemente por el tipo de estu-
dio que realice. Si se interesa en la velocidad con que los individuos reconocen un rostro, qui-
zá utilizará tiempos de reacción que se miden con un instrumento estándar. Por otra parte, si
desea medir aspectos de las personalidades de la gente, puede usar una prueba disponible de
--
~L_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_t,_·v_a_e_n~p_si_co_l_og~í_a____________________

personalidad. Como alternativa, tal vez desee medir algo que no se ha medido antes o no co-
-
mo usted lo pretende, en cuyo caso diseñará sus propios sistemas de medición.
Sea cual fuere el sistema de medición que considere, hay dos cuestiones por atender:
¿los sistemas de medición son confiables?, ¿resultan válidos? Para responder de manera
más completa ambas preguntas se requiere un grado de detalle estadístico que aún be de
proporcionar. Por lo mismo, en esta etapa daré una explicación breve de los dos conceptos
y pospondré la exposición más íntegra hasta el capítulo 19.

Confiabilidad
Por confiabilidad entendemos el grado en que el sistema de medición produciría el mismo
resultado de una ocasión a otra. Hay por lo menos dos tipos de confiabilidad. En primer lu-
gar, si se toma la medición de un pa1ticipante dos veces, un sistema de medición confiable
producirá un resultado similar. Por tanto, quien en dos ocasiones toma una prueba de cocien-
te intelectual (IQ) con gran confiabilidad debe lograr la misma puntuación, dentro de ciertos
límites. ingún sistema de medición psicológico es del todo confiable y, por tanto, necesita
conocer la confiabilidad del que use para acceder al grado de error que le es inherente. Si
la persona logra un lQ algo mayor en la segunda oportunidad que toma la prueba, querrá
saber si ésta representa una mejora real o pudo deberse a la falta de confiabilidad de la
prueba.
Si desarrolla un sistema de medición, ha de buscar su confiabilidad utilizando uno de
los métodos descritos en el capítulo 19. Si aplica un sistema de medición psicométrico exis-
tente, como una prueba de IQ o una de personalidad. el manual de la prueba debe informar
sobre su confiabilidad.
Un segundo tipo de confiabilidad tiene que ver con los sistemas de medición que su-
ponen cierta cantidad de juicio de los investigadores. Por ejemplo, si le interesara clasifi-
car la conducta no verbal de los participantes, tal vez querría asegurarse de que usted y sus
colegas son congruentes al aplicar su clasificación. Este tipo puede denominarse conjiabi-
lidad intrajuez, si comprueba la congruencia de una persona en la clasificación del mismo
comportamiento en dos ocasiones. Se denomina conjiabilidad interjuez si en la comproba-
ción dos o más jueces clasifican el mismo comportamiento de igual manera.
Si elige ese tipo de sistema de medición subjetiva, debe verificar las confiabilidades
intra e interjuez antes de emplearlo. Es común que los jueces necesiten estar capacitados y
que el sistema clasificatorio precise de refinación a la luz de desacuerdos no resueltos. Ello
tiene la ventaja de hacer explícita cualquier clasificación, en lugar de confiar en "una co-
razonada".
Desde luego, hay sistemas de medición diseñados para recoger cambios y, por tanto, no
querrá una calificación consistente de una ocasión a otra. Por ejemplo, en el área de la ansie-
dad se reconocen dos tipos: ansiedad específica del estado y ansiedad de rasgo. La primera
______________________L_a_s_e_ta~p~a~s~p~re~l~im~l~
·n~a~re~s~d~e_l~a_i_nv_e~s_ti~ga~c~io~'n____________~¡-:27

debe modificarse según el estado de la persona. Por tanto, el sistema de medición produ-
ci,.á una calificación similar cuando el sujeto atraviesa por el mismo estado, pero debe
mostrarse sensible para identificar cambios en la ansiedad entre estados. Por otra parte, la
ansiedad de rasgo será relativamente constante.

Validez
Hay varios tipos interrelacionados de validez dP- un sistema de medición que deben revi-
sarse. Sin embargo, todos atienden el mismo punto: si se mide lo que los investigadores
pretendían.

Validez patente o de facie


Validez patente o de facie se refiere a la percepción que la gente a quien se mide, o las per-
sonas que administran las mediciones, tiene de éstas. Si los participantes en su investiga-
ción captan de manera equivocada la naturaleza de la medición, tal vez se comporten de un
modo que la tornen carente de valor. Por ejemplo, si se da a los niños una prueba de inte-
ligencia, pero ven la ocasión
'--.
como oportunidad de conversar con un adulto, su desempeño
puede antojarse más deficiente que si hubieran apreciado correctamente la naturaleza de la
prueba. De f01ma similar, si e1 que administra la pru..;ba no comprende para qué está dise-
ñada o no cree que constituya un sistema de medición eficaz, la manera en que la aplique
afectaría los resultados.
El problema de la validez patente se ponderará contra los peligros de que los participan-
tes estén al tanto de la hipótesis que los investigadores prueban. Los sujetos pueden tratar
de ayudar a obtener el efecto predicho. :rueden trabajar deliberadamente contra su hipótesis.
Sin embargo, es ingenuo suponer que, como ha disfrazado el verdadero propósito del siste-
ma de medición, los participantes no sacarán sus conclusiones y se comportarán de acuerdo
con ello. Ome (1962) describió las pistas que los participantes recogen acerca de las expec-
tativas de un investigador como las características de la demanda del estudio. Señaló
que esto ayudará a detem1inar el comportamiento de los participantes. Notó que, en ciertas
situaciones, basta idear diferentes características de demandas para éstos a fin de que mo-
difiquen sus comportamientos, aun cuando no haya otra manipulación experimental. Por
tanto, si no quiere que la gente a quien estudia conozca sus intenciones reales, presénte-
le una historia para encubrimiento que la convenza. Milgram (1974) no habría obtenido los
resultados de sus estudios de obediencia de haber indicado a los participantes que anali-
zaba la obediencia. Antes de dar a los participantes una historia para encubrimiento, ha de
ponderar los costos de mentirles contra los beneficios del conocimiento por obtener.
Tenga en cuenta que puede dar una explicación vaga de lo que investiga, si ello no re-
vela el juego. Por ejemplo, puede decir que explora la memoria en lugar del efecto de la
disminución del recuerdo.
-
~L-------------~I~nv~e_st_ig~a_c_ió_n_c_u_an_t_it_a_ti_va__en~p~si~co~lo~g~ía~-------------------

Validez de constructo
Si un sistema de medición tiene una validez de constructo elevada, evalúa bien algún cons-
tructo teórico. En realidad, muchos sistemas que utilizan los psicólogos evalúan entidades
teóricas, como la inteligencia o la extraversión. A fm de verificar la validez de constructo de
un sistema de medición es necesario hacer explícito el constructo. Éste suele ser el punto
en que una definición psicológica empieza a diferir de una definición de lego sobre el mis-
mo término, pues el uso que le da quien no es psicólogo resulta demasiado impreciso. Ello
no significa que los psicólogos estarán de acuerdo con la definición. Por ejemplo, según cier-
tos psicólogos, las pruebas de IQ prueban la inteligencia, mientras que otros aseveran sim-
plemente que las pruebas de IQ prueban lo que las pruebas de IQ prueban.
Es posible proporcionar hechos adicionales sobre la validez de constructo si el sistema
de medición muestra tanto vínculos con pruebas de constructos relacionados -que conver-
gen con ellos (validez de constructo convergente)- como una diferencia con los sistemas
de medición de constructos no relacionados -divergente de ellos (validez de constructo
divergente).

Convergencia. Por ejemplo, si creemos que la inteligencia es una habilidad general y he-
mos diseñado un sistema de medición numérico de ella, nuestras mediciones deben producir
un patrón similar al de las pruebas de inteligencia verbal.

Divergencia. Si hemos desarrollado un sistema de medición de capacidad de lectura, no


quisiéramos que produjera una pauta muy similar a la generada por una prueba de inteli-
gencia: si fuera demasiado parecida, sugeriria que nuestra nueva prueba simplemente fue
de inteligencia.

Validez de contenido
Validez de contenido se refiere al grado en que una medida abarca toda la gama de com-
portamiento de la habilidad que se mide. Por ejemplo, si diseñamos un sistema de medición
de destreza matemática, tendría baja validez de contenido si comprendiera sólo medicio-
nes de la capacidad para sumar. Una forma de comprobar la validez de contenido de un siste-
ma de medición estriba en preguntar a los expertos del campo si cubre todo lo que esperan. No
obstante, vale la pena comprobar si ciertos aspectos de un sistema de medición son redun-
dantes y pueden omitirse porque miden lo mismo. Siguiendo con el ejemplo de las mate-
máticas, si pudiera mostrarse que la habilidad para sumar indica la pericia para realizar con
éxito formas más elevadas de matemática, entonces no hay necesidad de incluir el conte-
nido completo de los cálculos matemáticos en el sistema de medición de la destreza mate-
mática. Por tanto, podría idearse un sistema de medición más corto y rápido.
_j¡--29
.. __s_e_ta~p_a_s~p_re_l_im_,_·n_a_re_s_d_e_l_a_in_v_e_s_
______________________La ti~
ga_c_io_
·n____________

Validez de cr;terio
La validez de criterio aborda la cuestión de si un sistema de medición satisface ciertos prin-
cipios. En general, esto significa que debe producir una pauta similar a la de otro sistema
de medición. Hay dos tipos de criterios que pueden considerarse: concurrente y predictivo.
Validez concurrente. Un sistema de medición tiene validez concurrente si produce un re-
sultado similar al de un sistema existente que se toma más o menos al mismo tiempo. Por
tanto, si diseño una prueba de inteligencia, puedo comprobar su validez concurrente si ad-
ministro una prueba establecida de inteligencia al mismo tiempo.
Este procedimiento depende evidentemente de un sistema de medición preexistente y
válido contra el cual puede comprobarse la validez del nuevo sistema. Ello plantea la pregun-
ta de por qué se desearía otra prueba de lo mismo. En varias situaciones se requeriría una
prueba diferente. Una razón común es el deseo de producir un sistema de medición cuya
administración precise de menos tiempo y que resulte menos oneroso para los participan-
tes; es más probable que la gente permita que se le mida si la tarea se realiza más rápido.
Otra razón para diseñar un sistema de medición adicional al existente es que habrá de ad-
ministrarse de manera distinta de la originaL Supóngase que el sistema preexistente se uti-
lizaba en entrevista personal, como -la efectuada por un psiquiatra, y ahora se pretende usarlo
cuando el investigador no está presente (como en un cuestionario). Como alternativa, -se
tiene la necesidad común de un sistema de medición que pueda aplicarse a un grupo de ma-
nera simultánea, en lugar de hacerlo de modo individuaL
Validez predictiva. Un sistema de medición tiene validez predictiva si vaticina correcta-
mente algún estado de las cosas. Por tanto, si se ideó un sistema de medición de aptitud aca-
démica, podria utilizarse para seleccionar aspirantes a la universidad. El sistema tendria
buena validez predictiva si las calificaciones que proporciona pronostican el grado alcanza-
do por los estudiantes.
Con ambos tipos de validez se necesita comprobar que no existe contaminación del
criterio, lo cual significa que quienes proporcionan los criterios deben desconocer los re-
sultados de las mediciones. Si un psiquiatra o un maestro conocen los resultados de la me-
dición, ello podría afectar la manera en que tratan a las personas cuando toman sus propias
mediciones. Tal efecto sugeriría que el sistema de medición tiene validez de criterio mejor
que la real.

Efectos de piso y de t echo


Hay dos fenómenos por evitar al elegir un sistema de medición; ambos suponen la restrié-
ción del rango de posibles puntuaciones para los participantes. Efecto de piso significa que
éstos no pueden lograr una puntuación inferior a cierto punto; por ejemplo, un sistema de
medición de la edad de lectura carente de una edad inferior a siete años. El efecto de techo
---
~~---------------l_nv_e_s_ti~ga_c_io_
'n_c_u_a_nt_it_a_tl_·v_
a _e_n~p_si_co~.l_og~í_a____________________

ocurre cuando no pueden conseguirse puntuaciones superiores a un nivel particular, como


cuando se da una prueba de IQ a quienes muestran rendimiento superior. Los efectos refe-
ridos ocultan diferencias entre individuos y pueden evitar que se detecten cambios. En con-
secuencia, quizá la habilidad de lectura de un niño mejoró, mas si aún se encuentra debajo
del nivel de un pequeño de siete años, la prueba no detectará el cambio.
Una vez elegida el área de investigación. el método, el diseño, la hipótesis y el siste-
ma de medición por usar en el estudio, se necesita escoger un método de análisis.

Elección del análisis


Del capítulo 9 al 22 se describen varios tipos de análisis. Modos particulares se antojarán
apropiados para tipos específicos de sistemas de medición y para diseños parttculares. Una
práctica valiosa consiste en decidir cuál forma de análisis empleará antes de recolectar los
datos. Ello le evitará la compilación tanto de los que no puedan analizarse de maneras que
satisfarían su hipótesis como de los que no examinará. Hay una tentación. sobre todo entre
estudiantes, de tomar diversas mediciones sólo para eliminar varias cuando se llega a la eta-
pa de análisis Una ,·entaja adicional de la planeación del análisis se hará más clara en el
capítulo 18, donde se demostrará que la hipótesis tendrá más posibilidades de hallar respal-
do si el análisis se planea.
En el capítulo 13 se advierte que conocer el tipo de análisis por emplear le proporcio-
nará un medio de elegir un tamaño de muestra apropiado.

Elección de los participantes: la muestra


A continuación debe elegir a quiénes va a estudiar. Hay dos factores por considerar al res-
pecto: primero. las características de los participantes y. segundo. su número. La respuesta
de la primera cuestión depende del objeti,·o de su estudio. Si investiga una población espe-
cífica porque desea relacionar los posibles resultados con el conjunto de donde proviene la
muestra, requerirá una muestra representativa. Por ejemplo. tal vez quiera explorar el efec-
to de diferentes tipos de máquinas tragamonedas en el comportamiento de apuesta de los
adolescentes que juegan de manera regular. En este caso, tendría que definir el término
apostador regular (diseñar una definición operativa) y luego tomar una muestra de un con-
junto de personas adecuadas a su definición. de modo que tendría una muestra representa-
tiva del rango de edad, nivel de comportamiento de apuesta y cualquier otra variable que
considere relevante. En el capítulo 11 se exponen métodos para tomar muestras.
Con frecuencia. los investigadores que emplean un método experimental se interesan
por la población más amplia de todas las personas y desean formular generalizaciones que
se refieran a la gente en general más que a una subpoblación en particular. Éste puede ser un
método inocente, pues tal vez conduzca a que la muestra quede integrada por quienes
- ______________________L_a_s_e_
ta~p_a_s~p_re_l_im_l_·n_a_re_s_d_e_l_a_in_v_e_s_ti~ga_c_io_'n____________~¡--31

estaban más disponibles para los investigadores. lo cual suele significar estudiantes universi-
tarios de psicología. Sin embargo, aun en esa muestra restringida hay casi siempre el intento
de asegurarse de que los hombres y las mujeres estén representados de manera equitativa.
El número de participantes que utilice en un estudio depende del diseño que emplee al
menos por tres razones. La primera probablemente consista en la naturaleza de sus sujetos,
la cual es una directriz práctica. Si estudia una población especial, digamos, personas con
un tipo especial de daño cerebraL el tamaño de la muestra estará restringido a su disponi-
•• bilidad. Un segundo aspecto práctico estriba en el deseo de los participantes de tomar parte
en el trabajo; cuanto más onerosa sea la tarea, menores colaboradores obtendrá. Una terce-
ra guía puede hallarse en las estadísticas que empleará para el análisis respectivo. Como se
verá en el capítulo 13, es posible calcular cuántos participantes necesita para un diseño deter-
mmado con el propósito de dar a la investigación la oportunidad de respaldar su hipótesis si
resu lta correcta. No hay razón para reducir la probabilidad de dar sustento a una hipótesis
correcta si usa muy pocos sujetos. De igual forma. utilizaría una muestra innecesariamen-
te grande si no calcula cuántos de ellos requiere su diseño.

El procedimiento
El procedimiento es la manera en que se lleva a cabo el estudio; cómo se toman las deci-
siones de diseño. Ello incluye lo que se dice a los participantes. lo que éstos realizan, en
qué orden lo hacen y si se practica un análisis posterior con ellos (consulte el capítulo 1).
Cuando hay más de un investigador o si quien realiza el estudio no lo diseñó, es me-
nester que las personas que tratan con Jos participantes tengan claro el diseño y las necesi-
dades de ejecutarlo de la misma manera. Al efecto, ayudaría que se tuvieran instrucciones
estandarizadas para los investigadores y los sujetos.
Con frecuencia, los investigadores neófitos se preocupan porque tener varios colegas
en un proyecto puede invalidar los resultados, debido, en primer lugar, a que son diferen-
tes personas y, en segundo, a que cada investigador puede probar a los sujetos en un lugar dis-
tinto. Si tales variaciones no cambian sistemáticamente con los aspectos del diseño, esto no
supondrá un problema; si acaso, fortalecerá el trabajo. Un ejemplo de variación sistemá-
tica sería que un investigador sólo probara gente en una condición del estudio o un tipo de
persona, como nada más varones. En esas circunstancias, cualquier resultado sería una con-
secuencia de tales limitaciones. Sin embargo, si se erradicaron los problemas potenciales,
habrá resultados más generalizables a otras situaciones que lo conducido por un investiga-
dor en un lugar.
Por último, independientemente del método que se emplee en la investigación es im-
portante realizar un estudio piloto.
~L---------------'~n_ve~s_ti~ga~c~io~·n_c~u~a_n~ti~ta~tl_·v~a~e~n~p~si~c~ol~o~gí~a____________________
-
Estudios piloto
Un estudio piloto es cierto ensayo del estudio que debe efectuarse en una muestra más pe-
queña de la que se utilizará en la versión final de la investigación. Independientemente del
método que adopte, resulta esencial un estudio piloto previo, cuyo propósito estriba en
comprobar que los aspectos básicos del diseño y el procedimiento funcionen. Por tanto, de-
seará saber si los participantes comprenden las instrucciones que se les dictan y si su sistema
de medición tiene validez patente o, en su caso, si la historia para encubrimiento que utili-
za parece plausible. En un experimento estará comprobando que los aparatos funcionen co-
mo se pretendía y que los sujetos puedan utilizarlos. Por último, puede formarse una idea
de cuánto tiempo tarda el procedimiento con cada participante de modo que puede indicar
a las personas el tiempo que se les requerirá, cuando les pida que tomen parte, y permitir
tiempo suficiente entre uno y otro. Resulta muy útil un análisis posterior con la gente que par-
ticipe en el estudio piloto, pues sus ideas acerca de éste contribuirán a revelar cualquier falla,
incluidas posibles características de demanda.
Sin la información obtenida de un estudio piloto, podría presentársele un dilema si des-
cubre fal las durante la investigación: modificar el diseño a media tarea o seguir adelante
sin importar la deficiencia. El cambio del diseño durante el proyecto significa desde luego
que quizá no se trate igual a los participantes en las mismas condiciones. Ello representa la
adición de una fuente extra de variación en los resultados, lo cual plantea un problema para
la interpretación. Por otra parte, continuar con un diseño que sabe presenta inconsistencias
es simplemente una pérdida de tiempo para usted y los sujetos. Evítese dicho dilema: efec-
túe un estudio piloto.
Resulta particularmente importante practicar un estudio piloto cuando utiliza un siste-
ma de medición que ha diseñado, como en un cuestionario o en diseños donde se precisa
capacitación en la toma de mediciones. En los capítulos 5 y 7, dedicados al planteamiento
de preguntas y a observaciones, describiré cómo efectuar los estudios piloto requeridos para
esos métodos.
El estudio piloto debe emprenderse en un número pequeño de personas de la población
objetivo. No tiene mucho caso comprobar si el diseño funciona con individuos de una po-
blación distinta de la correspondiente a la muestra. Como en la mayoría de los casos, no
debe utilizar a tales sujetos otra vez en su estudio principal. El número que use estará de-
terminado por la disponibilidad de participantes de su población. Por tanto, si la población es
pequeña o si tiene acceso limitado a miembros de ella (por ejemplo, gente que nació con
ceguera total), podría elegir sólo a dos o tres en el estudio piloto. No obstante, se preferirá
que pruebe cada condición requerida por el estudio.
En el capítulo 13 se describe también una ventaja adicional del estudio piloto: le ayu-
dará a decidir el tamaño apropiado de la muestra para su estudio principal.
Después de completar dicho estudio puede introducir cualquier modificación indispen-
sable en el diseño y luego emprender la versión final del estudio.

_____ r~
______________________L_a_s_e_ta~p_a_s~p_re_l_im_T_·n_a_re_s_d_e_l_a_in_v_e_st_i~ga_c_io_'n____________~¡-:33

Resumen
Antes de emprender un proyecto de investigación estrechará su campo a un aspecto espe-
cífico del área elegida. Puede apoyarse leyendo trabajos anteriores de ese ámbito y tal vez
mediante charlas con expertos en la materia. Tiene que elegir uno de los métodos descritos
en el capítulo 1, un diseño de los referidos en el capítulo 4 y el sistema o los sistemas de
medición por aplicar durante la tarea, así como comprobar que éstos son confiables y váli-
dos. Ha de seleccionar a quién estudiará. lo cual depende en parte del método que emplee.
Por último, debe practicar un estudio piloto de su diseño. Una vez que haya tomado esas
decisiones y completado el estudio piloto, estará listo para llevar a cabo la versión final de
su investigación.
En los dos capítulos siguientes se considerarán aspectos de las variables participantes
en la investigación psicológica y los diseños más comunes empleados al respecto. Además,
se explicará la importancia de comprobar si cualquier hallazgo de un proyecto de investi-
gación que emplea un diseño específico puede generalizarse a personas y ambientes distintos
de los usados en el estudio y si puede afirmarse que ciertos diseños identifican las relacio-
nes de causa y efecto en él.

••

*
--

3
Las variables y la validez
de los diseños de investigación

Introducción
En el presente capítulo se describirán los tipos de variables que intervienen en una investi-
gación. Luego se explicará por qué los psicólogos necesitan considerar los factores de su
estudio que determinan si es posible generalizar los hallazgos a situaciones que rebasan el al-
cance de su trabajo original. Se explorarán entonces los aspectos de la investigación por
considerar cuando se abordan las causas de la conducta humana. Por último, se analizará có-
mo se formulan hipótesis.

Variables
Las variables son entidades que pueden tener más de un valor. Los valores no tienen que
ser forzosamente numéricos. Por ejemplo, la variable género puede tener el valor masculi-
no o femenino.

Variables independientes
Una variable independiente (VI) es la que se considera que puede afectar a otra. Por ejem-
plo, si creo que la edad influye en la inteligencia, la trataré como una VI con efectos so-
bre la variable inteligencia.
En experimentos, una VI es la que los investigadores han manipulado para ver sus efec-
tos sobre otra variable. Por ejemplo, en un estudio que compara tres métodos para enseñar

34
_________________L_as_v_a_r_ia_
b_le_s~y_la__va_l_id_e_z_d_e_lo_s_d_i_se_ñ_o_s _d e__in_v_es_t~ig~a_ci_ó_
n ______~¡-35

a leer se instruye a los niños a reconocer palabras de vista (el método de palabra comple-
ta), a aprender a reconocer el sonido de partes de una palabra común a varias de ellas (el
método fonético) o por una combinación de ambos métodos. En el caso de referencia, se
ha manipulado la VI (método de enseñanza) que tiene tres valores posibles en el estudio:
palabra completa, fonético o mixto. A los investigadores les interesa saber si la enseñanza
del método tiene algún efecto en la variable habilidad de lectura, es decir, si diferentes mé-
todos de enseñanza producen desempeños distintos en la lectura.
El término nivel se utiliza para describir uno de los valores que una VI toma en un estu-
dio concreto. Por tanto, en el estudio anterior, la VI (método de enseñanza) tiene tres nive-
les: palabra completa, fonético o mixto. Por otra parte, en un estudio que compara hombres
y mujeres. la VI (género) cuenta con dos niveles: masculino y femenino.
Con el término condición se describe cierto nivel de una VI. El estudio anterior de mé-
todos de enseñanza tiene una condición de palabra completa, una fonética y una mixta.
Las VI son de dos tipos básicos, fijas o aleatorias, según la manera en que se seleccio-
nan los niveles de la variable.

Variables fjjas
En una variable fija, el investigador ha elegido los niveles específicos por utilizar en el estu-
dio. Por consiguiente, en el experimento sobre la lectura la variable (métodos de enseñan-
za) es fija.

Variables aleatorias
Una variable aleatoria es una donde se han seleccionado aleatoriamente sus niveles entre
un conjunto mayor de niveles posibles. Por tanto, si tuviera una lista completa de todos los
métodos posibles para la enseñanza de la lectura y hubiera elegido tres al azar para incluir-
los en el estudio, ahora el método de enseñanza sería una variable aleatoria.
Resulta poco probable que quisiera elegir al azar los métodos de enseñanza; el siguien-
te es un ejemplo más apegado a la realidad. Supongamos que me interesa saber el efecto
de escuchar cintas de relajación de diferente duración sobre los niveles de tensión. En el
estudio, la duración de la cinta sería una VI, cuyos niveles puedo elegir de dos maneras.
Primero, puedo decidir que tengan una duración de 5, 10, 15 y 30 minutos. La duración de
la cinta sería entonces una VI fija. Otra posibilidad es que elija al azar cuatro duraciones
entre 1 y 30 minutos. Esto daría una VI aleatoria.
La decisión de utilizar variables fijas o aleatorias tiene dos consecuencias. En primer
lugar, el uso de una fija evita que los investigadores traten de generalizar a otros niveles
posibles de la VI, mientras que el empleo de una aleatoria permite más generalización. En
segundo lugar, el análisis estadístico puede verse afectado por el uso de una variable fija o
aleatoria.

-
~L_______________I_nv_e_s_
t i~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_
co_l~
og~í_a____________________

Variables dependientes
Una variable dependiente (VD) es aquella donde una independiente puede tener un efecto,
es decir, el valor de la VD depende del nivel de la VI. Por tanto, en el estudio de la lectu-
ra, una medida de la habilidad para leer sería la variable dependiente, mientras que en el
experimento de las cintas de relajación, una medida de la tensión sería la dependiente. Ob-
serve que en cada uno de estos ejemplos la VD es la medición proporcionada por los par-
ticipantes en el estudio: una calificación de lectura o una de tensión.

Otros tipos de variables


En cualquier estudio hay numerosas variables posibles. Algunas serán parte del estudio como
variables dependientes o independientes. Sin embargo, hay otras que los investigadores ne-
cesitan considerar.

Variables de confusión
Algunas variables afectan la relación entre las VI y las VD que se buscan; se denominan
de confusión. Por ejemplo, en el estudio de métodos de enseñanza, tal vez diferentes pro-
fesores han tomado gmpos distintos. Si los instmctores tienen diversos niveles de habili-
dad en la enseñanza de la lectura, entonces cualquier diferencia en la habilidad de lectura
entre los niños en los tres procedimientos referidos puede obedecer a las habilidades del
personal docente y no a éstos.....Por tanto, la habilidad de los profesores es una variable de
confusión. En el estudio de relajación podría suceder que quienes reciben la cinta de ma-
yor duración estén inherentemente menos relajados que los que reciben la más corta y es-
to enmascararía cualquier mejora debida al hecho de escuchar una cinta más larga. En tal
caso, el nivel de tensión inicial del participante es una variable de confusión.
Hay maneras de tratar de reducir los efectos de las \'ariables de confusión; muchos de
los diseños descritos en el capítulo siguiente se desarrollaron con tal objetivo.

Variables irre levantes o ajenas


Por fortuna, muchas de las variables presentes en un estudi0 no afectarán la VD; no poseen,
por tanto, relevancia para el estudio y no han de controlarse. Por ejemplo, es poco proba-
ble que la vestimenta del profesor repercuta en la habilidad de lectura de los niños. No obs-
tante, los investigadores considerarán cuáles variables son relevantes y cuáles no. En otro
estudio, digamos sobre obediencia, lo que el experimentador Yista puede influir en ésta.
Se ha criticado a los investigadores por suponer que ciertas variables son irrelevantes.
Como observó Sears ( 1986), se utiliza con frecuencia a los estudiantes universitarios de
p - -

_________________L_as_v_a_r_ia_b_Le_s~y_la__ in_v_es_t~ig~a_ci_ó_n______~¡-37
va_l_id_e_z_d_e_lo_s_d_i_se_ñ_o_s_de__

psicología como participantes en experimentos. Hay riesgos en la generalización de los


hallazgos de éstos a la demás gente, a los no estudiantes de la misma edad o incluso a esco-
lares que no cursan psicología.
Además, se ha sugerido que el inYestigador no debe ser tratado como una variable irre-
levante (Bonge, Schuldt y Harper, 1992). Es muy probable. sobre todo en experimentos de
psicología social, que aspectos de aquél repercutan en los resultados del estudio.

La validez de los diseños de investigación


El objetivo final de una pieza de investigación puede ser establecer una conexión entre una
o más VI y una VD, así como generalizar los resultados obtenidos entre los participantes
específicos en el estudio a otros grupos. Ningún áiseño lo logrará de manera perfecta. Se
debe conocer la validez del diseño para los objetivos concretos del trabajo respectivo. Hay
dos tipos principales de amenazas a la validez del diseño: amenazas a lo que se denomina
validez e.:rterna y valide= interna.

Validez externa
Por valide=externa se entiende la posibilidad de generalizar los hallazgos de una investi-
gación. Hay similitudes entre este tipo de validez y la ecológica. En dos áreas importantes
la posibilidad de generalización podría ser cuestionable. En primer lugar, puede haber du-
da sobre el grado en que las condiciones concretas del estudio permiten generalizar sus re-
sultados a otras circunstancias (las tareas requeridas de los participantes, el ambiente en
que tuvo lugar el trabajo o el tiempo en que se llevó a cabo éste). En segundo sitio, podemos
poner en duda si aspectos de los participantes permiten que los resultados de un estudio se
generalicen a otras personas (si son representativos tanto del grupo de que provienen como
de un conjunto más amplio).

Amenazas a la validez externa


Condiciones particulares del estudio
Tarea. Los investigadores deben tomar decisiones relativas a aspectos de su estudio, lo
cual puede limitar la posibilidad de generalizar los hallazgos. Por ejemplo, en un experi-
mento sobre reconocimiento de rostros, quienes lo conducen presentarán las fotografias por
un lapso determinado. Sus descubrimientos son válidos sólo para el periodo de exposición
a los retratos. Una crítica adicional consiste en que con presentar fotografias bidimensio-
nales y estáticas no s·e imita el reconocimiento de una persona en la calle: ¿la tarea es eco-
lógicamente válida?
~~--------------~ln_v~e~st~i~g a~c_ió~n_c~u~a_n_ti_ta_t_iv_a_e_n~p~s_ic~o_lo~g~ía~--------------------

Ambiente. Muchos experimentos se realizan en un laboratorio y, por tanto, puede estar en


tela de juicio su generalización a otros ambientes. Sin embargo, no sólo la investigación de
laboratorio puede tener una posibilidad limitada de generalización respecto al entorno
donde se realiza. Por ejemplo, tal vez un psicólogo clínico ha desarrollado una manera de
reducir el miedo de la gente a las arañas haciendo que escuche cintas de audio de una voz
tranquilizadora que habla acerca de éstas. Que haya resultado eficaz en el consultorio del
psicólogo no significa necesariamente que lo será en cualquier otro lugar.

Tiempo. Algunos fenómenos pueden verse afectados por la hora del día; por ejemplo, jus-
to después de comer. En tal caso, si se condujo el estudio sólo a esa hora, los resultados no
se generalizarían a otros horarios. Una posibilidad más estriba en que un estudio previo podría
producir resultados válidos en su momento, pero que dejan de ser generalizables debido a
los acontecimientos subsecuentes. Por ejemplo, las primeras investigaciones donde se some-
tía a la gente a privación sensorial revelaron que ésta se hallaba demasiado perturbada. Sin
embargo, con el advenimiento de la exploración de experiencias místicas, los participantes
empezaron a disfrutar la práctica, que se ha utilizado desde entonces con fines terapéuticos
(véase Suedfeld, 1980).

Características de los participantes


Quizá el investigador desee generalizar de los participantes particulares de su trabajo (la
muestra) al grupo de que provienen (la población). Por ejemplo, tal vez un estudio acerca
de la vida de los estudiantes se ha llevado a cabo con una muestra seleccionada de gente
que estudia un determinado tema en cierta universidad. A menos que la muestra sea una re-
presentación adecuada del grupo de que se seleccionó, hay limitaciones en la generaliza-
ción de cualquier hallazgo al conjunto más amplio.

Generalización a otros grupos


Como se mencionó, que la investigación sea generalizable legítimamente a escolares que es-
tudian el tema en tal universidad no significa que lo sea también a otros que lo estudian en
otra institución, a los que estudian temas distintos o incluso a los que no son estudiantes.
Muchas características de los participantes (por ejemplo, edad, género, nivel educati-
vo y ocupación) pueden tener relevancia para los hallazgos de una pieza particular de in-
vestigación.
Los experimentos de laboratorio son particularmente vulnerables a la crítica sobre su va-
lidez externa porque no suelen tratar a los participantes como representativos de la gente en
general. Sin embargo, tal vez el objetivo de los investigadores no consista en generalizar si-
no sólo en establecer la existencia de cierto fenómeno . Por citar un caso, pueden explorar

r
_________________L_as_v_a_n_·a_b_le_s~y_la__
va_l_id_e_z_d_e_lo_s_d_is_e_ñ_os__ in_v_
de__ es_t~ig~ac_i_ón________~¡-39
l
si la gente toma más tiempo en reconocer caras presentadas de cabeza que en el sentido co-
rrecto. No obstante. deben estar conscientes de las posibles limitaciones de generalizar de
la muestra a otras personas.

Mejoramiento de la validez externa


Las dos maneras principales de mejorar la validez externa son la réplica y la selección cui-
dadosa de los participantes. ·

Réplica
Réplica es el término utilizado para describir la repetición de una pieza de investigación.
Las réplicas, que pueden realizarse en el mayor número de condiciones originales, ayudan
a saber si los hallazgos originales fueron únicos y resultado de sucesos aleatorios, pero sir-
ven de poco para mejorar la validez externa. Esto se apoya por réplicas que varían del estu-
dio original en algún aspecto. Por ejemplo, si se incluyen participantes de edad distinta o
si se usa un nuevo ambiente. De obtenerse resultados similares. aumentarán las posibilida-
des de generalización .

Selección de participantes
Hay varias formas de seleccionar participantes; se tratan con m~or detalle en el capítulo
11. Por el momento, baste apuntar que la selección aleatoria de participantes del grupo más
amplio que representan ofrece el mejor caso para la generalización al conjunto más amplio.
Así disminuye la probabilidad de que se tenga una muestra sesgada, pues cada elemento de
un grupo más vasto tiene la misma probabilidad de ser elegido. Definiré el azar de mane-
ra más completa en el capítulo referido, pero vale la pena mencionar ahora lo que no es el
azar. Si selecciono a las primeras 20 personas que encuentro en el comedor de la universi-
dad, no he conseguido una muestra aleatoria sino una de oportunidad (mi muestra es repre-
sentativa sólo de quienes van al comedor, a esa hora en particular y en ese día).

Validez interna
La validez interna es el grado en que un diseño demuestra con éxito que los cambios de
una VD obedecen a Jos de una VI. Por ejemplo, tal vez encuentre un vínculo entre ver te-
levisión y exhibir un comportamiento violento, de modo que quienes pasan mayor tiempo
frente a ella son más agresivos, y desea descubrir si mirar programas violentos toma violen-
ta a la gente. La validez interna tiende a ser más problemática en la investigación cuasiex-
lil-
perimental, donde no cabe asignar al azar participantes a diferentes condiciones, o en la no
a:.:
'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
~~----------------ln_v_e_st_i~ga_c_io_

experimental, donde no se ha manipulado una VI sino que sólo se observó cómo se rela-
cionan dos variables (como ver televisión y exhibir comportamiento violento).

Amenazas a la validez interna


Selección
La presencia de participantes en diferentes niveles de una VI puede confundirse con otras va-
riables que afectan el desempeño en la VD. Un estudio acerca de la televisión y la violencia
exploraría una relación que ocurre de manera natural entre ver televisión y exhibir un com-
portamiento agresivo. En otras palabras, la gente se encuentra en distintos niveles de la VI,
mirar televisión, a partir de sus hábitos de observación, en lugar de que un investigador
la haya asignado de manera aleatoria a diferentes niveles. Se corre el riesgo de que varia-
bles adicionales influyan en el comportamiento violento; por ejemplo, si quienes tienen habi-
lidades sociales más deficientes observan más televisión. Por tanto, las habilidades sociales
deficientes llevarían a ver televisión durante más tiempo y a exhibir un comportamiento
más agresivo, pero los investigadores sólo pueden notar la conexión entre la televisión y la
violencia.

Maduración
Estudios que buscan un cambio con el tiempo en la VD, en los mismos participantes, en-
trañan el peligro de que haya ocurrido alguna otra modificación para éstos que también influ-
ya en dicha variable. Imagine que los psicólogos han establecido que hay un vínculo entre
la observación de la televisión y la violencia. Idean un programa de capacitación para re-
ducir la agresividad, lo implantan y luego valoran los niveles de violencia entre su muestra.
Encuentran que tal conducta se ha reducido con el tiempo. Sin embargo, han fallado en notar
que otros cambios ocurridos quizá influyeron en la reducción. Por ejemplo, varios partici-
pantes han encontrado amigos y. aunque ahora miran tanta televisión como antes, se hallan
en menos situaciones en las que podrían ser violentos. Por tanto, se han enmascarado los
posibles efectos prolongados de la televisión y se sostiene falsamente que el programa de
capacitación tuvo éxito.

H;stor;a
Tal vez un evento fuera del control de los investigadores produjo un cambio en la VD. A
consecuencia de la inquietud pública por el nexo entre televisión y violencia, es posible que
los ejecutivos de dicho medio hayan decidido modificar la programación y censurar los seg-
mentos agresivos. Una vez más. cualquier cambio del comportamiento violento se debería
p 0:

_________________L_as_v_a_n_·a_b_le_
s ~y_la__
va_l_id_e_z_d_e_lo_s_d_is_e_ñ_os__ in_v_es_t~ig~ac_i_ón________~¡-41
de__

a tales alteraciones, más que a cualquier manipulación de los investigadores. David Duo-
can (comunicación personal) encontró un ejemplo de los efectos de la historia cuando una
organización lo llamó para reducir el número de personas que abandonaban su empleo.
Ideó un programa que se implantó y descubrió que la rotación de personal se redujo. Sin
embargo, se dio cuenta de que durante el mismo tiempo la tasa de desempleo había aumen-
tado y que quizá ello afectaba los deseos de la gente de dejar el trabajo o su capacidad para
encontrar otro empleo.

Instrumentación
Si Jos investigadores miden las variables más de una ocasión, los cambios de los resultados
de cada medición pueden deberse a los de los sistemas de medición, más que al fenómeno
que se mide. Éste es un riesgo particular si se usó un sistema de medición diferente (por
ejemplo, tal vez se haya empleado otro sistema de medición de la violencia porque se con-
sideró que era mejor que uno anterior).

Pruebas repetidas
Las respuestas de los participantes al mismo sistema de medición pueden cambiar con el
tiempo; por ejemplo, con la práctica pueden volverse exper.tos en la realización de una tarea.
También cambiarían su actitud ante el sistema de medición. Por ejemplo, quizá se vuelvan
más honestos acerca de los niveles de violencia en que participan. Por tanto, los cambios
percibidos entre dos ocasiones cuando se toman las mediciones tal vez no se deban a ma-
nipulaciones de los investigadores sino a la manera en que los participantes han reaccionado
al sistema de medición utilizado.

Mortalidad o mortandad
El del título es un término poco afortunado y se refiere a la pérdida de participantes en el
estudio. En un estudio, algunos de los sujetos originales no toman parte en etapas posterio-
res. Es posible que quienes lo dejaron compartan cietta característica relevante para la jnves-
tigación. En tal caso, puede crearse una impresión falsa de la relación entre las variables
independientes y las dependientes, o es posible que una real se enmascare. Por ejemplo, si
los miembros más violentos de una muestra abandonan el experimento, se crearía una falsa
impresión de decremento de la violencia en la muestra. De acuerdo con esto, siempre debe-
mos examinar las características de quienes abandonaron un estudio para ver si comparten
alguna de relevancia para éste.
~L_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_

Selección por maduración


nt_it_a_ti_va__e_
n~p_
si_
co_l_
og~í_
a ____________________
-
Dos de las amenazas a la validez interna descritas antes podrían funcionar en conjunto
y afectar los resultados de la investigación. Imagine que tiene dos grupos: uno que mira
muchas horas la televisión y uno que la observa poco. En un afán de controlar la selección,
igualó a los participantes con base en la cantidad de violencia que se permite. Resultan facti-
bles los cambios que afectan los niveles de violencia en un grupo y no en el otro y que esto
se confunda con la cantidad de televisión vista (por ejemplo, si quienes la ven más también
tienen más hermanos y aprenden de ellos comportamiento agresivo). Por tanto, su base de
selección puede introducir una variable de confusión, por lo cual un grupo cambiará de ma-
nera significativa con relación al otro, sin importar cómo se les trate en la. investigación.
Las cuatro amenazas siguientes a la validez interna se refieren a los diseños con más
de una condición y donde los miembros del grupo se ven afectados por la existencia de los de
otro grupo (contaminación entre los grupos).

Imitación (difusión de tratamientos)


Los participantes de un grupo aprenden de los de otro aspectos del estudio que influyen eri
sus respuestas. Por ejemplo, en el análisis de los efectos relativos de diferentes películas de
capacitación para mejorar la conciencia sobre el sida, quienes miraron una cinta pueden na-
rrar el contenido a los elementos del otro grupo.

Compensación
Quienes tratan con los participantes pueden socavar el estudio, sobre todo si no son los psi-
cólogos, por la manera en que tratan a los participantes de diferentes grupos. Por ejemplo,
tal vez los investigadores busquen comparar un grupo que recibe cierta capacitación con
otro que no la obtiene. Los profesores que trabajan con este último tal vez lo traten, porque
no se le está dando el programa de capacitación de forma que mejore de algún modo su de-
sempeño. Ello presentaría la tendencia a reducir cualquier diferencia entre los grupos debida
a la capacitación.

Rivalidad compensatoria
Esto ocurre si un grupo realiza un esfuerzo adicional para ser mejor que el otro (por ejem-
plo, en un estudio donde se comparan los efectos de diferentes condiciones de trabajo en la
productividad).
_________________L_as_v_a_n_·a_b_le_s~y_la__ in_v_es_t~ig~a-ci_ó_n______~¡-43
va_l_id_e_z_d_e_lo_s_d_i_se_ñ_o_s_de__

Desmoralización
Lo inverso de la rivalidad compensatoria sería si un grupo sintiera que está perdiendo y se
esforzara menos de lo que haría habitualmente. Ello disminuiría de modo artificial los re-
sultados de tales personas.

Regresión a la media
Como expliqué en el capítulo 2, la mayor parte de los sistemas de medición son imperfec-
tos, están sujetos a cierta cantidad de error y, por tanto, no son confiables del todo. En otras
palabras, es poco probable que produzca idéntico resultado dos veces; por ejemplo, si el IQ
de alguien se mide dos veces y la prueba de IQ no es perfectamente confiable, entonces es
probable que la persona produzca una calificación algo diferente en ambas. El fenómeno
estadístico llamado regresión a la media se refiere al hecho de que, si el sujeto obtiene una
puntuación superior a la promedio de su población, cuando se le mida la siguiente vez es
probable que sus puntuaciones se aproximen más a la promedio, mientras que quienes ob-
tienen puntuaciones inferiores a éste la primera ocasión también tenderán a obtener unas
más cercanas al promedio en la segunda. En consecuencia, quienes obtienen puntuacio-
nes superiores al promedio tenderán a mostrar una caída entre las dos mediciones; quienes
las obtienen inferiores al promedio tenderán a mostrar un aumento en la puntuación.
Si se seleccionan participantes para asignarlos a diferentes niveles de una VI a partir
de su puntuación en algún sistema de medición, los resultados del estudio pueden sufrir la in-
fluencia de la regresión de la media. Imagine un estudio sobre los efectos de impartir clases
extra a gente con bajo IQ. En ese estudio, los sujetos se seleccionan entre una población con
un rango nom1al de puntuaciones de JQ y de otra con un rango bajo. A una muestra de cada
población se le aplica una prueba de IQ y a partir de los resultados se forman dos grupos
con IQ similares, uno que incluye individuos con IQ bajos de la población de IQ normal y
otro que incluye personas con los IQ más altos entre la población de IQ bajos. Las mues-
tras se han igualado de acuerdo con el IQ de modo que los que se encuentran en el grupo
de IQ normal actúen como grupo control, que no recibe tratamiento; en tanto, quienes se
encuentran en la población de IQ bajo reciben clases extra. Luego se mide otra vez el IQ
de ambos grupos. Por la regresión a la media, el IQ promedio de la muestra de la pobla-
ción de IQ normal habrá crecido hacia la media de esa población, mientras que el de la
muestra de la población de IQ bajo habrá disminuido hacia la media de su población. Por
tanto, aunque las clases adicionales tienen efectos benéficos, la calificación promedio de
los grupos se habrá acercado más y podría sugerir al investigador incauto que las clases no
han sido provechosas.
~L--------------~I~nv~e=s~ti~ga~c~io~
·n~c~u=a~nt~it=a~ti~v~a~e~n~p~si~co~l~og~í~a____________________
-
Mejoramiento de la validez interna
Muchas de las amenazas a la validez interna pueden reducirse con un grupo control que
no recibe tratamiento alguno. De esta manera, cualquier cambio con el tiempo de una VD
ocurrirá en un grupo de tratamiento sólo si la VI afecta la dependiente. Las amenazas que
incluyen cierto tipo de contaminac~ón entre grupos necesitan un análisis posterior más mi-
nucioso entre los participantes y quienes realizan el estudio (como los maestros que implan-
tan un p2.qucte de capacitación). Donde sea posible, la asignación aleatoria de participantes
a condiciones distintas disminuirá Jos riesgos de que la selección y la selección por madu-
ración constituyan una amenaza a la validez interna.

La elección de la hi pótesis
Una hipótesis explícita o un conjunto de hipótesis suele probarse en experimentos y a me-
nudo en estudios que emplean otros métodos de investigación. Cuando las hipótesis se eva-
luarán estadísticamente, hay un modo formal de expresarlas y probarlas. El procedimiento
consiste en formar lo que se denomina hipótesis nula e hipótesis alterna. La hipótesis nu-
la se establece de forma que la manipulación de la variable independiente no tenga efecto
sobre la dependiente. Imagine que los investigadores comparan los efectos de dos técriicas
terapéuticas en el nivel de tensión de los participantes (escuchar una cinta de relajación y
hacer ejercicio). La hipótesis nula, a menudo simbolizada como H 0, probablemente será de
la forma: "No hay diferencia, después de la terapia, en los niveles de tensión de Jos parti-
cipantes que escucharon una cinta de relajación y los que hicieron ejercicio". La hipótesis
alterna (HA), el resultado predicho por los investigadores, se conoce también como hipóte-
sis del investigador, hipótesis e.'!:perimental (en un experimento) o incluso H 1, si hay más
de una predicción.
Los investigadores propondrán sólo una hipótesis alterna por cada nula, pero pueden
elegirla entre tres versiones posibles. La distinción básica entre nipótesis alternas radica en
si son direccionales o no direccionales. Una no direccional (o bidireccional) es la que no
predice la dirección del resultado. En el ejemplo anterior, la alterna no direccional cobra-
ría la forma: "Habrá una diferencia entre los niveles de tensión de los participantes que expe-
rimentaron los dos regímenes terapéuticos". Por tanto, esa hipótesis predice una diferencia
entre ambas terapias, pero no la que resultará más benéfica.
Una hipótesis direccional (o unidireccional). en este ejemplo, puede ser de dos tipos.
Por una parte, puede establecer que •·tos participantes que recibieron la terapia de relaja-
ción estarán menos tensos que quienes practicaron ejercicio". Por la otra, puede establecer
que "los participantes que practicaron ejercicio estarán menos tensos que quienes recibie-
ron la terapia de relajación". Dicho de otro modo. una hipótesis direccional no sólo esta-
blece que habrá una diferencia entre los niveles de la VI sino que predice la dirección de la
diferencia.
__________________ La_s v_an_·ab_les~y_la_va_lid_ez_de
__ in_ve_st~
lo_s_d_is_e_ño_s_d_e__ ~ a_ció_n . ~¡- 45
______

Parece extraño que, para probar una predicción, los investigadores tengan ·que estable-
cer no sólo la predicción sino también una hipótesis nula que va contra ella. La razón estriba
en que resulta lógicamente imposible probar que algo es verdadero si puede probarse que
es falso. Por ejemplo, si mi hipótesis consiste en que me gustan todos los sabores de whisky,
entonces sin importar la cantidad de los que haya degustado, aunque los haya probado to-
dos a la fecha, siempre existe la posibilidad de que el siguiente que beba no me agrade; y
el ejemplo bastará para desaprobar mi hipótesis. De acuerdo con esto, si las pruebas no res-
paldan la hipótesis nula, se tomarán como soporte de nuestra hipótesis alterna; no como
prueba de la hipótesis alterna, porque ésa nunca se habría obtenido; sólo la apoyaría.
En el capítulo 1O mostraremos cómo se utiliza la estadística para decidir si la hipóte-
sis nula o la alterna es lo más cercano a la verdad.

Resumen
A menudo, los investigadores manipulan las variables independientes en su estudio y ob-
servan las consecuencias de ello sobre las dependientes. Así, deben tener en cuenta otros
aspectos del experimento que pudieran inte1ferir los resultados obtenidos. Además, si desean
que sus hallazgos sean generalizables, considerarán la validez externa de sus diseños. Si
quieren explorar la relación causal entre la VI y la VD en su proyecto, tendrán en cuenta la
validez interna del diseño de su investigación. Quienes prueban una hipótesis explícita esta-
dísticamente tienen que formularla como hipótesis alterna y proponer una nula opuesta. La
investigación proporcionará entonces pruebas de que permitirá a los psicólogos elegir en-
tre las hipótesis.
En el capítulo siguiente se presentarán varios diseños de investigación y se señalará cómo
cada uno de ellos podría fallar en la satisfacción de los requisitos de validez interna. Sin
embargo, recuerde que ésta será un problema sólo si trata de establecer un vínculo causal en-
tre variables independientes y dependientes.
4
Diseños de investigación
y su validez interna

Introducción
En el presente capítulo se describirán diversos diseños empleados en investigación psico-
lógica y se definirán varios términos que se utiljzan para distinguirlos. Además, se porme-
norizarán versiones específicas de diseños y se evaluarán los problemas que evitan que cada
uno de ellos se utilice para responder si una variable dependiente recibe la influencia de las
independientes.
Las tres secciones del capítulo exigen un trato diferente. Debe leerse el resumen ini-
cial de los tipos de diseño y la terminología utilizada para distinguirlos antes de avanzar en
la obra. Sin embargo, el resto del capítulo, donde se dan ejemplos específicos de los illse-
ños, ha de tratarse más como referencia o en caso de que tenga mayor experiencia en in-
vestigación.

Tipos de diseños
Los diseños se clasifican de diversas maneras. Una consideración que debe guiar su elec-
ción del diseño y el sistema de medición será el análisis estadístico que empleará en los
datos. Es mejor tener claro esto antes de realizar el estudio, en lugar de descubrir más ade-
lante que tiene que hacer lo mejor que pueda con un mal diseño y con mediciones que no
le permiten probar sus hipótesis.
De acuerdo con lo anterior, elegí clasificar los diseños con base en los posibles objeti-
vos de la investigación y en el tipo de análisis que podría aplicarse a los datos derivados de

46
___________Dl_
·s_
eñ_o_s_d_e_i_n_ve_s_tl~
·g~a_
ci_ó_
n~y_s_u_v_a_li_
de_z_l_
·n_te_r_n_a_ _ _ _ _~¡--47

ellos. Así, habrá un vínculo entre los tipos de diseño y los capítulos dedicados a su expli-
cación. Los diseños presentan siete tipos básicos:

1. LSe toman mediciones de una sola variable en un individuo o en un grupo 'Por ejem-
plo, se mide el IQ de una persona o de un grupo. [ ales diseños deben utilizarse con
propósitos descriptivo~ la estadística desc1iptiva se aborda en el capítulo 9. Como al-
temativa,!!_ales diseños han de utilizarse para comparar a un individuo o grupo con
otros, como una población, para ver si son inusualesj En el capítulo 12 se trata este
tipo de análisis.
2. § e emplea una sola variable independiente (VI) con dos niveles y una dependiente
(VD)$ Estos diseños se utilizan para buscar 'diferencias en la VD entre los niveles
de la VI ~ Por ejemplo, cuando los investigadores comparan las habilidades de lec-
tura de niños a quienes se enseña con dos técnicas. En el capítulo 15 se presenta el
análisis de tal diseño.
3. ¡1e emplea una sola VI con más de dos niveles y una VD_,_: Se trata de una extensión
del tipo de diseño anterior, que podría incluir la comparación ·de las habilidades de
lectura de niños a quiénes se enseñó con tres técnicas. El análisis de tales diseños obra
en el capítulo 17.
4. ~terviene más de una VI y una so1a VQ~ Por ejemplo, cuando una VI es una espe-
cie de problema de razonamiento con tres niveles (verbal, numérico y espacial) y
una segunda VI es el género, con el número de-problemas resueltos como la VD.

-
Igual que con los diseños 2 y 3,@ s investigadores buscarían diferencias en la VD
entre los niveles de las VI.•En el capítulo 17 se explican tales diseños.
5. Una versión del diseño anterior se presenta cuandcU.?s investigadores tienen inte-
rés en descubrir cuán apropiado sería utilizar mediciones (tratadas como VI \como
desempeño escolar y motivación de los estudiantes, l.Para predecir el grado univer-
sitario (tratado como una VD) que alcanzarán ésto . El análisis de esta versión del
diseño se incluye en la segunda mitad del capítulo 20.

Los primeros cinco tipos de diseño suelen describirse como univariables porque contienen
una sola VD.

6. Los diseños utilizados para evaluar una relación entre dos variables.
6a. este diseño se describe como bivariable porque - evidentemente- incluye dos va-
riables, pero ninguna de ellas puede clasificarse necesariamente como VI o ~Por
ejemplo, cuando los investigadores buscan la relación entre el desempeño en el ba-
chillerato y en la universidad. El análisis del diseño está en el capítulo 19.
6b. §e trata fundamentalmente del mismo diseño, pero una de las variables se conside-
ra independiente (aunque no necesariamente se haya manipulado) y se utiliza para
'
~L________________In_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

predecir la otra, tratada como VD_JPor ejemplo, si los encargados de admisiones de


una universidad desean predecir, con base en el desempeño en el bachillerato, el de-
sempeño en dicho nivel académico. El análisis respectivo figura en la primera parte
del capítulo 20.
7. Por último,pay diseños multivariables con más de una VD. Por ejemplo, cuando se
- #

enseña a los ruños con más de un método de lectura y los investigadores miden
un conjunto de habilidades, como las de leer, deletrear y completar frases. En el ca-
pítulo 21 se ofrecen descripciones breves de tales diseños y las técnicas usadas pa-
ra analizarlos.
Los diseños de los tipos 5, 6 y 7 se describen con pormenores en los capítulos relaciona-
dos con su análisis. Todos los diseños por describir en el resto del capítulo se utilizan para
ver si un individuo difiere de un grupo o si los grupos difieren entre sí. Típicamente, ~on
los diseños se busca determinar si el grupo tratado de cierta manera es distinto de uno al
que se trata de otra roanera_:_lor lo general,los miembros de un grupo proporcionan una so-
la estadística de resumen (a menudo, un promedio para el grupo) que se usa para compa-
rar con otros grupos.,_, Este enfoque considera las variaciones entre individuos del mismo
grupo un tipo de error. 1 Varios f~ctores contribuyen a que los individuos del mismo grupo
obtengan calificaciones diferentes:
l. Diferencias individuales (por ejemplo, en habilidad o en motivación).
2. La confiabilidad del sistema de medición que se utiliza.
3. Diferencias en cómo se ha tratado a los individuos en la investigación .

._Cuanto mayor variación de las puntuaciones presentadas en los grupos, tanto menor proba-
bilidad de que se detecten diferencias entre ésto~ Por tanto, donde sea posible, tales fuentes
de variación se reducirán al máximo en los diseños. \Jn diseño eficiente es aquel donde
pueden detectarse diferencias genuinas entre grupos~ o obstante, los investigadores de-
sean evitar la introducción de variables de confusión que produzcan diferencias falsas entre
diversos tratamientos o que enmascaren las genuinas entre éstos. Algunos intentos por con-
trarrestar las variables de confusión en diseños pueden aumentar las diferencias individua-
les dentro de grupos, lo cual lleva a producir diseños menos eficientes.

Terminología
Como en muchas áreas de los métodos de investigación, proliferan los términos útiles para
describir diseños. Lo que complica las cosas al novato es que diseños similares se detallan

1 Véase en Danziger ( 1990) una explicación acerca de cómo los psicólogos llegan a adoptar ese enfoque.
p

_____________________D_is_e_
ño_s_d_e_i_n_ve_s_ti~
ga_c_io_·n~y~su_v_a_h_.d_
ez__
in_te_r_n_a__________~¡-49

de maneras diferentes en ciertos casos y que distintos autores se refieren de varias formas
a los mismos diseños. Pormenorizaré los términos comunes y luego trataré de apegarme a
un conjunto consistente.

Réplica
En el capítulo 3 mencioné que la réplica, utilizada por lo menos en dos sentidos en la in-
vestigación, puede significar una nueva práctica de un estudio. Sin embargo, con el término
también ~describen diseños donde se trata de la misma manera a más de un participant~.
En consecuencia, quizá en un estudio de diferentes enfoques de enseñanza se tenga a más
de un niño en cada grupo. De otra manera, los resultados de la investigación dependerían
excesivamente de las características particulares de la muy limitada muestra que se empleó.
La mayoría de los estudios supone algún tipo de réplica, pues ésta tieneJa ventaja de
que permite utilizar en un análisis la puntuación promedio de los participantes para esa con-
dició~Ello disminuye el efecto de la variación entre puntuaciones que se presenta por di-
ferencias entre personas que se encuentran en la misma condición. No obstante, en ciertas
situaciones la réplica puede mantenerse al mínimo porque la tarea para los sujetos resulta
onerosa o lenta o porque hay muy pocos participantes disponibles (por ejemplo, en un es-
tudio de pacientes con un tipo raro de lesión cerebral).

Asignación de participantes
La mayor variación en la terminología se da en las descripciones de cómo se ha empleado
a los participantes en una pieza de investigación. Como punto de partida utilizaré, a guisa
de ejemplo, un diseño con VI con dos niveles.

Diseños entre sujetos


Uno de los diseños más simples comprende~ selección de una muestra de personas y la
asignación de cada cual a alguno de los niveles de la V_DPor ejemplo, cuando se comparan
dos formas de enseñar a leer a los niños.
Tales diseños tienen gran cantidad de nombres:_grupos no relacionados, entre sujetos,
factoriales no pareados (en el caso de una VI con dos niveles) o incluso independientes.
Utilizaré el término entre sujetos. Estos diseños resultan basta cierto puntol!Eeficientes por-
que quizá la variación general entre las puntuaciones (dentro de grupos y entre ellos) sea
relativamente grande porque hay diferencias entre las personas de cada grupo y hay más
espacio para las diferencias individuale~
Los diseños referidos tienen la desventaja adicional de que los participantes de distintos
niveles de la VI pueden diferir de manera notori~ como cuando un grupo presenta una
~~--------------~l~nv~e~s~ti~ga~c~io~·n~c~u~a~nt~it~a~tl~·v~a~e~n~p~si~co~l~og~í~a____________________

ventaja que mejora su desempeño en la V.Q.1Por citar un caso, si los niños de un grupo
pertenecen de manera predominante a familias de clase media que estimulan la lectura,
podría significar que ese grupo tendrá una mejor actuación en una prueba de lectura, sin
importar el método de enseñanza empleado.
Las diversas maneras de evitar el peligro de confundir algún aspecto de los participantes
con la condición a que se asignan incluyen..._
el empleo de una base aleatoria para asignarlos a
grupo~Ello se preferiría si los investigadores desconocieran las habilidades de los sujetos,
pues les ahorraría aplicar una prueba antes de asignarlos. Con frecuencia, cuando se sabe
de características más evidentes, se opta por controlar de cierta forma el factor.
~n método de control no recomendable consiste en seleccionar sólo a personas con
cierto antecedente (por ejemplo, niños de clase media) para que participen en la investiga-
-'
ción. Un estudio de ese tipo tendría claramente limitada capacidad de generalización a otros
grupos; carecería de validez extern1J
Un enfoque más útil viene con el encabezado siguiente.

Bloques
La formación de bloques requierc\!_a identificación de los participantes con similitudes en
algún aspecto relevante y su integración en un subgrupo o bloque. Debe cerciorarse des-
pués que los miembros de un bloque se asignen aleatoriamente a cada uno de los niveles
de la VI en estudi2,¡ Los investigadores garantizan así que el mismo número de niños de los
grupos socioeconómicos experimentan todos los métodos de lectura.
~n modelo de la formación de bloques se presenta cuando individuos específicos se
igualan en un grupo a partir de una característic~ Por ejemplo, si se utiliza una puntuación
de edad de lectura para formar bloques de niños. La igualación se clasifica por lo menos en
dos tipos. ~ igualación de precisión requiere que se tengan subbloques de infantes con las
mismas edades de lectura, en un bloque, mientras que la igualación de rango supone que
los menores incluidos en cada bloque tengan edades de lectura similare~Los diseños de
bloque poseen mayor eficacia que los simples diseños entre sujetos porqueceuscan elimi-
nar la variabilidad debida al factor de formación,. Sin embargo, ~ecesitan un análisis algo
más complejo porque introducen una segunda VI: el bloque..:.)
Un problema con la igualación es que muchos factores pueden resultar significativos
para el estudio, de modo que1la igualación perfecta se vuelve dificil. Además, puede intro-
~ ~

ducir una etapa extra en la investigación: {hay que evaluar a los participantes en las variables
relevantes si aún no se cuenta con esa información,...Una manera de sortear este problema
consiste en aplicar la igualación extrema, donde la misma persona actúa como su propio
par. Se trata entonces de un diseño intrasujetos.
D_
______________________ is_en_
-o_s_d_e_l_
· n_ve_s_tl~
·g~a_
ci_ó_
n ~y_s_u_v_a_li_
d e_z_l_
·n_te_r_n_a__________~¡--51

Diseños intrasujetos
L§i._cada participante toma parte en ambos niveles de la VI, el diseño puede describirse co-
mo relacionado, pareado, de mediciones repetidas, intrasujetos o, según he llegado a oír
(y para mayor confusión), dependient:JSi se utiliza una VI con más de dos niveles, los tér-
minos preferidos tienden a ser intrasujetos o mediciones repetidas. Utilizaré intrasujetos
para describir tales diseños.
~e tipo de diseño plantea sus propios problemas, dos de los cuales son los efectos de
orden y los de acarreo ~

Efectos de orden. ~i el orden en que los participantes completan los niveles de la VI se


mantiene constante, pueden adquirir mayor práctica y, por tanto, desempeñarse mejor en
las tareas finales (un efecto de la práctica) o sufrir fatiga o aburrimiento a medida que el
estudio avanzaJ así, su desempeño empeorará con las últimas tareas (un efecto de fatiga).
De esta manera, cualquier diferencia entre niveles de una VI podría deberse a un efecto de
orden o, como alternativa, un efecto de orden encubriría una diferencia genuina entre tra-
tamientos.
Dos formas de contrarrestar posibles efectos de orden radican en a) determinar por azar
el orden de cada participante y b) alternar el orden en que realiza cada tarea, es decir, con-
trabalancear el orden . Algunos sujetos recorren los nive es· en un orden, y otros en uno
distinto . Un efecto negativo de los órdenes aleatorios y del contrabalanceo es que proba-
blemente introducirán más variación en las puntuaciones, pues se ha tratado diferente a per-
sonas en la misma condición; el diseño resulta menos eficiente. Sin embargo, esto puede
abordarse con uno de dos métodos sistemáticos que pueden verse como tipos de formación
de bloques: contrabalanceo completo o cuadrados latinos.

Contrabalanceo completo. Un ejemplo de contrabalanceo completo sería donde los inves-


tigadores desean comparar el número de palabras de una lista que se recuerdan después
de dos pausas de diferente duración: 5 y 30 segundos. Podrían formar a los participantes
en dos grupos de igual tamaño (bloques) y dar a un bloque una lista para que evoquen vo-
cablos tras un lapso de 5 segundos seguida por otra lista para recordarla luego de una de-
mora de 30 segundos. El grupo dos recibiría las condiciones de pausa en el orden de 30
segundos primero y 5 después. Este diseño introduce una segunda VI: orden. Por tanto ,
tenemos dos VI, una intrasujetos (demora antes de recuerdo) y otra entre sujetos (orden).
Los diseños con ambos tipos de VI se denominan de esquema mixto o dividido . Sin embar-
go, algunos autores y ciertos programas de cómputo los llaman mediciones repetidas, pues
tienen por lo menos una VI que supone éstas.
sz-lL_______________I~n~ve~s~ti~ga~c~io~·n~c~u~a~nt~it~a~tl~·v~a~e~n~p~si~co~l~og~ía~------------------
Cuadrados latinos. Trataré aquí, de manera breve, los cuadrados latinos. Sin réplica de
un orden, para cada cuadrado latino se requieren tantos participantes como niveles de la VI
haya. Por ende, para tres niveles de una VI se necesitan tres sujetos. Por ejemplo, si se com-
paran los efectos de tres condiciones de pausa diferentes (5, 10 y 20 segundos) sobre el
recuerdo.

Tabla 4. 1. Cuadrado latino para un diseño con tres tratamientos.


Orden de tratamiento
Primero Segundo Tercero

Participante 1 Tratamiento 1 Tratamiento 2 Tratamiento 3


Participante 2 Tratamiento 2 Tratamiento 3 Tratamiento 1
Participante 3 Tratamiento 3 Tratamiento Tratamiento 2

Observe que cada participante ha estado en todos los tratamientos y que cada uno de éstos
ha estado una vez en cada orden.
Hay 12 posibles cuadrados latinos para una tabla como la anterior, de tres por tres; de-
jaré a los escépticos que los descubran por sí mismos. De ser menester réplicas adiciona-
les, puede asignarse un orden a participantes extra para completar los niveles de la VI al
obtener un cuadrado latino nuevo para cada trío de sujetos. Por ello, cuando hay tres trata-
mientos, se precisa de más de 36 personas antes que haya que usar de nuevo cualquier cua-
drado latino. Quienes deseen leer más acerca de tales cuadrados pueden consultar a Myers
y Well (1991), quienes dedican un capítulo completo al tema.

Efectos de acarreo. Si la participación en un nivel de una VI deja un residuo, se le denomi-


na efecto de acarreo conservado. Por ejemplo, cuando se prueba a los participantes en dos
ocasiones con la misma versión de una prueba. Es probable que recuerden durante un tiem-
po, después de tomarla por primera vez, algunos reactivos y ciertas respuestas. Un segundo
ejemplo sería cuando se ha ingerido una sustancia como el alcohol y sus efectos están pre-
sentes un tiempo después que se tomó cualquier medición.
Una manera de evitar los efectos de acarreo consiste en utilizar una pausa más larga
entre .os diferentes niveles de la VI. Sin embargo, ello no siempre puede realizarse porque
los residuos podrían ser permanentes: por ejemplo, una vez que un nli-:o aprende a leer con
un método, no puede borrarse la habilidad para capacitarse con un método distinto.
Otra manera de sortear los efectos de acarreo (y una solución más para efectos de orden)
consiste en utilizar diferentes participantes para los diversos niveles de la VI. Ello cierra el
círculo, de regreso a un diseño intersujetos o alguna forma de formación de bloques (igua-
lamiento) con más de un participante en cada uno de éstos.

-
-~- - -· - o zzd
..
------~ ~--
~~-~--

______________________
D_is_e_ in_v_es_t~ig~a_ci_ó_n~y_s_u_v_a_li_d_ez__
ño_s_d_e__ _r_n_a ____________~¡--53
in_te

En cuasiexperimentos, los investigadores tendrán control limitado sobre la asignación


de los participantes a tratamientos; en este caso. hay amenazas potenciales para la validez
interna del diseño.
Un aspecto adicional de los diseños se presenta cuando cada nivel de una VI se com-
bina con cada nivel de todas las demás VI. Si lo está, el diseño se denomina cruzado,· en el
caso contrario, anidado.

Diseños cruzados
Los diseños cru=ados son aquellos donde cada nivel de una VI se combina con cada nivel
de los de otra. Por ejemplo, en un experimento sobre velocidad de reconocimiento de ros-
tros se tendría tal diseño de incluir éste todas las combinaciones posibles de los niveles de
las VI, orientación y familiaridad: caras conocidas puestas de cabeza, desconocidas de ca-
beza, conocidas orientadas correctamente y desconocidas colocadas correctamente. Estos
diseños permiten investigar interacciones entre las VI; es decir, cómo se combinan ambas
variables para afectar la VD. (Las interacciones se explican en el capítulo 17.)
Un ejemplo de diseño cruzado es el diseño intrasujetos estándar: se cruza a los parti-
cipantes con la o las VI; cada uno de éstos toma parte de cada condición.

Diseños anidados
Una desventaja de los diseños cruzados puede estribar en que necesiten una prueba exhaus-
tiva de cada combinación posible de los niveles de las VI, lo cual significa que la tarea to-
mará más tiempo a los participantes en un diseño intrasujetos o que el estudio requerirá más
participantes en un diseño intersujetos. Un enfoque alterno consiste en incluir el anidamiento
de una variable en otra, es decir, evitar que se cruce cada nivel de una variable independiente
con los de otra. En realidad, los diseños entre sujetos tienen pa1ticipantes anidados en los ni-
veles de la o las VI.
Algunos cuasiexperimentos pueden forzar el uso de diseños anidados. Por ejemplo, si
los investigadores desean comparar dos enfoques de enseñanza de las matemáticas (fonnal
y nuevo), quizá deban probar niños en escuelas que han adoptado uno de esos enfoques.
Por tanto, los colegios se anidarán en los enfoques. Los diseños que incluyen el anidado de
una variable en otra se denominanjerárquicos. Una desventaja de estos diseños radica en
que no permiten valorar la interacción entre VI (en este caso, la escuela y el enfoque de en-
señanza). Por consiguiente, el anidamiento jerárquico debe adoptarse sólo cuando el inves-
tigador está obligado a hacerlo o si no se sospecha interacción alguna.
- ·
~L_______________I_n_
ve_s_ti~ga_c_io_·n_c_u_a_n_ti_
ta_tl_·v_a_e_n~p_si_c_ol_o~gí_a____________________

Diseños equilibrados
Siempre que se usen diseños entre sujetos o mixtos, es aconsejable tener números iguales
de participantes en cada nivel de cada VL Ello produce lo que se denomina diseño bien
equilibrado y resulta mucho más fácil analizarlo e interpretarlo que uno mal equilibrado.
En el resto del capitulo se describen versiones específicas de los primeros cuatro dise-
ños identificados unas páginas antes. Como menciono en la introducción, recomiendo más
tratar este apartado como referencia que leerlo en una sentada.

Ejemplos especificas de diseños de investigación


Diseños con variable de un nivel
1: El estudio de caso de una vez. Este tipo de diseño puede revestir varias formas; cada
una requiere que se derive una medición una vez, ya sea de un individuo o de un grupo.
Permite que los investigadores comparen la medición tomada del individuo o del grupo con
la de un conjunto más amplio. Así, yo podría comparar el desempeño de un individuo que
presenta lesión cerebral con el de quienes no la tienen para ver si sus habilidades son me-
nores en tareas específicas.
1.1: Puntuación única de un individuo. Un ejemplo de tal diseño sería medir el IQ (inte-
lligence quotient, coeficiente de inteligencia) de un paciente de apoplejía.

Figura 4. 1. Estudio de caso de una sola vez que incluye medición única de una persona.

1.2a: Puntuación promedio de una persona. Un ejemplo consiste en presentar a un indi-


viduo varios rompecabezas lógicos similares, cronometrar el tiempo que tarda en resolver-
Los y anotar luego el tiempo promedio tomado.

Figura 4.2. Estudio de caso de una sola vez con estadística de resumen de una persona.

• zC
D_is_en_-o_s_d_e_l_
______________________ ·n_ve_s_t~ig~a_ci_ó_n~y_s_u_v_a_li_de_z_l_·n_te_r_n_a__________~¡--55

1.2b: Estudio de caso de una sola vez con estadística de resumen de un grupo. Puede ser
una versión replicada del diseño 1.1, donde se anota el IQ promedio de un grupo, o del
1.2a, en el cual se apunta para un grupo el tiempo promedio tomado para resolver los
rompecabezas lógicos.

Figura 4.3. Estudio de caso de una sola vez con estadística de resumen de un grupo.

Los diseños referidos son útiles sobre todo para describir a un individuo o a un grupo. Por
ejemplo, en una encuesta entre estudiantes se pregunta si fuman y se anotan los porcenta-
jes de los que sí lo hacen y de los que no. Como alternativa, tales diseños pueden utilizar-
se para detectar si un individuo o un grupo difiere de la población general. Por ejemplo, los
investigadores pueden comparar los IQ de un conjunto de estudiantes maduros con las pun-
tuaciones que otros investigadores han encontrado para la población general a fin de ver si
aquéllos tienen IQ inusualmente altos o bajos.

1.2c: Sólo posprueba, con un grupo. Este tipo de diseño puede suponer la intervención o
manipulación de los investigadores; por ejemplo, si a un grupo de delincuentes se diera un
programa diseñado para evitar que reincidan.

Figura 4.4. Diseño de sólo posprueba, con un grupo.


~~--------------~'~nv~e~s~ti~ga~c~ió~n_c~u~a_nt_it~a~ti_va~e~n~p~si~co~l~og~í_a____________________

No hay problema de validez interna con este tipo de diseño porque no tiene sentido usarlo
para tratar de establecer relaciones causales. Incluso en el ejemplo del programa para delin-
cuentes, como un estudio en sí mismo, no hay base para valorar su eficacia. Aunque encon-
tremos que el grupo comete menos actos ilícitos que los delincuentes en general, no sabemos
si habría reincidido menos sin la intervención. Para responder a ello, los investigadores ten-
drían que comparar los resultados del programa con los de otros y con un grupo control. Al
hacerlo, emplearían otro tipo de diseño.

Diseños con una variable


independiente de dos niveles
Diseños entre sujetos
2.1 a. Diseño transversal con dos grupos. Dos grupos se tratan como niveles de una VI y
sus miembros se miden en una sola variable. Es probable que ambos conjuntos difieran en
alguna manera inherente, digamos en el género; en este caso, el diseño puede describirse
como comparación de grupo estático o de grupo no equivalente. Ejemplos de este diseño
se presentan cuando los investigadores preguntan a una muestra de hombres y a una de mu-
jeres si fuman o si prueban sus habilidades en matemáticas.

Figura 4. 5. Diseño transversal con dos grupos.

El diseño de referencia puede incluir tiempo como variable presupuesta al tomar diferen-
tes participantes en distintas etapas de un proceso, pero medido simultáneamente. Por
ejemplo, si los investigadores quieren estudiar diferencias en IQ con la edad, podrían pro-
bar los IQ de dos grupos de edad distintos (a los 20 y a los 50 años). Tal diseño padece de
los problemas de la historia: si los criterios educativos cambiaron con el tiempo, las dife-
rencias de IQ entre los grupos podrían ser consecuencia de éste, más que un cambio en los
individuos. Una manera de sortear el inconveniente consiste en utilizar un diseño longitu- ·
dinal donde la misma gente se mide en varias edades, Jo cual representaría un ejemplo del
diseño de panel que se ofrece más adelante en este capítulo.
_______________________D_is_e_ño_s_d_e__in_v_e_st_ig~a_c_io_'n~y_s_u_v_a_li_de_z__in_t_e_rn_a____________~¡--57

2.1 b: Dos grupos, sólo posprueba. Se forman dos grupos y cada uno se trata de manera
diferente; luego se toma una medición. Como alternativa, uno de ellos podría ser un grupo
. control. Un ejemplo de un estudio que utiliza tal diseño es cuando se comparan dos méto-
dos de capacitación para que los radiólogos reconozcan tumores con rayos X. La ventaja de
un grupo control estriba en que ayuda a establecer una línea base para comparar los méto-
dos de capacitación. Si no se encuentran diferencias entre los grupos que han recibido ca-
pacitación, sin un grupo control no podría saberse si alguna de las capacitaciones resultó
benéfica; quizá ambas redituaron las mismas ventaj as, o ninguna las ofreció. Sin embargo,
si quienes están en Jos grupos de capacitación no son mejores que Jos controles, se habrá
fracasado en demostrar algún beneficio de aquélla.

Grupo Grupo
1 2

Intervención Intervención
1 2

Figura 4.6. Diseño de dos grupos, sólo posprueba.

Cuando se utilizan grupos formados de manera natural, en lugar de participantes asignados


al azar, los diseños 2.1 b también pueden describirse como de comparación de grupos es-
táticos o no equivalentes. Pueden estar sujetos a selección como una amenaza para la vali-
dez interna.

2.1 e: Cuasipanel. Un propósito de diseño es medir a los sujetos antes de un evento y Juego
tratar de evaluar el efecto de éste. Por ejemplo, podría tomarse una muestra de estudiantes de
teatro previa a su asistencia a un curso en esa materia y medir su extraversión. Después
del primer año de curso, se tomaría otra muestra de la misma población, que podría incluir
algunas de las personas probadas originalmente, y medir su extraversión. Además de la se-
lección, la maduración y la selección por maduración representan amenazas posibles a la
validez interna, como lo sería la instrumentación.
58
Investigación cuantitativa en psicología

Tiempo 1

Tiempo 2

Figura 4. 7. El diseño de cuasi panel.

Participantes igualados
2.2a: Dos grupos igualados, sólo posprueba.
Este diseño compara dos niveles de una VI
o un tratamiento con un grupo control.

Grupo igualado
Grupo igualado
1 1

Figura 4.8. Diseño de sólo posprueba con dos grupos igualados.


_______________________ de__in_v_e_st_i~ga_c_io_·n~y_s_u_v_a_li_d_ez__in_t_e_rn_a____________~¡--59
D_is_e_ño_s__

Diseños intrasujetos
2.2b: Diseño de panel simple. Por ejemplo, se da a los participantes dos tipos de rompe-
cabezas lógicos para que los armen y luego se anota el tiempo utilizado para cada tipo. Aquí,
el tipo de rompecabezas lógico es la VI con dos niveles; el tiempo tomado, la VD.

j
~
Figura 4.9. Diseño de panel simple.

Hay diversas variantes de este diseño. Si se midió a los participantes en una ocasión y éstos
recibieron luego un tratamiento tras el cual se les midió de nuevo, esto podría denominar-
se diseño preprueba, posprueba de un grupo; por ejemplo, las mediciones pueden tomarse
antes de una capacitación en alguna habilidad y después de ella. Como alternativa, podría
ocurrir un solo tratamiento (como pedir que se aprenda una lista, tras lo que se prueba a los
participantes luego de una duración inicial y tras un periodo más largo).
El diseño de referencia podría estar sujeto a varias críticas. Primera, como no se inclu-
yó grupo control alguno no tenemos protección contra la maduración y la historia, sobre
todo si hay una pausa notoria entre los tiempos en que se tomaron ambas mediciones; no
sabemos si cualquier diferencia entre las dos ocasiones podría darse incluso sin capacita-
ción. Segunda, debemos tener cuidado de que cualquier diferencia que se detecte no se de-
ba a efectos de instrumentación, mortalidad, orden o acarreo.
Otra variante de este diseño es cuando el tiempo se introduce como una variable, re-
trospectivamente, al medir a los participantes después de un evento y luego hacer que
recuerden cómo eran antes (diseño de panel retrospectivo) . Por ejemplo, podría pedirse a
estudiantes que califiquen su pericia con las computadoras tras asistir a un curso de compu-
tación y luego indicárseles que califiquen cómo eran sus habilidades antes del curso. Un
problema con los diseños retrospectivos radica en que dependen de la memoria falible de
la gente.
¡ p&

·v_a_e_n~p_si_co_l_og~í_a____________________
~~---------------l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tl_

Diseños con VI de más de dos niveles


.
Los diseños siguientes son simples extensiones de los descritos en la sección anterior, pe-
ro vale la pena describirlos porque la manera de analizarlos resulta distinta. Proporcionaré
sólo ejemplos con tres niveles de la VI, mas el principio es el mismo para cualquier núme-
ro de niveles. Sobra decir que cada diseño muestra el mismo problema que su equivalente
con dos niveles de una VI.

D;seños entre sujetos


3.1a: Transversal con varios grupos (estático o no equivalente). Se trata de un diseño cua-
siexperimental cuyos participantes se encuentran en tres grupos (como tres niveles de una
VI) y se miden en una VD. Por ejemplo, se evalúa el conocimiento de las partes del cuer-
po de niños de tres grupos de edad.

1 Grupo 2

1

Figura 4.10. Diseño transversal con varios grupos.

3.1b: Varios grupos, sólo posprueba. Se da a cada grupo un tratamiento diferente y lue-
go se toma una medición. Por ejemplo, se coloca a los niños en tres grupos. Su tarea con-
siste en seleccionar una pieza de arcilla tan grande como una barra de chocolate que se les
ha mostrado. Antes de formular el juicio se evita que un grupo coma durante seis horas. Se
procura que otro no coma durante tres horas, mientras que al grupo final se alimenta justo
antes de la prueba. Aquí, el tiempo sin bocado alguno es la VI, con tres niveles; el peso de
la arcilla, la VD. La ventaja de este diseño sobre el equivalente con sólo dos niveles de una
VI consiste en que uno de los niveles de la VI podría ser un grupo control. Así, es posible
comparar dos tratamientos entre sí y con un grupo control.
3.1 e: Varios gmpos, cuasipanel. Es una extensión del diseño del cuasipanel de dos grupos
(2.lc) donde se toman tres muestras de una población en diferentes momentos para saber
si han ocurrido cambios. Imagine que se miden los niveles de extraversión de una tercera
muestra de estudiantes de teatro después del segundo año del curso.
Diseños de investigación y su validez interna 61

Figura 4.11. Diseño de varios grupos, sólo posprueba.

Grupo
1

Tiempo 1

Grupo
2

Tiempo 2

Grupo
3

Tiempo 3

Figura 4. 12. Diseño de varios grupos, cuasipanel.


~L------------~~In~v~e~st~ig~a~c~ió~n_c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Diseños de partidpantes igualados
3.2a: Varios grupos, igualados, sólo posprueba. Este diseño es el equivalente del 3.1b,
pero cada uno de los tres grupos igualados se trata de manera diferente y luego se toma una
medición. Una vez más, un grupo puede ser control.

Grupo igualado Grupo igualado Grupo igualado


1 2 3

Figura 4.13. Diseño de varios grupos, igualados, sólo posprueba.

Diseños íntrasujetos
3.2b: El panel con más de dos niveles de una VI Cada participante proporciona una medi-
ción de tres condiciones. Por ejemplo, se pide a cada sujeto de un grupo calificar la fisica, la
sociología y la psicología en una escala que va de "muy científica" a "no muy científica".

Figura 4.14. Diseño de panel con más de dos mediciones tomadas.

S
de__in_v_e_st_i~ga_c_io_·n~y_s_u_v_a_li_d_ez__in_t_e _rn_a____________~¡--63
_______________________D_is_e_ño_s__

3.2c: Serie de tiempo interrumpida. Se trata de una extensión del diseño de un grupo, pre-
prueba, posprueba que puede ayudar a proteger de la instrumentación y, en cierta medida,
la maduración y la historia. Una serie de tiempo interrumpida es un diseño donde las me-
diciones se toman en varios puntos. Por ejemplo, podría llevarse a cabo un estudio de ca-
pacitación diseñado para ayudar a quienes padecen Alzheimer a realizar mejor las tareas
básicas.

Grupo

Observación 1

Observación 3

Observación 4

Figura 4.15. Diseño de serie de tiempo interrumpida.

Los efectos graduales de la historia y la maduración deben mostrarse como tendencia; los
de la intervención, como un cambio de ésta. Una ventaja adicional de tomar mediciones en
varias ocasiones después de la intervención es que ayudan a monitorear los efectos de lar-
go plazo de ésta. El diseño puede realizarse retrospectivamente cuando se mantengan re-
gistros apropiados. Sin embargo, si la intervención no se encuentra sujeta af control de los
investigadores y no se toman registros con regularidad, los investigadores habrán de saber
desde luego acerca del cambio inminente, con anticipación, para empezar a tomar las me -
diciones.
ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
~~----------------ln_v_e_st_i~

Diseños con más de una VI y sólo una VD


En los ejemplos siguientes se presentarán diseños con dos VI a lo sumo; los que tienen más
de dos son simples extensiones de éstos. Además, la mayoóa de los casos expuestos mues-
tran sólo dos o tres niveles de una VI debido a razones de simplicidad en los diagramas, no
porque baya tal límite.

Diseños entre sujetos


4.1 a: Completamente factorial. En el diseño completamente factorial se coloca a cada par-
ticipante en una sola condición; es decir, una combinación de los niveles de ambas VI. Por
ejemplo, una VI corresponde a fotografías de caras con los niveles conocido y desconoci-
do; la otra, a la orientación en que se presenta la foto, con los niveles de cabeza y normal.
La velocidad con que se dice el nombre de la persona seóa la VD. Por lo general, se indi-
ca el número de VI en un diseño: un diseño de una vía tiene una VI, uno de dos vías posee
dos V1, etcétera.

Grupo 1 Grupo 2 Grupo 3 Grupo 4

Figura 4. 16. Dise ño completamente factorial de dos vías.


D_
______________________ is_en_-o_s_d_e_l_
·n_ve_s_t~ig~a_
ci_ó_n~y_s_u_v_a_Li_
de_z_l_·n_te_r_n_a__________~¡--65

4.lb: Dos vías conformación de bloques en una VI. Por ejemplo, en un estudio sobre los
efeCtos de la nemotecnia puede considerarse que la edad es un factor por controlar. Se co-
loca a los participantes en tres bloques según su edad. Los sujetos de cada bloque se forman
en dos subgrupos; a uno de éstos simplemente se dice que repita una lista de pares de nú-
meros, mientras que al ot.u .,e le pide formar una imagen de una fecha relacionada con cada
par de números (por ejemplo, 45 produce una imagen del final de la Segunda Guerra Mun-
dial). Así, las VI son la edad (con tres niveles) y la nemotecnia (con dos). La VD corres-
ponde al número de pares recordado de manera correcta.
Los cuasiexperimentos y las encuestas o experimentos que suponen varios niveles de
las VI, pero tienen un número limitado de participantes , pueden obligar a los investigado-
res a usar un diseño menos exhau..;tivo. Uno jerárquico con una variable anidada constitu-
ye otro tipo de tales diseños.

4.2: Anidamiento. En un ejemplo anterior, donde el enfoque de enseñanza de matemáti-


cas se anida en la escuela, imagine que hay dos enfoques en comparación: formal y basado
en el tema. Imagine también que participan cuatro instituciones: dos que adoptan un enfo-
que y dos el otro. Este diseño requiere dos VI: el colegio y el enfoque de enseñanza; los
planteles (y los niños) estarán anidados en los enfoques de enseñanza.

Grupo 1 Grupo 2 Grupo 3 Grupo4

VI 2
Nivel4

Figura 4. 17. Diseño con una VI anidada en otra.


~L--------------~I~nv~e~s~ti~ga~c~io~·n~c~u~a~nt~it~a~ti~v~a~e~n~p~si~co~l~og~í~a____________________

Diseños mixtos (trazo dividido)


4.3a: El experimento clásico o de dos grupos, preprueba, posprueba. En este diseño se
forman dos grupos y (como el nombre lo sugiere) cada uno se prueba antes de la interven-
ción. Luego se trata a cada uno de manera diferente y se vuelve a probar. Un grupo puede
servir de control. Por ejemplo, se asignan aleatoriamente los participantes a dos grupos. Se
miden sus niveles de tensión. A un grupo se capacita de maneras individual y colectiva pa-
ra relajamiento en una clínica. A los del segundo no se da tratamiento. Al cabo de dos me-
ses, se mide otra vez el nivel de tensión de cada sujeto.

Grupo 1 Grupo 2

Figura 4. 18. Diseño de dos grupos, preprueba, posprueba.


D_
______________________ is_
en_
-o_s_d_e_l_
·n_
v__
~ t~ig~a_ci_ó_n~y_s_u_v_a_li_de_z_l_
·n_te_r_n_a__________~¡--67

4.3b: Mixto o mezclado de dos vías. Una variación del diseño mixto supone dos VI, pe-
ro una como variable intrasujetos y la otra entre sujetos. Por ejemplo, cuando en el estudio
de reconocimiento de rostros se mide a ciertos participantes con fotografías (familiares y
no familiares) puestas de cabeza, y a otros, sólo con caras presentadas de manera conven-
cional.

Grupo 1 Grupo 2

..

Figura 4 . 19. Diseño mixto que incluye dos VI.

Otro caso de lo anterior ocurre cuando una VI es un bloque, y los bloques se han formado
en orden para contrarrestar los efectos del orden. Por ejemplo, cuando en un experimento
relacionado con la memoria una VI es la pausa antes de recordar, con dos niveles (después
de 5 y de 20 segundos), un bloque de participantes hará los niveles en el orden de 5 segun-
dos y luego en el de 20, mientras que el otro bloque lo hará en el orden de 20 segundos y
luego en el de 5.
Una variante más es el diseño de cuadrados latinos con diferente orden de tratamiento
entre participantes.
El tiempo puede integrarse en el diseño de la misma manera que en los diseños con una
sola VI, retrospectivamente o como parte de una serie de tiempo; de nuevo, la inclusión de
un grupo control mejorará la validez interna. Sin embargo, una vez más , si los participan-
tes no están asignados de modo aleatorio a los grupos (grupos no equivalentes), podrían
ocurrir problemas de selección.

11
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

4.4: Cuatro grupos de Solomon. Un diseño que trata de controlar varias amenazas para la
validez interna es el de cuatro grupos de Solomon. Combina dos diseños ya mencionados.
Como con el diseño 2.lb, se utiliza en situaciones donde se comparan dos niveles de una
VI o donde se emplean un grupo control y uno experimental. Sin embargo, como con el di-
seño 4.3a, a alguno de los grupos se realizan pruebas previas y posteriores. Ello permite a
los investigadores identificar efectos de prueba.
Un ejemplo de dicho diseño es cuando los investigadores desean probar el efecto del
condicionamiento en el gusto de pequeños por cierta comida. Se probaría el gusto por la co-
mida de dos grupos, uno experimental y otro control, y luego el primero experimentaría una
intervención donde los encargados tratarían de condicionar a los niños para que asocien
tal ingestión con una experiencia placentera; durante esta fase los grupos control ingerirían el
alimento en condiciones neutrales. Más adelante, a todos se aplicaría una posprueba para
medir su gusto por la comida.
Ese diseño es particularmente gravoso en cuanto al número de participantes, el doble
de los necesarios en los diseños 2.lb o 4.3a para realizar las mismas comparaciones.

Grupo 1 Grupo 2 Grupo 3 Grupo 4_

0
l
Figura 4.20. Diseño de cuatro grupos de Solomon en que se comparan dos tratamientos.
Diseños de investigación y su validez interna 69

4.5: Una serie de tiempo replicada, interrumpida. El diseño del título es una modifica-
ción de la serie de tiempo interrumpida ya mencionada. Aquélla requiere un grupo de com-
paración adicional; puede ser un grupo control o uno en que la intervención ocurre en un
punto diferente de donde lo hace en el grupo original.

Observación 3

Figura 4.11. Serie de tiempo replicada, interrumpida .

Hay que repetirlo: el estudio puede ser una capacitación diseñada para ayudar a quienes su-
fren de Alzheimer.
El diseño debe ser incluso mejor que el de la serie de tiempo interrumpida para detec-
tar cambios ocasionados por la maduración o por la historia como los que han de mostrar-
se en ambos grupos, mientras que los efectos de una intervención aparecerán sólo como
una discontinuidad del punto relevante.
~L--------------~'n~v~e~st~ig~a~c~ió~n~c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Diseños intrasujetos
4.6. Diseño multivías intrasujetos. Si el ejemplo de velocidad de reconocimiento requirió
que a cada participante se presentaran rostros conocidos y desconocidos, de cabeza o en
posición convencional, éste sería un diseño de dos vías intrasujetos.

Grupo

Figura 4.22. Diseño de dos vías, intrasujetos.

Para obtener más detalles acerca de los diseños, consulte Myers y Well ( 1991 ), Cochran y
Cox (1957) o Winer, Brown y Mícbels (1991).

Resumen
Los diseños pueden clasificarse de acuerdo con su número de VI y de VD, así como con el
objetivo de la investigación. Pueden incluir los mismos participantes en más de una condi-
ción o emplear sujetos distintos en diferentes condiciones. Los diseños también se distinguen
por el grado en que miden a los participantes en varias etapas de un proceso. Si bien resulta
factible elevar al máximo la validez interna de un diseño en experimentos de laboratorio,
gran parte de la investigación se realiza fuera de éste. En tal caso, los investigadores ele-
girán el diseño con mayor validez interna a su disposición en esas circunstancias. Ningún
diseño es perfecto, pero algunos se antojan más apropiados que otros para responder una
pregunta de investigación concreta.
Diseños de investigación y su validez interna 71

Los detalles para usar un método experimental se encuentran en los primeros cuatro ca-
pítulos del libro. Otros métodos cuantitativos necesitan explicación adicional. En los tres
capítulos siguientes se describe cómo los investigadores utilizan diferentes métodos: los re-
lacionados con el planteamiento de preguntas y los métodos de observación.
5
Planteamiento de preguntas 1:
entrevistas y encuestas

Introducción
En el presente capítulo se describen los temas que pueden abarcarse en preguntas y los for-
matos de éstas, los cuales van de lo informal a lo formal. Luego se abordan los modelos más
sobrios de cuestionamiento y se estudian los medios en que pueden realizarse las entrevis-
tas y las encuestas. Se consideran tanto la redacción y el orden de las preguntas como el di-
seño del cuestionario. Por último, se remarca la importancia de efectuar un estudio piloto
al diseñar un cuestionario.

Temas para preguntas


Los tipos de preguntas que pueden plantearse se agrupan en tres rubros: demografia, com-
portamiento y lo que se denomina indistintamente opiniones, creencias o actitudes.

Preguntas demográficas
Son preguntas para obtener descripciones de personas, como su edad, género, ingresos y
lugar de residencia.

Preguntas sobre comportamiento


Este tipo de preguntas puede incluir las relativas a si los consultados fuman o beben y
cuánto.

72

'
__________________P_l_a n_t_e_a_m_ie_n_to__d_
e ~p_re~g~u_n_ta_s_l_:_e_nt_r_ev_i_st_a_s~y_e_n_c_
ue_s_ta_s________~~

Preguntas acerca de opiniones, creencias y actitudes


Esto incluiría preguntas sobre lo que los encuestados consideran cierto; por ejemplo, si to-
dos los políticos son corruptos. También puede inquirirse acerca de lo que creen que debe
ser cierto; por decir algo, si ha de permitirse a los políticos tener un segundo empleo. En el
capítulo siguiente se destaca la manera de idear sistemas de medición de opiniones, creen-
cias y actitudes .

Los formatos para plantear preguntas
Hay por lo menos tres formatos para plantear preguntas; van de lo formal a lo informal.

Entrevistas/ cuestionarios estructurados


El formato más formal es un cuestionario. La redacción exacta de las preguntas se seleccio-
na de antemano y se plantea a cada participante la misma interrogante en orden idéntico. Pa-
ra este formato, el participante y el investigador no tienen que intervenir en una entrevista.

Entrevistas semiestructuradas
La entrevista semiestructurada es menos formal que el cuestionario. Aquí, éste tiene una
agenda (un tema específico sobre el que se inquiere y un conjunto de preguntas por respon-
der). Sin embargo, la redacción exacta de las interrogantes no se considera critica y el orden
en que se plantean no es fijo. Ello permite que la entrevista fluya de manera más parecida
a la conversación. No obstante, el investigador encauzará la charla al tema respectivo y ve-
rificará que se contesten las preguntas.

Entrevistas libres o no estructuradas


Las entrevistas libres no necesitan, como su nombre lo indica, agenda ni preguntas orga-
nizadas previamente. Puede permitirse que la conversación tome el rumbo que los par-
ticipantes encuentren de mayor interés. Sin embargo, en el contexto del estudio quizá el
investigador tenga ideas preliminares que guíen al menos las interrogantes iniciales, pero
no restringirá la conversación.

Elección entre formatos


La elección del formato depende de tres factores. En primer lugar, el objetivo de la eta a
particular de la investigación guiará la selección. Si el área que estudia ya se encuentra bie
explorada o si tiene una idea clara respecto a las preguntas que quiere plantear, tal vez dese.e
~L_______________ I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_
a ____________________

utilizar una entrevista estructurada o stmiestructurada. Sin embargo, si aborda un ámbito


relativamente poco tratado y no busca predeterminar la dirección de la entrevista, resulta-
rá más probable que emplee la entrevista libre.
En segundo lugar, la elección entre los formatos estructurado y semiestructurado de-
pende de la preocupación que sienta por los efectos del entrevistador. Si utiliza un formato
estructurado, minimizará los peligros de que diferentes participantes respondan de ma-
nera distinta porque las preguntas se redactaron de modo diverso y se plantearon en orden
diferente.
Un tercer factor que determina esa selección es el ambiente donde tiene lugar el cues-
tionamiento; no puede realizar una entrevista libre cuando los consultados no se encuen-
tran presentes ni hablan por teléfono.

Los ambientes para plantear preguntas


Entrevistas personales
Las entrevistas personales, o cara a cara, requieren que el investigador y el participante estén
presentes y juntos. El primero formula sus preguntas y toma nota de las respuestas. Tales
entrevistas pueden ocurrir en diversos lugares: en el territorio del entrevistador (cuando los
sujetos visitan el lugar de trabajo de dicha persona) o en el del consultado (si se visita su
hogar o su empleo). Por último, pueden realizarse en territorio neutral (por ejemplo, fuera
de una tienda). Por supuesto, cuando se llevan a cabo en el territorio del participante han de
tomar las mismas precauciones que cuando entra en un área extraña y, sobre todo, en el
hogar de un desconocido. Valdría la pena que indicase a alguien adónde va y cuándo espe-
ra regresar.

Cuestionarios autoadministrados
El participante lee el cuestionario autoadministrado y luego registra sus respuestas. Tales
encuestas pueden cobrar varias formas y transcurrir en distintos lugares.

Entrevistador presen t e
Como en la entrevista personal, el investigador puede estar presente. Ello supone la venta-
ja de que si alguien quiere plantear una pregunta puede respondérsele rápidamente. Igual
que las entrevistas personales, puede efectuarse en el territorio del investigador, en el del
participante o en un lugar neutral. Puede organizarse de tal modo que a cada sujeto se le
trate de manera individual. Como alternativa, se presenta el cuestionario a un grupo de par-
ticipantes y luego cada cual completa la copia respectiva.

__________________P_l_an_t_e_a_
m_ie_n_t_
o _d_e~p_re~g~u_n_ta_s_l_:_e_n_tr_e_vi_st_a_s~y_e_n_c_ue_s_ta_s________~¡--75

Entrevistas postales
Los participantes reciben el cuestionario para completarlo por cuenta propia. Luego lo de-
vuelven a los investigadores.

Entrevistas telefónicas
El entrevistador plantea las preguntas y anota las respuestas de los participantes .

Los méritos relativos de los distintos ambientes


La naturaleza de la muestra
Si reviste importancia que en una entrevista la muestra sea representativa de una población,
entonces resulta relevante cómo se elige a los participantes. Consulte en el capítulo 11 ma-
yores detalles sobre la manera de seleccionar una muestra.

Tasa de respuesta
Un problema adicional cuando se intenta obtener una muestra representativa es la propor-
ción de personas que no completan bien los cuestionarios. Quienes no han tomado parte
pueden compartir algunas características que socavan la base original del muestreo. Por
ejemplo, quizá falten en una muestra muchos sujetos de un grupo socioeconómico especí-
fico porque decidieron no intervenir.
Por lo general, la tasa de respuesta de una encuesta postal es la peor de los tres méto-
dos, si bien pueden hacerse recordatorios a la muestra (digamos, por correo o incluso por
teléfono), lo cual la mejora. En un sondeo reciente acerca del alojamiento de estudiantes en
la Universidad de Staffordshire la tasa de respuesta inicial fue de 50%, pero gracias a una
campaña con carteles que recordaban que se devolvieran los cuestionarios, aumentó a 70%.
Las encuestas telefónicas producen una mejor tasa de respuesta porque pueden com-
pletarse en el sitio y en el momento, en lugar de dejarlas y olvidarlas. Puede mejorar la tasa
de respuesta si envía de antemano una carta de presentación y, tal vez, si incluye una copia del
cuestionario. Los participantes tendrán así un aviso , pues algunos reaccionan muy mal a
las "llamadas en frío". Sin embargo, como descubrió uno de mis colegas cuando trató de
interrogar a médicos generales, un grupo muy consultado puede mostrar demasiada resis-
tencia, incluso ante las encuestas telefónicas y aunque haya recibido copia del cuestionario.
Pese a que muchas personas no se rehúsan de manera terminante, quizá dejen sin oportu-
nidad al investigador para una ocasión futura.
Si bien las encuestas cara a cara producen la mejor tasa de respuesta, pueden encontrar
resistencia. Cuando trataba de entrevistar en sus propios hogares a personas con impedi-
mentos visuales, una persona mostró sospechas, pese a que busqué tranquilizarla. de " ~
~L--------------~'~nv~~~ti~ga~c~io~
·n~c~u~a~nt~it~a~ti~v~
a ~e~n~p~si~co~l~og~í~a____________________

podría filtrar la información a la oficina de impuestos. Si visita a otros, también tiene el


problema de que tal vez no estén cuando llegue. En el caso de las entrevistas telefónicas y
de las personales, vale la pena definir que no realizará más que cierto número de intentos
por consultar a un individuo determinado.
Debe enviar por anticipado una carta de presentación, donde tal vez mencione la hora
en que le gustaria hacer la visita. También incluya una postal con la dirección del remiten-
te; permita con ello a quien responde indicar que la hora propuesta parece inconveniente y
sugerir otra. Esto tiene el doble propósito de ser cortés y disminuir la posibilidad de que la
persona haya salido de casa. Siempre cargue alguna identificación oficial, pues suele estimu-
larse a la gente para que no deje entrar extraños en su hogar. No suponga que como envió
dicha carta, los consultados recordarán todos los detalles, de modo que prepárese para expli-
carlos de nuevo.

Motivación de los encuestados


Si quiere que la gente se porte honesta y, en particular, que revele detalles íntimos acerca
de sí misma, constituirla una ventaja que tuviera la capacidad de establecer empatía (o rap-
port) con ella. Desde luego, no resulta fácil lograrlo en una encuesta postal o incluso en otras
situaciones donde los participantes completan un cuestionario por sí mismos, si bien una
carta redactada con cuidado puede ser de ayuda. Hay mayores posibilidades de crear em-
patía por teléfono y más aún en las entrevistas personales.

El anonimato de los encuestados


Es más probable obtener respuestas honestas a preguntas confidenciales si se mantiene el
anonimato de los participantes. Empero, si no realizó arreglos para establecer algún tipo de
relación con ellos, tendrán menor dedicación personal en la encuesta.

Efectos del entrevistador


Aunque el establecimiento de empatía ofrece ciertas ventajas, como en cualquier investi-
gación, se corre el riesgo de que el investigador tenga un efecto no planeado en el compor-
tamiento de los participantes. En el caso de los entrevistadores, muchos aspectos suyos
pueden influir en las respuestas, y hacerlo de manera diferente para distintos consultados.
En entrevistas personales, la manera en que aquéllos Yisten, su acento, su género, la entona-
ción particular con que plantean una pregunta y otras cuestiones de la comunicación no ver-
bal llegan a influir en las contestaciones, lo cual puede llevar a respuestas consideradas
aceptables para el investigador. Es posible que se reduzcan al máximo los efectos si viste
de la manera más neutra. Sin embargo, lo que cree neutro puede resultar muy formal para
una persona o demasiado informal para otra.
__________________P~t~a_nt~e~a_m_ie~n~t~
o ~d~e~p~r~eg~u~n~ta=s~l~:~e~n~tr~e-~~st~a~s~y_e~n~c~ue=s~t~as~------~¡--77

Si la muestra pertenece a un subgrupo determinado, es razonable que usted modifique


hasta cierto punto su vestimenta. )lo quiero decir que cuando entreviste a punks deba lucir
c0mo ellos, a menos que usted mismo lo sea; el intento de vestir de modo apropiado puede
desentonar con otros aspectos de su comportamiento y hacer que sus intentos parezcan có-
micos o condescendientes. Para ese grupo, simplemente vista más informal que si fuera a
visitar a una muestra de personas de mayor edad. Algunos de tales factores, como el acen-
to, la entonación y el género, están presentes durante la conversación telefónica; y ningu-
no, con la posible excepción del género del investigador, en la encuesta postal.
Como entrevistador, tal vez quiera dejar una impresión de profesionalismo, así que
asegúrese de hallarse completamente fami liarizado con el cuestionario. Por tanto, evite tro-
piezos con la redacción y conozca a fondo sus rutas. Es decir, debe reconocer las pregun-
tas apropiadas para cada sujeto.
Para evitar que se influya en las respuestas de un entrevistado, el investigador ha de
utilizar la redacción exacta elegida para cada pregunta. El cambio de la redacción puede
producir otro significado y, en consecuencia, una respuesta diferente. A veces quizá se ne-
cesiten "sondeos" para determinar una respuesta apropiada; por ejemplo, cuando la res-
puesta requerida para cierta interrogante es "Sí" o "No" y el sujeto dice "No estoy seguro".
Cabe recordar acerca de los sondeos que no irán en una dirección en particular; deben ser
neutrales. El silencio y la mirada interrogativa bastarán para producir la respuesta apropia-
da. Si ello no funciona, puede atraer la atención del individuo a la naturaleza de las contes-
taciones permisibles, o con otras preguntas podria decir "¿hay algo más?".
Esté atento para reescribir las opiniones de los participantes, sobre todo cuando respon-
den preguntas abiertas. En la etapa de análisis de la investigación buscará pautas de res-
puesta y temas comunes, los cuales pueden permanecer ocultos si no registró aquéllas con
exactitud.

Duración máxima de la entrevista


Otra ventaja de establecer una relación de empatía es que los participantes se mostrarán más
motivados a continuar con una entrevista más larga. Si se precisa mucho tiempo para res-
ponder el cuestionario, no se aconseja una encuesta postal. La duración de las entrevistas
telefónicas y de las personales, o cara a cara, depende de cuán ocupada se encuentre la per-
sona, de la utilidad que le atribuya a su entrevista y, posiblemente, de si se encuentra sola.
Las consultas personales realizadas en el hogar del sujeto pueden abarcar varias visitas.

Costo
La cuestión del costo depende del objetivo de la encuesta y de quién la realiza. Si la mues-
tra será representativa y la población de que se extrajo está geográficamente extendida. la
~~---------------l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tl_
·v_a_e_n~p_si_co_l_og~í_a____________________

entrevista personal resultará la más onerosa. La telefónica saldrá cara si no pueden aprove-
charse las llamadas con tarifa reducida. Las encuestas postales serán las más baratas, aun-
que un seguimiento diseñado para mejorar la tasa de respuesta aumentará los costos. Si la
calidad de la muestra posee menor importancia, una entrevista personal resultará relativa-
. mente barata, pues los investigadores pueden permanecer en sitios populares y tratar de
hablar con transeúntes (muestra de oportunidad). Sin embargo, si debe emplearse entrevis-
tadores, el costo se incrementará.

Cuándo puede supervisarse a los entrevistadores


Cuando se emplea a otros para administrar un cuestionario es importante supervisarlos. En
primer lugar, debe darles capacitación. Tal vez tome muestras de cierta población y use una
terminología que usted y sus posibles entrevistados dominan, pero no puede suponer que
quienes aplican los cuestionarios la manejen. Por ejemplo, quizá entreviste a ciegos y utilice
términos relacionados con las causas de su incapacidad visual. Es probable que también
quiera dar a quienes aplicarán los cuestionarios una idea de cómo interactuar con un grupo
determinado. Ello podría incluir la representación de un papel. Tal vez quiera cerciorarse
por sí mismo de que sus modales resultarán apropiados para alguien que encuesta a otros.
En segundo Jugar, acaso tenga ciertas ventajas que usted pueda atender las preguntas
de los encuestados, durante la entrevista. Sí ésta se lleva a cabo en un sitio central, en per-
sona o por teléfono, entonces es posible para usted responder a las dudas. Cuando los en-
trevistadores llaman desde sus casas o visitan el territorio del encuestado, usted no puede
contestarlas.
Un tercer factor es que tal vez desee verificar la honestidad de sus entrevistadores. Una
manera de hacerlo consiste en ponerse en contacto con una submuestra aleatoria de perso-
nas que aseguran se les consultó para confirmar que tuvo lugar la encuesta y que tomó el
tiempo predicho.

La habilidad para verificar respuestas


Un cuestionario completado con inconsistencias puede inutilizar los datos del participante.
Desde luego, el empleo de instrucciones claras y preguntas simples ayuda, pero con una
versión impresa de un cuestionario autoadministrado no tiene la opción de verificar si se
atendieron todas las preguntas relevantes; en ocasiones, incluso han dado vuelta a dos pá-
ginas y dejado incompleta otra. Un cuestionario bien diseñado permite a los entrevistado-
res (cara a cara o por teléfono) guiar a la persona por éste.
El cuestionario puede aplicarse con ayuda de la computadora; y con ello, guiar al en-
trevistador o al encuestado por las preguntas y registrar las respuestas al mismo tiempo. Las
....

Planteamiento de preguntas 1: entrevistas y encuestas ¡---79


----------------------------~~------------~--------------~

computadoras pueden utilizarse para cuestionarios autoadministrados sólo cuando el partici-


pante acude a un sitio central. Quien lo aplica también podría emplear una computadora por-
tátil en la casa del sujeto.

La velocidad a que puede conducirse la encuesta


Si las respuestas para toda la muestra se necesitan rápidamente, el teléfono es el mejor mé-
todo. Por ejemplo, quienes realizan encuestas de opinión sobre política lo utilizan a menudo
cuando desean medir la respuesta a determinado pronunciamiento de un político. Sin em-
bargo, si la naturaleza de la muestra no resulta fundamental, otro método rápido consiste
en pararse en un lugar público y preguntar a los transeúntes.

Aspectos de los participantes que pueden influir en la muestra


Si acude durante el dia a los domicilios respectivos, no encontrará a quienes salen a traba-
jar; tampoco incluirá en la muestra a quienes no tienen hogar. Puede ir por la noche, pero si
necesita ir acompañado por un traductor o un usuario del lenguaje de señas, su disponibili-
dad podría suponer un problema.
Si utiliza el teléfono, tendrá dificultades con las personas sordas o que no hablan su
idioma y omitirá a quienes no tienen una linea. Además, si obtiene la muestra con el direc-
torio, no incluirá a quienes tienen números privados ni a los que acaban de mudarse al área
y no se les ha incluido en ese catálogo. Puede sortear estos últimos problemas si marca nú-
meros al azar correspondientes al área de donde desea tomar la muestra. Es posible que
teclee algunos números de empresas, pero si no deben incluirse en la muestra, podría dete-
ner la entrevista una vez que esté al tanto de que se trata de un número comercial.
Asimismo, si utiliza una encuesta postal, pasará por alto a quienes no pueden leer (por
discapacidad visual, por dislexia o por desconocimiento del idioma en que redactó el cues-
tionario). Con un costo mayor, podría enviar una versión en audiocinta o hasta en video-
casete, pero también depende de que la gente tenga el equipo adecuado. Puede traducir el
texto aun a Braille; sin embargo, en el último caso, sólo una pequeña proporción de los dis-
capacitados visuales podría leerlo. Resulta evidente que necesita hacer una investigación
preliminar para familiarizarse con los problemas presentes en su muestra.

Grado de control sobre el orden


en que se responde el cuest ionario
El orden en que se plantean las preguntas de algunos cuestionarios afectará la respuesta
Por ejemplo, suele aconsejarse que ponga las más delicadas o confidenciales al final~
que los sujetos no hagan a un lado de inmediato la prueba y, más bien, las encuen:reu
~L--------------~I~nv~e=s~ti~ga=c~ió~n~c=u=a~nt~it=a~ti~va~e~n~p~si=co=l=og~í=a____________________
tras invertir cierto tiempo y se sientan más motivados a finalizar. Un cuestionario autoad-
ministrado impreso permite al sujeto revisarlo antes y advertir el contexto general de las
preguntas. Además, puede revisar que no incurra en contradicciones al revisar las pregun-
tas anteriores, con lo cual creará una falsa impresión de consistencia.

La elección del ambiente


Use una encuesta telefónica si la velocidad es importante, el cuestionario no resulta dema-
siado largo, se toma en cuenta el costo y se requiere una tasa de respuesta relativamente
buena.
Si el costo, el tiempo o el peligro de sesgo en el entrevistado no constituyen un proble-
ma, si el cuestionario es largo, si se requiere muy alta tasa de respuesta y si la muestra puede.
ser muy diversa o está tomada de un grupo especial donde el lenguaje representa un obstácu-
lo, entonces utilice una técnica personal, o cara a cara.
Cuando el costo o el anonimato suponen consideraciones fundamentales, la tasa de res-
puesta no resulta primordial y el cuestionario es corto, emplee una encuesta postal.

Elección de los participantes


La población
La población se definirá por los objetivos del estudio, los cuales se guiarán a su vez en parte
por Jos aspectos del tema de su interés y en parte por la decisión de generalizar a una po-
blación definida con claridad. El tema de su trabajo definirá su población. Por ejemplo, tal
vez le interesen las estudiantes que fuman. Como alternativa, quizá su población tenga una
especificación más abierta, como todos los posibles votantes en ciertos comicios.

La muestra
La manera de seleccionar la muestra depende de tres condiciones. Primera, si desea hacer
estimaciones acerca de la naturaleza de su población a partir de lo encontrado en la muestra
(por ejemplo, si desea estimar cuántas mujeres fuman de entre los estudiantes). Una segun-
da consideración estriba en el ambiente adoptado para el trabajo. Esto, a su vez, se relacio-
na con el tercer conjunto de factores, los cuales serán hechos como la distancia que separa
a los participantes y el costo del muestreo.
Consulte en el capítulo 11 la descripción de los métodos de muestreo y los detalles de
los procedimientos estadísticos útiles al respecto, incluidas las decisiones acerca de cuán-
tos participantes abarcar en la muestra.
a _m_ie_n_to__d_
__________________P_l_a n_t_e_ e ~p_re~g~u_n_ta_s_l_:_e_nt_r_ev_i_st_a_s~y_e_n_c_
ue_s_ta_s________~¡--81

Un censo
Censo se refiere a una encuesta que pretende incluir a todos los miembros de la población.
En Gran Bretaña, cada 1Oaños hay un censo nacional: se envía un cuestionario a los hoga-
res. Los habitantes están obligados legalmente a llenarlo.

Qué preguntas incluir


Antes de incluir cualquier interrogante, pregúntese por qué desea considerarla. A menudo
resulta tentador incluir una porque parece interesante en el momento, pero cuando se llega
al análisis de los datos no puede hacer nada con ella; piense en lo que hará con la informa-
ción. Tal vez tenga una idea de cómo se responderá una pregunta determinada, mas re-
flexione también sobre cuál información adicional desearía si se responde de manera posible
pero inesperada. Si no introduce algún tipo de pregunta de seguimiento, puede perder in-
formación útil e incluso forzar la necesidad de un cuestionario de seguimiento para encon-
trar la respuesta.

Tipos de preguntas
Preguntas abiertas
Las preguntas abiertas son las que no restringen a los consultados a un tipo de respuesta;
por ejemplo: "¿Qué marca de cigarros fuma?", o "¿Cuántos años tiene?".

Preguntas cerradas
Las preguntas cerradas restringen a un conjunto fijo de opciones las respuestas posibles.
Por tanto, podrían ser de la forma: "¿Fuma?", o "Marque su grupo de edad: 20-29, 30-39,
40-49 o 50-59". Una versión cerrada de la pregunta sobre marcas de cigarros predilectas
incluiría las diferentes posibilidades. Una manera de introducir cierta flexibilidad en una
pregunta cerrada consiste en incluir la opción otros, que permite dar opciones no espera-
das, pero recuerde pedir que se especifiquen éstas.
Otra forma de pregunta cerrada sería dar una opción e indicar a los consultados que se
califiquen en alguna dimensión. Por ejemplo, podría proporcionarles un conjunto de foto -
grafias de personas y solicitarles que las clasifiquen en una escala que va de "muy atractivo"
a "muy poco atractivo". Como alternativa, podrían ordenarse las fotografias por atractivo; es
decir, ordenarlas según el atractivo percibido. Además, hay formas estándar de pregunta
cerradas que se utilizan para preguntas acerca de actitudes; en el capítulo 6 se describen.
Las preguntas cerradas tienen ciertas ventajas: dan a los entrevistados un contexto para
sus respuestas y pueden ayudar a mejorar su memoria. Además, aumentan la probabilida
de que un cuestionario se complete porque resulta más fácil que uno mismo las admini
~L--------------~I~nv~e~s~ti~ga~c~io~·n~c~u~a~nt~i~ta~tl~·v~a~e~n~p~si~co~l~og~í~a____________________

y se completan con mayor rapidez. Por último, se torna más sencillo calificarlas para la
fase de análisis. Sin embargo, pueden restringir mucho las posibles respuestas. Es buena
idea incluir más preguntas abiertas en la versión original de un cuestionario. En el estudio
piloto, los participantes proporcionarán respuestas diferentes que pueden servir para crear
una versión cerrada de la pregunta.

Preguntas de filtro
Es posible que su muestra incluya personas que responderán de manera fundamentalmente
distinta y tal vez desee explorar más a fondo tal diferencia. En este caso, en lugar de hacer
preguntas inapropiadas a algunas personas, puede incluir preguntas de filtro que lleven a la
gente a la sección apropiada para ellos. Por ejemplo, "Si fuma, pase a la pregunta 7; de lo
contrario vaya a la pregunta 31 ".

Preguntas mal redactadas


Hay muchas formas en que puede crear malas preguntas. Deben evitarse porque dan la im-
presión de que el cuestionario se ha creado con descuido y llegan a confundir a los partici-
pantes sobre lo que significa la pregunta. 'Por otra parte, pueden sugerir la respuesta que se
espera o desea. Como resultado, pueden restar valor a las respuestas y hacer que los parti-
cipantes pierdan la motivación de llenar el cuestionario. ¿Por qué deberían invertir tiem~o si,
al parecer, usted no lo hizo? Además, tal vez ignore el significado de las respuestas. Mu-
chos de los temas siguientes pertenecen a una mala redacción en general.

Preguntas con jerga o lenguaje técnico. No tiene mucho sentido plantear una pregunta si
los sujetos desconocen los términos utilizados. En general, puede expresarse con palabras
más simples, pero el costo suele reflejarse en una pregunta más larga y de comprensión más
dificil. La ventaja de una entrevista telefónica o personal es que usted puede saber si los
consultados entienden los términos, o explicarlos si es necesario. No obstante, reduzca al
máximo la terminología técnica y, por lo mismo, no utilice abreviaturas prescindibles.

Preguntas ambiguas. Un ejemplo de pregunta ambigua sería éste: "¿Recuerda dónde se


encontraba cuando Kennedy fue asesinado?" Aunque la persona sepa que se habla de la fa-
mosa familia estadounidense, John y Robert Kennedy murieron asesinados, de modo que
no queda r!aro de quién se trata.
Preguntas vagas. Las preguntas ragas son las que (como las ambiguas) diferentes perso-
nas pueden interpretar de manera distinta porque no se ha dado una guía suficiente. Por ejem-
plo, la respuesta a ..¿Bebe mucho alcohol?" depende de lo que signifique mucho. Puedo
__________________P_l_
an_t_e_a m
__ie_n_to
__d_e~p_re~g~u_n_ta_s_l_:_e_nt_r_ev_i_
st_a_s~y_e_n_c_ue_s_ta_s________~~

beber un vaso de vino diario y considerar que eso es moderado, mientras que otro me ve-
ría casi como alcohólico y un tercero casi como abstemio, según sus propios hábitos (además,
cada quien juzgaría moderados sus hábitos). Es mejor dar un rango de posibles cantidades
de alcohol para que se indique su consumo.

Preguntas guiadas. Una pregunta guiada es la que indica al participante la respuesta es-
perada. Por ejemplo, "¿Cree en el mito de que los hombres no lloran?" sugiere que el con-
sultado no estará de acuerdo con la afirmación.

Preguntas con indicadores de rango deficientes. Si da opciones y quiere que los entrevis-
tados respondan sólo una, aquéllas deben ser mutuamente excluyentes, es decir, no será
posible satisfacer más de una. Imagine una persona de 30 años cuando se le pide que "In-
dique el rango de edad al que pertenece: 20-30, 30-40, 40-50, 50-60".

Preguntas con suposiciones implícitas. Algunas preguntas son inapropiadas para ciertos
entrevistados y, sin embargo, suponen que todos pueden responderlas. Un ejemplo sería
"¿Qué procesador de palabras utiliza?" sin dar la opción ninguno. Más común suele resul-
tar una pregunta de la forma "¿Su madre fuma?". Esto se antojaría inapropiado por varias
razones: la persona no conoció a su madre, o ésta murió.

Preguntas con doble elemento. Ciertas preguntas incluyen dos o más elementos, pero se
permite al entrevistado que responda sólo a uno. A menudo puede ser una extensión de la pre-
gunta con una suposición implícita. Por ejemplo, "Cuando se ducha, ¿usa gel para rega-
dera?". Si cuenta nada más con tina, tendrá dificultades para contestar porque, de hacerlo, no
sugeriría que sí tiene ducha pero que utiliza sólo jabón.

Uso de dobles negaciones. Las negaciones dobles resultan dificiles de entender. Por decir,
"¿Está de acuerdo con la frase 'a los abogados no se paga una cantidad que no es conside-
rable'?". Si quien elaboró el cuestionario quiere saber si la gente piensa que se paga mu-
cho a los abogados, convendría más expresarlo directamente.

Preguntas difíciles o confidenciales


Las preguntas dificiles pueden abarcar desde las demográficas, acerca de la edad y los in-
gresos, hasta las concernientes a comportamiento ilegal o transgresor de normas sociales.
Las interrogantes sensibles sobre detalles demográficos pueden resultar más aceptables si
se ofrecen rangos, en lugar de solicitar información exacta. A veces, la dificultad puede ra-
dicar simplemente en decir la edad de una persona en voz alta, en cuyo caso podría pregun-
tar la fecha de nacimiento y calcular la edad.
~L--------------~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti~va~e~n~p~si~co~l~og~í~a____________________

Las preguntas acerca del comportamiento pueden resultar más problemáticas. Conviene
tranquilizar al participante con relación al anonimato, pero tal vez se necesite redactar la
pregunta de manera tal que aminore en cierta medida la incomodidad que despertaría. Por
ejemplo, si inquiere respecto al uso de drogas, podría llegar de modo indirecto a la interro-
gante, con comentarios preliminares que sugieran que sabe que muchos las consumen y qui-
zá si pregunta si los amigos del consultado las utilizan, para preguntar luego si él también.

El diseño gráfico del cuestionario


El diseño gráfico puede tomar más legible el cuestionario y ayudar a crear un aspecto más
profesional para la investigación, con lo cual los participantes se sentirán más motivados a
completarlo. Esto es cierto para cuestionarios autoadministrados y puede ayudar a que la en-
trevista avance con mayor apacibilidad si se administra personalmente o por teléfono.
Seccione el cuestionario. Por ejemplo, uno referente al hábito de fumar podría tener
una parte para preguntas demográficas, otra sobre dicho comportamiento, una más respec-
to a la actitud ante el tabaquismo, una sobre conocimientos acerca de la salud y una más
relacionada con la influencia de los demás. Esto da al cuestionario coherencia y un contexto
para las preguntas de una sección específica. lncluya preguntas de filtro donde sea indispen-
sable. Ello incrementará la complejidad de la administración del cuestionario, pero signifi-
ca que no se plantearán interrogantes inapropiadas.
Dé instrucciones y notas de explicación para todo el cuestionario y para cada sección.

El uso del espacio


Utilice sólo una cara del papel; ello reducirá la posibilidad de que se omita una página de pre-
guntas. Siga la directriz usual para el diseño de texto: mantenga una relación atinada entre
espacio en blanco y texto (Wright, 1983). Con esto será más legible y también se propor-
cionará a quien califica las hojas espacio suficiente para escribir comentarios y le facilitará
la codificación. Emplee márgenes de tamaño razonable. Cuando dé opciones en una pre-
gunta cerrada, inclúyalas en una lista vertical, no en una horizontal. Por ejemplo:

¿Cómo viaja al trabajo?


a pie
en bicicleta
en autobús
en tren
en el automóvil de otra persona
en automóvil propio
en otro medio (por favor, especifíquelo)
__________________P_l_an_t_e_a_m_ie_n_t_
o _d_e~p_r~eg~u_n_ta_s_l_:_e_nt_r_ev_i_st_a_s~y_e_n_c_ue_s_ta_s________~¡--85

Reserve un espacio suficiente para responder cuanto se desee en preguntas abiertas, pero
no demasiado como para sentirse intimidado por él.

Orden de las preguntas


Como desea motivar a los encuestados, no desalentados, coloque primero preguntas inte-
resantes, pero simples, cerradas en lugar de abiertas, para facilitar que se completen; y sitúe
al final las más confidenciales o difíciles. Varíe el formato de las preguntas, si es posible, a
efecto de mantener el interés y de evitar que los participantes respondan automáticamente,
sin considerar con propiedad la cuestión. Tal vez desee controlar el orden de las secciones, de
modo que cuando se responda alguna no se conozcan por completo las otras interrogantes.
Por ejemplo, quizá desee introducir preguntas sobre comportamiento previas a las relacio-
nadas con actitudes.
Si le preocupa que el orden específico de las preguntas o la redacción de algunas in-
fluya en las respuestas, adopte un enfoque de votación dividida. Ello significa simplemente
la creación de dos versiones del cuestionario con diferentes órdenes/redacciones y la entre-
ga de una versión a la mitad de su muestra y de la otra versión a la mitad restante. Puede
comparar después las respuestas para ver si quienes recibieron las distintas versiones res-
pondieron de manera diferente. Si esto le preocupa, pruébelas en la etapa piloto.

El estudio piloto
Resulta fundamental el estudio piloto cuando usted ha formulado las preguntas de un cues-
tionario o si prueba un cuestionario existente en una nueva población. Como es usual, debe
aplicarse a individuos de su población destino. Vale la pena utilizar un número mayor de per-
sonas en un estudio piloto en que idea el sistema de medición que en uno donde emplea un
sistema existente, como en un experimento.
Además, el estudio piloto desempeña dos papeles. Primero, le ayudará a refinar su
cuestionario. Como ofrece un repertorio de respuestas a las preguntas abiertas, puede con-
vertirlas en cerradas si incluye las opciones que se le han dado. Segundo, puede indicarle
la utilidad de una pregunta. Si todos la responden igual, puede eliminarla por redundante.
Si una pregunta está mal redactada, debe quedar claro durante el estudio piloto, de modo
que tenga la oportunidad de volver a redactarla.

Resumen
Quienes desean plantear preguntas a sus participantes elegirán lo siguiente: los temas re -
pectivos (demográfico, de comportamiento y actitud/opinión/creencia), el formato del
86 Investigación cuantitativa en psicología

cuestionario (estructurado, semiestructurado o libre) y el ambiente para éste (personal,


completado por el participante o por teléfono). Tras ello, se necesita refmar la redacción de
las preguntas y escoger tanto el orden en que se plantean como el diseño gráfico del cues-
tionario. Antes de aplicar el estudio final, resulta esencial uno piloto. Esto cobra importan-
cia particular cuando los investigadores han ideado el cuestionario.
En el capítulo siguiente se tratarán el diseño y la conducción de cuestionarios de actitud.
6
Planteamiento de preguntas 11:
medición de actitudes y significado

Introducción
En muchas situaciones, los investigadores desean medir actitudes. Tal vez quieran explorar
un área para descubrir las actitudes existentes (por ejemplo, conceptos de la gente sobre la
protección de animales). O quizá busquen conocer qué siente la colectividad acerca de algo
en particular (por ejemplo, si el gobierno realiza un buen trabajo). Incluso, una vez más, tal
vez quieran relacionar actitudes con aspectos de comportamiento (como descubrir la ma-
nera en que las actitudes de la gente hacia varios métodos anticonceptivos se relacionan con
su uso).
Una forma de identificar actitudes consiste en interrogar a la gente. Se ban ideado va-
rias técnicas para ello. En el presente capítulo se describen tres escalas de actitudes que qui-
zá encontrará cuando lea investigación sobre actitudes: las escalas de Thurstone, Guttrnan
y Likert. También se explica por qué esta última se ha vuelto el sistema de medición de ac-
titudes más usual. Además, se describen otros tres métodos utilizados para explorar lo que
significan ciertas entidades para la gente: el diferencial semántico, la metodología Q y las
cuadrículas de repertorio.

Confiabilidad de los sistemas de medición


Si quisiéramos descubrir la actitud de una persona hacia algo, digamos la política, tal vez
nos veríamos tentados a plantear una sola pregunta; por ejemplo:
¿Le gustan las políticas de los conservadores? (Sí/No)

87
- ------------~

~~---------------ln_v_e_st~ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Ésa seria una pregunta razonable si tratara de predecir el comportamiento al votar. Sin em-
bargo, fallaría para identificar las sutilezas de la actitud hacia la política, pues supone que
hay una simple dicotomía entre quienes prefieren tales políticas y quienes las desdeñan.
Con frecuencia, cuando se le enfrenta a este tipo de preguntas, la gente responde que depen-
de de cuál política se considere. Por tanto, si los medios confieren importancia a una política
determinada con la que se está en desacuerdo, podría responder No, mientras que si fuera más
importante una política con la que se asiente, la respuesta sería Sí. No obstante, si las acti-
tudes son relativamente constantes, desearíamos un sistema de medición que reflejara la
consistencia. En otras palabras, queremos un sistema confiable. En general, una sola pre-
gunta es un sistema de medición de actitudes poco confiable.
Para prevenir la falta de confiabilidad de las preguntas únicas, se idearon escalas de va-
rios reactivos. La respuesta de una sola pregunta puede cambiar de una ocasión a otra, pero
las relativas a un conjunto de interrogantes proporcionará una puntuación que debería per-
manecer relativamente constante. Una escala de varios reactivos ofrece la ventaja adicional
de que la actitud de una persona puede colocarse en una dimensión, la cual va de tener una
actitud positiva hacia algo a tener una actitud negativa hacia eso mismo. Así, las actitudes
relativas de diferentes personas se compararán de manera más precisa.

Dimensiones
El uso de escalas de vari<;>s reactivos también permite a los investigadores explorar Jas su-
tilezas de actitudes para ver si existe una o más dimensiones. Por ejemplo, en actitudes po-
líticas podría percibirse una sola dimensión de la izquierda a la derecha. Sin embargo, hay
otras dimensiones; por ejemplo, liberal-autoritario. Por tanto, existen liberales de derecha
y de izquierda, así como autoritarios de izquierda y de derecha. Debido a ello, si los inves-
tigadores quieren explorar el dominio de la actitud hacia la política desearán plantear algunas
preguntas que identifiquen dónde se encuentra una persona en la dimensión izquierda-de-
recha y algunas que sitúen la dimensión liberal-autoritario.
Las tres escalas descritas a continuación abordan de manera diferente el tema de las di-
mensiones. La de Thurstone soslaya el problema y trata las actitudes como si fueran una
sola dimensión. La de Guttrnan lo reconoce y busca producir una escala unidimensional eli-
minando preg¡.mtas alusivas a otras dimensiones. La escala de Likert explora el repertorio
de actitudes y puede contener subescalas que atienden dimensiones distintas. La creación de
cualquiera de dichas escalas requiere a su vez la de un conjunto de preguntas o afirmacio-
nes y la posterior selección de las apropiadas a partir de cómo una muestra ha respondido
a ellas. Como se verá, el criterio para determinar lo que constituye una afirmación apropia-
da depende de la escala.
No obstante, los criterios de los tres tipos de escala comparten ciertas características.
Como con todos los cuestionarios, evite preguntas o afirmaciones mal redactadas; consul-
te en el capítulo anterior una descripción de los errores comunes. Ya que ha producido un
..
_____________P_l_an_t_ea_m_l_·e_
n_to_d_e~
pr_e~gu_n_t_as__
ll:_m
__ed_i_ci_ó_
n _d_e_a_ct_it_u_d_es~y_si~g_ni_fi_ca_d_o____~¡-89

conjunto inicial de afirmaciones, como con cualquier investigación, realice un pequeño es-
. tudio piloto para verificar que la redacción, a pesar de sus mejores esfuerzos, no es defi-
ciente. Luego, tras quedar satisfecho con este punto, estará listo para realizar el estudio más
completo para explorar su escala de actitudes.

Escalas de actitud
Escala de Thurstone
Una escala de Thurstone está diseñada para incluir cierto conjunto ~e preguntas con dife-
rentes valores en una dimensión. Quienes responden identifican las afirmaciones con las
que están de acuerdo. Por ejemplo, en una escala diseñada para medir actitudes acerca de la
protección de los animales las afirmaciones podrían ir de
Los humanos tienen derecho a cazar animales por placer

a
Ningún animal debe ser muerto para beneficio de los humanos

El diseñador de la escala formula juicios para clasificar cada afirmación, según el lugar que
ocupa en la dimensión (por ejemplo, de "totalmente despreocupado por la protección de los
animales" a "muy preocupado ... "). A partir de tales clasificaciones, se elige un conjunto de
afirmaciones, de manera que éstas tengan puntuaciones distribuidas equitativamente entre
los valores posibles. Tras elegir el conjunto final de afirmaciones, puede utilizarse en in-
vestigación; la puntuación de un participante en la escala será la media de las afirmaciones
con que está de acuerdo.

Elección de las afirmaciones


Conjunte aproximadamente 60 afirmaciones relevantes para la actitud que desea medir. Re-
dáctelas de forma que representen todo el repertorio de actitudes posibles. Colóquelas en
orden aleatorio, en lugar de hacerlo de acuerdo con su supuesto sitio en la dimensión.

Exploración de la escala
Pida a por lo menos 100 jueces que califiquen cada afirmación en una escala de 11 puntos. Por
ejemplo, podría solicitarse a uno que califique las afirmaciones dadas antes, en la dimen-
sión que va de "totalmente despreocupado por la protección de los animales" (que obtendría
puntuación de 1) a "muy preocupado... " (con puntuación de 11). No se le pide que indique sus
propias actitudes hacia los animales sino que exprese sus opiniones sobre el lugar de la di-
mensión en que se encuentra cada afirmación.

11
90 Investigación cuantitativa en psicología

Análisis de reactivos
Se calcula la calificación promedio (la media) de cada afinnación, pues es una medida del
grado de acuerdo entre los jueces sobre la puntuación de cada afirmación (la desviación es-
tándar). El cálculo de ambos estadísticos se trata en el capítulo 9.
Ordene las afinnaciones con base en el tamaño de la puntuación media para cada una
de ellas e identifique las de, aproximadamente, puntuaciones medias para cada medio pun-
to de la escala. Por tanto, debe haber afinnaciones con puntuación de 1, otras con 1.5 y así
sucesivamente, hasta una de 11. Quizá las haya con puntuaciones similares. Elija para caaa
intervalo de la escala la pregunta sobre la que hubo más acuerdo, es decir, con la menor des-
viación estándar. Descarte las otras. Coloque en orden aleatorio las afirmaciones selecciona-
das y agregue la respuesta posible (de acuerdo/en desacuerdo) para cada una de ellas.

Criticas sobre la escala de Thurstone


La primera crítica ya se mencionó. Las escalas de Thurstone suponen que la actitud por me-
dir obra en una sola dimensión, pero no verifica si ése es el caso. En segundo lugar, quizá
dos personas que alcanzan la misma puntuación en la escala, sobre todo en el rango medio
de las calificaciones, obtuvieron sus puntuaciones a partir de diferentes pautas de respues-
ta. Por tanto, una puntuación detenninada no denota una actitud única y, de ese modo, no
distingue con claridad entre los sujetos. Una tercera crítica: debe crearse un número grande
de afirmaciones, para empezar, y tener la posibilidad de tenninar con un conjunto de pre-
guntas espaciadas equitativamente en la dimensión supuesta. Por último, se necesita que
mucha gente actúe como juez.
Una escala de Guttrnan atiende dichos problemas, excepto el último.

Escala de Guttman
La creación de una escala de Guttrnan también supone producir afirmaciones con las que
los entrevistados están de acuerdo o no. Una vez más, se diseña un conjunto de afmnacio-
nes para obtener una muestra del repertorio de actitudes posibles. Se dan a una muestra de per-
sonas y se examina la pauta de respuestas. La estructura de una escala de Guttman es tal que
resulta obligatorio que las afmnaciones se encuentren en una sola dimensión. Las afirma-
ciones se redactan de fonna que cierta persona con una actitud en un extremo de la escala no
esté de acuerdo con ninguno de los reactivos, mientras que alguien con una actitud en el otro
extremo de la escala concordará con todas las afinnaciones. Por tanto, un sistema de me-
dición de actitudes hacia la protección de los animales tendría afirmaciones que irían de
Es aceptable experimentar con animales para fines médicos
y
Es aceptable experimentar con animales para fines cosméticos
_____________P~I~an~t~e~
a~m ie~n~to~d~e~pr~e~g=un~t~as~ll:~m~ed=i~cl~·ó~n~d~e~a~c~ti~tu~d~e~s~y~sl~·g~ni~fi~c~ad=o~--~¡-91

a
Es aceptable experimentar con animales para cualquier fin

Si tales reactivos forman una escala de Guttman, alguien acorde con el reactivo fmal tam-
bién concordaría con los anteriores y quien no estuviere de acuerdo con el primer reactivo
discreparía de todos los demás. Las afirmaciones que no se encontraren en la pauta se des-
cartarían. La puntuación de una persona se basa por tanto en el grado de la dimensión con
que acepta estar de acuerdo. Si esas afirmaciones formaran una escala de tres puntos, por
estar de acuerdo con la primera se tendría puntuación de 1; por estarlo con la segunda, de 2;
y por estarlo con la última, de 3. Podría decirse que dos personas con la misma puntuación
figuran en el mismo punto de la dimensión.

Escalas de distancia social de Bogardus


La escala de distancia social de Bogardus puede considerarse una versión de la de Gutt-
man, pues produce una escala unidimensional. En este caso, la dimensión se relaciona con
el grado de contacto que alguien está dispuesto a tener con quienes presentan ciertas carac-
terísticas, como una raza o una discapacidad. Los reactivos de la escala pueden ir desde
preguntar sobre la voluntad del entrevistado para permitir que personas de una determi-
nada raza visiten su país basta la voluntad de permitirles que se casen con un familiar del
participante.

Criticas sobre la escala de Guttman


La mera fortaleza de tratar estrictamente con una sola dimensión significa que, a menos que
se creen subescalas para observar dimensiones diferentes y relacionadas, una escala de
Guttman pasa por alto las sutilezas de las actitudes hacia un tema específico. Por ejemplo,
una escala de Guttman que investiga las actitudes respecto a temas raciales quizá requeri-
ría escalas diferentes para razas distintas.
Una escala de Likert explora las dimensiones en actitudes hacia un tema determinado
y puede incluir subescalas. Se ha convertido en la técnica más popular de asignación de
escalas.

Escala de Likert
Cada reactivo de una escala de Likert es una afirmación con la que los entrevistados pue-
den indicar su nivel de acuerdo en una dimensión de respuestas posibles. Un ejemplo del
tipo de afirmación es:
Ningún animal debe ser muerto para beneficio de los humanos
~L--------------~I~nv~e=s~ti~ga~c~io~·n~cu~a~n=t¡=·ta~t~iv~a~e~n~ps~ic~o~lo~g~í~a_____________________

Por lo general, el repertorio de posibles respuestas sería de la forma siguiente:

Muy de De acuerdo Indeciso En desacuerdo Muy en


acuerdo desacuerdo

Recomiendo usar una escala de cinco o siete puntos. Menos puntos en la escala omitirían
el repertorio de actitudes; más requerirían un nivel artificial de precisión, pues a menudo la
gente no puede proporcionar ese tipo de sutilezas en sus respuestas. Además, un número
non de posibles respuestas permite incluir una posición neutral; la falta de tal respuesta po-
sible fuerza a los participantes a tomar una decisión en una dirección específica, cuando tal
vez estén indecisos y ello tal vez produzca una medición poco confiable.

Elección de Las af;rmac;ones


Necesita por lo menos 20 afirmaciones que considere que evaluarán la actitud de una perso-
na respecto al tema elegido, pues quizá encuentre que algunas no son útiles al analizar las
respuestas. Recuerde que desea distinguir entre las actitudes de la gente, de modo que no in-
cluya elementos con los que todos estarán de acuerdo o en desacuerdo, ya que resultarán
redundantes.

Redacción de las afirmaciones


De acuerdo con el párrafo anterior, no formule afirmaciones demasiado extremas; permita
que quienes responden indiquen su nivel de acuerdo con Ja respuesta elegida.
Redacte la mitad de las afirmaciones en la dirección opuesta al resto. Por ejemplo, si
su escala se relaciona con actitudes hacia el tabaquismo, la mitad de las afirmaciones de-
be requerir que los sujetos inclinados positivamente hacia él respondan De acuerdo o Muy
de acuerdo, mientras que la mitad restante de las afmnaciones precisará que se responda
En desacuerdo o Muy en desacuerdo. Así, obligará a quienes contestan a leer las afirma-
ciones y evitará lo que se denomina sesgo en la respuesta (la tendencia de ciertos individuos
a usar un lado de la gama de respuestas). Ello no significa que usted, de forma simple, tome
una afirmación redactada de manera positiva y produzca una versión negativa de ella para
agregarla a la escala.
Parte de la razón para esto radica en que usted intenta explorar el repertorio de actitu-
des que hay y no querrá afmnaciones redundantes que nada agreguen a lo cubierto ya por
otras preguntas. Sin embargo, tal vez no siempre pueda identificarse, antes de realizar el
estudio, qué devendrá una pregunta redundante.
_____________ P_l_a n_t_e_
am ie_n_
__ to_d_e~pr_e~gu_n_t_as__
ll:_med_i_cl_.ó_n_d_e_a_c_ti_tu_d_e_s~y_sl~·g_ni_fi_ca_d_o____~¡-93
__

Tamaño de la muestra
En el capítulo 13 se explica la elección del tamaño de la muestra para un estudio determi-
nado. Por el momento, indicaré la regla de que la inclusión de al menos 68 personas en la
muestra significa que da a sus preguntas una posibilidad razonable de mostrar que son úti-
les en el análisis que llevará a cabo. Si usa menos sujetos, aumentará la posibilidad de que
rechace una pregunta porque no es útil para medir un aspecto de la actitud en estudio.

Análisis de la escala
Es posible efectuar dos análisis de las respuestas que la muestra ha dado a los reactivos. El
primero (un análisis de reactivos) busca si la escala de actitud mide una o más dimensio-
nes; ello identificará también afirmaciones que no parecen suficientemente relacionadas
con las otras de la escala. El segundo análisis verifica si una afirmación recibe una gama
suficiente de respuestas (el poder discriminatorio de la afirmación). Recuerde que si todos
dan la misma respuesta, o una muy similar, a una afirmación, aun cuando mantengan una
actitud distinta, no tiene caso incluirla porque no indica cómo difiere la gente.
De no leer los capítulos 9 y 19, no tendrá cubierto el material sobre las técnicas esta-
dísticas utilizadas en ambos análisis. Más adelante se describen éstos. En el apéndice XII
consulte una descripción más completa del proceso.

Puntuación de las respuestas


Elija que se califique el lado negativo de la escala como 1 y el positivo como 5. Por ejemplo,
si su escala fuera de actitudes respecto a los animales, asigne 1 a una respuesta que implique
una actitud extremadamente desfavorable hacia ellos y 5 a una que suponga una actitud fa-
vorable en extremo. Por tanto, debe invertir la puntuación de las afirmaciones redactadas
de manera negativa. Por ejemplo, si una fuera de la forma "La caza de la zorra es buena",
el acuerdo extremo obtendría 1 y el desacuerdo extremo, 5.
Una vez que se han calificado las respuestas, encontrará la puntuación total de cada
participante con sólo sumar todas las que dio a cada afirmación.

Realización de un análisis de reactivos


Las afirmaciones de una sola dimensión deben correlacionarse bien entre sí y con la puntua-
ción total; para que dos de ellas se correlacionen, la gente _q ue da una puntuación alta a una
afim1ación tenderá a dar una alta a la otra, y quienes confieren una baja puntuación a una ten-
derán a otorgar una baja a la otra. Las afirmaciones que forman una dimensión separada
no se correlacionarán bien con la puntuación total sino entre sí. Por ejemplo, en un estudio
~L_______________I~n~ve~s~ti~ga~c~io~·n~c~u~a~n~ti~ta~tl_·v~a_e~n~p~si~c~ol~o~gí~a____________________

sobre actitudes respecto a la familia real británica un grupo de estudiantes encontró que una
dimensión adicional a la principal se relacionaba con la manera en que la familia era retra-
tada en los periódicos.
La afirmación que no se coiTelaciona razonablemente bien con la calificación total ni
con otras afi1maciones debe descartarse. Valdría la pena examinar estas afmnaciones para
ver qué identifica en ellas que pudiera explicar el resultado. Tal vez estén mal redactadas,
a pesar de haberse probado en el estudio piloto. Podría deberse a que la gente difiere poco en
cómo r-esponde a un reactivo determinado; si no hubiera variedad en las puntuaciones para
esa afirmación, no se correlacionaría con el total. Como alternativa, aunque haya inclui-
do la afirmación porque la creía relevante para la actitud, este resultado demuestra que no
poseía importancia, después de todo.

Análisis de poder discriminatorio


Descarte los elementos que fallaron en el análisis de reactivos y efectúe uno separado de
poder discriminatorio por cada dimensión (o subescala) que haya identificado. Para cada
dimensión encuentre una nueva puntuación total para cada persona que responde. Averigüe
quiénes obtuvieron el 25% superior de las puntuaciones totales y quiénes el25% inferior. En
seguida, puede tomar cada afirmación relevante para esa dimensión y ver si hay diferencias
en cómo ambos grupos responden a ella. La afirmación que no distingue entre quienes ob-
tuvieron calificaciones altas y bajas en la escala total tiene poder discriminatorio escaso y
puede eliminarse.

Críticas sobre las escalas de Ukert


Como las escalas de Thurstone, dos personas con la misma puntuación en una escala de Li-
kert pueden tener pautas de respuesta diferentes. En consecuencia, no podemos tratar una
calificación como si tuviera un significado único acerca de la actitud de una persona.

Técnicas para medir significado


Metodologfa Q
La metodología Q es una estrategia de investigación desaiTollada por Stephenson (1953).
Requiere que los participantes o jueces clasifiquen afmnaciones u otros elementos en una
dimensión determinada o sobre cierta base. La metodología Q emplea una técnica consisten-
te en hacer que los participantes realicen clasificaciones Q. Por lo general, una clasificación
Q requiere que se presente a los sujetos un conjunto de afmnaciones, cada una en una tar-
jeta, y que se les pida colocarlas en una dimensión, como Muy importante para mí o No im-
portante para mi. (Kerlinger [1973) recomienda que para garantizar una clasificación Q
_____________P~l~an~t~e~am~ie_n~to~d~e~pr~e~gu~n~t~as~ll:~m~ed~i~ci~ó~n~d~e~a~ct_it_u~d~es~y~si~g~ni~fi~ca~d~o____~¡-95

confiable, el número de afirmaciones no debe ser menor de 60 pero no mayor de 90.) Las
clasificaciones pueden utilizarse después por lo menos en tres maneras. En primer lugar,
pueden buscarse similitudes entre personas respecto a cómo clasifican los elementos. Por
ejemplo, los investigadores pueden pedir a potenciales votantes que clasifiquen por orden
de importancia un conjunto de afirmaciones. Éstas podrían incluir La inflación debe man-
tenerse baja, Las pensiones deben incrementarse, Debe mantenerse la actual asignación
de fondos al cuidado de la salud y Debemos mantener nuestro gasto actual en defensa.
Luego podrían explorarse las clasificaciones para ver si hay consenso entre los votantes en
cuanto a los temas considerados más importantes.
Un segundo uso, y más interesante, de la metodología Q sería la exploración de varios
subgrupos de personas que producirían ordenamientos similares, pero que diferirían de
C'tros subgrupos. Por tanto, en el ejemplo anterior podría encontrar que algunos clasifican
las pensiones y los fondos para el cuidado de la salud como los más importantes, mientras
que otros ponen prioridades más altas en defensa e inflación y un tercer grupo podría con-
siderar fundamentales los temas ambientales.
Un tercer uso de la metodología Q estriba en examinar el grado de acuerdo que un in-
dividuo tiene cuando clasifica objetos diferentes en la misma escala. Podría explorar el gra-
do en que una persona ve a sus padres como si fueran similares haciendo que clasifique un
conjunto de afirmaciones según el apego con que describe a un padre y hacer luego que re-
pita la clasificación de las afirmaciones para el segundo. Una vez más, podría lograr que
varias personas realicen tales clasificaciones para cada uno de sus padres y ver después si
hay un grupo que los clasifica de manera similar y otro que clasifica a cada un0 de modo
diferente.
Rogers ( 1951, 1961) ha usado clasificaciones Q en el contexto de la búsqueda de ayu-
da psicológica. Por ejemplo, puede pedirse a una persona que acude a terapia que clasifi-
que 100 ·afirmaciones en una escala de 11 puntos teniendo en cuenta si considera que las
afirmaciones la describen de manera típica. Esa clasificación Q puede compararse con otra
que tiene en cuenta si considera que las afirmaciones describen de forma típica a la perso-
na que le gustaría ser (su personalidad ideal). En varias etapas del periodo en que la persona
recibe ayuda se repetirían las clasificaciones Q. El objetivo de la terapia consistiría en lograr
que ambas clasificaciones Q tengan la mayor concordancia, ya sea con mejorar la imagen
propia de la persona o con tornar más realista su personalidad ideal. Además, Rogers ha
usado metodología Q para investigar si los psicólogos y sus pacientes concuerdan en cier-
tos temas. En este caso, se dan afitmaciones al terapeuta y al cliente y se les pide que las
ordenen por importancia. Según Rogers, el grado de acuerdo entre las dos clasificaciones
puede predecir bien el resultado de la terapia.
La metodología Q sirve para explorar teorías. Por ejemplo, las clasificaciones o los or-
denamientos se utilizan para examinar los significados de un concepto. Stenner y Marshall
(1995) la emplearon para investigar las acepciones que la persona reconoce para el \·oca-
blo rebeldía.
!11~~. .---~------~---------------------------------------------------~----~~~--------- -·----------

~~---------------l_n_
ve_s_ti~ga_c_io_'n_c_u_a_n_
ti_
ta_tl_ a _e_n~p_si_co_l_o~gí_a____________________
·v_

Criticas sobre la metodologia Q


A veces, los clasificadores se ven forzados a ordenar las afirmaciones de acuerdo con
una pauta determinada. Por ejemplo, suele indicárseles a cuántas afirmaciones pueden dar
la puntuación de 1, a cuántas 2 y así en toda la escala. Una pauta tipica sería una en la que las
pilas de afirmaciones formaran una distribución normal (consulte en el capítulo 9 una expli-
cación del término). Una segunda crítica concierne a las técnicas estadísticas aplicadas
en la metodología Q. Como se verá en los capítulos sobre análisis de datos, ciertas técni-
cas consideran la pauta de dat9s entre varias personas, no con una sola. Sin embargo, algu-
nos usuarios de metodología Q utilizan tales técnicas estadísticas en datos derivados de un
individuo.
Al considerar esas críticas, sería mejor emplear la metodología Q con fines explorato·
ríos en lugar de confiar demasiado en las técnicas estadísticas aplicadas para ello.

El diferencial semántico
Osgood, Suci y Tannenbaum (1957) idearon el diferencial semántico como una manera de
explorar cierta opinión sobre alguna entidad o, como lo expusieron, de medir cuantitativa-
mente el significado. Un ejemplo que dieron es la investigación acerca de cómo la gente ve
la política. Sugirieron que hay un espacio semántico con muchas dimensiones, donde cabrá
el s ignificado que una entidad determinada (por ejemplo, un político) tiene para alguien.
Contrastaron su método con los de otros contemporáneos y concluyeron que el suyo era ex-
plícitamente multidimensional, mientras que los métodos de los demás incluían sólo una
dimensión.
A los participantes se da una lista de pares de adjetivos bipolares como bueno-malo,
rápido-lento, activo-pasivo, seco-mojado, afilado-romo y duro-suave y se les pide clasifi-
car las entidades (los políticos), de una en una, en una escala de 7 puntos (1 para bueno y
7 para malo) para cada par. Recomendaron el diseño siguiente:

Margaret Thatcher

justa X injusta

rápida X lenta

activa X pasiva
------------~P~l~an~t~ea~m~~~·e~n~to~d~e~pr~e~gu=n~t=as~ll:~m~ed=i=ci=ó~n~d=e~a~ct=it~u=d=es~y=si~g=ni~fi=ca~d=o----~~
La persona que clasifica coloca una cruz en el cuadro abierto que parece más adecuado a
esa entidad para cada par de adjetivos.
La diferenciación semántica es el proceso de colocar un concepto en el espacio semán-
tico al clasificarlo en cada uno de los pares de adjetivos bipolares. La diferencia de significa-
do entre los conceptos se verá por su lugar en el espacio semántico. Luego se analizan las
respuestas de cierta persona o grupo para ver si forman pautas (factores). Una pauta común
es aquella en la que las clasificaciones forman tres dimensiones: Evaluación (por ejemplo,
limpio-sucio); Potencia (como fuerte-débil) y Actividad (digamos rápido-Lento).
El conjunto concreto de pares de adjetivos bipolares útiles depende del estudio en par-
ticular. Osgood y sus colaboradores indican que hermoso-horrible sería irrelevante cuando se
clasifica un candidato presidencial, pero justo-injusto poseería trascendencia; para clasifi-
car pinturas tal vez lo inverso sería la verdad. Brindan una lista de 50 pares de adjetivos.
El diferencial semántico sirve para varios propósitos: explorar las actitudes de un indi-
viduo respecto, digamos, a un partido político; comparar individuos para ver las diferen-
cias existentes sobre los significados que las entidades tienen para ellos, o evaluar cambios
después de una terapia o de una manipulación experimental.

Cuadriculas de repert orio


Kelly ( 1955) desarrolló varias técnicas que permiten a los investigadores o terapeutas ex-
plorar los significados y las asociaciones de un individuo. Por ejemplo, podrían usarse para
explorar cómo estima un fumador el tabaquismo, al observar la manera en que estima a los
fumadores y a los no fumadores y a la gente que no se identifica como ninguno de los dos.
Las técnicas son consecuencia de la teoría del constructo personal de Kelly, donde ve a los
sujetos como si pensaran de manera similar a los científicos, pues construyen un modelo
mental del mundo en que los elementos (por ejemplo, personas) se clasifican en categorías
de acuerdo con la presencia o con la ausencia de ciertos constructos (como simpatía).
En general, una cuadricula de repertorio requiere que se pida a un individuo que pien-
se en dos personas (digamos sus padres) y en un parecido entre ambas. Esa similitud forma
entonces el primer constructo de la cuadricula. La naturaleza de los constructos que la gen-
te proporciona dice algo de ella: muestra lo importante para ella, las bases que utiliza para
clasificar aspectos de su mundo (en este caso, gente). Puede emplear constructos psicoló-
gicos, como agradable, o puramente físicos, como viejo. Después de proporcionar el pri-
mer constructo, se le pedirá que considere a una tercera persona (por decir, un hermano)
y que piense en el modo en que ésta difiere de las dos anteriores. Si ello supone un nuevo
constructo, se agrega a la cuadricula. El proceso continúa hasta que se crea un conjunto de ele-
mentos y cada uso se evalúa con cada constructo. Luego se analiza cómo se perciben los
elementos a partir de los constructos en busca de pautas mediante técnicas como análisis
de conglomerados (clusters) (cap. 21). Las cuadriculas de repertorio pueden utilizarse en
un medio terapéutico para conocer la visión que un paciente tiene del mundo y cómo ésta

..
~L________________In_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

cambia durante la terapia. Asimismo, puede aplicarse con fines de investigación para inda-
gar cómo se percibe a un grupo en particular; por ejemplo, cómo consideran los ciegos a
quienes no tienen discapacidad visual. Para obtener un recuento sobre el uso de las cuadricu-
las de repertorio y otros aspectos de la teoría de los constructos personales como se utili-
zan en la psicología clínica, consulte Winter (1992).

Resumen
Las escalas que incluyen varios reactivos se prefieren para valorar actitudes personales,
pues son más confiables que las preguntas simples diseñadas para valorar la misma actitud.
Esas escalas requieren la creación de gran número de reactivos que han de evaluarse en una
muestra razonable antes de utilizarlos en una investigación. La escala más popular es en es-
te momento la de Likert. Los psicólogos también usan otros medios para evaluar lo que
se piensa acerca de aspectos de sus vidas; sobre todo, lo que tales cosas significan para los
individuos.
En el capítulo siguiente se presentará un análisis sobre la observación del comporta-
miento humano.
7
Observación y análisis de contenido

Introducción
En el presente capítulo se describen dos métodos que tal vez no parezcan iguales en la su-
perficie pero que, en realidad, presentan problemas y soluciones similares. La observación
tiende a considerarse en el contexto de percibir el comportamiento de la persona, mientras
que el análisis de contenido suele asociarse con el análisis - valga la redundancia- de tex-
tos. Sin embargo, cuando puede observarse comportamiento videograbado y cuando se ha
aplicado análisis de contenido sobre anuncios televisivos, las barreras entre ambos méto-
dos parecen difusas. Como señalamos en el capítulo 2, puede indicarse que toda la inves-
tigación psicológica se basa en la observación y medición de comportamientos (trátese de
movimiento abierto, lenguaje o estados psicológicos) porque no podemos observar directa-
mente el pensamiento. No obstante, en el capítulo restringiré el significado de la observación
a la de algún tipo de movimiento o discurso.
Tanto la observación como el análisis de contenido pueden realizarse cualitativa y
cuantitativamente. Voy a centrarme en el método cuantitativo, pero muchos de los temas
metodológicos tratados en el capítulo también sirven de guía para quien efectúa investiga-
ción cualitativa. Debido a la superposición entre ambos métodos, empezaré por describir la
observación, luego echaré un vistazo a los aspectos de la investigación comunes para los
dos métodos. Describiré una forma de observación estructurada y, por último, revisaré el
análisis de contenido.

99
1(K}lL______________~In~v~e~st=ig~a~c~io=·n~c=u~a~n~ti~ta~t~iv~a~e=n~p~s~ic~o~lo~g~ía~--------------------
Observación
¿Cuándo es aplicable?
En varias situaciones desearemos efectuar una observación. Por lo general, es así cuando
no se cuenta con un reporte verbal exacto. Una de tales ocasiones se presenta cuando los
sujetos de estudio tienen poco repertorio lingüístico, o carecen de él, como los niños pe-
queños. Asimismo, tal vez quiera explorarse el comportamiento que ocutTe sin que su autor
esté consciente de lo que hace, como sucede en gran parte de la comunicación no verbal,
como cuando se establece contacto visual. Otra área en que vale la pena indagar es aquella
donde interesa a los investigadores resolver problemas. Es común el caso de expertos, co-
mo médicos, quienes para diagnosticar enfermedades no suelen seguir la ruta de razona-
miento que se les enseñó, pero cuando se les pide que describan su procedimiento reportan
el que se les enseñó originalmente. La observación ayudaría mucho a aclarar las etapas que .
tal diagnóstico recorre.
Una cuarta situación donde la observación resulta apropiada es cuando los participan-
tes desean presentarse bajo una luz favorable, como las personas prejuiciosas contra una
minoría étnica y que tal vez no admitan la manera en que se comportan con miembros de
ese grupo minoritario. Sin embargo, aun cuando se cuente con reportes verbales exactos,
vale la pena realizar observaciones para complementarlos.

Tipos de observación
Las observaciones pueden clasificarse de varias maneras. Una se basa en el grado en que
el psicólogo participa en el comportamiento analizado. Ello abarca desde el participante
completo, cuyo papel como observador se oculta a los demás sujetos que toman parte, has-
ta el observador completo, quien no interviene en absoluto y tiene un papel que también se
oculta a dichas personas. Un ejemplo del primer caso sería un investigador que se une encu-
biertamente a una organización para explorarla desde el interior. Uno del segundo incluiría
la observación de personas en un centro comercial para ver cómo utilizan el espacio. Entre
ambos extremos se hallan varias gradaciones. Una es la de participante-como-observador,
que --como el nombre lo indica-- requiere que los investigadores tomen parte en la acti-
vidad que se observa pero que revelen que son investigadores. En ocasiones, la labor del
participante completo y del participante-como-observador se describe como investigación
etnográfica.
La clasificación siguiente, partiendo de la participación directa, es la de participante
marginal. En ésta, es posible que los investigadores den pasos, como vestir cierta ropa,
para no obstruir la observación. Luego sigue el observador-como-participante. Los in-
vestigadores revelan que están explorando, pero no intervienen directamente en la acción
analizada. Esta clasificación destaca que la presencia de aquéllos puede tener cierto efecto
•' en el comportamiento de los demás y, por tanto, la mayoría de los observadores participan en
algún grado.
O_b_se_~
_________________________ _a_c_io_·n~y_a_n_
ál_is_is_d_e__
co_n_t_e_ni_d_o_______________J~

Otra manera de clasificar los tipos de observación se relaciona con el nivel en que se
observa y registra el comportamiento. El comportamiento molar se refiere a uno de mayor
escala, como saludar a una persona que entra en la habitación; este nivel de observación pue-
de requerir interpretación del observador respecto a la naturaleza del comportamiento. Por
comportamiento molecular se entienden los componentes del comportamiento molar, y es
menos probable que precise interpretación. Por ejemplo, una descripción molecular del
comportamiento definido antes como saludar a quien entra en la habitación seria ésta: "Tien-
de la mano al recién llegado; toma la mano del recién llegado y la sacude; eleva la comisu-
ra de los labios y hace breve contacto visual; suelta la mano del recién llegado".
Una forma más de clasificar la observación depende del grado en que esté predetermi-
nada su naturaleza. Ello abarca de lo que se denomina observadón informal o casual a la
formal o sistemática. En la informal, los investigadores pueden anotar lo que consideran de
interés en el momento; este procedimiento suele ser precursor del sistemático y se utiliza
para obtener una idea respecto al repertorio de comportamientos posibles. En la observa-
ción sistemática se buscan aspectos específicos de comportamiento con la idea de probar
hipótesis.
La última forma de ver los tipos de observación se basa en las posiciones teóricas de los
investigadores. Probablemente la etología (el estudio de animales y de seres humanos en su
medio natural) recurra más a la observación de comportamiento molecular y a poca interpre-
tación. Tal vez la observación estructurada utilice más interpretación y aborde comporta-
miento más molar. La etnografia quizá demande más información e interpretación casual,
además de una introspección del observador. Quienes emplean la observación ecológica
estarán interesados en el contexto y el ambiente donde ocurrió el comportamiento y, tam-
bién, en la inferencia de los significados y las intenciones de los participantes.
El uso de palabras como tal vez y probablemente en el párrafo anterior se debe a mi
creencia de que ninguna de tales formas de clasificar la observación describe modos mu-
tuamente excluyentes de realizar una observación. Diferentes maneras son complementa-
rias, y los mismos investigadores pueden utilizarlas en triangulación. Además, diversos
métodos pueden representar varias etapas en una sola pieza de investigación, como se su-
girió antes.

Obtención de acceso
Sí va a observar una situación abierta al público (por ejemplo, una escuela, una prisión, una
institución psiquiátrica o una compañía), hay un obstáculo inicial por vencer: la obtención
de acceso a las personas que realizan sus tareas ·diarias. Si permanecerá totalmente encu-
bierto, entonces tal vez deba afiliarse a la institución por el mismo medio que los otros
miembros lo han hecho. Antes de decidir si estará encubierto del todo, considere los temas
éticos afines (consulte el capítulo 1). Por otra parte, si consigue un confidente en la o~-
1 .-~- ------ ------------~~

~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s~ic_o_lo~g~ía__________________

nización puede obtener acceso sin revelar a todos sus intenciones. Aunque su p~pel como
investigador sea abiertamente conocido, necesita que alguien le ayude a introducirse y que
dé a la tarea cierta legitimidad.
Procure no identificarse demasiado con esa persona, pues es probable que no agrade a
los demás o que a éstos les preocupe lo que podría revelar, lo cual matizaría el comporta-
miento hacia usted.
Ha de tranquilizar a la gente acerca de sus objetivos. Para ello, tal vez deba modificar lo
que expresa, de modo que los sujetos no se pongan innecesariamente en guardia o incluso
se vuelvan hostiles. Piense si es necesario indicar a los profesores de escuela que, como psi-
cólogo, trata de comparar los enfoques que aplican para la enseñanza de matemáticas con
las recomendaciones de los teóricos. Seria mejor explicar que le interesa la manera en que la
planta docente enseña ese tema y en sus opiniones. No recomiendo que recurra al engaño;
lo que dice es verdad, pero si presenta su informe completo, los instructores podrían com-
portarse y hablarle de modo que se amolde a lo que piensan que usted debe oír, en lugar de
reflejar lo que realmente hacen. Vale la pena destacar el valor que tendrá para ellos cual-
quier invest:gación que usted lleve a cabo; garantice confidencialidad, de manera que los
individuos no sean identificados, y muestre su deseo de compartir sus descubrimientos con
ellos; cumpla estas promesas.

Métodos de grabación
El método idóneo para registrar lo observado es el que no obstruye y que preserva en lo po-
sible el .comportamiento original. Un sistema de medición que no obstruye reduce al máxi-
mo el efecto del investigador sobre los participantes; no tiene mucho sentido obtener un
registro carente de validez ecológica porque los participantes modificaron su comporta-
miento debido a que se les estudiaba. De igual manera, tiene poco interés explorar com-
portamientos con plena validez ecológica si no puede registrarse lo que se quiere. En la
circunstancia correcta, las videocámaras conectadas a un buen sistema de audiograbación
ofrecen lo mejor de estos dos mundos.
Puede tenerse una habitación construida a propósito, con cámaras y micrófonos con-
trolados desde otro cuarto. Los movimientos de la cámara --cambios de foco y de ángu-
lo- han de ser lo más silenciosos posible, lo cual se logra con las cámaras modernas. La
grabación visual que proporciona el vídeo resulta útil aunque la investigación se centre en
el lenguaje, pues pondrá a éste en su contexto. Mantener las cámaras lo más cerca del techo
las tornará menos evidentes, pero se requerirá una habitación de buen tamaño para grabar
más que la simple vista de las cabezas de la gente.
Una sola cámara puede significar que, a menos que se restrinjan la posición y el movi-
miento de los sujetos de estudio, se grabará sólo parte de la acción. Una combinación de dos

-
o tres aparatos reducirá el número de puntos ciegos en una habitación. Pueden grabarse
O_b_se_~_a_c_i_
_________________________ o·n~y_a_
na_'l_is_is_d_e__
co_n_t_en_i_d_o______________~¡-voJ

las imágenes de más de una cámara directamente en una sola videocinta. Ello permite a los
investigadores ver las caras de dos personas que conversan frente a frente o analizar a un
solo individuo en acercamiento o a la distancia.
Aparte de las ventajas descritas, el vídeo permite a los investigadores ver varias veces
la misma pieza de comportamiento. Así, puede observarse la misma conducta en varios nive-
les, lo cual permite centrarse, en diferentes ocasiones, en diversos aspectos del comporta-
miento. También toma factible grabar en la cinta una medida del tiempo transcurrido; ello
ayuda al muestreo y al cálculo del tiempo que duran ciertos comportamientos. Una venta-
ja adicional radica en que la cinta puede reproducirse a distintas velocidades para detectar
- los comportamientos de gran rapidez. El vídeo también permite verificar más fácilmente la
confiabilidad de las mediciones.
Por muchas razones quizá no pueda usar el laboratorio construido a propósito. Sin em-
bargo, aun en investigación de campo puede utilizar una cámara de mano o con un tripié. Por
fortuna, la gente tiende a habituarse a la presencia de una cámara o de una grabadora de au-
dio si no interfieren mucho. Si los individuos dudan al conceder su permiso para que se les
registre, concédales la oportunidad de indicar cuándo desean que el dispositivo de grabación
se apague y, para tranquilizarlos, especifiqueles qué uso dará a las grabaciones. No obstante,
tal vez haya situaciones en que observe de manera encubierta o en que se le haya denega-
do el permiso de grabar. En el último caso, tendrá un problema de selectividad y de saber
cuándo anotar lo que ha sucedido.
Si pretende una observación más impresionista, tal vez deba tomar descansos compara-
tivamente frecuentes para anotar sus observaciones; sin duda, tendrá problemas para depen-
der de su memoria y verificar la confiabilidad. Aun cuando haya tomado notas, requiere
tiempo para ampliarlas en cuanto sea posible, después del evento. Si desea una observa-
ción más formal, lo aconsejable radica en crear una lista de verificación de conductas en la
forma más conveniente para anotar lo ocurrido y, si lo precisa, la duración de comporta-
miento relevante. En ese caso, tal vez pueda verificar la confiabilidad de ese conjunto de
observaciones si hace que un segundo observador utilice la lista de verificación al mismo
tiempo. Por lo menos debe verificar la confiabilidad general de ésta haciendo que dos o más
observadores la empleen mientras exploran cierto comportamiento relevante. Es posible
anotar más información si se utilizan varios observadores para que cada cual se centre en
diferentes aspectos de la conducta o que supervise a distintas personas.

Temas compartidos entre la


observación y el análisis de contenido
Como se ha recalcado en capítulos anteriores, debemos estar seguros de que nuestros e-
mas de medición son confiables y válidos. En la observación y en el análisis de contenido,
tales temas resultan particularmente problemáticos a medida que empezamos a emplear
1Q4lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
sistemas más subjetivos. Por ejemplo, .en ambos métodos quizá deseemos clasificar si el dis-
curso o el texto resulta humorístico o sarcástico. Para que otros puedan utilizar nuestro siste-
ma de clasificación necesitamos hacer operativa la definición de nuestros conceptos. Sin
embargo, hemos de ser cuidadosos para no producir un sistema de medición confiable pero
carente de validez.
Las categorías del sistema de clasificación serán mutuamente excluyentes, es decir, un
segmento de conducta no puede colocarse en más de una categoría.
Una vez ideado un sistema de clasificación, debe red~ctarlo, con ejemplos, y capacitar
a otro investigador en su uso. Luego, con el empleo de un nuevo episodio de conducta o un
nuevo segmento de texto, tendrá que verificar la confiabilidad entre jueces (es decir, el gra-
do en que quienes evalúan, trabajando por separado, están de acuerdo en sus clasificacio-
nes del comportamiento o el texto). Si la concordancia es mala, debe refinar el sistema y
negociar las diferencias entre los clasificadores. Consulte en el capítulo 19 cómo cuantifi-
car la confiabilidad y lo que constituye un nivel aceptable de concordancia.
Siempre se halla presente un problema de sesgo del observador o del juez, en que éste
permite que su conocimiento afecte sus juicios. Ello disminuirá si está ciego a la hipótesis
de los investigadores y a la condición específica que observa. Por ejemplo, si los investiga-
dores compararan participantes a quienes se dio alcohol con otros a los que se administró
placebo, no dirían a los jueces en qué condición se halla un participante, o ni siquiera cuáles
son las condiciones posibles. Además, los jueces deben estar ciegos a los juicios de los otros
evaluadores.
Otro problema es la inercia del observador, donde posiblemente debido al aburrimien-
to, la confiabilidad empeora con el tiempo. Es probable que los jueces permanezcan más
vigilantes y resulten más confiables si piensan que se verificará una muestra aleatoria de
sus puntuaciones.

Transcripción
Una desventaja del videocasete y, en menor medida, de la cinta de audio, se halla en la
gran cantidad de información por escudriñar. Ello puede consumir mucho tiempo. Resulta
tentador pasar las cintas a alguien más para que transcriba las descripciones o, más par-
ticularmente, las palabras dichas. Si bien esto ahorra tiempo a los investigadores y ayuda a
proporcionar un registro más útil para leerlo con atención, parece buena idea ver y escu-
char las cintas originales. Es muy útil conocer el contexto en que ocurrió el comporta-
miento, el discurso y la entonación originales. Una solución intermedia consiste en tener
una transcripción a la que se añadirán notas tomadas de la observación de la grabación
original.
________________________O_b_
se_N_a_c_io_·n~y~an_á_li_si_s_d_e_c_o_nt_e_nl_·d_o______________~f105

Tipos de datos
En primer lugar, probablemente extraerá una lista de categorías y subcategorías de conduc-
ta relevante. Luego debe determinar si registrará la frecuencia. con que ocurre una conducta
en particular o su duración. Además, tal vez le interesen secuencias específicas de eventos
a fin de buscar pautas en cómo ciertas conductas siguen a otras. Aun cuando le interese sólo
la frecuencia con que ocurren ciertas conductas, tal vez valga la pena poner esto en dife-
rentes marcos temporales para ver si ocurre un cambio con el tiempo. Además, en el caso
de juicios más subjetivos, quizá prefiera obtener evaluaciones de aspectos, como el grado de
emóción.

Muestreo
El muestreo puede realizarse a partir del tiempo y del lugar, además de la gente. El muestreo
continuo de tiempo real consiste en observar el comportamiento todo el tiempo que se reaJj-
za. Ello consume mucho tiempo y además existen maneras de seleccionar periodos más
cortos de la duración completa. El muestreo temporal de punto requiere la elección de momen-
tos específicos, anotando si ocurren entonces las conductas objetivo. Esto podría efectuarse de
manera regular o aleatoria. Como alternativa, el muestreo temporal de intervalo consiste en
la elección de lapsos de una duración fija en etapas seleccionadas de la duración general,
anotando la frecuencia de los comportamientos objetivo durante los periodos fijos .
Debe pensar en los periodos y ambientes que le gustaría incluir en la muestra. Por tanto,
si explora el comportamiento de estudiantes en la universidad, acaso desee observar confe-
rencias, cursos, seminarios, bibJjotecas, comedores y dormitorios. Además, querrá observar
durante la semana de inicio de cursos. en varios momentos de cada año, incluso durante los
periodos de exámenes y graduación.
Un ejemplo de muestreo sistemático para un análisis de contenido sobre anuncios comer-
ciales de televisión consiste en obtener anuncios que representen lo mostrado en diferentes
lapsos del día, como programas durante el desayuno, el día, la tarde y la noche cuando aún
la miran niños, en horas pico y a medianoche. El enfoque aleatorio supondría la elección de
cierto número de ejemplares del año anterior de una revista, al azar, a partir del número del
ejemplar. Consulte en el capítulo 11 un análisis de la selección aleatoria.

Observación estructurada
Una forma de observación estructurada que se usa ampliamente es el análisis de proceso
de interacción (IPA, interaction process analysis), el cual fue ideado por Bales (1950).
,..

1Q6l~---------------'~nv~e~s~ti~ga~c~ió~n_c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a____________________

Análisis de proceso de interacción de Bales


El rPA puede utilizarse para observar la dinámica en un grupo pequeño a fin de identificar
los estilos de interacción que adoptan los miembros del grupo. Por ejemplo, es posible que
surjan diferentes tipos de líder (los que están predominantemente concentrados en la tarea
y los que lo están en la cohesión del grupo). Además, puede subdividirse el periodo de in-
teracción para buscar los cambios del comportamiento con el tiempo. Una lista de verifica-
ción de conductas sirve para anotar clases concretas de éstas, quién las mostró y a quién iban
dirigidas, incluido si lo hacía en el grupo completo. Las conductas se inscriben en cuatro
categorías generales: positiva, negativa, planteamiento de preguntas y respuesta a pregun-
tas. Si se conducen en vivo, lo idóneo sería tener tanto observadores como participantes,
aunque un número mayor de observadores permitiría alguna verificación de la confiabilidad
entre evaluadores.

Análisis de contenido
El análisis de contenido puede verse como una forma de observar sin intrusión, pues el
experimentador no está presente cuando las acciones se desarrollan, sino que analiza los
trazos dejados por éstas. En general, requiere el análisis de textos, como artículos de pe-
riódico o transcripciones de un discurso o de una conversación. Sin embargo, puede apli-
carse en otro medio, como un anuncio de televisión.
Un análisis de contenido típico incluye la observación de cómo las personas se repre-
sentan a sí mismas y a quienes buscan mediante anuncios en colwnnas de corazones solita-
rios de una revista. El analista podría investigar si hay diferencias entre hombres y mujeres
en sus métodos y en las palabras que usan. Por ejemplo, ¿los hombres se centran en su ri-
queza y sus posesiones pero aluden a los atributos físicos de la pareja que esperan? ¿Los
hombres y las mujeres hacen uso diferente del humor? Las categorías buscadas podrían deri-
varse de una teoría de cómo se comportarían los hombres y las mujeres o de una observa-
ción preliminar de los anuncios para ver cuáles dimensiones sobresalen. Una vez definidas
las categorías, un análisis de este tipo requerirá el conteo del número de hombres y muje-
res que muestran estilos particulares en sus anuncios.
Manstead y McCulloch (1981) condujeron otro ejemplo de un análisis de contenido.
Examinaron anuncios mostrados en la televisión británica para ver si se representaba de
manera diferente a los hombres y a las mujeres. Para empezar, identificaron, donde era po-
sible, los personajes clave de varón y de dama. Luego clasificaron los anuncios de acuerdo
con la naturaleza del producto que se vendía y los papeles que hombres y mujeres desem-
peñaban en los mensajes (como emisores o receptores de la infonnación).
O_b_se_~_a_c_io_'n_y~a_na_'l_is_is_d_e_c_o_n_t_en_i_do______________~~
_________________________

Resumen
La observación y el análisis de contenido son dos métodos no experimentales de conside-
rar la conducta. En el caso de la observación, el investigador suele estar presente cuando
ocurre la acción y varia el grado en que los participantes están enterados de la presencia e
intenciones del observador. Por otra parte, el análisis de contenido se conduce sobre el pro-
ducto de la acción, y el analista no se halla presente cuando se realiza ésta. Ambos métodos
requieren que se idee un sistema para clasificar el material que se analiza. Por tanto, es ne-
cesario examinar en los dos la validez y la confiabilidad de los sistemas de clasificación.
En los capítulos 8 y 22 se tratará el tema de la recolección de datos en la investigación
y cómo analizarlos.
8
Escalas de medición

Introducción
En el capítulo 2 se analizaron las diferentes formas de medición que utilizan los psicólogos.
Además, se recalcó la necesidad de comprobar que aquéllas son válidas y confiables. En el pre-
sente capítulo se mostrará cómo tales mediciones pueden clasificarse en cuatro escalas. Se
contrastará esto con la manera en que los expertos en estadística se refieren a las escalas.
Se analizarán también las consecuencias del uso de una escala de medición en particular.

Ejemplos de mediciones
Las preguntas siguientes dan lugar a respuestas que difieren en el tipo de medición reque-
rido. Antes de pasar a la próxima sección, observe las preguntas y vea si encuentra diferen-
cias en el tipo y en la precisión de la información que cada respuesta proporciona.

1. Género: ¿femenino o masculino?


2. ¿Cuál es la ocupación de su madre?
3. ¿Cuánto mide (en centímetros)?
4. ¿Cuántos años tiene?
10-19 20-29 . 30-39 40-49 50-59
5. ¿Cuál es su color favorito?
6. ¿Qué periódico lee?
7. ¿Cuántos hermanos tiene?
8. ¿Cuál es su bebida no alcohólica favorita?
_____________________________E_sc_a_la_s_d_e_m_ed
__io_._ón____________________~f109

9. ¿Come carne?
10. ¿Cuánta'S horas prefiere dormir por la noche?
11. ¿De qué color son sus ojos?
12. ¿Cuántas unidades de alcohol bebe por semana?
(1 unidad= un vaso de cerveza, una medida de alcohol o un vaso de vino)
13. ¿Su memoria es ...?

mucho mejor mejor que promedio


que el promedio el promedio

14. ¿Cuántos años tiene su padre?


15. ¿A qué temperatura ambiente (expresada en centígrados) se siente cómodo?
16. ¿A cuánto ascienden sus ingresos anuales?

Escalas de medición
Hay cuatro escalas que se utilizan para describir las mediciones posibles; lea sus descrip-
ciones y luego trate de clasificar las 16 preguntas anteriores en las cuatro. Las respuestas
se darán al final de la sección siguiente.

Nominal
La escala nominal de medición se usa para describir datos integrados únicamente por nom-
bres o categorías (de allí su otro nombre: nivel categórico). Por tanto, la respuesta a la pre-
gunta ¿vive en las instalaciones universitarias? constituye una forma de dato nominal. Los
datos nominales no son sólo binarios (donde hay sólo dos contestaciones posibles). La res-
puesta a ¿cómo viaja a la universidad? también representa un dato nominal.

Ordinal
La escala ordinal se refiere, como su nombre lo indica, a los datos que pueden colocarse
en un orden. Por ejemplo, las clasificaciones de grados universitarios en lo., 2o. y 3o. for-
man una escala ordinal.

De int ervalo
La escala de intervalo incluye datos que indican más que simplemente un orden; señala el
grado de diferencia entre dos calificaciones: Por ejemplo, si se le dice la temperatura, ex-
presada en grados Fahrenhcit, de dos habitaciones, sabrá no sólo que una es más cálida que
la otra, sino también en cuánto.
110l~· _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
De razón
La escala de razón le proporciona, como la de intervalo, información acerca de la magni-
tud de las diferencias entre lo que está midiendo. Sin embargo, reúne la propiedad adicional
de que Jos datos deben tener un cero verdadero; en otras palabras, cero significa que la pro-
piedad que se mide carece de una cantidad. Por ejemplo, el peso expresado en kilogramos
es una escala de razón. Ello puede resultar confuso porque cuando se pregunta a la gente su
peso, no puede responder "cero kilogramos"; esto significaría que no cuenta con peso. La tem-
peratura en grados Fabrenheit se encuentra en una escala de intervalo y no en una de razón
porque cero grados Fabrenheit constituye una temperatura mensurable.
En el caso de una escala de razón, podemos hablar de la razón entre dos entidades me-
didas en ella porque hay un punto de partida fijo. Por ejemplo, si comparamos la estatura
de una persona que mide 100 centímetros con la de otra de 200, podemos decir que la pri-
mera tiene la mitad de la altura de la segunda. En el caso de la temperatura, no hay un punto
de partida fijo para la escala; por ello, no es verdad si se dice que 40 centígrados es la mi-
tad de 80 centígrados.
Comprenderá el concepto si convierte la escala a otro tipo de unidades para ver si la ra-
zón entre dos puntos permanece igual. Si el ejemplo de la altura se cambia a pulgadas, donde
cada una equivale a 2.54 centímetros y 0.00 centímetros es lo mismo que 0.00 pulgadas, la
persona de menor estatura mide 39.37 pulgadas y la más alta 78.74. La conversión no ha
cambiado la relación entre ambos individuos; el primero mide la mitad del segundo. Sin
embargo, si convertimos 40 y 80 centígrados a Fabrenheit, obtendremos 104 y 176 grados,
respectivamente. Queda claro que una temperatura no es la mitad de la otra. Por fortuna
para cualquier lector que no comprenda la diferencia entre escalas de intervalo y de razón,
las estadísticas explicadas en este libro tratan de la misma manera los datos de razón y los
de intervalo.

La relevancia de las cuatro escalas


A medida que pase de datos nominales a datos de razón, obtendrá más información acerca
de Jo que se mide. Por ejemplo, si pregunta:
¿Fuma? (Sí!No)

obtendrá datos nominales.


Si pregunta:

¿Fuma?
Nada e n absoluto.
Entre uno y 1O cigarrillos al día.
Más de 1O cigarrillos al día.
----------------------------~E=s~ca~l~as~de~m~e=d~ic~io~-n~------------------~¡-111
obtendrá datos ordinales que le ayudarán a distinguir, entre los fumadores, a quienes fuman
mucho y a quienes fuman poco,
Por último, si pregunta:
¿Cuántos cigarros fuma al día?

recibirá datos de razón que le indicarán con más precisión cuánto fuma la gente.
La diferencia importante entre las tres versiones de la pregunta es que usted puede apli-
car distintas técnicas estadísticas, según cuente con datos de intervalo/razón, ordinales o
nominales. Cuanto más información proporcione, tanto más informativas serán las estadís-
ticas que derive de ella.
De acuerdo con lo anterior, si se le proporciona una medida situada en una escala de
razón, estará desperdiciando información si la trata como ordinal o nominal.
Las preguntas siguientes le dan datos nominales:

1. Género: ¿femenino o masculino?


2. ¿Cuál es la ocupación de su madre?

Vale la pena señalar que si quisiera ordenar las ocupaciones sobre la base, digamos, del es-
tatus, convertiría los datos en una ·escala ordinal. Sin embargo, si no tiene un. orden, perma-
necerán en una escala nominal. ~
Otras escalas nominales son éstas:

5. ¿:uál es su color favorito?


6. ¿Qué periódico lee?
8. ¿Cuál es su bebida no alcohólica favorita?
9. ¿Come carne?
11. ¿De qué color son sus ojos?

Las preguntas siguientes arrojan datos ordinales:

4. ¿Cuántos años tiene?


10-19 20-29 30-39 40-49 50-59
13. ¿Su memoria es... ?

mucho mejor mejor que promedio peor mucho peor


que el promedio el promedio que el promedio que el promedio

El ejemplo anterior puede confundir, pues indica que las opciones son simplemente nom-
bres o categorías, pero note que forman un orden; quien asegura tener una memoria mejor
que el promedio afirma que la suya es mejor que la de alguien con una memoria promedio.
peor que el promedio o mucho peor que el promedio.
112l~ _______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
La pregunta siguiente es una de las pocas que ofrecen datos de intervalo, no de relación:

15. ¿A qué temperatura ambiente (expresada en centígrados) se siente cómodo?


Las preguntas siguientes le darían datos de razón:
3. ¿Cuánto mide (en centímetros)?
7. ¿Cuántos hermanos tiene?
10. ¿Cuántas horas prefiere dormir por noche?
12. ¿Cuántas unidades de alcohol bebe por semana?
(1 unidad = un vaso de cerveza, una medida de alcohol o un vaso de vino)
14. ¿Cuántos años tiene su padre?
16. ¿A cuánto ascienden sus ingresos anuales?

Indicadores
Una consideración adicional sobre el nivel de una medición específica estriba en cómo ha-
brá de usarse; qué indica. Se ha señalado que los psicólogos en raras ocasiones tienen me-
diciones directas de lo que desean observar. Esto resulta particularmente cierto si tratan con
algo --digamos un estado socioeconómico- que tal vez quieren definir. Mediciones co-
mo años de estudios o ingresos se encuentran en el nivel de razón, pero cuando se utilizan
para indicar el estatus socioeconómico son ordinales, pues una diferencia del mismo tamaño
en ingresos significará cosas distintas en diversos puntos de la escala. Por tanto, una persona
que gana 200 000 pesos al año se halla en una situación mucho mejor que alguien que percibe
l 00 000, mientras que quien gana 2 600 000 al año no está mucho mejor pagado que alguien
que obtiene 2 500 000. Con el ejemplo anterior se demostró que un aumento absoluto tenT
drá significado diferente en distintos puntos de la escala. Sin embargo, incluso el mismo
aumento en proporción o razón puede tener significados diversos en diferentes puntos de
la escala. Es más probable que un aumento de 10% tenga mayor importancia para quienes
ganan l 00 000 al año (e incluso puede llevar a clasificarlos en un grupo socioeconómico di-
ferente) de lo que sería 10% para el individuo que percibe 2 500 000.

Especialistas en estadística y escalas


Los especialistas en estadística tienden a clasificar las escalas numéricas en tres tipos: conti-
nuas, discretas y dicotómicas. La diferencia entre las primeras y las segundas se ilustra con
, tipos de reloj. El análogo (con manecillas que giran) le da la hora en una escala conti-
dos
nua, ya que puede señalarle cada hora posible. El digital, sin embargo, recorta el tiempo en
unidades iguales y, cuando ha pasado una, indica la siguiente, pero no marca la hora entre uni-
dades; da el tiempo en una escala discreta. En ocasiones, la distinción entre una escala con-
tinua y una discreta llega a ser borrosa. Los ejemplos del reloj pueden aplicarse para ilustrar
-----------------------------~-c_a_la_s_d_e_m_e_d_i_ci_ón____________________~J113
el tema. A menos que el reloj análogo sea suficientemente grande, resultará difícil efectuar
mediciones muy exactas; podría utilizarse sólo para dar la hora en múltiplos de segundos,
mientras que un reloj digital puede darle una medición muy precisa, incluso en milisegundos.
Dicotómica se refiere a una variable que puede tener sólo dos valores (por ejemplo, sí
y no). Otro término para dicotómico es binario.
Vuelva a las 16 preguntas del principio del capítulo y trate de identificar las que pue-
den clasificarse como continuas, discretas o dicotómicas.
Las preguntas siguientes arrojan respuestas que se miden en una escala continua (si se
interpreta que pertenecen a ese nivel de precisión):

3. ¿Cuánto mide (en cent ímet ros)?


10. ¿Cuántas horas prefiere dormir por la noche?
12. ¿Cuántas uni dades de alcohol bebe por semana?
(1 unidad = un vaso de cerveza, una medida de alcohol o un vaso de vino)
14. ¿Cuántos años tiene su padre?
15. ¿A qué temperatura ambiente (expresada en centígrados) se siente cómodo?
16. ¿A cuánto ascienden sus ingresos anuales?

Las preguntas siguientes arrojan respuestas que se encuentran en una escala discreta:

2. ¿Cuál es la ocupación de su madre?


4. ¿Cuántos años tiene?
10-19 20-29 30-39 40-49 50-59
5. ¿Cuál es su color favorito?
6. ¿Qué periódico lee?
7. ¿Cuántos hermanos tiene?
8. ¿Cuál es su bebida no alcohólica favorita?
11. ¿De qué color son sus ojos?
13. ¿Su memoria es...?

mucho mejor mejor que promedio peor mucho peor


que el promedio el promedio que el promedio que el promedio

Las preguntas siguientes arrojan respuestas que se hallan en una escala dicotómica:

1. Género: ¿femenino o masculino?


9. ¿Come carne?

Los psicólogos se sitúan en al menos dos campos: los que aplican la clasificación nominaL or-
dinal o de intervalo/razón de medición para decidir cuál estadística emplear; y los que pre-
fieren seguir el sistema de clasificación de los expertos en estadística. Sin embargo. deben
~~----------------ln~v~e~st~ig~a~c~io~·n_c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
considerarse ambos sistemas. Como verá en el capítulo 14, otros criterios importantes in-
dican cuál versión de un procedimiento estadístico emplear. Mí percepción es que ambas
maneras de clasificar las escalas resultan válidas y que podemos seguir el consejo de los
expertos en estadística respecto a la elección de pruebas estadísticas, pero hemos de reparar
en lo que las mediciones significan (lo que indican) y, por tanto, en el sentido que podemos
dar a los resultados del análisis estadístico.

Resumen
Hay dos métodos para clasificar escalas de medición. Los psicólogos tienden a describir
cuatro de éstas: nominal, ordinal, de intervalo y de razón. Cada una proporciona un deter-
minado nivel de información; la escala nominal ofrece la menor cantidad de información, y
la de razón la mayor. En cuanto a las técnicas estadísticas descritas en el libro, las es'calas
de mediciones de intervalo y de razón pueden tratarse igual. Los expertos en estadística pre-
fteren hablar de escalas continuas, discretas y dicotómicas. Ambos sistemas de clasifica-
ción deben tomarse en cuenta. Una consideración adicional que determina cómo clasificar
una medición es lo que se pretende indicar. La escala de una medición tiene efecto sobre el
tipo de estadística utilizable en esa medición.
En el capítulo siguiente se presentan las maneras en que pueden describirse los datos,
tanto numérica como gráficamente.
·~

9
Resumen y descripción de datos
.
111

Introducción
La primera fase del análisis de datos consiste en la producción de un resumen. Esta mane-
ra de describir los datos puede ser numérica o gráfica. Reviste utilidad particular porque
puede mostrar si los resultados de la investigación concuerdan con la hipótesis del investi-
gador. Los expertos en estadística confieren una importancia creciente a esta etapa y la han
descrito como análisis de datos exploratorio (EDA, exploratory data analysis). Los psicó-
logos tienden a subemplear el EDA como una etapa de su análisis.

Métodos numéricos
Datos de razón, de intervalo u ordinales
Medidas de tendencia central
Cuando haya recolectado datos acerca de los participantes deseará elaborar un resumen que
le dé una idea sobre los resultados de los participantes que ha estudiado. Imagine que ha
entregado a un grupo de 15 adultos una lista de 100 palabras y que le ha pedido a cada per-
sona que recuerde el mayor número de palabras posible. Las puntuaciones de recuerdo son
las siguientes:

3, 7, 5, 9, 4, 6, 5, 7, 8, 11, 10, 7, 4, 6, 8

------------------------------------------------------------~
f115
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_l~og~ía______________________

Ésta es una lista de lo que se denomina datos crudos. Tal como se presentan, proporcionan
poca información acerca del fenómeno que se estudia. El lector puede revisar los datos cru-
dos y tratar de obtener una idea de su aspecto, pero posee mayor eficacia utilizar alguna
forma de estadística de resumen o despliegue gráfico para presentar los datos. Esto es aún
más cierto cuando hay un número mayor de puntos de datos.
El tipo más común de estadística de resumen es el que trata de presentar alguna espe-
cie de valor central de los datos. Esto suele denominarse promedio. Sin embargo, hay más
de un promedio; a continuación se presentan los tres más comunes.
Media. La media es aquello en lo que la gente suele pensar cuando utiliza el término pro-
medio. Se encuentra al sumar las puntuaciones y dividir la respuesta entre el número de
éstas. Para encontrar la media de recuerdo del grupo de 15 participantes, sumaría las 15
puntuaciones, lo que daría un total de 100, y luego dividiría el resultado entre 15, lo cual
significaría una media de 6.667. El símbolo más común para la media de una muestra es x.
Los expertos en estadística emplean letras minúsculas del alfabeto latino para simbolizar
estadísticas calculadas a partir de una muestra.
Mediana. La mediana es el valor que se encuentra en medio de todos los valores. Por tan-
to, para encontrar la de recuerdo del grupo de 15 participantes, deben ordenarse las puntua-
ciones de recuerdo.

Tabla 9 . 1. Número de palabras recordadas por participante, en rango.


Rango Recuerdo
1 3
2 4
3 4
4 5
5 5
6 6
7 6
8 7 <-··· Mediana
9 7
10 7
11 8
12 8
13 9
14 10
15 11
_________________________R_e_su_m_e_n~y~d_e_s_
cn~·p~c_io_·n_d_e__
da_t_o_s______________~f117

Ahora cuente hacia arriba, hasta la persona con el octavo mejor recuerdo (la situada en una
posición donde el número de sujetos con mejor recuerdo es el mismo que los que tienen
peor recuerdo). Su recuerdo es la mediana del grupo. En este caso, la mediana de recuerdo
es 7. De haber un número par de personas, no figuraría persona alguna en medio del gru-
po. En ese caso, la mediana caerá entre la mitad con el peor recuerdo y la mitad con el me-
jor recuerdo. Tome la media del individuo con el mejor recuerdo de la mitad inferior del
grupo y la persona con el peor recuerdo de la mitad superior. Ese valor será la mediana
del grupo. Si una persona con una puntuación inferior a 7 se agregase a las 15 puntuacio-
nes mostradas en la tabla 9.1, la mediana estaría entre el 7o. y el 8o. rangos actuales, en
6.5. Sin embargo, si se agregase a los 15 una persona con una puntuación de 7 o más, la
mediana se encontraría entre los actuales 7o. y 8o. rangos, en 7.
Modo. El modo es el valor que más se presenta entre los participantes. En la tabla 9.1 la pun-
tuación de recuerdo más frecuente fue 7. Como la mediana, el modo se identifica mejor si
las puntuaciones se ordenan por magnitud. 1·

Los mér;tos relativos de las medidas de tendencia central


La media es la medida de tendencia central que los psicólogos emplean más, probablemen-
te por tres razones. Su cálculo tiene en cuenta todos los valores de los datos. Se utiliza en
muchas pruebas estadísticas, como veremos en capítulos ulteriores. Puede utilizarse junto
con otras medidas para dar una idea del rango de puntuaciones de la mayoria.
No obstante, la media tiene por lo menos dos desventajas. Primera, lejos de represen-
tar a todo el grupo, podría representar a nadie. Esto se ilustra con más claridad cuando la
media produce un valor inalcanzable. Por ejemplo, cuando se dice que la familia promedio
tiene 2.4 hijos. Por tanto, aceptaremos que el punto central, como lo representa la media,
sólo es matemáticamente central. Se ha producido un valor situado en una escala continua
cuando la medida original (número de hijos) es un valor discreto.
Un segundo y más serio problema con la media radica en que puede afectarse por una
sola puntuación muy diferente del resto. Por ejemplo, si la media de recuerdo de un grupo
de 15 personas es de 6.667 palabras y también se incluye en la muestra a otra persona cuyo
recuerdo es de 100 palabras, la media del nuevo grupo será de 12.5, la cual supera a todas las
puntuaciones del grupo, excepto una y, por tanto, no ofrece una estadística de resumen útil.
Se han ideado maneras de tratar este efecto. En primer lugar, puede calcularse la me-
dia recortada, donde se dejan fuera las puntuaciones extremas. Hay diferentes versiones de
la media recortada. La más simple requiere la eliminación de las puntuaciones más altas y
más bajas. Sin embargo, a menudo se elimina 10% de las puntuaciones superior e inferior.
Esta versión puede simbolizarse como .X_ 10. Como alternativa, una persona tan inusual pue-
de identificarse como extrema y eliminarse. Ello se lleva a cabo mediante un diagrama de ca-
ja (véase más adelante) u otras técnicas presentadas en el capitulo 12.
~L--------------~In~v~e~st~ig~a~c~io~·n_c~u~a_n~ti~ta~t~iv~a_e~n~p~s~ic~o~lo~g~ía~--------------------
La mediana puede ser, como la media, un valor que no representa a nadie cuando hay
un valor par de participantes. Si la mediana de recuerdo del grupo ha sido de 7.5 palabras,
se trata de una puntuación que no ha alcanzado a ningún miembro del grupo. Sin embargo,
la mediana no se ve afectada por valores extremos. Si quien recordó 100 palabras se une al
grupo, la mediana permanecerá en 7, mientras que la media crecerá en más de 5.5 palabras.
Otra manera de tratar el efecto de los extremos en la tendencia central es reportar la mediana
en lugar de la medía o además de ella.
Sólo en raras ocasiones los psicólogos utilizan el modo. Tiene por lo menos tres des-
ventajas; las primeras dos se refieren a que tal vez no exista un único modo. En primer sitio,
sí no hay dos valores iguales, entonces tampoco hay un modo; por ejemplo, si las 15 per-
sonas tienen diferentes puntuaciones de recuerdo. En segundo lugar, si dos puntuac~ones
coinciden por tener los dos grupos más numerosos de personas, tampoco hay un solo modo;
por ejemplo, sí en la muestra dos sujetos han recordado cinco palabras y dos siete palabras.
Es posible que se encuentre con los términos bimodales (de dos modos) o multimodal (de
más de un modo). El tercer problema con el modo es que puede ser muy poco representa-
tivo cuando todos, salvo unos cuantos, son diferentes. Por ejemplo, si en una muestra de
100 personas 98 tienen distintas puntuaciones de recuerdo, pero las dos restantes recorda-
ron 99 palabras, entonces el modo sería 99, y ello sugeriría una muestra muy inusual.
Una sola medida de tendencia central ofrece detalles insuficientes de la muestra que
describe, pues el mismo valor puede producirse a partir de conjuntos de cifras muy dife-
rentes. Por ejemplo, puede tener dos muestras, cada una con media de recuerdo de 7, aunque
una se integre por personas que tienen sólo un recuerdo de 7, mientras que la otra incluye una
persona con un recuerdo de 3 y otra de 11. Por ello, resulta útil reportar alguna medición de
esta dispersión de puntuaciones, a fin de poner la medida de tendencia central en contexto.

Medidas de dispersión
Máximos y mínimos. Sí reporta los valores mayor (el máximo) y menor (el mínimo) en la
muestra, da una idea de la dispersión de tal muestra. Por tanto, si todos en la muestra re-
cordaron 7 palabras, entonces el máximo y el mínimo serían 7, mientras que la muestra de
dispersión más amplia tendría un máximo de 11 y un mínimo de 3.
Rango. Otra forma de expresar el máximo y el mínimo consiste en restar el mínimo al
máximo para dar el rango de valores. Esa cifra permite que diferentes muestras tengan ran-
gos similares aunque difieran sus máximos y mínimos. Por ejemplo, una muestra puede
tener un recuerdo máximo de 9 y uno mínimo de 1, en tanto que otra puede tener un re-
cuerdo máximo de 11 y uno mínimo de 3. Al reportar su rango, puede ver claramente que
ambas tienen la misma dispersión de 8 palabras.
_________________________R_es_u_m_e_n~y~d_e_s_ ·n_d_e_d_a_t_os________________~f119
cn~·p~c_io_

Tanto el rango como el máximo y el mínimo aún tienen problemas para resumir de ma-
nera suficiente al grupo, pues tratan sólo con valores extremos. La falla se encuentra en que
no considera si esos extremos son comunes. Por ende, una muestra de 15 personas podría
incluir una con un recuerdo de 3, otra de 11 y todo el resto el mismo recuerdo de 7. El grupo
tendría el mismo máximo y mínimo (y, por tanto, igual rango) que otro grupo cuyas pun-
tuaciones de recuerdo tuvieran una dispersión más equitativa entre 3 y 11.

Rango intercuarmar. Para calcular el rango intercuartilar se localizan las puntuaciones si-
tuadas en el25o. (en otras palabras, el valor de puntuación más alto del 25% inferior) y en
el 75o. percentiles (el valor de puntuación más alto del 75% inferior) y se anota su diferen-
cia. Si tomamos como referencia !a tabla 9.1, veremos que el25o. percentil es 5 y el 75o.
8. Por tanto, el rango intercuartilar es 8 - 5 = 3. El rango intercuartilar tiene la ventaja de
que lo afectan menos las puntuaciones extremas que el rango, calculado con el máximo y
el mínimo.

Varianza. La varianza tiene en cuenta la diferencia entre el valor de cada persona y la media
del grupo. Para calcularla se anota cuánto difiere (o se desvía) cada puntuación de la me-
dia. Utilizaré como ejemplo las puntuaciones de recuerdo de una muestra de 5 personas.

Palabras recordadas
1
2
3
4
5

Tiene que calcularse la media: x= 3 palabras. En seguida, encontramos la desviación de


cada puntuación tras restar la media a cada puntuación.

Palabras recordadas Desviación de la media


-2
2 1
3 o
4
5 2

Ahora queremos resumir las desviaciones. Sin embargo, si sumáramos las desviaciones,
obtendríamos cero; y ello sería siempre igual para cualquier conjunto de números. Una ma-
nera de sortear tal dificultad consiste en elevar al cuadrado las desviaciones antes de su-
marlas, ya que eso elimina los signos negativos.
~L--------------~In~v~e~st~ig~a~c~io~·n~c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Palabras recordadas Desviación de la media Desviación al cuadrado
1 -2 4
2 -1 1
3 o o
4
5 2 4

Ahora, cuando sumamos las desviaciones al cuadrado obtenemos 1O. Para identificar la va-
rianza, dividimos la suma de las desviaciones al cuadrado entre el número de puntuaciones
(5) y obtenemos una varianza de 2.

Un grupo de dispersión más equitativo tendría una varianza mayor, pues habría más personas
cuyo recuerdo diferirla de la media. Si dos de 15 participantes tienen puntuaciones de 3 y
11 palabras, mientras que todas las demás recuerdan 7, la varianza será 2.134. Por otra par-
te, la muestra distribuida de manera más equitativa, que se observa en la tabla 9.1, tiene una
varianza de 4.889. La varianza se utiliza, como la media, en muchas técnicas estadísticas.
Para complicar el tema, los expertos en estadística han observado que si tratan de estimar,
a partir de los datos reunidos, la varianza de la población de que provienen los participan-
tes, obtienen un estimado más exacto si dividen la suma de los cuadrados de las desviaciones
entre el número de elementos de la muestra, menos uno. Esta versión de la varianza es la
que suelen dar los programas de cómputo y la que se utiliza en pruebas estadísticas. En es-
ta versión, la varianza para el conjunto de puntuaciones de dispersión más equitativa será
5.238.

Desviación estándar. La desviación estándar (so DE) se vincula directamente con la va-
rianza porque es la raíz cuadrada de ésta; por tanto, suele representarse como s 2 la varian-
za de una muestra. La desviación estándar que los programas de cómputo en general dan
se deriva de la varianza, que supone la división de la suma de las desviaciones al cuadra-
do entre el número de puntuaciones menos uno, pues también constituye la mejor esti-
mación de la desviación estándar de la población. Por tres razones se prefiere la desviación
estándar sobre todas las medidas de dispersión, cuando se resumen datos.
En primer lugar, es -igual que la varianza-- una medida de dispersión relacionada
con la media. Por consiguiente, cuando se reporta la media es apropiado notificar la des-
viación estándar. En segundo término, las unidades en que se expresa la desviación estándar
son las mismas que la medición original, esto es, puede decirse que la desviación estándar de
recuerdo es de 2.289 palabras para el conjunto de puntuaciones de dispersión más equita-
tiva. En tercer sitio, la desviación estándar se usa en ciertas circunstancias para indicar la
proporción de personas de la población que se inscriben en un rango determinado devalo-
res. Consulte en el capítulo 12 una explicación más completa del tema.

------------------------~R~e~su~m~e~n~y~de=s~c~ri~pc=i~ón~de~d~at~o~s--------------~¡121
Desviación intercuartilar. Cuando se cita una mediana, la medida apropiada de dispersión
es la desviación intercuartilar. Se trata del rango entre cuartiles dividido entre 2. En el ejem-
plo de las 15 calificaciones de recuerdo la desviación intercuartilar sería 2. = 1.5.
2

Datos nominales
Si se trata con 'variables que tienen niveles en forma de categorías, los números son frecuen-
cias; es decir, el número de personas situadas en una categoría específica. Por ejemplo,
cuando hemos encontrado cuántas personas de un grupo fuman tiene poco sentido aplicar
las técnicas mostradas antes para resumir los datos. Podemos utilizar varios métodos de
presentación basados en el número de personas de una categoría determinada. Por ejemplo,
podemos simplemente reportar el número de fumadores (digamos 10) y el de no fumadores
(digamos 15). Como alternativa, podemos expresar esas cifras como fracciones, proporcio-
nes o porcentajes.

Fracciones
Para encontrar una fracción buscamos el número total de personas (25) y expresamos el de
fumadores como una fracción de ese total. Por tanto, 10 de 25, o .!..Q, de la muestra eran fuma-
25
dores; 15 de 25, o~. no. Podemos simplificarlo aún más porque 10, 15 y 25 son divisibles
25
entre 5. Así, diremos que ~ eran fumadores y 2. no.
5 5

Proporaiones
Podemos encontrar proporciones a partir de fracciones si convertimos las fracciones en deci-
males. Por tanto, al dividir 10 entre 25 (o 2 entre 5) se nos indica que 0.4 de la muestra eran
fumadores, mientras que 15 dividido entre 25 (o 3 entre 5) revela que 0.6 de la muestra no
fumaban. Tenga en cuenta que las proporciones de todos los sub grupos deben sumar 1: 0.4 +
0.6 = l; esto puede servir como comprobación de que los cálculos son correctos.

Porcentajes
Para encontrar un porcentaje debe multiplicar una proporción por 100. Así, de la muestra,
40% corresponde a fumadores y 60 a no fumadores. El porcentaje de todos Jos subgrupos
sumará lOO.
122lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_i_ta_tJ_·v_a_e_n~p_si_co_L_o~gí_a____________________
Distribuciones de frecuencia
Si hemos preguntado a una muestra de 120 personas cuál es su grupo de edad podemos re-
presentar esto en una tabla simple:

Tabla 9.2. Distribución de frecuencia de edades de los participantes.

Edad (en años) 20-29 30-39 40-49 50-59 60-69


Número de personas 15 45 30 20 10

En la tabla anterior se ve la distribución de edades en nuestra muestra.


Considere que si se nos presentan los datos en esa forma y queremos calcular la media
o la mediana, no podríamos hacerlo con exactitud, pues sólo conocemos el rango de eda-
des posibles en que cae la persona. Como señalamos en el capítulo 8, todos los sujetos del
gr>.1po de edad 20-29 podrían tener 20 o 29 años, o estar distribuidos equitatiyamente en ese
rango. Las técnicas para calcular las medias y las medianas en tal situación se presentan en
el apéndice l.
?

Tablas de contingencia
Cuando los niveles de las variables son nominales (u ordinales, como en el último ejemplo);
pero se consideran dos variables, los datos pueden presentarse como una tabla de contingen-
cia. Imagine que hemos preguntado a 80 personas (50 hombres y 30 mujeres) si fuman.

Tabla 9.3. Distribución de fumadores y no fumadores entre hombres y mujeres.

Fumadores No fumadores

Hombres 20 30
Mujeres 12 18

Sin embargo, a veces resulta más apropiado, sobre todo con fmes de comparación entre
grupos con muestras desiguales, reportar proporciones o porcentajes. El reporte de los datos
crudos de que 20 hombres y 12 mujeres fuman dificulta la comparación entre géneros: 20
de 50 se vuelve 20 = 0.4, o 4 de 10; 12 de 30 se toma ~ = 0.4, o 4 de 10, también. Ex-
50 30
presado así, puede verse que pese a los distintos tamaños de muestra, hay proporciones
equivalentes de fumadores entre las muestras de hombres y mujeres.
__________________________R_e_su_m_e_n_y~d_e_sc_n~
· p_c_ió_n_d_e_d_a_t_os________________~¡-123

Tabla 9.4. Porcentaje de fumadores y no fumadores entre hombres y mujeres.

Fumadores No fumadores Total

-Hombres 40% 60% 100%

Mujeres 40% 60% 100%

Una ventaja adicional del reporte de proporciones es que el lector puede calcular con rapi-
dez las proporciones o los porcentajes que no caen en una categoría. Por tanto, 0.6 o 60%
de hombres y 60% de mujeres de la muestra no fuman.

Métodos gráficos
Hay muchas formas de resumir gráficamente los datos. La ventaja de un resumen gráfico
es que comunica al lector aspectos de los datos, como tamaño relativo, de manera más ': 11-
v
mediata que las tablas equivalentes. Se tienen por lo menos dos desventajas. Primera, a ve-
ces resulta dificil obtener los valores exactos de una gráfica. Segunda, con frecuencia quien
las elabora no tiene en cuenta que tal vez algunos lectores no estén acostumbrados a las
convenciones relacionadas con las gráficas. Ello se toma menos problemático cuando se
encuentran en un artículo, pues el lector puede dedicar tiempo a descubrir lo que se repre-
senta. El peligro principal surge cuando se utilizan para ilustrar una charla y no se da tiempo
suficiente a los escuchas para verlas ni se explican a cabalidad las convenciones que se
usan. E¡l primer problema se resuelve proporcionando tablas y gráficas, pero algunas revis-
tas desalientan tal práctica.
La mayoría de la exhibición gráfica de datos emplea dos dimensiones, o ejes: una para
los valores de la variable independiente y otra para la dependiente. Por convención, el eje
vertical representa la variable dependiente y el horizontal la independiente. A menudo no
hay variables dependientes o independientes obvias; en ese caso, han de colocarse las va-
riables en los ejes de la manera en que tenga más sentido a la luz de la convención.

Graficación de totales y subtotales


Gráficas de barras
Una gráfica de barras se utiliza cuando los niveles de la variable independiente se relacio-
nan con categorías, como en el ejemplo de hombres y mujeres que fuman.
~L--------------~'~nv~e=s~ti~ga~c~io~·n~c~u~a~n=ti=ta~t~iv~a~e~n~~ps~ic~o~lo~g~í~a____________________
30
• Fumadores
"'"'e:o 25
O No fumadores
"'
.....
Cl> 20
a.
Cl> 15
-o
o 10
.....
Cl>
E 5
• :::l
z o
Hombres Mujeres
Género

Figura 9.1. Número de fumadores y no fumadores entre hombres y mujeres.

Como alternativa, con tamaños de muestra desiguales un mejor método consiste en mos-
trar en la misma barra el número de fumadores y no fumadores .
"' 50 O No fumadores
"'5 40 • Fumadores
"'
~ 30
Cl>
-o 20
e
~ 10
• :::l
z o
Hombres Mujeres
Género

Figura 9.2. Número de fumadores y no fumadores entre hombres y mujeres.

Histogramas
Los histogramas son similares a las gráficas de barras, sólo que éstas se tocan entre sí, y
tienden a usarse cuando los niveles de las variables independientes son cuantitativos, como
en el ejemplo de grupo de edad mostrado en la tabla 9.2. Algunos dirán que lo~ histogra-
mas deben reservarse para variables continuas, pues el contacto entre las barras implica que
los valores no son discretos. Considero innecesaria tal distinción.
"' 50
"'
e:
~ 40
:!i 30
Cl>
-o 20
e
~ 10
•:::l
z o 1
20·29 30·39 40·49 50·59 60·69
Edad (en años)

Figura 9.3. Número de personas en cada grupo.


_________________________R_e_su_m_e_n~y~de_s_cr~ip~c_io_'n_d_e__
da_t_o_s______________~¡t25

Gráficas de pastel (o de sectores)


Las gráficas de pastel difieren de la mayoría de las gráficas porque representan los subto-
tales como área de un pasteL Consulte en el apéndice 1 una descripción de cómo calcular
la cantidad del pastel (o tamaño de la rebanada o sector) correspondiente a cada categoría.

Edad (en años)

60-69 20-29

Figura 9.4. Número de personas en cada grupo de edad.

De modo alternativo, las áreas pueden expresarse como porcentajes con una clave (o leyen-
da) para mostrar a cuál subgrupo pertenece cada rebanada o sector.

Edad (en años)

~ 20-29

• 30-39

~ 40-49

~ 50-59

~ 60-69

Figura 9.5. Porcentaje de personas en cada grupo de edad.


126lL-------------~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a____________________

Es posible hacer hincapié en uno o más subtotales extrayéndolos del pastel.


Edad (en años)

~ 20-29

.30-39

~ 40-49

~ 50-59

~ 60-69

Figura 9.6. Número de personas en cada grupo de edad.

También resulta factible mostrar más de un conjunto de datos en gráficas de pastel separa-
das, de modo que los lectores puedan compararlas.

Mujeres Hombres

60%

• Fumadores
O No fumadores

Figura 9. 7. Porcentaje de fumadores y no fumadores entre hombres y mujeres.

Una ayuda visual adicional consiste en representar los diferentes números de participantes
de cada rebanada o sector haciendo un pastel más grande para una muestra mayor.
..
--~----------------------R_e_su_m_e_n~y_d_e_sc_r~ip_c_ió_n_d_e_d_a_t_o_s______________~¡-127

Mujeres Hom bres

60%
60%

• Fumadores
D No fumadores

e
Figura 9.8. Porcentaje de fumadores y no fumadores entre hombres y mujeres.

Graficaciones de una variable dependiente


Distribuciones de frecuencia
Una distribución de frecuencia puede mostrarse como un histograma que presenta una
imagen del número de participantes que da una calificación específica o un rango de cali-
ficaciones. El ancho de las barras puede elegirse de acuerdo con el nivel de precisión re-
querida. En la figura 9.9 se muestran las calificaciones de recuerdo de la tabla 9.1; el ancho
de la barra ha de ser tal que cada barra represente a quienes recordaron un número particu-
lar de palabras.
3.5

3.0

2.5

"'

e:
2.0
(])
::J
u
~ 1.5
LL..

1.0

0.5

0.0
3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 11.0
Número de palabras recordadas

Figura 9. 9. Distribución de frecuencia del número de palabras recordadas.


128lL _______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_v_
a_e_n~p_si_co_l~og~í_a____________________

En la figura 9.9 se aprecia de un vistazo que 7 es el modo, el cual se encuentra casi en me-
dio de la dispersión de puntuaciones y que el mínimo es 3 y el máximo 11. En la figura 9.3
se observa una distribución de frecuencia de edad, pero las barras tienen anchos de 10 años.

Gráficas de tallo y hojas


Las gráficas de tallo y hojas son una variante del histograma. Normalmente, se presentan
con los valores de la variable (el tallo) en el eje vertical y las frecuencias (las hojas) en el
horizontal. A continuación se grafican las calificaciones de recuerdo de 15 participantes.

2 o
4 0000
6 00000
8 000
10 00

Figura 9.10. Gráfica de tallo y hojas de número de palabras recordadas.

Los valores del tallo dan el primer número del rango de puntuaciones contenidas en la ho-
ja. En la versión de la gráfica de tallo y hojas, los O de las hojas denotan simplemente el
número de puntuaciones que caen en el rango específico. Por tanto, el 2 indica que las pun-
tuaciones en el rango de 2 a 3 están contenidas en esa hoja y el O único de la hoja muestra
que hay sólo una puntuación en ese rango.
La naturaleza del tallo puede cambiar según la dispersión de puntuaciones. A continua-
ción se muestra la gráfica cuando la 15a. puntuación es 25 en lugar de 11:
o 344
o 5566777889
o
2
2 5
Figura 9.11. Gráfica de tallo y hojas de número de palabras recordadas (con una
puntuación extrema).

En el ejemplo, la dispersión se ha dividido en rangos de cinco cifras: O a 4, 5 a 9, etc. En la


gráfica se supone que todos los números tienen dos dígitos y, así, se trata 3 como 03. El tallo
muestra el primer dígito de cada número. De acuerdo con esto, podemos ver que hay tres
puntuaciones en el rango de O a 4 y nueve en el de 5 a 9. También se aprecia que no hay pun-
tuaciones en los rangos de 14 a 19 y de 20 a 24. La ventaja de esta versión de la gráfica de
_________________________R_e_su_m_e_n~y~d_e_s_cr~ip~c_io_·n_d_e_d_a_t_os________________~j129

tallo y hojas sobre el histograma es que podemos leer las puntuaciones reales, aunque ca-
da tallo se base en un amplio rango de puntuaciones, como en el último ejemplo. Observe
que, aunque una parte del tallo no tenga una hoja correspondiente, aún debe mostrarse esa
parte del tallo (fig. 9.11).

Gráficas de puntuaciones individuales


Diagrama de dispersión
Un diagrama (o gráfica) de dispersión es una manera útil de presentar los datos de dos va-
riables proporcionados por cada participante; por ejemplo, si en el caso del recuerdo también
hemos probado el tiempo que toma a cada participante decir la lista original en voz alta (la
velocidad de articulación).

Tabla 9.5. Número de palabras recordadas y velocidad de articulación clasificada según


el número de vocablos recordados .
Velocidad
Orden de recuerdo Recuerdo de articulación

1 3 30
2 4 25
3 4 28
4 5 30
5 5 25
6 6 23
7 6 24
8 7 23
9 7 21
10 7 23
11 8 23
12 8 18
¡:J!)

13 9 19
14 10 20
IUUO.··
15 11 19
----------------------------------------
13ol Investigación cuantitativa en psicología

12

11 o
"'
"'
"O
10 o
"'
'E
o
V 9 o
....
Cl>

"'~ 8 o o
.t:l
7 o o
"'
-¡¡;
a.
Cl> 6 o o
"O
e 5 o o
Cl>
E
•::J 4 o o
z
3 o
2
16 18 20 22 24 26 28 30 32
Tiempo de articulación (décimas de segundo)

Figura 9.12. Diagrama de dispersión de velocidad de articulación y palabras


recordadas.

La posición de cada puntuación en la gráfica se obtiene encontrando su valor en el eje de


velocidad de articulación y trazar una línea vertical imaginaria desde ese punto. A continua-
ción, se localiza su valor en el eje de recuerdo y se dibuja una línea horizontal imaginaria
desde allí. El círculo se traza donde se intersecan las dos líneas imaginarias. Pruébelo con
el primer par de puntos de datos: 30 y 3.
Observe que he colocado la velocidad de articulación en el eje horizontal y el recuer-
do en el vertical. Si bien no estoy sugiriendo que la velocidad de articulación afecta la
memoria, parece tener más sentido que sugerir que la memoria afecta la velocidad de articu-
lación. Por tanto, cuando el diseño de una investigación no comprende variables dependien-
tes e independientes explícitas, debe asignarlas a los ejes de la manera en que tenga más
sentido, dadas las convenciones. La ventaja del diagrama de dispersión es que el lector pue-
de percibir de un vistazo cualquier tendencia. En este caso se sugiere que una articulación
más rápida va acompañada de un mejor recuerdo.
En el ejemplo, dos participantes recordaron el mismo número de palabras y tenían igual
velocidad de articulación. El diagrama de dispersión de la figura 9.12 no ha mostrado eso.
Sin embargo, hay formas de representar situaciones donde las puntuaciones coinciden.

Maneras de representar puntuaciones iguales (empates). Hay varias formas de mostrar que
varios puntos de datos son iguales. Un método consiste en usar números como símbolos y en
representar el número de puntos de datos que coinciden por el valor del número.
___________________________R_e_s_
um e_n~y_d_e_s_c_ri~pc_i_ó_n_d_e_d_a_t_os________________~¡-131
__

12

11
V>
<O 10
"O
<O
"O
9
C5
u
~ 8
V>
~
_.o
<O
7 2
-¡¡;
c..
OJ 6
"O
eOJ 5
E
- ::J
z 4

2
16 18 20 22 24 26 28 30 32

Tiempo de articulación (décimas de segundo)

Figura 9.13. Diagrama de dispersión de velocidad de articulación y recuerdo de


palabras (con las puntuaciones iguales indicadas con números).

Otro método estriba en hacer que el tamaño del símbolo denote el número de puntos de da-
tos coincidentes.

12

V> 11 o
<O
"O
<O 10 o
.....
"O
o
u 9 o
~
V>
<O
8 o o
.2i<O
-¡¡;
7 o o
c..
OJ
6 o o
"O
o
..... o o
OJ
E
- ::J
4 o o
z
3 o
2
16 18 20 22 24 26 28 30 32
Tiempo de articulación (décimas de segundo)

Figura 9. 14. Diagrama de dispersión de velocidad de articulación y recuerdo de


palabras (con las puntuaciones iguales indicadas con puntos grandes).
---------------------------------------.. ·---

1JZlL--------------~I~nv~e~st~ig~a~c_ió_n_c_u_a_nt_it_a_ti_va__en~p_
si_co_lo~g~ía_____________________

Una técnica adicional consiste en utilizar lo que se llama girasol. Aquí, el número de pun-
tos de datos coincidentes se representa con el número de pétalos de una flor.

12
11 o
"'<O
""E
<O 10 o
o 9 o
...
ijj
8 o o
..."'
f
<O
.o
<O
7 o
-¡;;
a.
41
6 o o
"e 5 o o
41
E
•::::1
4 o o
z 3 o
2
16 18 20 22 24 26 28 30 32
Tiempo de articulación (décimas de segundo)

Figura 9. 15. Diagrama de dispersión de velocidad de articulación y recuerdo de


palabras (con las puntuaciones iguales indicadas como pétalos de girasol).

Graficación de medias
Una var;able ;ndepend;ente
Gráficas de líneas. Para este ejemplo, imagine que los investigadores desean explorar la
eficacia de dos técnicas de memorización. La primera requiere que los participantes rela-
cionen los elementos de una lista de palabras con un conjunto de elementos aprendidos pre-
viamente y que riman entre sí: uno-ayuno, dos-veloz. Por ejemplo, la lista que habrá de
aprenderse podria empezar con las palabras caballo y pato. Se estimula a los participantes
a formar una imagen de un caballo en ayuno y de un pato veloz. Esta técnica se llama pa-
labras gancho. La segunda técnica precisa que los participantes imaginen que caminan por
una ruta que les resulta familiar y que coloquen cada artículo de una lista de palabras en la
ruta, de modo que cuando deseen recordar los artículos imaginen que caminan una vez más
por la ruta (conocido como método de ubicación o locz). Los investigadores también inclu-
yen una condición control en que no se da capacitación a los participantes.
Las medias y las desviaciones estándar para las tres condiciones se muestran en la ta-
bla 9.6 y en la figura 9.16.
__e_
___________________________R_e_s_um n~y_d_e_s_c_ri~p_
ci_ó_n_d_e_d_a_t_o_s________________~~

Tabta 9.6. La media y las desviaciones estándar de palabras recordadas en tres


condiciones de memoria.
Control Palabras gancho Método de ubicación
X: 7.2 8.9 9.6
DE 1.62 1. 91 1.58

10
Vl

o "'
"O
L.. " '
9.5
QJ"O
E Í5 9
-~ ~
QJ Vl 8.5
"Oro
.,_o
·-:;:o."'
-o_
QJ "'
8

QJ 7.5
"O

7
Control Palabras gancho Método de ubicación
Estrategia nemotécnica

Figura 9.16. Media de número de palabras recordadas por tres estrategias


nemotécnicas.

Esto sugiere que el uso de la nemotécnica mejora el recuerdo y que el método de ubicación
es la mejor de las dos técnicas. Sin embargo, conviene ser cauteloso en relación con lama-
nera en que se despliega la información. Observe que el rango de puntuaciones de recuerdo
posibles mostrado en el eje vertical sólo va de 8.6 a 10. Tal truncamiento del rango devalo-
res puede sugerir una diferencia entre grupos mayor que la real. En la figura 9.17 se mues-
tran las mismas medias, pero con el eje vertical sin truncarse.

Control Palabras gancho Método de ubicación


Estrategia nemotécnica

Figura 9.17. Media de palabras recordadas para tres diferentes grupos de memoria
(eje· vertical no truncado).
1J4l~_______________l_nv_e~st~ig~a~c~ió_n_c_u_a_nt_it_a_ti_va~en~p_si_co~lo~g~ía~-------------------

Observe que la diferencia entre las medias no parece tan marcada en la gráfica anterior.

Gráficas de barras. Las medias de dos variables independientes también pueden mostrar-
se con gráficas de barras. En realidad, como la medida del eje horizontal es discreta (y no-
minal, en este caso), las gráficas de barras pueden considerarse más apropiadas porque no
tienen líneas que conectan las medias y que podrían implicar una continuidad entre los ni-
veles de la VI usada en la investigación.

10
~ 9
e~ s
lli"E 7 -
Eo
·~ ~ 6
Q¡ "' 5
~~ 4
" 111 3
~~ 2
~ 1
0+-~----L--+--~---L--+-~----L-~

Control Palabras Método de ubicación


gancho
Estrategia nemotécnica

Figura 9 . 18. Media de pal~bras recordadas en tres condiciones nemotécnicas.

Dos variables independientes


Gráficas de líneas. Cuando tiene más de una variable independiente, lo usual es colocar
los niveles de una de ellas en el eje horizontal y los de la otra como líneas separadas dentro
de la gráfica. Un ejemplo sería si el diseño anterior se agrandara para incorporar una se-
gunda VI (el grado en que las palabras de la lista estaban vinculadas conceptualmente) con
dos niveles, vinculados y desvinculados; la lista vinculada incluiría artículos que se en-
cuentran en una cocina. Las medias se muestran en la tabla 9.7 y en la figura 9.19.

Tabla 9. 7. Media de recuerdo de palabras de grupos a los que se dieron listas vinculadas
y desvi nculadas de palabras para que las recordaran mediante diferentes
técnicas de memorización.

Control Palabras gancho Método de ubicación

Vinculada 11.0 10.6 10.6


Desvinculada 6.4 8.4 8.8
___________________________R_e_s_
u_m_e_n~y_d_e_s_c_ri~p_cl_
·ó_n_d_e_d_a_t_o_s________________~~

• • •
12

ca
V\
10
o "O
'- ca
v-o
E C; 8
•:::1
<:: ~
u -+- Vinculada
<1! V\ 6
----- Desvinculada
"O
ca.n
e
'5
v-"' 4
~~
<1! 2
"O

o
Control Palabras Método
gancho de ubicación

Estrategia nemotécnica

Figura 9. 19. Media de número de vocablos recordados con tres estrategias nemotécnicas
cuando las palabras de la lista están vinculadas o desvinculadas.

A partir de lo expuesto, el lector puede ver que, generalmente, el recuerdo fue mejor en las
listas vinculadas, pero se produjo la mayor mejora, sobre las desvinculadas, cuando los
participantes estaban en la condición control donde no utilizaban técnica de memorización
alguna.
Gráficas de barras. También es posible presentar las medias de dos variables indepen-
dientes con una gráfica de barras.

12

10
"'
V\

o "O
._ ca
<1!"0 8
E C;
'~ ~ • Vinculada
<1! 6
"O
V\
e O Desvinculada
. !!!~
alíií
~c.
4

<1!
"O 2

o
Control Palabras Método
gancho de ubicación
Estrategia nemotécnica

Figura 9.20. Media de número de vocablos recordados con tres estrategias


nemotécnicas cuando las palabras de la lista están vinculadas o
desvinculadas.
~L--------------~In~v~e~st~ig~a~c~ió~n_c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------

Gráficas de medias y dispersión


Como señalamos en el análisis de los métodos numéricos para describir datos, las medias
en sí no dicen todo acerca de los datos. Resulta útil mostrar también la dispersión en una
gráfica porque proporciona una idea respecto a la superposición que hay entre las puntua-
ciones para los diferentes niveles de la VI. Esto puede realizarse si se utiliza una gráfica de
líneas o de barras o un diagrama de caja.

Gráficas de lineas
Si graficamos medias y desviaciones estándar para las tres condiciones de memoria obten-
dremos lo siguiente:

12

11
"'"'
"O
"'
"E 10
o
u
.....

"'.....
"'
.o
9

~
"'a.

8
"O
o
.....
Q¡ 7
E
.::;,
z
6

S
Control Palabras Método
gancho de ubicación
Estrategia nemotécnica

Figura 9. 21 . Las medias y las desviaciones estándar de palabras recordadas con las
tres estrategias nemotécnicas.

Las líneas verticales muestran una desviación estándar arriba y abajo de la media. Eso re-
fleja que la diferencia entre las tres condiciones no es tan clara como sugiere la gráfica que
sólo incluyó las medias. Aquí podemos ver que los tres métodos tienen un alto grado de su-
perposición. En el capítulo 12 se abordan otras medidas de dispersión que pueden incluir-
se en una gráfica de líneas.
_________________________R_~_u_m_e_n~y_d_e_s_ __ió_n_d_e_d_a_t_os________________~j137
cn~·~

Cuando se incluye más de una variable independiente en el estudio es mejor no mos-


trar la desviación estándar en una gráfica de lineas, pues eso dificulta más la lectura de la
gráfica, ya que las barras de desviación estándar podrían encimarse.

Gráficas de barras
Con una gráfica de barras, sobre todo si éstas habrán de sombrearse, es mejor mostrar só-
lo una desviación estándar arriba de la media.
12

11
"'"'
'O
"'o
....
'O
10
~
....
"'~ 9
.Q

"'
-¡¡;
c. 8

'O
o
.... 7

E
•::J
z 6

5
Control Palabra.s Método
gancho de ubicación

Estrategia nemotécnica

Figura 9.22. Las medias y las desviaciones estándar de palabras recordadas con las tres
estrategias nemotécnicas.

Sería posible representar las desviaciones estándar para los niveles de dos VI en una gráfi-
ca de barras.

Diagramas de caja
Un diagrama de caja ofrece al lector gran cantidad de información útil. En este ejemplo. in-
cluí los datos de 15 personas a quienes se dio una lista para recordar (los datos mostrados
en la tabla 9.1 ).
~L--------------~I~nv~e=s~ti~ga~c~io~'n~cu~a~n=tl=·ta~t~iv~a~e~n~ps~ic~o~lo~g~í~a_____________________

La caja representa la mitad central de las puntuaciones y la línea horizontal en ella es la


mediana. Los extremos superior e inferior de la caja se conocen como bisagras superior e
inferior; el rango de calificaciones en la caja, como rango H (el mismo que el rango inter-
cuartilar tratado al principio del capítulo). Las líneas verticales arriba y abajo de la caja se
denominan bigotes; por ello, el diagrama de caja se conoce como diagrama de caja y bi-
gotes. Los bigotes se extienden hasta las bardas interiores superior e inferior. En las figuras
9.23 y 9.24, la computadora las ha representado extendiéndose hasta el 90o. y el lOo. per-
centiles, respectivamente; el 90o. percentil es el punto que tiene 90% de puntuaciones abajo
de ella, en tanto que el 1Oo. tiene l 0% de las puntuaciones abajo. Esa versión del diagra-
ma de caja la ha adaptado el paquete estadístico StatView y está tomada de Cleveland
( 1985). En el apéndice I se incluyen detalles de una convención más común para la posi-
ción de los bigotes y cómo calcular su longitud.

12
~ 11 o
"<O
T
10
'E
~ 9
"' 8
~
.g 7

a. 6
Ql

"
e 5
_L
~ 4
· ::;)
z o
2

Figura 9.23. Un diagrama de caja de número de palabras recordadas.


12
~ 11 o Posible extremo
~ 10 90o. percentil ~ Barda superior interna
'E

[
~ 9 -Bigotes
"' 8 Bisagra superior
.ge
~
Ql
7
6 ''""'"
(50%)
Mediana

"o 5 Bisagra inferior


a; 4 1Oo. percentil _L Barda inferior interna
E
~ 3 o Posible extremo
2

Figura 9.24. Diagrama de caja de palabras recordadas, con elementos etiquetados.


_________________________R~e~su~m~e~n_y~de~s~c~ri~pc~io~·n~de~da~t~o~s--------------~1139

Los bigotes pueden extenderse a lo que se denomina bardas exteriores superior e in-
ferior (no mostradas en la figura 9.24). Los puntos situados entre las bardas interior y exte-
rior pueden ser extremos y deben examinarse. Resulta muy probable que los puntos que se
encuentran más allá de las bardas exteriores sean extremos y pueden excluirse legítimamen-
te una vez que se hayan comprobado las razones para que dichos valores sean tan extremos.
Al agregar alguien cuyo recuerdo es de 25 palabras y volver a calcular el diagrama de
caja se muestra que esa persona cae más allá de las bardas interiores.

27.5
"'
V>

"'O 25 o
"'o
"E 22.5
u
~
20
17.5
-.--
V>
~
.o 15
"'o.
-¡;;
12.5
<IJ
10
...o
"'O

<IJ
7.5 1

+
E 1 1
5
z
·~

2.5

.
Figura 9.25. Diagrama de caja del recuerdo de un adulto con una puntuación extrema
y una barda exterior superior agregada.

En la figura anterior he superpuesto la barda exterior superior para la distribución, que


se extiende hasta 17. De acuerdo con ello, tenemos buenas bases para tratar una puntuación
de 25 como extremo y desearemos eliminarlo del análisis posterior. No obstante, debemos
estar interesados en cómo alguien alcanzó esa puntuación. Recomendaría explorar por qué
este punto de datos discrepa tanto del resto comprobando que no se haya introducido inco-
rrectamente en la computadora o, quizá, entrevistando a quien la obtuvo. El análisis ulte-
rior con los participantes puede ayudar a identificar razones para puntuaciones extremas.
En el capítulo 11 se ofrece otra versión del diagrama de caja y una manera más de identi-
ficar lo que podrían ser puntuaciones extremas.

La distribución de datos
Observar la distribución de datos es una razón para producir un histograma o una gráfica
de tallo y hojas. Esto resulta importante porque varias pruebas estadísticas deben aplicarse
a un conjunto de datos sólo si la población de que proviene la muestra se amolda a una dis-
tribución en particular (la distribución normal).
__________. _ ~~ --e:;::

14Dl~-------------~'~nv~e=s~ti~ga~c~ió=n=c=u=a=nt~it~a=ti_va~e=n~p~si=co~l~og~í~a____________________

La distribución normal
Cuando una variable está distribuida normalmente, la media, la mediana y el modo son
iguales. Además, el histograma muestra que tiene una distribución simétrica en ambos la-
dos de la media (la mediana y el modo). Por ejemplo, si una prueba de IQ tiene una media
de 100 y una desviación estándar de 15 y si se aplica a 16 000 personas, las puntuaciones de
éstas tendrán una distribución normal, como se muestra en seguida:

3000
..

"'eo r-
VI

2 000 - -
....
-
VI
Q¡ r-
c.

r-
"O
o r-
....

1000
E
•:::J r-
r-
z

o
40 50
A
60 70 80 90 100 110 120
~
130 140 150
IQ

Figura 9 . 26. la dist'ribución de puntuaciones de IQ en una muestra de 16 000 personas.

Observe que a medida que el IQ que se grafica se aleja de la media, menos personas tienen
ese IQ. Por tanto, son menos las personas con un IQ de 90 que con uno de 100. Debidq a
su forma, a veces se le denomina curva de campana. Otro nombre es curva de Gauss, por
uno de los matemáticos que la identificaron (Carl Friedrich Gauss).
En realidad, la distribución normal es una distribución teórica; es decir, en realidad no
existe. Se considera que los datos están distribuidos normalmente cuando se asemejan a la
distribución teórica. La distribución normal es continua y, por tanto, forma una curva sua-
ve, como se muestra en la figura 9.27.

Sesgo
Se dice que una distribución está sesgada cuando no es simétrica a ambos lados de la me-
dia (la mediana o el modo). El sesgo puede ser positivo o negativo.
___________________________R_e_s_um
__e_n~y_d_e_s_c_ri~pc_i_ó_n_d_e_d_a_t_os________________~¡-1.41

Valor de variable

Figura 9.27. La curva de distribución normal.

Sesgo positivo
Por ejemplo, podríamos probar el recuerdo de una muestra y encontrar que algunas perso-
nas tienen memorias particularmente buenas. Observe que la cola de la distribución es más ·-·
larga en el lado en que son mayores las puntuaciones de recuerdo.
20

"'
Vl r-
e f--
oVl
L...
Q)
f--
c. - f-
Q) r-
-o 10 -
o -
:¡; r-
E r- f--
•:J -,-
z

lnmm
-,-
-

o
0.5 4.5 8.5 12.5 16.5 20.5 24.5 28.5
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5

Número de palabras recordadas

Figura 9.28. Distribución de frecuencia de recuerdo de palabras sesgadas


positivamente.
142lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
La media de la distribución en la fi gura anterior es 9.69 palabras, la mediana 8 y el modo
4. Observe que las medidas de tendencia central , cuando se colocan en orden alfabético, es-
tán disminuyendo.

Sesgo negativo
Esta muestra podría incluir una gran proporción de personas que han practicado nemo-
técnica. Ahora, la cola de la distribución es mayor donde las puntuaciones de recuerdo
son menores.
20

r-
"'"'e: r
o r
~ r
~ r-
~ 10 r-
e
41
r-

E r-
• ::J
z r

-m-miT
r

o
0.5
2.5
4.5
6.5
8.5
10.5
12.5
14.5
16.5
18.5
20.5
22.5
24.5
26.5
28.5
n
30.5
Número de palabras recordadas

Figura 9.29. Distribución de palabras recordadas con sesgo negativo.

La media de la distribución anterior es 20.31 palabras, la mediana 22 y el modo 26. Obser-


ve que, esta vez, las medidas de tendencia central aumentan cuando se ordenan alfabéti-
camente.

Curtosis
Curtosis es el término utilizado para describir cuán angosta o ancha resulta una distribu-
ción. La distribución relativamente plana se describe como platicúrtica (fig. 9.30) y la rela-
tivamente alta y angosta como leptocúrtica (fig. 9.31); la normal es mesocúrtica.
------~-----.-------------R_e_s_u_m_e_n~y_d_e_s_c_ri~p_cl_.ó_n_d_e_d_a_t_o_s________________~¡-1.43

Valor de variable

Figura 9.30. Distribución de frecuencia platicúrtica.

"'e:
·e;
(j)
::J
u
....(j)
LL.

Valor de variable

Figura 9.31. Distribución de frecuencia leptocúrtica.

El sesgo y la curtosis influyen en cómo deben analizarse e interpretarse los datos. Los pa-
quetes estadísticos dan índices de sesgo y de curtosis. Sin embargo, como veremos, éste
suele ser más problemático que aquélla. Los efectos de las distribuciones no normales se
tratan en los capítulos sobre el análisis. La interpretación de los índices se aborda en el
apéndice l.

"
144lL--------------~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti~va~e~n~p~si~co~l~og~í~a____________________

Gráficas de cuantH-cuantH normal


Otra forma de gráfica, la de cuantil-cuantil normal, ayuda a evaluar si una distribución es
normal. (Un cuantil constituye una proporción de una distribución; por ejemplo, 0.5 de la
distribución se encuentra arriba de la mediana y 0.5 debajo de ella.) Esta gráfica es como
un diagrama de dispersión, pero en ella se grafican, en el eje horizontal, la distribución de
datos y, en el vertical, lo que sería la distribución normal. Si los datos estuvieran distribuidos
de manera normal, Jos puntos deben formar una linea recta en la gráfica de cuantil-cuantil
normal. Sin embargo, si no es normal, los puntos no caerán en una linea recta. En la figu-
ra 9.32 se muestra la gráfica de cuantil-cuantil normal de los datos sesgados positivamente
de la figura 9.28.

Gráfica de cuantil-cuantil normal de número de palabras recordadas


3
o

o
'U

"'l¡¡o.
"'QJ
-¡¡¡ o
E
::;
e
'-
o -1
~
o
-2
o

-3
-10 o 10 20 30 40
Valor observado

Figura 9.32. Gráfica de cuantil-cuantil normal de datos sesgados positivamente.

Resumen
La primera etapa del análisis de datos debe incluir siempre algún tipo de resumen de los
datos. Ello puede hacerse de manera numérica o gráfica (o de ambas). El proceso permite
determinar s i los resultados de la investigación concuerdan con la hipótesis de los inves ti-·
gadores. Además, serán útiles para ayudar a identificar puntuaciones inusual es y, cuando se
reporten los resultados, como una manera de describir los datos.
Resumen y descripción de datos
------------------------------~--~~----------------------~
["145
Con frecuencia, las gráficas se emplean para identificar la distribución de los datos.
La distribución normal es una pauta particularmente importante para los datos porque, si
está presente, pueden aplicarse a los datos ciertas técnicas estadísticas. La distribución de
éstos puede apartarse de la normal por estar sesgada (no simétrica) o tener curtosis (creando
una forma plana o alta y angosta). Las gráficas de cuantil-cuantil normal ayudan a detectar
datos que tienen una distribución normal.
En el capítulo siguiente se describirá el proceso que los investigadores utilizan como
ayuda para decidir si los resultados de su investigación han apoyado su hipótesis.

SIIE
10
Más allá de la descripción

Introducción
En el presente capítulo se explica cómo se utilizan los resultados para probar hipótesis. Se
presenta la noción de probabilidad y se muestra cómo la decisión de rechazar o aceptar la
hipótesis depende de la probabilidad de que Jos resultados hubieran ocurrido por azar.

Prueba de hipótesis
La expresión formal de una hipótesis de investigación siempre se realiza en términos de dos
hipótesis relacionadas. Una es la experimental, alternativa o de investigación (a menudo se
muestra como HA o H 1). Se trata de una afirmación que postula el resultado del estudio
como lo predicen los psicólogos. Por ejemplo, en el capítulo 9 observamos un trabajo sobre
la re lación entre la velocidad con que la gente pronunciaba una lista de palabras (velocidad
de articulación) y el recuerdo de éstas. En este caso, la hipótesis de investigación sería: hay
una relación positiva entre la velocidad de articulación y la memoria de corto plazo. La
segunda hipótesis es la nula (H0) . Por lo general, es una afmnación de que una VI no tiene
efecto sobre una VD o de que no hay relación entre variables. Por ejemplo, no hay relación
entre la velocidad de articulación y la memoria de corto plazo.
Puel.!e plantearse sólo una HA para cada H 0, aun cuando en la investigación se pruebe
más de una hipótesis. En otras palabras, cada H A debe tener una H 0 equiparable. Habrá nota-
do que sólo en raras ocasiones los psicólogos mencionan de manera explícita su hipótesis

146
--------------------------~Má~·=s~a=ll=á~d=e_la~d~es~c~ri~~~i~ón~----------------~1147
cuando reportan sus investigaciones, y que es aún más raro que mencionen su hipótesis nu-
la. Recomiendo que durante la etapa en que aprenda acerca de la investigación y la prueba
de hipótesis haga explícitas las hipótesis de investigación y nula. Así comprenderá mejor los
resultados de la prueba de su hipótesis.

Probabilidad
Como se explicó en el capítulo 1, nunca puede probarse que una hipótesis es verdadera. Lo
mejor que podemos hacer estriba en evaluar los datos para ver si resulta improbable que H 0
sea verdadera. Podemos hacer esto sólo sobre la base de la probabilidad de que el resul~­
do obtenido habría ocurrido si H 0 fuera cierta. Si es poco probable que nuestro resultado
ocurriera por azar, podemos rechazar H0 y aceptar HA. Por otra parte, si es probable que
nuestro resultado ocurriera por azar, entonces no podemos rechazar H0 .
Para analizar el significado de probabilidad, usaré un ejemplo simple, donde la proba-
bilidad de que cierto resultado se produzca por azar se calcula de manera directa. Esto se
diseñó para demostrar que diferentes resultados pueden tener distintas probabilidades de ocu-
rrir, aun cuando se obtengan del mismo evento al azar.
Si tomamos una moneda que no está "cargada" y la lanzamos al aire, habrá sólo dos
resultados, igualmente posibles: caerá cara o cruz. En otras palabras, la probabilidad de que
caiga cara es una de dos o 112. De igual manera, la probabilidad de que caiga cruz es de
1/2. Tenga en cuenta que cuando sumamos las dos probabilidades el resultado es uno. Esto
último es cierto en cualquier situación; sin importar cuántos resultados posibles haya en
una situación, si calculamos la probabilidad de cada uno y sumamos esas probabilidades el
resultado será uno. Ello significa simplemente que la probabilidad de que ocurra por lo me-
nos un resultado es de uno. Las probabilidades suelen expresarse como proporciones de
uno. Por ejemplo, la probabilidad de una cara es 0.5 y la de una cruz de 0.5 también. En oca-
siones, las probabilidades se expresan asimismo como porcentajes. Por ejemplo, hay 50%
de oportunidadés de que una sola moneda caiga cara y 100% de que salga cara o cruz.
Imagine que una amiga dice que puede influir en el resultado del lanzamiento de mone-
das haciendo que caigan cara. Convirtamos esto en un estudio para probar su afirmación.
Estableceríamos nuestras hipótesis:
HA: nuestra amiga puede hacer que las monedas caigan cara.
H 0: nuestra amiga no puede influir en la caída de las monedas.
Sabemos que la posibilidad de que una moneda caiga cara por azar es de 0.5. Por tanto. si
la lanzamos y cae cara, sabríamos que era muy probable que esto sucediera por azar y no
tendríamos pruebas suficientes para rechazar la hipótesis nula. En realidad, ésta no consti-
tuye una prueba justa de nuestras hipótesis, pues ningún resultado del estudio en parricular
es suficientemente improbable por azar para servir de evidencia contra la hipótesis nula.
~~----------------ln_v_e~~_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Para que la prueba de nuestra hipótesis resultara más justa necesitaríamos una situa-
ción en la que fuera improbable que algunos resultados ocurrieran por azar. Si complicamos
ligeramente la situación, veremos que diferentes resultados pueden tener probabilidades
distintas.
Si lanzamos cinco monedas a la vez y anotamos cómo caen, habremos aumentado el
número de resultados posibles. Las posibilidades van desde que todas caigan cara hasta que
todas caigan cruz, pasando porque algunas caigan cara y otras cruz. En realidad, hay cinco
posibles resultados: cinco caras, cuatro, tres, dos, una y ninguna cara.
Sin embargo, algunos resultados podrían obtenerse con más de una combinación, mien-
tras que otros se lograrían sólo de una manera. Por ejemplo, hay cinco combinaciones para
tener cuatro caras. La moneda uno cae cruz mientras todas las demás caen cara, la moneda
dos cae cruz mientras todas las demás caen cara, la moneda tres cae cruz mientras todas las
demás caen cara, la moneda cuatro cae cruz mientras todas las demás caen cara y la moneda
cinco cae cruz mientras todas las demás caen cara. Por otra parte, hay una manera única en
que hubiéramos obtenido cinco caras: que las cinco monedas cayeran cara. En la tabla 10.1
se muestran todas las combinaciones posibles de la caída de las cinco monedas.
Observe que hay 32 combinaciones. Podemos elaborar una distribución de frecuencia
a partir de estos resultados posibles (fig. 10.1).

12

10

8
"'e

Cll
:l 6
u
....
<1.1
1.1..

o
0.0 1.0 2.0 3.0 4.0 5.0

Número de caras

Figura 10.1 . Distribución de caras y cruces a partir del lanzamiento de cinco monedas.
__io_·n__________________~¡-1.49
----------------------------M~á~s_a_ll_á_d_e_l_a_d_e_sc_n~·pc

Tabla 1O. 1. Combinaciones posibles de la caída de las cinco monedas.

Resultado Moneda 1 Moneda 2 Moneda 3 Moneda 4 Moneda 5 Número


de caras
1 cruz cruz cruz cruz cruz o
2 cara cruz cruz cruz cruz 1
3 cruz cara cruz cruz cruz 1
4 cruz cruz cara cruz cruz 1
5 cruz cruz cruz cara cruz 1
6 cruz cruz cruz cruz cara 1
7 cara cara cruz cruz cruz 2
8 cara cruz cara cruz cruz 2
9 cara cruz cruz cara cruz 2
10 cara cruz cruz cruz cara 2
11 cruz cara cara cruz cruz 2
12 cruz cara cruz cara cruz 2
13 cruz cara cruz cruz cara 2
14 cruz cruz cara cara cruz 2
15 cruz cruz cara cruz cara 2
16 cruz cruz cruz cara cara 2
17 cara cara cara cruz cruz 3
18 cara cara cruz cara cruz 3
19 cara cara cruz cruz cara 3
20 cara cruz cara cara cruz 3
21 cara cruz cara cruz cara 3
22 cara cruz cruz cara cara 3
23 cruz cara cara cara cruz 3
24 cruz cara cara cruz cara 3
25 cruz cara cruz cara cara 3
26 cruz cruz cara cara cara 3
27 cara cara cara cara cruz 4
28 cara cara cara cruz cara 4
29 cara cara cruz cara cara 4

30 cara cruz cara cara cara 4 1


31 cruz cara cara cara cara ¿

32 cara cara cara cara cara 5


150l~--------------~l~nv~e=s~ti~ga~c~io~·n~c~u=a~nt~it=a~ti~v~a~e~n~p~si~co~l~og~í~a____________________

A partir de la tabla 10.1 podemos calcular la probabilidad de cada resultado si tomamos el


número de combinaciones con que pudo lograrse cierto resultado y lo dividimos entre 32
(el número de combinaciones en que las monedas pudieron caer).

Tabla 10.2. Probabilidades de diferentes resultados cuando se lanzan cinco monedas.

Número de combinaciones
Número de caras con que se obtiene Probabilidad

5 1 0.031
4 5 0.156
3 10 0.313
2 10 0.313
1 5 0.156
o 0.031

Por tanto, los resultados menos probables son que todas las monedas caigan cara o cruz;
cada una de tales combinaciones tiene una probabilidad de 1/32, o 0.031, de ocurrir por
azar. Recuerde que esto también puede expresarse como una posibilidad de 3.1% de obte-
ner cinco caras. Pongámoslo de otra manera: si lanzamos las cinco monedas y anotamos el
número de caras y de cruces, y lo hacemos hasta que hayamos lanzado las monedas 100
veces, esperaríamos obtener por azar cinco caras en aproximadamente tres ocasiones.
Las combinaciones más probables son las de tres caras y dos cruces y tres cruces y dos
caras, cada una con la probabilidad de 10/32, o 0.313, de ocurrir por azar. En otras pala-
bras, si lanzamos las cinco monedas 100 veces, esperaríamos obtener exactamente tres ca-
ras en unas 31 ocasiones.
Imagine ahora que hemos hecho el estudio para probar si nuestra amiga puede influir
en las monedas de modo tal que caigan sólo caras. Lanzamos las cinco y caen caras. Sabe-
mos que el resultado pudo ocurrir por azar, pero nos preguntamos: ¿es suficientemente im-
probable que ocurra por azar para arriesgamos a decir que pensamos que puede rechazarse
la hipótesis nula y sustentar nuestra hipótesis de investigación?
Antes de probar una hipótesis, los investigadores establecen un nivel de probabilidad
crítico, de modo que el resultado de su trabajo debe tener una probabilidad igual o menor
que el nivel crítico antes de rechazar la hipótesis nula de que el resultado ocurrió por azar.
Estos experimentadores dicen que el rango de resultados tan probable o menos probable que
la probabilidad crítica se encuentra en la región de rechazo; en otras palabras, es suficien-
temente improbable que estos resultados ocurran al azar para rechazar la hipótesis nula.
___________________________M_á~s_a_ll~á~d~e~la~ ri~~-io_·n__________________~f151
de~s~c_

Significación estadistica
Si el resultado del estudio se encuentra en la región de rechazo, se dice que el resultado es
estadísticamente significativo; si su probabilidad se halla fuera de la región de rechazo, no
se considera estadísticamente significativo. Por convención, en investigación la probabili-
dad crítica suele fijarse en 0.05. En general, se utiliza el símbolo a (la letra griega alfa) para
denotar la probabilidad crítica. Por tanto, a= 0.05 en muchas investigaciones. Este nivel
parece elevado porque constituye otra manera de indicar una oportunidad en 20, pero se ha
elegido como un compromiso entre dos tipos de error que los investigadores llegan a co-
meter cuando deciden si rechazan la hipótesis nula. Si la probabilidad de que nuestro resul-
tado haya ocurrido por azar es igual o menor que a, resulta estadísticamente significativa
y podemos rechazar H 0 . Sin embargo, si la probabilidad es mayor que a, no resulta esta-
dísticamente significativa y no podemos rechazar H 0 .
Como la probabilidad de obtener cinco caras por azar es de 0.031 (por lo general, expre-
sada como p = 0.031) y a que pes menor que 0.05 (nuestro nivel crítico de probabilidad,
a), rechazaríamos la hipótesis nula y aceptaríamos nuestra hipótesis de investigación. Por
consiguiente, concluimos que nuestra amiga puede influir en la caída de la moneda para
producir caras.
Una convención adicional se refiere a cómo escribir acerca de la significación estadís-
tica. A menudo se elimina la palabra estadística y un resultado se describe simplemente
como significativo. En cierto modo, esto es desafortunado, pues torna menos explícito el
hecho de que la significación se relaciona con ciertos criterios estadísticos. Sin embargo,
se vuelve engorroso describir un resultado como significativamente diferente estadística-
mente; por tanto, seguiremos la convención y evitaremos tales expresiones.

Tipos de error
Cualquier resultado puede ser un evento al azar, aun cuando sea muy improbable, pero de-
bemos decidir si deseamos arriesgarnos a rechazar la hipótesis nula, pese a la posibilidad.
Como no podemos saber con seguridad que nuestra hipótesis es correcta, hay cuatro re~Úl­
tados posibles de nuestro proceso de decisión y se basan en la decisión que tomamos y la
naturaleza de la realidad (que no podemos conocer).

Tabla 10.3. Errores que pueden cometerse al probar una hipótesi s.

Realidad
H0 falsa H0 verdadera

Nuestra elección Rechazar H0 Correct a Error tipo 1


Fallo al rechazar H0 Error tipo 11 Correcta
152l~ ______________l_nv~e~st~ig~a~c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si~co~l~og~ía_____________________
En consecuencia~ bay dos formas en que podemos estar correctos y dos probables tipos de
error. Cuando tomamos una decisión, no podemos saber si es correcta, de modo que siem-
pre corremos el riesgo de cometer un tipo de error. Un error tipo I ocurre cuando elegimos
rechazar la hipótesis nula aunque sea verdadera. Uno tipo 11 sucede si rechazamos nuestra
hipótesis de investigación (HA) cuando es verdadera. La probabilidad con que estamos dis-
puestos a cometer un error tipo 1 es a. Si fijamos una a muy pequeña, aunque disminuyamos
el peligro de incurrir en un error tipo 1, aumentaremos la probabilidad de que cometamos un
error tipo 11. Por tanto, la convención es establecer a en 0.05.
Sin embargo, el nivel real de a que establezcamos para una investigación determinada
depende de la importancia relativa de cometer un error tipo 1 o II. Si es más importante evi-
tar un error tipo 1 que uno tipo II, podemos establecer una a más pequeña que 0.05. Por ejem-
plo, si probáramos un medicamento de efectos colaterales molestos para saber si cura una
enfermedad que no amenaza la vida sería importante no cometer un error tipo l. No obstan-
te, si fuéramos a probar un medicamento de efectos colaterales mínimos pero que podría
salvar vidas estaríamos más preocupados en no cometer un error tipo II y podríamos esta-
blecer un nivel de a mayor que 0.05.
Tal vez s ienta que esto es como hacer que la estadística diga lo que usted desea. Si bien
ello no es cierto, a menos que haya una buena razón para establecer a en un nivel diferen-
te, los psicólogos a menudo juegan seguro y usan un nivel de a de 0.05. Por ende, si no se
siente cómodo al cambiar a, ajústese a 0.05 y la mayoría de los demás psicólogos no lo
considerarán alguien atípico.

Cálculo de la probabilidad
del resultado de la investigación
A menudo, en la investigación psicológica no efectuamos una predicción exacta en nuestra
hipótesis de investigación. En lugar de manifestar que nuestra amiga puede hacer que las
cinco monedas caigan cara, expresamos que puede influir en la caída de las monedas de
manera que caigan cara. Imagine que volvemos a ejecutar el experimento, pero ahora ob-
tenemos cuatro caras en lugar de cinco. Recuerde que nuestra amiga no dijo que podría ha-
cer que cuatro de cinco monedas cayeran cara. En este caso, la probabilidad de obtener ese
resultado sería de 4/32, o 0.156 (tabla 10.2). Ahora, quizá se daría el caso de que ella pudie-
ra influir en las monedas, pero que estuviera pasando por un mal dia. Hemos de advertir que
la probabilidad de que este resultado ocurra por azar es la probabilidad del resultado real,
más las probabilidades de todos los demás resultados posibles más extremos que el alcan-
zado pero que concuerdan con la hipótesis, pues si tenemos en cuenta sólo la probabilidad
exacta del resultado, aun cuando no corresponda a la predicción hecha, estamos dando una
ventaja injusta a la hipótesis de investigación. La probabilidad que usamos ahora es la de
obtener cuatro o más caras; es decir, 0.156 + 0.031 = 0.187. Por tanto, si obtenemos sólo
___________________________M_á_s_a_ll_á~d~e_la~de~s_c_ri~~-i_ón__________________~j153

cuatro caras, no tendríamos justificación para rechazar la rupótesis nula, porque la probabili-
dad es mayor de 0.05. Por consiguiente, concluimos que hay pruebas insuficientes para
apoyar la hipótesis de que nuestra amiga puede influir en las monedas para que caigan cara.
En el caso de cinco monedas, podríamos rechazar la hipótesis nula sólo si todas las mo-
nedas cayeran cara. No obstante, en ciertas situaciones nuestra predicción no podría satis-
facerse plenamente y, sin embargo, aún podemos rechazar la hipótesis nula.
Para demostrarlo, echemos un vistazo a la situación en que lanzamos 1O monedas. En
seguida se muestra que en este caso hay JI posibles resultados que van de cero a 1O caras,
pero ahora hay l 024 maneras en que podríamos lograrlo.

Tabla 10.4. Resultados posibles y sus probabilidades cuando se lanzan 10 monedas.

Número de posibles
Número de caras combinaciones para obtenerlo Probabilidad

o 1 0.00098
1 10 0.00976
2 45 0.04395
3 120 0.11719
4 210 0.20508
5 252 0.24609
6 210 0.20508
7 120 0.11719
8 45 0.04395
9 10 0.00976
10 1 0.00098

Imagine que, para probar nuestra hipótesis, lanzamos las lO monedas, pero sólo nueve caen
cara. La probabilidad del resultado (o uno más extremo y en dirección de nuestra hipó-
tesis) estribaría en la probabilidad de obtener nueve caras, más la probabilidad de obtener
10: 0.00976 + 0.00098 = 0.01074. En tal caso, estaría justificado el rechazo de la hipótesis
nula. Por tanto, el resultado no tiene que concordar totalmente con nuestra hipótesis antes de
que podamos considerarla sustentada.
Por fortuna, es muy improbable que alguna vez se vea obligado a calcular la probabi-
lidad del resultado de su investigación. En el capítulo siguiente mostraremos que puede uti-
lizar pruebas estadísticas estándar para evaluar su estudio y que los expertos en estadística
ya calcularon las probabilidades.
154l~ ______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
Pruebas de una y de dos colas
Hasta ahora hemos considerado la situación en que nuestra amiga nos indicó que podía lo-
grar que las monedas cayeran cara. Ha predicho la dirección en que ocurrirá el resultado.
Imagine ahora que ella nos ha hecho conjeturar y que ha señalado simplemente que podía
influir en la caída de las monedas de modo que hubiera una mayoría de un tipo, pero no ha
expresado si se trata de caras o de cruces.
Otra vez lanzaremos cinco monedas y nuestras hipótesis serán éstas:

HA: nuestra amiga puede lograr que las monedas caigan de manera tal que la mayoría
caigan del mismo lado.
H 0 (como antes): nuestra amiga no puede influir en la caída de las monedas.

Cuando planteamos nuestra hipótesis original, que las monedas caerán cara, dijimos que el
resultado estará en el lado derecho de la distribución de la figura 10.1 (o la cola derecha de
la distribución). Eso se describe como hipótesis direccional o unidireccional.
Sin embargo, la nueva hipótesis de investigación es no direccional o bidireccional por-
que no estamos prediciendo la dirección del resultado; no estamos señalando en cuál cola de
la distribución esperamos que esté el resultado. Podemos calcular la probabilidad de la si-
tuación, pero ahora debemos tener en cuenta ambas colas. Si las cinco monedas caen cara, la
probabilidad de que todas caigan del mismo lado es la misma de que todas sean cara, más
la probabilidad de que todas sean cruz. Planteado de otra forma: 0.031 + 0.031 = 0.062. Por
lo mismo, en la nueva versión del experimento no rechazaríamos la hipótesis nula, pues
es demasiado probable que este resultado, o uno más extremo, en la dirección de nuestra
hipótesis, ocurra por azar (es decir, que p sea mayor que 0.05, lo cual suele escribirse co-
mop > 0.05).
Cuando la hipótesis establece la dirección del resultado aplicamos lo que se describe
como prueba de una cola de la hipótesis porque la probabilidad se calcula sólo en una "co-
la" (o extremo) de la distribución. Sin embargo, cuando la hipótesis no es direccional, la
prueba se describe como de dos colas porque la probabilidad se calcula para ambos extre-
mos de la distribución.
Con una prueba de una cola, la región de rechazo se encuentra en una cola de la distri-
bución y, así, estaremos dispuestos a aceptar un resultado como estadísticamente significa-
tivo si su probabilidad es de 0.05 o menor, en el lado predicho de la distribución. En otras
palabras, 5% de los casos posibles se sitúan en la región de rechazo (fig. 10.2).


--------------------------~M~á~s~a~ll~á~d~e~la~de~s~c_ri~pc~i_ón__________________~f155

Todas cruz Todas cara


Caída de monedas

Figura 10. 2. Región de rechazo para una prueba de una cola con a = 0.05.

Con una prueba de dos colas, por lo general dividimos la probabilidad de 0.05 en 0.025 en
un lado de la distribución y 0.025 en el opuesto. En otras palabras, 2.5% de los casos posi-
bles se encuentran en una región de rechazo y 2.5% en la otra (fig. 10.3).

Todas cruz Todas cara


Caída de monedas

Figura 10.3. Regiones de rechazo para una prueba de dos colas con a = 0.05.

Si compara las figuras 10.2 y 10.3, verá que para que un resultado se encuentre en la región
de rechazo cuando aplicamos una prueba de una cola, debe tener menos caras --y aún resul-
tar estadlsticamente significativo-- de las que necesitaría en caso de aplicarse una prueba de
dos colas.
156l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
Resumen
Los investigadores nunca pueden aceptar de manera inequívoca sus hipótesis. Deben eva-
luar la probabilidad de que los resultados obtenidos sucedieran por azar. Con base en ello,
pueden decidir si rechazan o no la hipótesis nula. Por convención, si la probabilidad de que
el resultado ocurra por azar es de 0.05 o menor, se describe como estadísticamente signifi-
cativo y puede rechazarse la hipótesis nula. Este nivel de probabilidad se ha elegido como
el mejor valor para evitar un error tipo I (rechazo de la hipótesis nula cuando es verdade-
ra) y tipo II (fallo al rechazar la hipótesis nula cuando es falsa).
En el capítulo se ha tratado sólo la manera en que los investigadores tienen en cuenta
el peligro de cometer un error tipo l. En el capítulo 14 mostraremos cómo pueden reducir
al máximo la probabilidad de incurrir en uno tipo 11. Además, se mostrarán otras formas de
presentar los resultados y que dependen menos de la prueba de significación.
Ya se explicará en el capítulo siguiente cómo pueden utilizar los investigadores las es-
tadísticas de resumen para obtener conclusiones sobre la población de que provienen sus
muestras. También se analizarán temas relacionados con la manera de seleccionar una mues-
tra de una población.

111 ,.
11
Muestras y poblaciones

Introducción
En este capítulo se presenta la noción de parámetros de población y se describen dos mé-
todos básicos para elegir una muestra de una población: muestreo aleatorio y no aleatorio.
Se explica la noción de intervalo de confianza y se muestra cómo deben estimarse las pro-
porciones en una población a partir de las encontradas en una muestra.

Estadísticas
Las estadísticas de resumen, como la media ( x), la varianza (s 2 ) y la desviación estándar
(s), que se trataron en el capítulo 9, describen la muestra que se midió. Cada estadística tie-
ne un equivalente que describe la población de la cual proviene la muestra; ésta se conoce
como parámetro.

Parámetros
Cada parámetro se simboliza con una letra del alfabeto griego. El equivalente de la media
de la muestra es la media de la población y se denota con 1..1. (la letra griega mu). El equiva-
lente de la varianza de la muestra es la varianza de la población, que se muestra como cr2
(el cuadrado de la letra griega sigma). El equivalente de la desviación estándar de la mues-
tra es la desviación estándar de la población, denotada por cr. Hay una razón para elegir una
letra griega en cada caso: 1..1. es el equivalente de la m en nuestro alfabeto, y a de nuestra s.

--------------------------------------------------------~ 157
~L--------------~In~v~e~st~ig~a~c~ió~n~c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Cuando se propone una hipótesis de investigación, el psicólogo está interesado no só-
lo en la muestra específica de participantes. En cambio, la hipótesis hará una afirmación
más general sobre la población de que proviene la muestra. Por ejemplo, la hipótesis "los
hombres realizan menos labores domésticas que sus compañeras" puede probarse en una
muestra en particular, pero se hace la suposición de que el hallazgo puede generalizarse a la
población más amplia de hombres y mujeres.
A menudo, los parámetros se estiman a partir de encuestas que se han realizado para
identificar pautas de votación o características propias de una población, como la propor- ....
ción de personas que practican cantidades recomendadas de ejercicio diario.
Además, muchas pruebas estadísticas incluyen la estimación de los parámetros de la
población para evaluar la probabilidad de que los resultados de la investigación hayan ocu-
rrido por azar.

Elección de una muestra


A menudo, cuando se realizan experimentos existe la suposición implícita (a menos que se
estudie a grupos específicos, como niños pequeños) de que cualquier muestra de personas
será representativa de su población: la gente en general. Ello puede llevar a conclusiones
erróneas cuando la muestra se limita a un grupo cuyos miembros provienen de una subpo-
blación, digamos los estudiantes. Lo que puede resultar cierto para el desempeño de los es-
tudiantes quizá no lo sea para quienes no lo son.
Sin embargo, cuando los investigadores conducen una encuesta, con frecuencia desean
generaljzar explícitamente lo encontrado en su muestra a la población de la que proviene. Pa-
ra ello, tratan de asegurarse de que la muestra es representativa de la población más amplia.
Antes de elegir una muestra, los investigadores deben tener claro qué constituye supo-
blación. Al hacerlo, decidirán cuál es su unidad de análisis; es decir, lo que constituye un ele-
mento de la población. A menudo, la unidad de análisis será la gente. No obstante, muchos
de los principios de muestreo también se aplican cuando los elementos de población son
lugares, tiempos, segmentos de conducta o incluso programas de televisión. En aras de la
sencillez, el análisis se basará en la suposición de que la gente representa los elementos de
población por incluir en una muestra.
La decisión siguiente acerca de la población corresponde a los factores de limitación; es
decir, cuáles restricciones habrán de colocarse a lo que constituye un elemento de población
(por ejemplo, individuos elegibles para votar o que tienen educación de tiempo completo).
Sudman (1976) recomienda que se operacionalice al máximo la definición de un elemento
de población, a riesgo de excluir a algunas personas. Da el ejemplo de definir un rango de
edad precisa en lugar de emplear el término edad de crianza de hijos. Sin embargo, consi-
dera que se puede volver demasiado rígida la definición y, con ello, aumentar los costos de
la encuesta por forzar a los investigadores a vigilar a mucha gente ant~s de que la muestra

-
quede identificada.
1 1

____________________________M_u_e_st_ra_s~y~p~o_b_la_c_io_n_e_s__________________~f159

Los objetivos del estudio ayudarán a definir la población y, a gran escala, a constituir la
muestra. Por ejemplo, si se desea comparar elementos de subpoblaciones, como géneros o
grupos de edad, tratará de lograrse una representación igual de los subgrupos de la muestra.
En las encuestas se emplean dos métodos generales de muestreo: aleatorio (o probabi-
lístico) y no aleatorio (o no probabilístico). Su elección dependerá de los objetivos del es-
tudio y de factores como la exactitud, el tiempo y el dinero.

Muestras aleatorias
En las muestras aleatorias cada elemento de población tiene una probabilidad igual, o una
probabilidad cuantificable, de ser seleccionado. El principio del muestreo aleatorio se com-
prenderá más fácilmente a partir de la descripción del proceso de muestreo aleatorio simple.

Muestreo aleatorio simple


Una vez que se elige a la población, la primera etapa consiste en determinar el tamaño de
la muestra. Ello dependerá del grado de exactitud con que los investigadores desean gene-
ralizar los hallazgos a las poblaciones. Resulta claro que cuanto mayor sea la muestra, tanto
más exactas serán las probables generalizaciones a la población respectiva. (En el apéndice
II se detalla la manera de calcular el tamaño apropiado de una muestra.) En una segunda
etapa se identificará cada elemento de la población. En tercer lugar, si los elementos care-
cen aún de código, se asignará a cada uno de ellos un código de identificación único (por
ejemplo, un número). En cuarto lugar, Jos códigos se seleccionarán al azar, hasta que se
identifiquen todos los elementos de la posible muestra.
Para la selección aleatoria puede emplearse un programa de computadora o una tabla
de números aleatorios, o pueden colocarse todos los números en hojas de papel y extraer-
se de un sombrero. (En el apéndice XVI se incluyen tablas de números aleatorios.)

Problemas con la identificación de los elementos de población


Tal vez se presenten dificultades al emplear listas publicadas de personas, pues quizá por
razones sistemáticas se omitan algunas. Por ejemplo, en Gran Bretaña se estableció un im-
puesto en la década de 1990 que requería que los recaudadores supieran dónde vivía cada
individuo. Por tanto, muchos trataron de mantener sus nombres fuera de' las relaciones uti-
lizables para identificarlos, sobre todo las de votantes. Si la lista se hubiera usado a fin de
identificar sujetos para una encuesta, los demasiado pobres u opuestos políticamente al im-
puesto quedarían excluidos; por tanto, se habría producido una muestra con sesgo.
Otro ejemplo proviene del campo de los discapacitados visuales, respecto a quienes las
autoridades locales de Inglaterra y de Gales mantienen un registro. Sin embargo, para que
16QlL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
alguien se registre debe darse la recomendación de un oftalmólogo. Es probable que mu-
chas personas de edad avanzada simplemente acepten su discapacidad visual y no visiten
al oftalmólogo; en tal caso, el registro tendría una subrepresentación de individuos de edad
avanzada.
También ocurre que, para identificar elementos de una población, debe llevarse a cabo
una encuesta más amplia. En el caso de los discapacitados visuales, tal vez se necesite to-
mar una muestra de gente en general para estimar tanto la proporción de la población que
padece una discapacidad visual como sus características.

Encuestas telefónicas
Cuando se realiza una encuesta telefónica puede caerse en la tentación de usar un directo-
rio. Sin embargo, al menos tres grupos se verán excluidos por el método: quienes no tienen
teléfono; quienes se han mudado recientemente al área y, por tanto, no aparecen en ese catá-
logo, y quienes han elegido que se les retire de éste. En cada caso, la falta de dichas perso-
nas producirá una muestra sesgada.
Una forma de sortear ambos problemas consiste en seleccionar números telefónicos al
azar a partir de todas las combinaciones permisibles para el área o las áreas incluidas en la
muestra.

Otros métodos de muestreo aleatorio


El muestreo aleatorio simple es sólo una entre muchas técnicas. Hay por lo menos otras tres
formas de muestreo aleatorio, cuya administración puede resultar más simple, pero que lle-
gan a presentar complicaciones al estimar los parámetros: muestreo sistemático, estratifi-
cado y de conglomerados.

Muestreo sistemático
El muestreo sistemático requiere que se decida un tamaño de muestra y que luego se divida
el de la población entre el de la muestra. Esto da una cifra (redondeada al número entero más
cercano) que se usa como base del muestreo. Por ejemplo, si se necesita una muestra de lOO
personas de una población de 2 500, la cifra es 2 500/ 100 = 25. Al azar se elige un número
de inicio entre la población; digamos 70. La primera persona de la muestra es la 70a., la si-
guiente es la 70 + 25 = 95, sigue la 95 + 25 = 120 y así sucesivamente, hasta que tenemos
una muestra de 100. Sin embargo, considere que la 97a. persona que seleccionamos para
la muestra será la 2 495 de la población; si a ésta le sumamos 25, obtendríamos 2 520, un
número superior al tamaño de la población. Para sorteado, debemos restar 2 500 a 2 520 y
elegir a la 20a. persona, seguida por la 20 + 25 = 45a.
--------------------------~M~u~e~st~ra=s~y~p~o~b~la=c~io~n~e~s------------------~¡161
Un peligro del muestreo sistemático sería que el ciclo coincidiera con un ciclo natural de
r
la población. Por ejemplo, si se tomó una muestra de personas que viven en una calle deter-
minada y la base del muestreo usa un número par, podría incluirse sólo a moradores de un
lado de la calle. Esto revestiría especial importancia si una autoridad local gobierna un lado
de la calle y una autoridad distinta el otro.

Muestreo estrati{kado
Un muestreo estratificado requiere la división de la población en subgrupos o estratos mu-
tuamente excluyentes. Un ejemplo típico es la división de la muestra por género, en estratos
de hombres y mujeres. Una vez que se han elegido los estratos puede aplicarse el muestreo
aleatorio simple o el sistemático en cada estrato para elegir la muestra. Una ventaja del mues-
treo estratificado es que se garantiza que ésta contendrá representantes suficientes de cada
uno de los estratos. Un riesgo del muestreo aleatorio simple y del sistemático radica en que no
pueden garantizar una buena representación de los miembros de subgrupos particulares. Hay
dos maneras de conducir el muestreo estratificado: proporcionada y desproporcionada.
Muestreo proporcionado. El muestreo proporcionado se aplica si el muestreo del estrato re-
fleja las proporciones de la población. Por ejemplo, un colega quería entrevistar a gente que
visitaba una clínica de enfermedades transmitidas sexualmentc. Sabía que alrededor de una
séptima parte de los visitantes eran mujeres. Por ello, si quisiera una muestra estratificada
proporcionada, habría de integrarla de tal modo que obtuviera seis séptimas partes de hom-
bres y una séptima parte de mujeres.
Muestreo desproporcionado. Si los investigadores no requieren que su muestra tenga las
proporciones de la población, pueden elegir una muestra desproporcionada. Mi colega tal
vez quería que su muestra tuviera 50% de hombres y 50% de mujeres. Resulta claro que,
simplemente, no sería razonable combinar las submuestras de una muestra desproporcionada
y tratar de extrapolar el resultado a la población. La extrapolación implicaría un análisis
más complejo (véase Sudman, 1976).

Muestreo de conglomerados
El muestreo de conglomerados requiere un muestreo inicial con base en una unidad mayor
que el elemento de población. Esto puede hacerse de dos maneras: en una sola etapa o en
varias .
.'vfuestreo de conglomerados de una sola etcpa. Un ejemplo radica en que los investigado-
L res desean encuestar a estudiantes que cursen psicología en Gran Bretaña, pero en lugar de
Identificarlos a todos identifican todos los lugares donde se imparten cursos en la materia.
Podrían seleccionar al azar varios cursos y luego encuestar a todos Jos inscritos en ellos.
~L________________In_v_e_st_ig~a_c_io_
'n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Mue~treo de conglomerados de varias etapas. Una muestra de conglomerados de varias


etapas podría usarse cuando los investigadores desean encuestar a jóvenes de secundaria. Em-
pezarían por identificar a todas las autoridades educativas de Gran Bretaña y seleccionar al
azar entre ellas. Luego, de las autoridades seleccionadas identificarían todas las escuelas y
elegirían al azar entre éstas. Más adelante podrían encuestar a todos los alumnos de las ins-
tituciones seleccionadas o tomar muestras al azar de cada una de ellas.
El muestreo de conglomerados tiene la ventaja de que, si los elementos de la población
están muy dispersos geográficamente, la muestra se aglomera en un número limitado de lu-
gares. Por tanto, si en el estudio se requiere que los investigadores se encuentren con los
participantes, sería necesario visitar la menor cantidad de sitios. De igual manera, si entrevis-
tadores capacitados deben conducir el experimento, podría concentrárseles en un número
reducido de lugares.

Trato a quienes no responden


Independientemente de la técnica de muestreo aleatorio que utilice, la manera en que trate
a quienes no responden tendrá un efecto importante en la naturaleza aleatoria de su mues-
treo. Habrá ocasiones en que no estará disponible una persona seleccionada. Debe realizar
más de un intento por incluirla(s). Si aún así no lo consigue, no pase al elemento siguiente de
la lista original que comprende a toda la población para completar su muestra. Si lo hace,
habrá minado la aleatoriedad de la muestra, pues tal elemento de la población ya se había
rechazado del procedimiento de muestreo. Cuando identifique la muestra potencial inicial,
será mejor que abarque a más personas de las requeridas. De este modo, si no puede incluir
a alguien en la muestra, sólo deberá pasar al próximo sujeto de la muestra potencial.

Muestras no aleatorias
Muestreo accidental 1de oportunidad1de conveniencia
Como su nombre lo indica, el muestreo accidental/de oportunidacllde conveniencia implica
el muestreo de las personas que uno encuentra por casualidad. Por ejemplo, los investiga-
dores podrían pararse fuera de un supermercado y acercarse a toda la gente que necesiten. A
menos que esté interesado sólo en personas que se detienen en una sucursal determinada
de una cadena de supermercados en particular, se aconseja que diversifique su ubicación.
También recomiendo que se anote la tasa de rechazo y alguna indicación de quién rechaza. Así
tendrá un indicio sobre cualquier sesgo de la muestra.

Cuota
Una muestra de cuota es una de oportunidad, pero con cuotas establecidas para el número de
personas que habrán de incluirse en las submuestras. Por ejemplo, tal vez los investigadores
____________________________M_u_es_t_ra_s~y~p_o_b_la_c_ es__________________~f16J
io_n_

deseen un número igual de hombres y mujeres. Una vez que obtengan su cuota para un
género, se acercarán sólo a miembros del otro género, hasta que tengan los individuos su-
ficientes.
A veces la cuota puede basarse en algo, como un grupo de edad o un estatus socioeco-
nómico, donde se necesitaría acercarse a todos y plantear una pregunta de fi ltro para saber
si se encuentran en uno de los subgrupos por incluir en la muestra.
Si las cuotas se establecerán en varias dimensiones, suele usarse el ténnino muestreo
dimensional (por ejemplo, si los investigadores querían muestras de gente con distintos
niveles de discapacidad visual, de varios grupos de edad y diversa edad de inicio con su con-
dición visual). Para ese trabajo tal vez se necesitaría buscar gente que cumpla especifica-
ciones muy precisas.

ProposWvo
El muestreo propositivo se utiliza cuando desea estudiarse una muestra definida claramen-
te. Un caso común es donde los investigadores tienen una noción de lo que constituye un
ejemplo típico de lo' que les interesa. Podría tratarse de una región donde la pauta de vota-
ción en las elecciones suele reflejarse en la pauta nacional. El peligro del método estriba en
que tal vez la región ya no resulte tipica.
Otro uso del muestreo propositivo es cuando se buscan participantes con característi-
cas particulares, como gente de cada nivel de una organización.

Bola de nieve
El muestreo de bola de nieve usa contactos iniciales para identificar a otros posibles partici-
pantes. Por ejemplo, en la investigación sobre cómo redactan los escritores ciegos, un colega
y yo usamos nuestros contactos para identificar a escritores invidentes y luego les pregun-
tamos por otros que conocieran.

Las ventajas de una muestra aleatoria


Si se ha empleado una muestra aleatoria es posible generalizar con cierto grado de exactitud
los resultados obtenidos de la muestra a la población. Si se ha usado una muestra no aleato-
ria, no puede extrapolarse con exactitud. La generalización de una muestra aleatoria se ob-
tiene al calcular un intervalo de confianza para cualquier estadística obtenida de la muestra.

Intervalos de confianza
Como con cualquier estimado, nunca podemos estar totalmente seguros de que nuestro es-
timado de un parámetro es exacto. Sin embargo, sí podemos encontrar un rango de valores
16,4lL--------------~'~nv~e~s~ti~ga~c~ió~n~c~u=a~nt~it~a=ti~va~e=n~p~si~co~l~og~í~a____________________

que nos dé cierto nivel de confianza de que el parámetro debe caer en él. Tal rango se lla-
ma intervalo de confianza. En general, el nivel de confianza que podemos tener de que el
parámetro debe estar en el rango suele expresarse como porcentaje. Un nivel común de
confianza es 95%. No sorprende que cuanto mayor sea el porcentaje de confianza que re-
querimos, tanto mayor será el intervalo donde el parámetro puede caer a fm de que podamos
tener más confianza de que hemos incluido el parámetro en el intervalo.
En el apéndice II figuran una explicación acerca de cómo se obtienen los intervalos de
confianza y los detalles de los cálculos que son necesarios para cada uno de los ejemplos
dados más adelante. También se describe cómo puede decidir el tamaño de una muestra si
requiere cierta exactitud en sus estimados.
Por ejemplo, en el caso de unos comicios, cierta compañía de investigación de merca-
dos realiza un sondeo de opinión para predecir cuál partido ganará. Utiliza una muestra
aleatoria de 2 500 votantes y encuentra que 36% dice que sufragará en favor de un partido
de derecha (la Vía Derecha), mientras que 42% afirma que lo hará por uno de izquierda (el
Partido de los Trabajadores). Los encuestadores calculan los intervalos de confianza apro-
piados. Encuentran que pueden tener 95% de confianza de que el porcentaje de la pobla-
ción que se inclinaría por la Vía Derecha se halla entre el 34.1 y el 37.9%; el que votaría
por el Partido de los Trabajadores, entre el40.1 y el43.9%. Como no se superponen esos
dos intervalos de confianza, podemos predecir que si se realizara la elección más personas
votarían por el Partido de los Trabajadores que por la Vía Derecha.
Tal vez haya notado que a veces las organizaciones dedicadas a las encuestas reportan
en sus resultados lo que llaman margen de en·or. En este caso, el margen de enor sería de
aproximadamente 2%, pues la votación predicha para cualquier partido está en un rango si-
tuado aproximadamente 2% aniba y 2% abajo de las cifras encontradas en la muestra. El
margen de error es la mitad del intervalo de confianza.
Por lo menos tres factores influyen en el tamaño del intervalo de confianza para el mis-
mo grado de confianza: la proporción de la muestra para la que se calcula el intervalo de
confianza; el tamaño de la muestra, y los tamaños relativos de la muestra y de la población.

Efecto de la proporción en el intervalo de confianza


Cuanto más se aleje de 0.5 (o 50%) la proporción para la que se estima el intervalo de con-
fianza, tanto menor será éste. Por ejemplo, imagine que quienes realizan las encuestas
también encuentran que 0.05 (o 5%) de su muestra votaría por el Partido del Ala Izquier-
da. Cuando se calcula el intervalo de confianza, se estima que el porcentaje de la población
que sufragaría por dicho partido estaría entre 4.15 y 5.85%. Observe que el rango para es-
te intervalo de confianza es de sólo l. 7%, mientras que con el mismo tamaño de muestra
el rango del intervalo de confianza para quienes votarían por el Partido de los Trabajado-
res es un poco menor de 4%.
En la tabla 11. 1 se dan ejemplos de la manera en que el intervalo de confianza de una
submuestra se afecta por el tamaño de la proporción que forma una submuestra.
'11

____________________________M_u_e_st_ra_s~y~p~o_b_la_c_io_n_es__________________~j165

Tabla 11. 1. Intervalo de confianza de 95% para una submuestra, según la proporción
entre la submuestra y la muestra de 2 500.

Submuestra como proporción de la muestra completa

0.05 0.10 0.20 0.30 0.40


o o o o o 0.50
0.95 0.90 0.80 0.70 0.60
Intervalo de confianza 1.7% 2.4% 3.1% 3.6% 3.8% 3.9%

Efecto del tamaño de la muestra


en el intervalo de confianza
El grado de exactitud obtenible depende menos del tamaño relativo de la muestra de la po-
blación que del absoluto de la muestra. Esto es cierto si la muestra resulta inferior a 5%
(una parte en 20) del tamaño de la población. Cuanto mayor sea la muestra, tanto menor
será el rango del intervalo de confianza para el mismo nivel de confianza; es decir, pode-
mos determinar con mayor exactitud el parámetro de la población.
Para comprobar que el tamaño de la muestra influye en el intervalo de confianza, ima-
gine que una segunda compañía de encuestas toma una muestra de sólo 100 personas para
descubrir cómo votarán. De manera coincidente, obtiene los mismos resultados que la pri-
mera. Sin embargo, cuando calculan el intervalo de confianza, con 95% de confianza para
el porcentaje en la población que sufragaría por el Partido de los Trabajadores, hallan que
está entre 32.33 y 51.67%, un rango de 19.34% o un margen de error de casi LO%.
Cuanto mayor sea la muestra, tanto mayor será el aumento del tamaño de la muestra
que se precisa para reducir el intervalo de confianza en una cantidad equivalente. Obser-
ve que el intervalo de confianza disminuye de 19.34 a 3.86%, un decremento de 15.48%
cuando se incluyó en la muestra un extra de 2 400 participantes. Si se agregaran 2 400 adi-
cionales, para formar una muestra de 4 900, el intervalo de confianza se volvería de 2.76%,
que sólo es una reducción de 1.1% adicional. En realidad, necesitaría una muestra de casi
1O 000 para reducir a 2% el intervalo de confianza. En la tabla 11.2 se muestra el efecto
que el tamaño de la muestra tiene sobre el ancho del intervalo de confianza para una sub-
muestra.
Evidentemente, debe pensar con cuidado antes de invertir el tiempo y el esfuerzo adi-
Clonal de tomar una muestra de 1O000 personas en lugar de 2 500, cuando ganará sólo 1%
er el margen de error.
166lL______________~In_ve~s~ti~ga~c~io~·n~c~u~an_t~it~at~iv~a_e_n~p~s~ic~o~lo~gí~a____________________
Tabla 11.2. Intervalo de confianza de 95% para una submuestra, según el tamaño de la
muestra, cuando la submuestra forma la mitad de la muestra.
Intervalo
Tamaño de muestra de confianza

50 27.7%
100 19.6%
200 13.9%
300 11.3%
400 9.8%
500 8.8%
1 000 6.2%
2 000 4.4%
2 500 3.9%
5 000 2.8%
10 000 2.0%

Efecto del tamaño de la muestra .


como una proporción de la población
Cuanto mayor sea la muestra como proporción de la población, tanto más exacto será el in-
tervalo de confianza (tabla 11.3).

Tabla 11.3. Efecto en el intervalo de confianza de 95% tras variar la muestra como una
proporción de la población (para una submuestra de 500 tomada de
una muestra de 1 000).

Muestra como porcentaje de la población

Intervalo de confianza

Desde luego, si ha tomado un censo de su población (es decir, de todos los elementos de la
población), no hay un intervalo de confianza, pues las estadisticas que calcule serán !os pa-
rámetros de población.
El factor final que influye en el tamaño del intervalo de confianza es el grado de con-
fianza que requiere con relación al tamaño del intervalo de confianza.

dlk.-
____________________________M_u_e_st_ra_s~y~p~o_b_la_c_io_n_e_
s __________________~j167

Efecto del grado de confianza


en el tamaño del intervalo de confianza
Las cifras citadas antes han sido para un intervalo de confianza de 95%, que es cuando de-
seamos tener 95% de confianza de que el intervalo de confianza --valga la tautología--
contiene el parámetro que estamos estimando, que es el que normalmente se calcula. Sin
embargo, pueden tenerse o~os niveles de confianza. Cuanto más de ésta desee tener acer-
ca del lugar en que se encuentra d parámetro, tanto mayor será el margen de error y, por
ende, el intervalo de confianza. Si deseamos tener una confianza de 99% sobre la propor-
ción de los simpatizantes de la Vía Derecha en la población, el margen de error se elevaría
a 2.5% y el intervalo de confianza estaría entre 0.335 y 0.385, o 33.5 y 38.5%. En seguida
se observan los efectos de la variación del nivel de confianza en el ancho del intervalo de
confianza cuando la submuestra es 0.5 (50%) de la muestra:

Tab la 11.4. Efecto de la modificación del nivel de confianza en el intervalo de


confianza (para una submuestra de 500 tomada de una muestra de 1 000).

Nivel de confianza
80% 85% 90% 95% 99%
Intervalo de confianza 4.0% 4.6% 5.2% 6.2% 8.1 %

1!".-
Las cifras anteriores son reales sólo para una muestra aleatoria simple. El lector que desee
calcular los intervalos de confianza o el tamaño de la muestra para otros tipos de muestra
aleatoria debe consultar un texto más avanzado, como Sudman (1976). Ha de tener en cuen-
ta que ese grado de exactitud se basa en la suposición de que la muestra carece de sesgo.
i

Resumen
Los investigadores pueden elegir la muestra que deseen estudiar por muestreo aleatorio o
no aleatorio. Si emplean una muestra aleatoria, pueden estimar a partir de las cifras obte-
nidas con sus muestras y, con cierto grado de exactitud, los parámetros equivalentes para
la población. El grado de exactitud de esos estimados dependerá del tamaño de la muestra
y de la proporción de la población que habrán incluido en la muestra.
En el capítulo siguiente se describirá cómo los investigadores pueden decidir la proba-
bilidad de que una muestra provenga de una población en particular.
12
Análisis de diferencias entre
una sola muestra y una población

Introducción
En ocasiones, luego de obtener una puntuación para una persona o una muestra, los inves-
tigadores desean conocer si es común en una población. Además, buscan identificar si una
medida tomada de alguien, o de una muestra de individuos, resulta estadísticamente distinta de
la medición equivalente de una población. En este capítulo se presenta una familia de prue-
bas estadísticas (las pruebas z) que permite responder ese tipo de preguntas. Además, se
trata una familia de pruebas afines (pruebas t) aplicables en circunstancias donde hay in-
formación insuficiente para usar una prueba z.
En el capítulo se incluyen también versiones adicionales de gráficas y otra manera de
identificar mediciones extremas.

Pruebas z
Las pruebas z permiten a los investigadores comparar una estadística determinada con la
media de la población para dicha estadística, a fin de ver si ésta es común en la población
y, por tanto, de saber las probabilidades de que la persona, o la muestra de individuos,
provenga de la población dada. Una prueba =puede utilizarse para probar la significación
estadística de un amplio rango de estadísticas de resumen, incluido el tamaño de una sola
puntuación, de una media o de la diferencia entre dos medias. En el capítulo utilizaré ejem-
plos para examinar el total de un participante individual o de una media proveniente de una
muestra.

168
Análisis de diferencias entre una sola muestra y una población ¡169
------------------------------------------~~~~----------~

Todas las pruebas z se basan en el mismo principio. Señalan la distancia a que se en-
cuentra la estadística que se evalúa de la media de la población, en términos de desviacio-
nes estándar de ésta. Por ejemplo: la estadística podría ser una puntuación individual de una
prueba de IQ; la media de la población, la media de la puntuación de IQ para una pobla-
ción determinada, y la desviación estándar, la desviación estándar para los IQ de quienes
se encuentran en la población. La gente que diseñó la prueba habrá determinado los pará-
metros de la población (o nomzas) y los incluirá en el manual donde se explique el uso
apropiado de la prueba.
La ecuación para una prueba z que compara la puntuación de un solo participante con
la de la población es de la forma siguiente:

Puntuación única - media de población para la medición


z = desviación estándar de la población para la medición

En un nivel intuitivo, podemos decir que la prueba z determina el tamaño de la diferencia


entre la estadística de muestra y la media de población para tal estadística. Por ello, cuan-
to mayor sea la diferencia, tanto mayor será z. Sin embargo, z tiene en cuenta también la
cantidad de dispersión de la estadística en la población, expresada en términos de la des-
viación estándar. Por lo mismo, cuanto mayor dispersión, tanto menor resultará z. En conse-
cuencia, para que la z sea grande, la diferencia entre la estadística y la medía de la población
para esa estadística debe ser suficientemente grande para contrarrestar el efecto del tama-
ño de la dispersión.
Esta etapa de la explicación es fundamental , pues presento el principio general para la
mayoría de las estadísticas inferenciales. Hasta ahora, cuando hablaba acerca de la distri-
bución normal (véase el capítulo 9), me refería a una entidad concreta, como una puntuación
de IQ. En la figura 12.1 se aprecia la distribución de puntuaciones de IQ para 16 000 per-
sonas en una prueba con media de población de 100 puntos de IQ y desviación estándar de
15 puntos (recuerde que en una distribución normal el valor de la media también es el más
frecuente: el modo).
Imagine ahora que seleccionamos a una persona de la muestra anterior. Incluimos el
IQ para ese individuo en la ecuación para z y calculamos ésta, luego colocamos ese valor
de z en una gráfica de frecuencia. Repetimos esto para toda la muestra, seleccionamos a
cada persona, una por una, probamos su IQ, calculamos el nuevo valor de z y luego lo aña-
dimos a la gráfica. En tales condiciones, el valor más probable de z sería cero, pues la pun-
tuación de IQ más frecuente será la media de la población:

100 - 100
z 15
o
1701 Investigación cuantitativa en psicología

3000

"'e:
""o - -
~ 2000 r--
- -
Q)
a.

"....o
Q)

Q)
r-- r-
E
•::l 1000 f-
z r--

o
40 50
A60 70 80 90 100 110 120
k 130 140 150
IQ

Figura 12. 1. Distribución de puntuaciones de IQ en una muestra de 16 000 personas


para una prueba con media= 100 y desviación estándar= 15.

Cuanto mayor diferencia entre la puntuación de IQ que probamos y la media del IQ de la


población, tanto menos frecuente será esa puntuación. Por ello, la distribución de las pun-
tuaciones z de la muestra tendrá el aspecto siguiente:

3000

r--
"'e:
o""
2000 r-- 1--
~
8.
- -
"....o
Q)

Q)
- -
E
·::l
z 1000
....- 1--

,...--
f--

o ~ ~
- 3.96 - 2.62 - 1.29 0.04 1.38 2.71

Figura 12. 2. Distribución de 16 000 puntuaciones z.


______________A_n_á l_is_is__
de__
d_if_er_e_n_c,_·a_s _e_nt_r_e_u_n_a_s_ol_a_m
__ue_s_tr_a~y~un_a~po_b_l_
a c_i_
ón______~¡-171

La distribución teórica de z (la distribución normal estandarizada) se muestra en seguida:

-4 -2 o 2 4
z

Figura 12.3. Distribución normal estandarizada.

Como todas las distribuciones normales, la anterior es simétrica alrededor de la media (y


del modo y la mediana). Sin embargo, la media para z es O; la desviación estándar para z
tiene el valor de l .
Con la distribución z, los expertos en estadística han calculado la proporción de una
población que tendrá una puntuación en particular en una medición distribuida normal-
mente.
Por tanto, si tenemos alguna medición que sabemos está distribuida normalmente en la
población, podemos determinar la posibilidad de un valor dado si aplicamos una prueba z.
Por ejemplo, si sabemos que cierta prueba de IQ tiene media de 100 y desviación estándar
de 15, podemos probar el IQ de una persona y ver cuántas tiener un IQ superior (o infe-
rior) a ése. Imagine que la persona alcanza una puntuación de 120 en la prueba de IQ. Con
la ecuación de z podemos ver cuántas desviaciones estándar figuran arriba de la media:

120 - 100
z =
15
1.333

Al consultar las tablas z, podemos encontrar cuál proporción de personas tiene una puntua-
ción z por lo menos igual de grande.
1721 Investigación cuantitativa en psicología

Lectura de tablas z
El apéndice XN incluye las tablas de valores z utilizables para encontrar su significación.
En seguida se observa una parte de la tabla AXIV.l de dicho apéndice XIV:

Tabla 12.1. Extracto de las tablas z tomado del apéndice XIV.


2o. lugar decimal
z o 2 3 4 5 6 7 8 9
0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183

Para identificar la proporción de una z de 1.333, busque en la primera columna basta en-
contrar la fila que indica el primer lugar decimal: 1.3. Ahora, como la cifra (1.333) tiene
más de un lugar decimal, recorra las columnas hasta dar con el valor del segundo lugar de-
cimal (3). Observe ahora la entrada en la tabla donde la fila 1.3 coincide con la columna 3;
esto nos dará la proporción de la población que produciría una puntuación z de 1.33 (o ma-
yor). En esta tabla no podemos encontrar una puntuación z con mayor precisión que dos
lugares decimales. La celda da la cifra 0.0918. Ésta es la proporción de personas que ten-
drán una puntuación suficientemente alta para arrojar una z de al menos 1.33; en otras
palabras (en este ejemplo), la proporción de personas que tengan un IQ de 120 o más.
La conversión de la proporción en un porcentaje (multiplicándolo por lOO) nos indi-
ca que el IQ medido está en el9.18% superior. Si restamos esa cifra de 100%, podemos
decir que 90.82% de la población tiene un IQ inferior al de tal persona.
Si una puntuación z resulta negativa, entonces, como la distribución z es simétrica, aún
podemos utilizar la tabla 12.1, pero las proporciones deben leerse ahora como las situadas
debajo de la puntuación z. Por tanto, si z = -1.333 (para un IQ de 80), entonces 9.18% de
la gente de la población tiene una puntuación igual o inferior a ésta.
_____________A_n_á_lis_is__
de__
dl_·re
_r_e_nc_i_as_e_n_t_re_u_n_a_s_o_ta_m
__ue_s_tr_a~y~u_n_a~po~b_ta_c_ió_n______~J173

Con este uso de las puntuaciones z se demuestra que una desviación estándar puede
constituir una estadística de resumen particularmente útiL Si conocemos la media y la des-
viación estándar de una población (distribuida de modo normal), entonces si alguien tiene
una puntuación que representa una desviación estándar más alta que la media, la z de esa
persona será l.
Por ejemplo, sabemos que la desviación estándar de la prueba de IQ es 15. Si una per-
sona tiene un IQ con una desviación estándar arriba de la media, su IQ será 115. Por tanto,

115 - 100
z=
15

Si buscamos en la tabla 12.1 la proporción para z = 1, usamos la columna cuyo encabeza-


do es Oporque una z de 1 representa lo mismo que una z de 1.00 (con dos lugares decima-
les). La tabla muestra el valor 0.1587. En otras palabras, 15.87% de la población tiene un
IQ igual o mayor que una desviación estándar arriba de la media. De igual manera, s i una
persona tiene un IQ una desviación estándar abajo de la media (es decir, 100 - 15 = 85), la
z de su puntuación será igual a-L En otras palabras, 15.87% de la población tiene un IQ
una o más desviaciones estándar abajo de la media de la población.
Con esas dos piezas de información podemos ver que 15.87% + 15.87% = 31.74%
de la población tiene un IQ que es una desviación estándar, o más, arriba o abajo de la me-
dia de la población. Por tanto, el resto de la población, aproximadamente 68%, tiene un IQ
situado en la desviación estándar de la media. Es decir, alrededor de 68% de la población
tendrá un IQ en el rango de 85 a 115. Por tanto, si suponemos que una estadística determina-
da está distribuida de modo normal, sabemos que 68% de la población caerá en una des-
viación estándar de la media para esa población.

Prueba de la significación de una sola puntuación cuando


se conocen la media y la desviación estándar de la población
Otra ,fom1a de considerar la prueba z consiste en tratar la distribución z como s i nos indi-
cara la probabilidad de que cietta puntuación, o una más extrema, ocurriera en una población
detem1inada. En el ejemplo anterior, podemos decir por tanto que hay una probabilidad de
0.0918 de que alguien elegido al azar de la población alcance una puntuación de IQ de 120
o superior. De esta manera, podemos probar la hipótesis de si es probable que una puntua-
ción determinada provenga de cierta población de puntuaciones.
Por ejemplo, si un psicólogo educacional prueba el IQ de una persona, puede realizar-
le una prueba z en el IQ para ver si es significativamente distinta de lo que se esperaría si
el sujeto proviniera de la población dada.
Digamos, otra vez, que la media de la prueba de IQ es 100 y su desviación estándar 15.
1]4lL_______________In_ve_s_ti~ga_c_ió_n_c_u_an_t_it_at_iv_a_e_n~p_s_ic_ol_o~gí_a___________________
Dicho psicólogo podría probar la hipótesis
HA: El cliente tiene un IQ demasiado bajo para provenir de la población dada.
Para la cual la hipótesis nula sería:
H 0 : El cliente tiene un IQ que proviene de la población dada.
El psicólogo educacional prueba el IQ y es 70. Para evaluar la hipótesis alternativa, aplica
una prueba z a los datos

70-100
z=
15
-2
En otras palabras, el IQ del cliente se encuentra dos desviaciones estándar abajo de la me-
dia de la población.

Búsqueda de la significación estadística de una puntuación z


Los programas de computadora suelen reportar la significación estadística de una puntua-
ción z que han calculado. Sin embargo, a veces es preciso consultar tablas estadísticas para
buscar su significación.
Para encontrar la probabilidad de que la persona provenga de la población con una me-
dia de IQ de 100 y una desviación estándar de 15, releeremos las tablas z. Tomaremos el
s igno negativo como una señal de que la puntuación se encuentra por debajo de la media de
la población, mas para los propósitos de lectura de las tablas z obviaremos el signo por-
que la distribución es simétrica.
El cuerpo de la tabla 12.1 (y el de la AXIV.l) da las probabilidades de una cola para z.
En otras palabras, prueba una hipótesis direccional. Como el psicólogo evalúa si el IQ de
la persona es inferior al de la media de la población, tiene una hipótesis direccional.
De buscar en la tabla 12.1, veremos que con z = 2, p = 0.0228. Ésta es la probabilidad
de que una persona con un IQ igual (o menor) que 70 provenga de la población donde se
estandarizó la prueba de IQ. Como 0.0228 es menor que 0.05, el psicólogo educacional
puede decir que el IQ del individuo es significativamente inferior al de la media de la pobla-
ción y puede rechazar la hipótesis nula de que la persona proviene de la población dada.

Prueba de una hipótesis no direccional


Si el psicólogo de la educación no tiene una hipótesis direccional, realizará una prueba de
dos colas. Para buscar una probabilidad de dos colas, encuentra la de una (en este caso,
0.0228) y la multiplica por dos (0.0228 x 2 = 0.0456). Podemos hacer esto porque nece-
sitamos buscar en ambas colas de la distribución un valor de z positivo y uno negativo.
_____________A_n_á_li_si_s_d_e_d~if~e~~~n~ci~a~s~en~t~re~un~a~so~la~m~u~es_t_ra~y~un~a~po~b~la~c~io~·n______~f175

Además, como la distribución es simétrica. la =negativa tendrá la misma probabilidad que


la z positiva.

Examen de la diferencia entre la media


de una muestra y la de una población
Para la explicación siguiente, imagine que los investigadores creen que los niños criados
en cierta institución de asistencia han sido privados de estimulación intelectual y que ello
habrá influido en el decremento de su IQ. Desean probar sus hipótesis
HA: Los niños criados en la institución tienen IQ inferiores a la población general.
La hipótesis nula será ésta:
H0 : Los niños criados en la institución tienen IQ normales.
En tales condiciones, podemos emplear una nueva versión de la prueba z; una que sirva
para probar una media de una muestra. Sin embargo, para aplicar una prueba z a cierta es-
tadística, necesitamos conocer la distribución de esta última. Por ende, hemos de conocer en
este caso la distribución de medias.

Distribución de medias
En lugar de tomar todas las puntuaciones individuales de una población y buscar su distri-
bución, necesitamos tomar una muestra aleatoria de un tamaño determinado de la pobla-
ción y calcular la media de la muestra, y luego repetir el ejercicio con otra muestra de igual
tamaño de la misma población. De realizar esto con la frecuencia suficiente, produciremos
una distribución de medias, la cual tendría su propia media y desviación estándar.
Los expertos en estadística han calculado cómo se distribuyen las medias. Han encon-
trado que la media de esta distribución es la misma que la de la población. Sin embargo, la
desviación estándar de las medias depende del tamaño de la muestra, de manera que la pobla-
ción de tales medias tiene una desviación estándar de ':- ; es decir, la desviación estándar
vn
de las puntuaciones originales dividida entre la raíz cuadrada del tamaño de la muestra. A
veces, la desviación estándar de las medias se denomina error estándar de las medias.
Por tanto, si conocemos la media y la desviación estándar de la población original de
puntuaciones, con una prueba z podemos calcular la significación de la diferencia entre la
media de una muestra y la de la población mediante la ecuación siguiente:

media de la muestra - media de la población


z =
desviación estándar de la población)
( ~tamaño de la muestra
1]6lL______________~I_nv_e~s~ti~ga~c_ió_n_c_u_a_nt_it~a~ti_va~e~n~p~si~co~l~og~í~a____________________
De esa manera, podemos calcular la probabilidad de que una media de cierta muestra pro-
venga de una población específica.
Supongamos que se aplica una prueba a 20 niños de la institución de asistencia y que
la media de IQ es de 90, con una prueba de media de 100 y desviación estándar de 15. Po-
demos calcular una puntuación z con la ecuación apropiada y esto muestra que z = - 2.98.
La consulta de las tablas de probabilidad de puntuaciones z en el apéndice XIV indica que la
probabilidad de una cola de esta puntuaciónz es 0.0014. Como esto se encuentra debajo de
0.05, podemos rechazar la hipótesis nula y concluir que los niños criados en instituciones
de asistencia tienen un IQ significativamente inferior al del resto de la población.
Una prueba z puede aplicarse cuando conocemos los parámetros necesarios de la pobla-
ción porque, si no se conocen todos, se requerirán otras pruebas. Una de éstas es la prueba t.

Pruebas t de un grupo
Evaluación de la media de una sola muestra
cuando se conoce la media de la población,
pero no la desviación estándar de la población
Cuando conocemos, o suponemos que conocemos la media de una población, pero no su
desviación estándar, lo mejor es usar una aproximación de tal desviación a partir de la co-
rrespondiente a la muestra. Los expertos en estadística han descubierto que no es posible
producir ese tipo de afirmación suficientemente parecida a la desviación estándar de la po-
blación para que revista utilidad en una prueba z. En su lugar, idearon otro tipo de distri-
bución, utilizable para probar la significación de la diferencia entre la media de la muestra
y la media de la población: la distribución t.

Pruebas t para probar la significación de la media de una muestra


La ecuación para calcular esa versión de t es similar a la indicada para z cuando compara-
mos la media de una muestra con la de una población. En tal caso se utiliza la desviación
estándar de la muestra, en lugar de la correspondiente a la población:

media de la muestra- media de la población


t =
desviación estándar de la muestra)
( ~tamaño de la muestra

La distribución t también es similar a la distribución z. Tiene forma de campana y la me-


dia se ubica en cero. Sin embargo, se agrega la complicación de que tal distribución es par-
cialmente dependiente del tamaño de la muestra o, más bien, de los grados de libertad (gl),
los cuales se explican en la sección próxima.
Análisis de diferencias entre una sola muestra y una población
------------------------------------------~~~~----------~
r177
Para la versión actual de la prueba t los gl son el tamaño de la muestra menos uno. En la
figura 12.4 se aprecia la distribución de t cuando gl es 1 y cuando es 50.

gl = 1
gl =50

Figura 12.4. Distribuciones t con 1 y 50 grados de libertad (gl).

A medida que los grados de libertad aumentan, la distribución empieza a parecerse más a
una distribución normal. Como la forma de la distribución depende de los gl, en lugar de
que sea posible producir una sola para t, hay una diferente de t para cada muestra cuyo ta-
maño se conoce.
Las pruebas t pueden aplicarse para probar la significación de varias estadísticas, no
sólo medias individuales. A diferencia de las tablas z, las probabilidades que se muestran en
tablas t dependen del tamaño de la muestra y de la versión de la prueba t que se usa. Los ex-
pertos en estadística han descubierto que la distribución t depende de otro factor, aparte del
mero tamaño de la muestra: los grados de libertad relacionados con la versión particular de t.
En vez de crear otro conjunto de tablas de probabilidad para cada versión de la prueba t, la
misma tabla sirve si conocemos los grados de libertad relacionados con la versión particu-
lar de la prueba t que se emplea.
Grados de libertad. Los grados de libertad de muchas pruebas estadísticas dependen, en
parte, del tamaño de la muestra y, en parte, del número de entidades fijas en la ecuación de
la prueba a fin de estimar los parámetros. En el caso de una prueba t, con base en una sola
media, nada más una entidad es fija (la media) porque se utiliza para estimar la desviación
estándar de la población.
'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
~L________________In_v_e_st_ig~a_c_io_

Para demostrar el significado de los grados de libertad, imagine que hemos aplicado a
cinco personas un examen de matemáticas. De 1O aciertos posibles, sus puntuaciones fue-
ron las siguientes:
Puntuación
Participante en matemáticas
1 7
2 8
3 6
4 5
5 9
La media de las puntuaciones es 7. Puedo modificar un número y, si cambio uno o más del
resto de los números para compensar, todavía tendré una media de 7. En realidad, tengo la
libertad de modificar cuatro de los números al valor que desee, pero ello significará que el
valor del quinto número será fijo. Por ejemplo, si sumo uno a cada uno de los primeros cua-
tro números, el último tendrá que ser 5 para que la media siga siendo 7. De ahí se deduce
que tengo cuatro grados de libertad. Por tanto, para obtener los gl de la ecuación, restaré
uno al tamaño de la muestra.
El método para calcular los gl de cada versión de la prueba t se dará a medida que se
presente cada versión. Sin embargo, la mayoría de los programas de computadora reporta-
rá los gl para la prueba t.
(Por cierto, a medida que la muestra se amplía, su desviación estándar produce una me-
jor aproximación de la desviación estándar de la población. Por tanto, cuando los gl para
la prueba t se encuentran arriba de 200, la probabilidad para un valor t determinado es casi
igual que para el mismo valor z.)
Como ejemplo del uso de esta versión de la prueba t, conocida como de un grupo, si-
gamos usando las puntuaciones del examen de matemáticas. Digamos que los investigado-
res idearon un método de capacitación para mejorar el desempeño en matemáticas. Como
hay pocos posibles participantes, cuentan sólo con un grupo de 1O personas en su estudio.
A las 1O se proporciona la capacitación y luego se les aplica un examen de matemáticas a
cuyo respecto se nos ha dicho, en el manual, que tiene una media de 6 en la población, pe-
ro que, por un mal reporte, se desconoce la desviación estándar de ésta.
La hipótesis de la investigación era direccional:
HA: La puntuación en matemáticas de los participantes que recibieron capacitación
será mejor que la de la población general.
La hipótesis nula era ésta:

H 0: La puntuación en matemáticas de los participantes que recibieron capacitación


no será mejor que la de la población.
..
A_na_·h_.sl_·s_d_e_d_if_er_e_nc_i_as_e_n_tr_e_u_n_
_____________ a_s_
ol_
a_m_u_e_
st_
ra_y~un_a~p~o_b_la_c_ió_n______~l179

La media de la muestra fue de 7 y la desviación estándar de 1.247. La media resulta con-


11!- sistente con la hipótesis, pues el desempeño es mejor que el de la población, pero quere-
mos saber su significación. Por tanto, se introdujeron los resultados en la ecuación para una
prueba t de un grupo, con este resultado:
7-6
( 1.2471
~To)
2.536

donde el 9 entre paréntesis indica los grados de libertad.

Búsqueda de la significación de t. Para encontrar la probabilidad de alcanzar por azar ese


tamaño del valor de t necesitamos consultar las tablas t. Una versión completa se ofrece en
el apéndice XIV. En seguida se presenta un extracto de la tabla:

Tabla 12.2. Extracto de la tabla t (del apéndice XIV).


Valores críticos para la prueba t
Probabilidades de una cola

0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005

Probabilidades de dos colas

gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001

8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781

10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587

Observe que las tablas t tienen un diseño distinto del correspondiente a las tablas z. Aqui,
los niveles de probabilidad se dan en la parte superior, los gl en la primera columna y los
valores de t en el cuerpo de la tabla misma. Observe también que se proporcionan las pro-
babilidades de una y de dos colas.
Para leer la tabla, encuentre los gl (en este caso, 9). Recorra la fila hasta que llegue al
valor de t inmediatamente inferior al de los resultados de su búsqueda (t = 2.536). Observe
que 2.262 es menor que 2.536, mientras que 2.821 es mayor. Por tanto, siga basta la parte
superior de la columna que contiene 2.262. Como la hipótesis de la investigación es 'direc-
cional, queremos una probabilidad de una cola. Se nos ha dicho que el valor de t ha sido
18QlL--------------~I~nv~e=s~ti~ga~c~io~·n~c=u=a~nt~it=a~ti~v~a~e~n~p~si~co~l~og~í~a____________________

2.262; entonces, la probabilidad sería 0.025. Nuestro valor de tes mayor aún y así sabemos
que la probabilidad es menor de 0.025. Esto puede escribirse p < 0.025, donde el símbolo
<significa menor que. Como 0.025 es menor que el valor crítico de 0.05, los investigado-
res pueden rechazar la hipótesis nula y aceptar la suya de que el grupo que recibió la capaci-
tación en matemáticas tiene mejor desempeño que la población en general.

Reporte de los resultados de una prueba t. La columna para el nivel p = 0.01 de una co-
la en la tabla 12.2 muestra que el valor de t tendría que ser 2.821 para resultar significati-
vo. Como el valor de t obtenido en la investigación fue mayor que 2.262 pero menor que
2.821, sabemos que el nivel de probabilidad cae entre 0.025 y 0.01. Ello puede represen-
tarse como sigue:
0.01 <p < 0.025
Hay muchas sugerencias con relación a la manera de notificar los niveles de probabilidad.
Si un programa de computadora le ha dado el nivel exacto, repórtelo (en este caso, p =
0.016). No obstante, si debe obtener el nivel de tablas t, recomiendo el formato que muestra
el rango donde cae el nivel de p, pues constituye la manera más informativa de presentar
los datos. Si escribe sólo p < 0.025, el lector no sabe si pes inferior o superior a 0.001.
Para reportar los resultados de la prueba t utilice el formato siguiente:
t( 9) = 2.536; 0.01 < p < 0.025, prueba de una cola

Trabajo con resultados inesperados


A veces, los investigadores plantean una hipótesis direccional pero el resultado va en la di-
rección opuesta a la predicha. El resultado se encuentra fuera de la región de rechazo ori-
ginal (en la que puede rechazarse la hipótesis nula), pues figura en la cola incorrecta de
la distribución. Sin embargo, en lugar de sólo rechazar la hipótesis de investigación es po-
sible preguntar si el resultado habría sido estadísticamente significativo si la hipótesis
no hubiera sido direccional. Abelson (1 995) sugiere que, si esto sucede, debe ver si el resul-
tado posee significación estadística en la otra cola de la distribución, pero debe establecer
el nuevo nivel de a en 0.005 para una prueba de una cola. Así, el nivel de a general para
ambas evaluaciones es el equivalente de una probabilidad de dos colas de 0.05 + 0.005 =
0.055, que apenas si se encuentra sobre el nivel de a convencional. Llama a esto prueba de
desequilibrio, pues las regiones de las dos colas de la distribución no son iguales, ya que
se encuentran en una prueba de dos colas convencional. Como se trata de un procedimien-
to inusual, recomiendo que, si lo usa, explique por completo lo que ha hecho.
¡¡a

_____________A d_i~_r_e_nc_i_as_e_n_t_re__
_n_á_li_sis_ _d e__ un_a_s_o_la_m
__ue_s_tr_a~y~un_a~p~o_b_la_c_ió_n______~j181

Intervalos de confianza para medias


Los intervalos de confianza (IC) se explicaron en el capítulo lO, donde el ejemplo usado se
relacionaba con proporciones. Recuerde que un ICes un rango de valores posibles en el
cual es probable que caiga un parámetro de población y que se estima a partir de la esta-
dística encontrada en una muestra. Ahora tiene la información necesaria para permitir que
se describan los intervalos de confianza de una medía. Hay dos formas de calcular el IC de
la media de la población. La primera se basa en la prueba z y se utiliza cuando la muestra
es mayor que 30. La segunda, fundada en la prueba t, se usa si la muestra es menor que esa
cifra.
En el apéndice III se dan ejemplos trabajados de ambos métodos de calcular el IC de
una media. La obtención del IC de la media en el examen de matemáticas nos indica dón-
de caería la media si diéramos a la población de niños la mejora en la capacitación de
6.d. la asignatura. El intervalo de confianza de 95% está 0.892 arriba y abajo de la media de la
muestra. La media de la muestra fue 7, de modo que el intervalo de confianza se encuen-
tra entre 7 - 0.892 = 6.108 y 7 + 0.892 = 7.892. Observe que el intervalo no incluye 6, la
media en el examen de matemáticas para la población general. Esto proporciona mayor
prueba para concluir que la capacitación en aras de mejorar en matemáticas produce un de-
sempeño mejor que el que se esperaría de la población en general.

Gráficas adicionales
Ahora podemos introducir tres nuevas versiones de gráficas analizadas originalmente en el
capítulo 9: gráficas de línea con medías y error estándar de la medía, gráficas de línea con
medías e intervalos de confianza y diagramas de caja con muescas.

Gráfi cas de linea con medias y error estándar de la media


Algunos investigadores, entre ellos los que trabajan en psicofisica, prefieren presentar el
error estándar de la media como la medición de dispersión en una gráfica de línea. Una grá-
fica de líneas de medias con desviación estándar como medida de dispersión (según se apre-
cia en la figura 9.21) presenta el rango de puntuaciones que aproximadamente 68% de la
población tendría si la medición estuviera distribuida de manera normal. Como medida de
dispersión, ese tipo de gráfica presenta el rango de puntuaciones que aproximadamente 68%
de las medias tendría si el estudio se repitiera con el mismo tamaño de muestra.
En la figura 12.5 se presenta la media de recuerdo para las tres estrategias nemotécni-
cas tratadas en el capítulo 9, pero con el error estándar de la media como medida de dis-
persión.
~L________________In_v_e_st~ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p_s_ic_o_lo~g~ía______________________

Control Palabras gancho Método de ubicación


Estrategia nemotécnica

Figura 12.5. Media de recuerdo y el error estándar de la media de las tres estrategias
nemotécnicas.

Gráficas de línea con medias e intervalos de confianza


Otra medición que puede presentarse en una gráfica de línea es el intervalo de confianza,
el cual permite la comparación entre grupos para ver si los intervalos de confianza se su-
perponen. Si lo hacen, como en la figura 12.6, esto sugerirá que aun cuando los resultados
de la muestra presenten una diferencia significativa entre las medias, tal vez las medias de
las tres poblaciones no difieran en realidad.

"'
"'
~ 11
~
8 10
~
"'
~ 9
"'a.
-¡¡¡
8
Q)
-o
e
Q)
1
E
~ 6

Control Palabras gancho Método de ubicación


Estrategia nemotécnica

Figura 12.6. Media de palabras recordadas e intervalo de confianza de 95% para las tres
estrategias nemotécnicas.
Análisis de diferencias entre una sola muestra y una población
------------------------------------------~~~~----------~
f18J
Diagramas de caja con muescas
En seguida se reproduce la versión anotada del diagrama de caja original de los datos re-
cuerdo de palabras para 15 participantes (de la tabla 9.1) que se presentó en el capítulo 9:

12
11 o Posible extremo
"'
VI

"O 10 90o. percentil - r- Barda superior interna


"'....
"O
o
u 9 -Bigotes
~
VI 8 Bisagra superior
"'
B 7 RangoH [ Mediana
"'a.
-¡;¡
6
(50%
QJ central)
"O
o
.... 5 Bisagra inferior
QJ
E 4 1Do. percentil
_j_ Barda inferior interna
•::S
z
3 o Posible extremo
2

Figura 12. 7. Un diagrama de caja de palabras recordadas, con elementos etiquetados.

Se aprecia en seguida la versión con muescas del diagrama de caja para los mismos datos.
Esta variante del diagrama de caja permite que se presente en la muesca el intervalo de con-
fianza de la mediana. La manera de calcular este intervalo de confianza se muestra en el
apéndice III.

12
11 o
VI

"'
"O 10
"'....o
"O
9

J
u
....
QJ
8
Intervalo
VI

"'
....
.D 7
de confianza
"'
-¡;¡ para la mediana
a. 6
QJ
"O 5
o
....
QJ
E 4
•::S
z 3 o
2

::S Figura 12.8. Diagrama de caja con muescas del número de palabras recordadas.
1B4l~_______________ln_v_es~ti~g_ac_io_·n_c_u_a_nt_it_a_
ti_
va_e_n_p~s_ic_o_lo~g~ía____________________

Identificación de extremos con puntuaciones estandarizadas


Además de utilizar diagramas de caja para identificar extremos es posible estandarizar un
conjunto de números si se usa una variante de la puntuación z y ver si estos números son
muy extremos. Para estandarizar las puntuaciones se emplea la ecuación siguiente:

puntuación - media de la muestra


puntuación estandarizada = d . .ó . d d
esvtact n estan ar e 1a muestra
En el capítulo 9 se presentó un ejemplo de las puntuaciones de recuerdo a las que se agre-
gó una 16a. persona al grupo original de 15. Ésta tenía una puntuación de 25, mucho más
alta que la del resto. La media para la muestra agrandada es 7.8125 y la desviación están-
dar de la muestra 5.088. En seguida se aprecian las puntuaciones de recuerdo original y es-
tandarizada:

Tabla 12.3. Puntuaciones original y estandarizada para el recuerdo de palabras de 16


participantes.

Puntuación Puntuación
original estandarizada
3 -0.946
4 -0.749
4 - 0.749
5 - 0.553
S - 0.553
6 - 0.356
6 - 0.356
7 - 0.160
7 -0.160
7 - 0.160
8 0.037
8 0.037
9 0.233
10 0.430
11 0.626
25 3.378
______________A_n_á l_is_is_d_e__d_
if_
er_e_n_cl_
·~__e_nt_r_e_u_n_a_s_ol_a_m
__ue_s_tr_a~y~un_a~po_b_l_
ac_i_
ón________~~

Una puntuación estandarizada mayor que 3 o menor que -3 debe investigarse más como
posible extremo. Considere que la puntuación de 25 produjo una puntuación estandarizada
de 3.378.

Resumen
Cuando los investigadores conocen la media y las desviaciones estándar de la población en
una estadística de resumen pueden comparar el valor de una estadística obtenida de una per-
sona o de una muestra de individuos con la media de la población de esa estadística, utilizan-
do una prueba z. Así, pueden ver si los valores obtenidos son comunes entre la población
y, por tanto, identificar la probabilidad de que el sujeto o el grupo provengan de la pobla-
ción determinada. Cuando se conoce sólo la media de la población de la estadística tiene
que emplearse una prueba t en lugar de una z.
El capítulo se ha centrado sobre todo en la significación estadística como manera de
decidir entre una hipótesis de investigación y una nula. En otras palabras, se consideró sólo
la probabilidad de cometer un error tipo I. En el capítulo siguiente se explicará cómo los
investigadores pueden tratar de evitar un error tipo II y se presentarán estadísticas de resu-
men adicionales que les ayudarán a decidir.
13
Tamaño del efecto y poder

Introducción
Los psicólogos y otros científicos relacionados con el estudio del comportamiento han ten-
dido a centrarse en determinar si un resultado es estadísticamente significativo y a excluir
cualquier otra consideración estadística (Cohen, 1962; Sedlmeier y Gigerenzer, 1989;
Clark-Carter, 1997). En el presente capítulo se tratan las consecuencias de tal enfoque y se
describen técnicas adicionales que permiten a los investigadores tomar decisiones más in-
formadas.

Limitaciones de la prueba de significación estadística


Por concentrarse en la significación estadística se descuida un aspecto importante de las es-
tadísticas inferenciales: el tamaño de la muestra afecta la significación estadística. Ello tiene
dos consecuencias. Primero, la probabilidad estadística no puede utilizarse como medición
de la magnitud de un resultado; dos estudios pueden producir resultados muy diferentes
en términos de significación estadística simplemente porque usaron tamaños de muestra
distintos. Por tanto, si se emplea.sólo significación estadística, no pueden compararse los
resultados. En segundo lugar, dos estudios conducidos de la misma manera en todos los aspec-
tos, excepto el tamaño de la muestra, pueden llevar a conclusiones diferentes. El que tie-
ne la mayor muestra puede alcanzar un resultado estadísticamente significativo, mientras que
el otro no. Por lo expuesto, Jos investigadores del primer estudio rechazarán la hipótesis

186
___________________________Ta_m_a_ñ_o_d_e_l_e_fe_c_
to_y~po_d_e_r________________~j187

nula de que no hay efecto, en tanto que los del estudio más pequeño se verán forzados a re-
chazar su hipótesis de investigación. De acuerdo con esto, cuanto más pequeño sea el ta-
maño de la muestra, tanto más probable resultará que cometamos un error tipo II (recha-
zando la hipótesis de investigación cuando en realidad es correcta).
Dos nuevos conceptos proporcionarán soluciones de ambos problemas. El tamaño del
efecto ofrece una medida de magnitud de un resultado independiente del tamaño de la mues-
tra. El cálculo del poder de la prueba estadística ayuda a decidir sobre la probabilidad de
que se evite un error tipo II.

Tamaño del efecto


Para que sea posible comparar los resultados de los estudios necesitamos una estadística in-
dependiente del tamaño de la muestra. Las mediciones del tamaño del efecto proporcionan
esa estadística. En capítulos ulteriores se presentarán las mediciones del tamaño del efecto
apropiado para cada diseño de investigación. En este capítulo trataré los diseños descritos
en el anterior, donde la media de un conjunto de puntuaciones se compara con la corres-
pondiente a una población. Hay varias versiones para algunas medidas del tamaño del efec-
to. En general, usaré las medidas sugeridas por Cohen (1988).
En el caso de la diferencia entre dos medias podemos usar la d de Cohen como la me-
dición del tamaño del efecto:
d = ¡.t2 - ¡.ti
a

donde f.!¡ es la media de una población


1-'-2 es la media de la otra población
o es la desviación estándar de la población (que se explicará más adelante)
Para que esto resulte menos abstracto, recuerde el ejemplo usado en el capítulo previo, don-
de el IQ de los niños criados en una institución de asistencia se comparaba con el de otros
que no lo fueron. Entonces, f.A-1 es la media de IQ de la población de niños no criados en ins-
tituciones de asistencia, ¡.¡.2 la media de la población de niños criados ahí y o la desviación
estándar de las puntuaciones de IQ, que se supone son las mismas para ambos grupos. Tal
suposición se explicará en el capítulo siguiente, pero no ha de preocupamos. Por lo gene-
ral, no conocemos los valores de todos lo_s parámetros necesarios para calcular el tamaño
de un efecto y, por tanto, utilizamos las estadísticas equivalentes de una muestra.
De acuerdo con lo referido, d es una medida de cuántas desviaciones estándar separan
a las dos medias. Tenga en cuenta que, si bien es similar a la ecuación para calcular z dada
en el capítulo previo, d cumple nuestros requisitos para una medición independiente delta-
maño de la muestra.
18ilL_______________I_nv_e_st_i~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p-si_co_l_og~í-a____________________
En el capítulo anterior se dijo que, como es común, la media del IQ de la población
"normal" era 100; la desviación estándar de la prueba en particular, 15; la media del IQ de
los niños criados en una institución, 90. Por tanto:
90-100
d=--
15
= -0.67
Después de revisar la investigación publicada, Cohen ha definido, para cada medida del ta-
maño del efecto, lo que constituye un efecto pequeño, uno mediano y uno grande. En el caso
de d, una de 0.2 representa un tamaño del efecto pequeño, una de 0.5 uno mediano y una de
0.8 uno grande (cuando evalúe la magnitud de un tamaño del efecto, obvie el signo negati-
vo). Por consiguiente, en este estudio podemos decir que ser criado en una institución de
asistencia tiene un efecto entre medio y grande en el IQ de los niños.
Un uso adicional del tamaño de efecto estriba en la combinación de los resultados de
varios estudios relacionados para ver si producen un efecto consistente. Esta técnica, deno-
minada metaanálisis, se detallará en el capítulo 22.

Importancia del tamaño de un efecto


Como Rosnow y Rosenthal (1989) han señalado, la importancia del tamaño de un efecto
depende de la naturaleza de la investigación que se realiza. Si un estudio referente a la efi-
cacia de un medicamento para salvar vidas sólo encuentra un tamaño de efecto pequeño, se
trataría de uno importante, aunque se salve nada más la vida de una pequeña proporción de
los participantes. Sin embargo, si el estudio fue sobre algo trivial, digamos una técnica para
mejorar el desempeño en un juego de computadora, entonces tal vez no se considere im-
portante un efecto grande.

Poder estadístico
El poder estadístico se defme como la probabilidad de evitar un error tipo II. La probabi-
lidad de cometerlo suele simbolizarse con B(la letra griega beta). Por tanto, el poder de una
prueba es 1 - B.
En la figura 13. 1 se representa la comparación de dos medias; por ejemplo, la media
del JQ de la población en que se ha estandarizado una prueba (1..1. 1) y la de la población de
gente a quien se dio una capacitación especial para mejorar su IQ (~). Establecida formal-
mente, H0 es ~ = !..1. 1, mientras que la hipótesis de investigación (HA) es !..1.2 > !..1. 1. Como es
usual, se establece un nivel de a (digamos, a= 0.05). Ello determina la media crítica (la
media de IQ) para un tamaño demuestra determinado, que sería suficientemente grande pa-
ra permitimos rechazar H 0. Determina ~' que será el área (en la distribución que está cen-
trada en !..1.2 ) situada a la izquierda de la media critica. También determina el poder (1 - ~),
que es el área (en la distribución centrada en J.l?.) que cae a la derecha de la media critica.
......

___________________________
Ta_m_a_ñ_o_d_e_l_ef_ect
__o~y~~--e_r________________~f189

Media crítica

Figura 13.1. Representación gráfica de los vínculos entre el poder estadístico, ~ y a.

El poder que requerimos para cierta investigación depende de los objetivos de ésta. En
consecuencia, si resulta particularmente importante evitar un error tipo II, nos orientaremos
a un nivel de poder lo más cercano posible a l. Por ejemplo, si fuéramos a probar la efica-
cia de un medicamento que puede salvar vidas, no querremos rechazar de manera errónea
la hipótesis de investigación de que el medicamento posee eficacia. Sin embargo, como se
verá, para lograr tal nivel de poder tal vez sea preciso un tamaño de muestra impráctica-
mente grande. Por tanto, Cohen y otros expresan, como regla básica, que un nivel razonable
de poder, en condiciones normales, es 0.8. En otras palabras, la probabilidad de cometer un
error tipo II (~) es 1 - poder = 0.2. Con un nivel de a establecido en 0.05, esto nos dará
una razón de probabilidades de cometer un error tipo I y tipo Il de 1:4. Empero, como in-
dicamos en el capítulo 10, puede establecerse un nivel de a diferente.
El poder estadístico depende de muchos factores, incluidos el tipo de prueba que se
emplea, el tamaño del efecto, el diseño (si es entre sujetos o intrasujetos), el nivel de a es-
tablecido, si la prueba es de una o dos colas y, en el caso de diseños entre sujetos, el tamaño
relativo de las muestras.
El análisis de poder puede utilizarse de dos maneras: prospectivamente durante la etapa
de diseño, para decidir el tamaño de la muestra requerido a fin de lograr cierto nivel de po-
der; y de forma retrospectiva, una vez que los datos se han recolectado, para evaluar cuál
es el poder de la prueba. El enfoque más útil se halla en el análisis de poder prospectivo. Tras
19QlL_______________I_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tT_·v_a_e_n~p_si_co_l_og~í_a____________________
decidir el diseño, el nivel de a y la cola de la prueba, los investigadores pueden calcular el
tamaño de la muestra que requieren. Sin embargo, aún encaran el problema de llegar a una
indicación del tamaño del efecto antes de que puedan realizar los cálculos del poder. Em-
pero, como falta realizar el estudio, éste es desconocido.

Elección del tamaño del efecto antes de realizar un estudio


Hay por lo menos tres maneras de elegir el tamaño del efecto antes de llevar a cabo un tra-
bajo. Primero, se puede buscar investigación previa en el área para darse una idea de los
tamaños del efecto encontrados. En ello ayudaría que los investigadores informaran de mo-
do rutinario los tamaños del efecto detectados. No obstante, si se han reportado las esta-
dísticas descriptivas apropiadas (como medias y desviaciones estándar), puede calcularse
un tamaño del efecto. En segundo lugar, en ausencia de tal información, puede calcularse un
tamaño del efecto a partir de los resultados de los estudios piloto respectivos. Una manera
más de sortear el problema consiste en decidir de antemano cuál tamaño de efecto desea
detectarse. Aquí resulta útil la clasificación de Cohen de los efectos en pequeño, mediano
y grande. Los psicólogos pueden decidir que desean detectar un efecto, aun pequeño, por-
que resulta estadísticamente significativo si reviste importancia particular que no cometan
un error tipo II. Como alternativa, pueden buscar el poder apropiado para detectar un efecto
mediano o incluso grande si su investigación requiere eso.
Recomendaría el último método sólo si no hay indicaciones de cuál tamaño del efecto
es probable que alcance su investigación. No obstante, este enfoque le permite por lo me-
nos realizar cálculos de poder en ausencia de otra información sobre el probable tamaño
del efecto.
Para ayudar con el enfoque al lector, en los apéndices proporciono tablas de poder pa-
ra cada una de las pruebas estadísticas. Cuando presente éstas, explicaré el uso de la tabla
apropiada.

El poder de una prueba z de un grupo


El análisis de poder para la prueba z de un grupo tal vez sea el más simple. Para el lector
interesado, en el apéndice IV describo cómo calcular el poder e~acto de la prueba y, tam-
bién, el tamaño de muestra necesario para un nivel dado de poder. Aquí describiré cómo
utilizar las tablas de poder con objeto de decidir el tamaño de la muestra.
En la tabla 13.1 se muestra parte de la tabla de poder para una prueba z de un grupo,
tomada del apéndice XV
Ta_m_a_ñ_o_d_e_l,_ef_e_c_to_y~po_d_e_r________________~¡191
___________________________

Tabla 13. 1. Extracto de las tablas de poder para una prueba z de un grupo,
probabilidad de una cola, a= 0.05 ( *denota que el poder está
sobre 0.995).

Tamaño del efecto (d)

n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4

15 0.10 0.19 0.31 0.46 0.61 0.75 0.86 0.93 0.97 0.99

16 0.11 0.20 0.33 0.48 0.64 0.77 0.88 0.94 0.97 0.99

17 0.11 0.21 0.34 0.50 0.66 0.80 0.89 0.95 0.98 0.99

18 0.11 0.21 0.35 0.52 0.68 0.82 0.91 0.96 0.99

19 0. 1.1 0.22 0.37 0.54 0.70 0.83 o. 92 o. 97 o.99


20 0.12 0.23 0.38 0.56 0.72 0.85 0.93 0.97 0.99

25 0.13 0.26 0.44 0.64 0.80 o. 91 o. 97 o. 99


30 0.14 0.29 0.50 0.71 0.86 0.95 0.99

35 0.15 0.32 0.55 0.76 0.91 0.97 0.99

40 0.16 0.35 0.60 0.81 0.94 0.98

En la fila superior de la tabla se advierten los tamaños del efecto (d) y en la primera colum-
na, el tamaño de la muestra. Las cifras del cuerpo de la tabla son el poder estadístico que
se alcanzará con cierto tamaño de efecto si se usa un tamaño de muestra específico.
En la tabla se muestra que para una prueba z de un grupo con un tamaño de efecto me-
dio (d = 0.5), una prueba de una cola y un nivel de a de 0.05 se requieren 25 participantes
a fin de lograr un poder de 0.80.
En los ejemplos siguientes se aprecia el efecto que la modificación de cada una de ta-
les variables tiene sobre el poder. Si bien los ejemplos son para la prueba z de un grupo, el
poder de todas las pruebas estadísticas se afectará de manera similar por los cambios del
tamaño de la muestra, el tamaño del efecto, la naturaleza de la hipótesis de investigación y
el nivel de a,
192lL_______________In_v_es_tl~·g_ac_io_·n_c_u_a_nt_it_a_ti_va_e_n~ps_ic_o_lo~g_ía____________________
Tamaño de muestra y poder
Un tamaño de muestra aumentado produce mayor poder. Si todo lo demás se mantiene
constante, pero usamos sólo 15 participantes, el poder caerá a 0.61. Como alternativa, su-
birá a 0.94 si empleamos 40 participantes.

Tamaño del efec to y poder


Cuanto mayor sea el tamaño del efecto, tanto mayor será el poder: con un tamaño de 0.8,
el poder aumentará a 0.99 para 25 participantes con un nivel de a de 0.05, de una cola; y
caerá a 0.26 si dicho tamaño se reduce a 0.2.

H;pótes;s de ;nvest;gadón y poder


Una prueba de una cola tiene más poder que una de dos. Una del segundo tipo que utiliza 25
personas tendría un poder de 0.71, mientras que la versión de una cola lo daría de 0.8.

Njvel de a y poder
Cuanto más pequeño sea el nivel de a, tanto menor será el poder. En otras palabras, si
todo lo demás se mantiene constante, la reducción de la probabilidad de cometer un error
tipo 1 aumentará la de incurrir en uno tipo 11. Si se establece a en 0.0 l el poder se reducirá
de 0.8 a 0.57. Por otra parte, si se establece a en 0.1 se aumentará el poder a casi 0.99.
Estos efectos se observan en la figura 13.1; a medida que a se empequeñece (la media crí-
tica se mueve a la derecha), 1 - ~ disminuye; y a medida que a se amplía (la media crítica
se mueve a la izquierda), 1 - ~ crece.

El poder de una prueba t de un grupo


Para evaluar el poder de una prueba t de un grupo o decidir el tamaño de muestra necesa-
rio a fin de lograr un nivel deseado de poder utilice la tabla que se proporciona en el apén-
dice XV, parte de la cual se reproduce en la tabla 13.2.
Las tablas para una prueba d de un grupo pueden leerse igual que las de la prueba z de
un grupo. Como ejemplo, imagine que los investigadores desean detectar un tamaño del
efecto pequeño (d = 0.2) y tener un poder de 0.8. Necesitarían illcluir entre 150 y 160 par-
ticipantes en su estudio. Por tanto, como 0.80 cae a medio camino entre 0.79 y 0.81, diría-
mos que la muestra requeriría incluir 155 participantes (a medio camino entre 150 y 160).
Ta_m_a_ñ_o_d_e_l_e_fe_c_to_y~p_od_e_r________________~j193
___________________________

Tabla 13.2. Extracto de una tabla de poder para pruebas t de un grupo, probabilidad
de una cola, a =·0.05 (*denota que el poder es sobre O. 995).
Tamaño del efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.1 1.2 1.3 1.4
140 0.32 0.76 0.97
150 0.33 0.79 0.98
160 0.35 0.81 0.98
170 0.36 0.83 0.99
180 0.38 0.85 0.99
190 0.39 0.86 0.99
200 0.41 0.88 0.99
300 0.53 0.96
400 0.64 0.99
500 0.72
600 0.79
700 0.84
800 0.88

Análisis de poder retrospectivo


Si un estudio no prueba la hipótesis de investigación hay dos explicaciones posibles. La que
se adopta de manera más común radica en que la hipótesis era de algún modo incorrecta.
Sin embargo, otra explicación consiste en que la prueba tiene poder insuficiente para alcan-
zar significación estadística. Si ésta no se consigue, recomiendo calcular el poder de la
prueba. Ello permitirá a los psicólogos, y a cualquier persona que lea un reporte del trabajo,
ver cuál era la probabilidad de que se cometiera un eiTor tipo II. Luego sugeriría calcular el
tamaño de la muestra necesario, con el tamaño de efecto dado, para lograr un poder de 0.8.
A veces, los investigadores --sobre todo los estudiantes- establecen que de utilizar
más participantes no habrían alcanzado un resultado estadísticamente significativo. No se
trata de una afirmación muy útil, pues casi siempre será verdad si se emplea una muestra
suficientemente grande, sin importar lo pequeño que sea el tamaño del efecto. Por ejemplo,
si se usaba una prueba t de un grupo, con a= 0.05 y un tamaño del efecto d = 0.03, unta-
maño de muestra de aproximadamente 1O 000 daría un poder de 0.8 para una prueba de una
cola. Tal tamaño de efecto se alcanza si la media de la muestra es de sólo tres centésimas
de una desviación estándar de la media de la población; una diferencia de la mitad de un
punto de IQ si la desviación estándar de la muestra es de 15 puntos de IQ.
194lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l_og~í_a____________________
Tiene mucho mayor utilidad especificar el número de participantes que se requeriría
para alcanzar un poder de 0.8, lo cual pondría los resultados en perspectiva. Si el tamaño
del efecto es particularmente pequeño y el de la muestra requerida muy grande, cuestiona-
ría la pertinencia de tratar de replicar el estudio como está, mientras que si el tamaño del
efecto resultaba razonable, valdría la pena la réplica.
Como demostración del análisis de poder retrospectivo, imagine que los investigadores
realizan un estudio con 50 participantes. Analizaron sus datos con una prueba t de un grupo
con una probabilidad de una cola de nivel a de 0.05. La probabilidad de que el resultado hu-
biera ocurrido por azar era mayor de 0.05 y, así, tenían información insuficiente para re-
chazar la hipótesis nula. Cuando calcularon el tamaño del efecto, encontraron que era
d = 0.1 . Luego calcularon el poder de la prueba y hallaron que_era de 0.17. En otras pala-
bras, la probabilidad de cometer un error tipo II era 1 - 0.17 = 0.83. Por tanto, había 83%
de probabilidades de que rechazaran su hipótesis de investigación cuando era verdadera.
Apenas si le daban una oportunidad justa. Al consultar la tabla 13.2 vemos que se necesi-
tarían más de 600 participantes para alcanzar el poder de prueba de 0.8. La necesidad de una
muestra de tal magnitud debería hacer pensar a los investigadores dos veces antes de tratar
de replicar el estudio. Si desearan probar la misma hipótesis, podrían examinar la eficien-
cia de su diseño para ver si podían reducir la variabilidad general de los datos.
Como segundo ejemplo, imagine que los investigadores utilizaron 25 participantes en
un estudio pero, tras el análisis de los datos, encontraron que la prueba t de un grupo, una
cola, no era estadísticamente significativa en el nivel de 0.05. El tamaño del efecto encon-
trado es d = 0.4. Por tanto, la prueba tiene un poder de sólo 0.61. Para alcanzar el deseado,
de 0.8, se usarían 40 participantes. En el ejemplo, el tamaño del efecto se sitúa entre peque-
ño y mediano y como un tamaño de muestra de 40 es razonable, valdría la pena replicar el
estudio con una muestra mayor.

Resumen
El tamaño del efecto es una medida del grado en que se considera que una VI afecta una
VD o del grado en que dos o más variables están relacionadas entre sí. Como es indepen-
diente del tamaño de la muestra, resulta útil para comparar estudios.
Cuanto mayor poder tiene una prueba estadística, tanto mayores probabilidades habrá
de evitar un error tipo II. Un contribuyente importante al poder de una prueba es el tama-
ño de la muestra. Durante la etapa de diseño los investigadores deben realizar algún tipo de
análisis de poder para decidir el tamaño de muestra óptimo. Si no alcanzan significación
estadística, deben calcular el nivel de poder de su prueba e identificar el tamaño de mues-
tra requerido para lograr un nivel razonable de poder estadístico.
En el capítulo siguiente se analizará la diferencia entre dos tipos de prueba estadística:
paramétrica y no paramétrica.
14
Pruebas paramétricas
y no paramétricas

Introducción
Las pruebas estadísticas pueden clasificarse en paramétricas (como las t) y no paramétricas
- a veces conocidas como pruebas de distribución libre- (como las de Kolmogorov-
Smimov, cuyo análisis se presenta más adelante). La diferencia se basa en ciertas suposi-
ciones acerca de los parámetros de población existentes y en el tipo de datos analizables.
La prueba de bondad de ajuste, x2 (llamada chi cuadrada), se presenta para analizar
datos a partir de un grupo cuando el nivel de medición es nominal.

Pruebas paramétrkas
Las pruebas paramétricas tienen dos características, de las cuales puede desprenderse su
nombre. Primero, su cálculo requiere la estimación,·a partir de los datos muestreados, de
los parámetros de la población. Segundo, realizan ciertas suposiciones acerca de la natura-
leza de ciertos parámetros para las mediciones tomadas.

Supuestos de las pruebas paramétricas


Las pruebas paramétricas requieren que la población de puntuaciones, de la cual proviene
la muestra, esté distribuida normalmente. Los criterios adicionales para ciertas pruebas
paramétricas se delinearán a medida que se presente cada una de ellas. En el caso de la
prueba t de un grupo, se presupone que los datos son independientes unos de otros. Ello

--------------------------------------------------------~195
~L----------------I~nv~e~s~ti~ga~c~io~·n~cu_a_n_ti~ta~t~iv~a_e~n~ps_ic_o~lo~g~ía~--------------------

significa que nadie debe contribuir con más de una puntuación. Además, no habrá influen-
cia de una persona hacia otra. En el capítulo 12 se dio un ejemplo en que un grupo recibió
mejor capacitación en matemáticas. Luego se aplicó a los participantes una prueba de esa
materia. Para que las puntuaciones resulten independientes no existirá oportunidad de que
los participantes pasen las respuestas de la prueba.
Un caso común donde resultan improbables los datos independientes se encuentra en la
investigación en psicología social; ahí los proporcionan personas a quienes se prueba en
grupos. Un ejemplo sería que los participantes se concentraran en grupos para analizar sus
opiniones acerca de una pintura; aquí, la variable dependiente sería la puntuación del gusto
de cada persona por la pintura. Sin duda, los individuos de un grupo sufrirían la influencia de
las opiniones de otros del grupo. Una manera de alcanzar la independencia de las puntua-
ciones en la situación referida consistiría en tomar las medias de los grupos como variable
dependiente, en lugar de las calificaciones individuales. Para esto, y a fin de mantener un
nivel razonable de poder estadístico, debería tenerse un número de participantes mayor del
que se requeriría si pudieran utilizarse las puntuaciones individuales.
Un criterio adicional que los psicólogos establecen a menudo para una prueba paramé-
trica radica en que los datos deben ser de intervalo o razón. Como se señala en el capítulo
8, los expertos en estadística se preocupan menos por ese principio. Al sumarse a él, pue-
den imponerse restricciones acerca de cuáles análisis son posibles con los datos. Las direc-
trices siguientes le permiten una sujeción menos estricta a la regla. En el caso de datos
nominales con más de dos niveles no tiene sentido aplicar pruebas paramétricas porque no
hay un orden inherente en los niveles (por ejemplo, si la variable es un partido político; y·
los niveles, conservador, liberal y radical). Sin embargo, si la variable es ordinal pero tie-
ne niveles suficientes (digamos, 20 o más) entonces, si se satisfacen los otros requisitos pa-
ramétricos, se considerará legítimo aplicar pruebas paramétricas sobre los datos. Un ejemplo
común al respecto se presenta cuando se ha obtenido una puntuación a partir de una esca-
la de Likert de varios elementos (consulte el capítulo 6). Si la escala incluye cinco elementos
y cada uno tiene una escala ordinal de 7 puntos, el rango de puntuaciones posibles estará
entre 5 y 35. Zimmennan y Zumbo (1993) señalan que muchas pruebas no paramétricas
producen la misma probabilidad que si se convirtieran los datos originales en rangos (y, por
tanto, en un nivel ordinal de medición) y se realizara la prueba paramétrica equivalente en
los datos ordenados. Así, la restricción de las pruebas paramétricas a datos de intervalo o
de razón ignora la derivación de algunas pruebas no paramétricas.
Si no se satisfacen los criterios para cierta prueba paramétrica es inapropiado utilizar
ésta. Sin embargo, hay otro malentendido entre los investigadores: la creencia de que las
estadísticas no paramétricas están exentas de presuposiciones acerca de la distribución de
los datos. Por tanto. aunque no se satisfagan Jos presupuestos de una prueba paramétrica no
se recomienda el uso de una no paramétrica equivalente. Se han elaborado algunas varia-
ciones de pruebas paramétricas para utilizarlas aunque se hayan contravenido algunas su-
posiciones.
--------------------~Pr~u~e~b=as~p~a=r=a~m=é=tn=·c=a=s~y~n~o~p~a~r~am~é=tr~ic=a=s______________~r-t97
Una desventaja adicional de una prueba no paramétrica consiste en que puede tener
menos poder que su equivalente paramétrica. En otras palabras, tal vez tengamos más proba-
bilidades de cometer un error tipo II cuando usamos una no paramétrica. Sin embargo, esto
suele ser ~erdad sólo cuando los datos cumplen los requisitos de una prueba paramétrica y
aun así utilizamos una no paramétrica. Cuando no se reúnen tales exigencias, la prueba no
paramétrica puede ser la más poderosa.

Robustez
Pese a los criterios establecidos, los expertos en estadística han encontrado que las pruebas
paramétricas resultan muy exactas, aunque se infrinjan algunas de sus suposiciones; son ro-
bustas. Sin embargo, esta noción ha de tratarse con cuidado. Si los datos no cumplen más de
una suposición relacionada con una prueba paramétrica concreta, sería mejor utilizar una pa-
ra métrica que relaje algunas suposiciones o una no paramétrica equivalente, pues tal vez los
niveles de probabilidad dados por las tablas estándar o por la computadora no reflejen las pro-
babilidades reales. Por el advenimiento de las computadoras, ahora los investigadores pueden
evaluar los efectos de las contravenciones de las suposiciones de las estadísticas paramé-
tricas y no paramétricas. Esos estudios han mostrado que, en ciertas condiciones, ambos
tipos de pruebas se afectan en gran medida por tales violaciones, de manera tal que pueden
malinterpretarse las probabilidades que reporten; es probable que, en algunas condiciones,
tengamos muy poco poder y que, en otras, la probabilidad de cometer un error tipo 1 sea
marcadamente mayor de lo que nos indican las tablas o el programa de computadora.
Las reglas básicas sobre la distancia a que nuestros datos pueden alejarse de la condi-
ción ideal antes de que debamos hacer algo para contrarrestar el problema se darán a me-
dida que se presente cada prueba.
Por.fortuna, en psicología a menudo nos interesa una estadística de resumen y no las
puntuaciones originales que proporciona la estadística. Por tanto, solemos interesamos en
la diferencia entre la media de una muestra y la de la población o de otra muestra, en lugar
de la diferencia entre la puntuación de un individuo y la correspondiente a la población.
Hay un fenómeno más bien conveniente (descrito por el teorema de/límite central): si
tomamos una estadística de resumen como la media, tendrá una distribución normal, aun
cuando la población original de puntuaciones de la que proviene carezca de ella. Para com-
prender la distribución de la media, imagine que tomamos una muestra de cierto tamaño
de una población y que obtenemos la media de la muestra. Luego tomamos otra muestra de
igual tamaño de la misma población y obtenemos su media. Realizamos esto hasta que ha-
yamos encontrado las medias de gran cantidad de muestras de la población. La distribución
de frecuenc ia de las medias que produzcamos será normal. Sin embargo, adviértase que el
tamaño de la muestra debe ser suficientemente grande. La mayoría de los autores parece de
acuerdo en que basta una muestra de 40 o más elementos, aunque la distribución original
de puntuaciones individuales esté muy sesgada.
198l~ _______________l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
A menudo desconocemos la distribución de las puntuaciones de la población. He dicho
que esta última debe estar distribuida normalmente. Tal vez sólo tengamos los datos de
nuestra muestra. No obstante, podemos obtener una impresión de la distribución de la po-
blación a partir de dicha muestra. Por ejemplo, en la muestra incluí el IQ de 20 personas de
una población con distribución normal; el resultado de la distribución se aprecia en seguida:

"'"'e 7
o 6
"''- 5
a.
V

4
"o
V

'-
3
V
E 2
• ::J
z
o
20 40 60 80 100 120 140 160 180
IQ

Figura 14. 1. Distribución del IQ de 20 personas seleccionadas de una población


distribuida normalmente.

Al crear una distribución de frecuencia de los datos de la muestra podemos ver si está sesga-
da marcadamente. Si no lo está, podemos seguir con una prueba paramétrica. Si está ses-
gada y la muestra es menor de 40, podemos transformar los datos.

Transformac1ón de datos
Es posible aplicar una fórmula matemática para cada elemento de datos y producir un conjun-
to de ellos con distribución más normal. Por ejemplo, si los datos forman una distribución
con sesgo negativo, con elevar al cuadrado cada puntuación puede reducirse el sesgo; luego,
sería permisible emplear una prueba paramétrica de los datos. Si utiliza una prueba esta-
dística que busque diferencias entre las medias de diferentes niveles de una variable inde-
pendiente ha de utilizar la misma transformación en todos los datos. Tal tansformación es
un procedimiento del todo legítimo si no prueba varias transformaciones para encontrar la
que produce resultados estadísticamente significativos. No obstante, se sospecha que mu-
chos estudiantes utilizan ese procedimiento. Para quienes desean profundizar en el tema se
presentan posibles transformaciones para diferentes distribuciones en el apéndice V, junto
con ilustraciones sobre el efecto de algunas de ellas.
Pruebas paramétricas y no paramétricas 199

Pruebas no paramétricas para diseños de un grupo


Por lo menos datos ordinales
Cuando los datos se encuentran en la escala ordinal es posible utilizar la prueba de una
muestra de Kolmogorov-Smirnov. Sin embargo, es de uso poco frecuente y suele sustituír-
sele c0n la prueba para datos nominales (la de x?
de una muestra). Por tanto, aquella prue-
ba sólo se describe en el apéndice V.

Datos nominales
Prueba ;(2 de una muestra
A veces queremos ver si una pauta de resultados de una muestra difiere de lo que habríamos
esperado según alguna suposición hecha sobre tal pauta. Un ejemplo se da cuando estudia-
mos las preferencias iniciales de los niños por ciertas pinturas en una galería de arte. Obser-
vamos a 25 pequeños cuando entran en una sala que incluye cinco cuadros y anotamos, en
el caso de cada infante, a cuál obra se acerca primero. Nuestra hipótesis de investigación
sería que los niños se aproximarán primero a una pintura más que a las otras. La hipótesis
• nula sería que el número de pequeños que se acercan primero a cada cuadro será igual para
todos éstos. De acuerdo con la hipótesis nula, esperaríamos que los pequeños se aproxima-
25
ran primero a cada obra en un =5 de los casos.
5
Los datos se observan en seguida:

Tabla 14. 1. Número de niños que se acercan primero a una pintura específica y número
esperado de acuerdo con la hipótesis nula.

Pintor Se acercaron primero Esperado por H0

Klee 11 5
Picasso 5 5
Modigliani 3 5
Cézanne 4 5
Rubens 2 5

La prueba x2 compara los números reales, u observados, con los esperados (de acuerdo con
la hipótesis nula) para ver si difieren significativamente. El ejemplo anterior produce x2 =
x
1O. La manera en que se calcula la 2 de un grupo se muestra en el apéndice V.
20Ql~_______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________

Búsqueda de la significación estadistica de x!


Si condujo la x2 con una computadora le indicaría que el resultado fue p = 0.0404, lo cual
se consideraría estadísticamente significativo; por tanto, podríamos rechazar la hipótesis
nula. La probabilidad para una prueba x2 dada por computadora y en tablas estadísticas es
siempre para hipótesis no direccionales. La noción de una prueba de una o dos colas no
es aplicable aquí, pues hay más de una forma de rechazar la hipótesis nula: cualquiera de las
pinturas pudo ser la preferida. Sin embargo, si hubiéramos predicho que la pintura de Klee
sería la preferida y hubiéramos redactado la hipótesis de investigación de acuerdo con lo pre-
dicho podríamos dividir entre cinco la probabilidad dada, ya que el resultado obtenido
correspondía a nuestra predicción y era una de las cinco formas en que una pintura pudo re-
sultar la preferida. Por tanto, la probabilidad sería

0.0404 = 0.0081
5

Aunque legítima, ésta no constituye una práctica muy utilizada y, por consiguiente, tendría
que reportar cómo llegó a tal probabilidad.
Si no conocemos la probabilidad exacta de x2 podemos utilizar una tabla que dé las
probabilidades para lo que se llama distribución de chi cuadrada. Como la tabla puede uti-
lizarse para encontrar las probabilidades de las pruebas estadísticas diferentes de las x2, se-
guiré la práctica de algunos autores de escribir chi cuadrada cuando hable de la tabla y x2
si me refiero a la prueba.
Para encontrar la probabilidad de los resultados de una prueba x2 debe conocer los gra-
dos de libertad. En la versión de un grupo de la prueba x2, se basan en el número de cate-
gorías, que en este caso eran cinco (la cantidad de pinturas). Los gl se calculan restando
uno al número de categorías, pues el total de participantes es el elemento fijo de la prueba.
En este caso, como tal número era 25 podría cambiarse la cantidad de participantes que se
encontraba en cuatro de las categorías, pero la de la quinta tendría que ser tal que totaliza-
ra 25. Por tanto, hay cuatro grados de libertad.
La tabla de probabilidad para la distribución de chi cuadrada se da en el apéndice XIV.
En la tabla 14.2 se muestra un extracto suyo.
Cuando hay cuatro gl, el nivel crítico para x2 en p = 0.05 es 9.49 y para p = 0.02 de
11.67. Por tanto, como nuestra x2 era 1O y esto rebasa 9.49, la probabilidad de que tal
resultado or.urra por azar es menor que 0.05. Sin embargo, como 1O es menor que 11.67,
la probabilidad es mayor que 0.02. En este caso, reportaríamos la probabilidad como
0.02 < p < 0.05. La manera completa de informar el resultado de una prueba x2, cuando us-
ted no conoce la probabilidad exacta, es x2(4) = 10, 0.02 < p < 0.05, N = 25.
. Pruebas paramétricas y no paramétricas [201
Tabla 14.2. Extracto de la tabla de probabilidad para la distribución de chi cuadrada.

Probabilidad

gl 0.99 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.02 0.01 0.001

0.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 10.83 11

2 0.02 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 7.82 9.21 13.82

3 0.11 0,35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 16.27

4 0.30 0.71 1.06 1.65 2.19 3.36 4.88

5 0.55 1.1 5 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 13 .39 15.09 20.51

El tamaño del efecto de x2


Cohen (1988) usa w como la medida del tamaño del efecto para x2 , donde

y N es el tamaño de la muestra.
Por tanto, en el presente caso :

{10
w=
~ 25
roA
0.632

Cohen define una w de 0.1 como un tamaño de efecto pequeño, una de 0.3 como uno me-
dio y una de 0.5 como uno grande. Por tanto, podemos decir que el tamaño del efecto era
grande en el ejemplo.

El poder de la prueba x2
En las tablas del apéndice XV se da el poder de la prueba z2 . En la tabla 14.3 se aprecia un
extracto de las tablas de poder cuando gl = 4.
2o2l Investigación cuantitativa en psicología

Tabla 14.3. Extracto de las tablas de poder para w cuando gl = 4 y a = 0.05 ( * denota
que el pode r está arriba de 0.995).

gl =4
Tamaño del efecto (w)

n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0. 9

22 <0.20 <0.20 <0.20 0.29 0.43 0.60 0.75 0.87 0.94

24 <0.20 <0.20 <0.20 0.31 0.47 0.64 0.80 0.90 0.96

26 <0.20 <0.20 0.20 0.33 0.50 0.69 0.83 0.92 0.97

28 <0.20 <0.20 0.21 0.36 0.54 0.72 0.86 0.94 0.99

30 <0.20 <0.20 0.23 0.38 0.57 0.76 0.88 0.96 0.99

35 <0.20 <0.20 0.26 0.44 0.65 0.82 0.93 0.98

En la tabla se ve que, cuando w es aproximadamente 0.6, con a = 0.05, gl = 4 y N= 25, el


poder de la prueba cae entre 0.64 y 0.69 (para N= 24) y 0.80 y 0.83 (para N= 26). En rea-
lidad, el poder es 0.71. Es decir, hay aproximadamente 71% de probabilidades de evitar un
error tipo II. En el apéndice XV se explica cómo encontrar niveles de poder para muestras
o tamaños de efecto que no están presentes en las tablas.

Suposiciones de la prueba x!
La primera suposición consiste en que todas las observaciones son independientes, esto es,
en este caso cada niño debe contarse sólo una vez (para 25 puntuaciones habrá 25 peque-
ños). La segunda suposición estriba en que las frecuencias esperadas tendrán por lo menos
cierto tamaño. En el caso donde hay nada más un gl (por ejemplo, sólo dos pinturas), todas
las frecuencias esperadas serán de al menos 5. Cuando los gl son mayores de 1, no más de
20% de las frecuencias esperadas pueden estar abajo de 5. En el caso de cinco categorías,
significa que sólo una de las frecuencias esperadas podía ser menor de 5. Como las frecuen-
cias esperadas están regidas parcialmente por el tamaño de la muestra, para tratar de evitar
el problema de frecuencias pequeñas esperadas se aconseja tener por lo menos cinco parti-
cipantes por categoría. Por ello, el tamaño de muestra mínimo para esta investigación habría
sido de 25.
Si demasiadas categorías tienen frecuencias esperadas abajo de 5, es posible combinar
aquéllas. Por ejemplo, si la muestra hubiera incluido sólo 20 participantes, como se obser-
va en la tabla 14.4, podríamos combinar los números para diferentes pinturas.
Pruebas paramétricas y no paramétricas
------------------------~--------~--~--------------------~
¡--203
Tabla 14.4. Número de niños que se acercan primero a una pintura específica
y número esperado de acuerdo con la hipótesis nula.

Pintor Se acercaron primero Esperado por H0

Klee 9 4
Picasso 4 4
Modigliani 2 4
Cézanne 3 4
Rubens 2 4

Podríamos comparar el número de acercamientos a Klee con los correspondientes a otras


pinturas, como se aprecia en seguida:

Tabla 14. 5. Número de niños que se acercan primero a una pintura específica
y número esperado de acuerdo con la hipótesis nula.
Pintor Se acercaron primero Esperado por H0
Klee 9 4
Otros cuadros 11 16

Observe que la frecuencia esperada para los otros cuadros es la suma (o total) de las espe-
radas para cada una de las pinturas. E l resultado de una x2 para estos datos es x2(l) = 7.812,
p = 0.0052 y N= 20, que también reviste significación estadística.
Con el último ejemplo se demuestra que las frecuencias esperadas no tienen que ser
iguales. Con el ejemplo original se probaba si las pinturas tenían una probabilidad igual de
x
que los niños se les aproximaran primero. Sin embargo, otro uso para la prueba 2 de un
grupo se halla en una de bondad de ajuste. Tal vez en ciertas situaciones pensamos que
un conjunto de datos está distribuido de manera particular y deseamos probar si la suposi-
ción es correcta. Pongamos por caso que se nos dice que una población comprende 20% de
fumadores y 80% de no fumadores. Tenemos una muestra de 100 participantes cuyo es-
tatus de tabaquismo hemos anotado y deseamos comprobar que la muestra es representati-
va de la población. Los datos se advierten en seguida:

Tabla 14.6. El número de fumadores y no fumadores en una muestra y los números


esperados de acuerdo con lo predicho a partir de la población.

Estatus de tabaquismo Observado Esperado


Fumadores 25 20
No fumadores 75 80
2Q4lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l~og~í_a____________________
A diferencia de la estadística inferencia! de uso común, donde buscamos un resultado es-
tadísticamente significativo, en este caso averiguamos un resultado que sugiera que la
diferencia entre las frecuencias esperadas y las observadas no es estadbcicamente signi-
ficativa. El análisis produce este resultado: x2( l) = 1.562,p = 0.2133, N= 100. Concluiría-
mos que la muestra no era no representativa significativamente con relación al estatus
de tabaquismo.
Sin embargo, tal :Go de las pruebas inferenciales se antoja problemático, pues invierte
el proceso usual debido a que nuestra predicción es que no habrá diferencia. Por tanto, esta-
mos tratando de confirmar una H 0 según la cual la distribución no difiere de lo que espe-
raríamos si la muestra se hubiera seleccionado al azar de la población. Tenemos el problema
de que cuanto menor sea el poder de la prueba, tanto más probable será que se apoye la su-
posición.
Para tomar un ejemplo extremo, imagine que fuéramos suficientemente imprudentes
para tener una muestra de sólo 25 personas en la encuesta. Si encontramos que ocho eran
fumadoras (32%, en lugar del 20% que se nos dijo se presentaba en la población). el aná-
lisis produce el resultado siguiente: x2(1) = 2.25, p = 0.1336, N = 25, pese a que el tamaño
del efecto sería w = 0.3 (un tamaño de efecto medio). El poder de la prueba sería 0.32. En
otras palabras, ~(la probabilidad de cometer un error tipo II: omitir un efecto cuando estaba
presente) seria 0.68 o 68%.
Cohen (1988) ha sugerido una manera de sortear el problema: seleccionar un tamaño
de muestra que establezca en 0.95 el poder de la prueba. Ello significaría que~ sería 0.05
y, por tanto, igual a a. Tendríamos que fijar un tamaño particulannente pequeño para el efec-
to que buscamos (digamos, una w menor que 0.1 ). La consecuencia estribaría en que con
gl = 1 necesitaríamos unos 800 participantes a fin de tener el poder requerido para la prueba.

Resumen
Pruebas paramétricas como la t hacen ciertas suposiciones acerca de la medición que se
analiza. En su mayoría requiere que los datos que se analicen sean independientes entre sí
y tengan una distribución normal en la población. Si las suposiciones no se cumplen, de-
ben emplearse las versiones modificadas de las pruebas paramétricas o no paramétricas.
En el capítulo siguiente se describen las pruebas estadísticas que nos permiten compa-
rar los datos a partir de dos niveles de una VT para ver si son significativamente distintos.
15
Análisis de diferencias entre dos
niveles de una variable independiente

Introducción
En este capítulo se estudian los diseños que incluyen una variable independiente con sólo
dos niveles. Se presentan pruebas paramétricas y no paramétricas que analizan diseños en-
tre e intrasujetos. Se explica el uso de pruebas z para evaluar muestras más grandes en prue-
bas no paramétricas. Se examina también el poder y el tamaño del efecto de la prueba t de
dos muestras y sus equivalentes no paramétricas.

Pruebas paramétricas
Distribución de la diferencia entre dos medias
Como ahora buscamos la diferencia entre las medias de dos muestras en vez de la media
de una muestra y de una población, los expertos en estadística han tenido que identificar
cómo se distribuye la nueva estadística (cuáles son su med ia y su etTor estándar), de modo
que una estadística inferencia! puede utilizarse con fines de evaluación. En realidad, hay
diferentes versiones de la prueba, ya sea que se trate de diseño entre o intrasujetos. En el
apéndice VI se presentarán las ecuaciones completas para las pruebas y se darán ejemplos
de trabajo. Todas las versiones de la prueba emplean la distribución t y, por tanto, puede
usarse la misma tabla de probabilidad que para la prueba 1 de un grupo.

----------------------------------------------------~ 205
206l~--------------~l~nv~e~st~ig~a~c~ió_n_c~u~a_nt~it~a~ti_va~en~p~si~co~lo~g~ía~-------------------

Pruebas t para evaluar la diferencia


entre las medias de dos muestras
Diseños entre sujetos
Suposición adicional de la prueba t entre sujetos. En el capítulo 14 se indicó que habrán
de cumplirse ciertos criterios para que resulte apropiado usar una prueba paramétrica como
la t. El nivel de medición debe ser por lo menos de intervalo o, si es ordinal, tendrá, en po-
tencia, 20 o más valores. Las puntuaciones que contribuyen a una media determinada deben
ser independientes. La población de puntuaciones estará distribuida normalmente, o al me-
nos lo estará la estadística de resumen que se evalúa, lo cual, en el caso de la prueba t de
medias, puede ser verdad si la muestra tiene por lo menos 40 participantes.
Además, la prueba t para comparar entre las medias de dos muestras independientes
requiere lo que se llama homogeneidad de varianza. El término significa que las varian-
zas de la población de los dos conjuntos de puntuaciones son iguales. Por lo general, los
investigadores estarán tratando con los datos de muestras más que de poblaciones y, por en-
de, es improbable que las dos muestras posean exactamente la misma varianza, aunque la
tengan las poblaciones de que provienen.
Por fortuna, la prueba t ha mostrado ser tan robusta que las varianzas pueden ser dife-
rentes, en cierto grado, sin que la prueba se afecte en gran medida. Como regla básica, si
la varianza mayor de las dos muestras no es más que el triple de la varianza menor, aún es
legítimo utilizar la prueba t. Sin embargo, si la población de puntuaciones es marcadamen-
te no normal y las varianzas difieren, incluso por menos del triple, la prueba se vuelve menos
robusta. Además, esta regla debe emplearse sólo cuando son iguales los tamaños de muestra
en los dos grupos.
Para este ejemplo, los investigadores desean evaluar la eficacia de una técnica terapéu-
tica diseñada para eliminar la aracnofobia (aversión extrema a las arañas) en la gente. Tratan
de tener dos grupos de aracnofóbicos. Uno actuará como grupo experimental y recibirá te-
rapia, el otro será el grupo control, que no la recibirá. Los investigadores miden la ansiedad
con una lista de verificación que contestan los participantes, la cual arroja una puntuación
entre 20 y lOO y se sabe que tiene una distribución normal entre la población; una puntua-
ción alta significa que la persona es más ansiosa. La variable independiente es, por tanto, la
experiencia de la terapia, con dos niveles: experiencia y no experiencia. La variable depen-
diente es el nivel de ansiedad. La hipótesis de investigación es ésta:
HA: Quienes reciben terapia tienen niveles de ansiedad menores que quienes no la re-
ciben,
con la hipótesis nula siguiente:
H 0 : No hay diferencia en la media de nivel de ansiedad entre quienes reciben terapia
y quienes no la reciben.
____________A
_n_á_li_sl_·s_d_e_d_if_e_re_n_c_ia_s_e_n_t_re__ de__u_na__v_an_·a_b_le__in_d_e~p_
do_s_n_i_ve_l_e s__ e_nd_i_e_
nt_e__~~

.. Puesta formalmente, la hipótesis nula consiste en que la media de nivel de ansiedad para la
población que recibe la terapia (¡..¡. 1) es la misma que la correspondiente a la que no la reci-
be (¡..¡.e); es decir: ¡..¡.1 = 11-e o (¡..¡. 1 - ¡..¡.) = O. La hipótesis de investigación es ¡..¡. 1 < !!e o (!J- 1 -
!!)<o.
Para decidir el tamaño de muestra, los investigadores realizan un análisis de poder.

Análisis de poder
I:a hipótesis es direccional y, en consecuencia, resultará apropiada una prueba de una
cola. La alfa se .establecerá en 0.05. Los investigadores esperan que la terapia produzca unta-
maño de efecto grande (d = 0.8). Buscan poder de 0.8. Buscan en las tablas de poder apro-
piadas (véase el apéndice XV), donde se aprecia que necesitan 20 personas en cada grupo.
Encuentran 40 aracnofóbicos y los asignan al azar a los dos grupos.
Los resultados del estudio se muestran en seguida:

Tabla 15. 1. Medias y desviaciones estándar de nivel de ansiedad de los grupos de


terapia y control.

Terapia Control
Media 71.5 79.5
DE 6.557 7.64

90

"O
l1l 80
"O
(l)
·¡¡:;
e:
l1l
(l)
"O
a;
z> 70

60
Terapia Control
Grupo

Figura 15. 1. Medias y desviaciones estándar de niveles de ansiedad de grupos de


terapia y control.
~~----------------ln_v_e~st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic~o_lo~g~ía~--------------------

Tamaño del efecto


En un caso como el presente estudio, donde el efecto que buscamos es el cambio entre una
condición control y una experimental, tiene sentido calcular d con la ecuación siguiente,
donde se utiliza la desviación estándar del grupo control:
- -
x (para grupo experimental) - x (para grupo control)
d = --------------------------------
DE (para grupo control)

En el ejemplo,

71.5-79.5
d
7.64
-1.047
Lo anterior nos indica que la terapia redujo la ansiedad en una desviación estándar de 1, lo
cual, en términos de Cohen, puede considerarse un tamaño del efecto grande.
Si la investigación hubiera incluido la comparación entre las medias de dos grupos ex-
perimentales sería más legítimo utilizar una desviación estándar que combinara la informa-
ción de ambos grupos (la desviación estándar combinada) en la ecuación anterior en lugar
de la desviación estándar de un grupo (véase en el apéndice VI la ecuación de la desvia-
ción estándar combinada).
Hemos visto que el resultado ha ido en la dirección de la hipótesis; ahora deseamos sa-
ber si es estadísticamente significativo. Sin embargo, primero debe verificarse si los datos
cumplen los requisitos de una prueba t. Uno adicional de la prueba t entre sujetos estriba
en que los datos de las dos condiciones deben ser independientes. Los investigadores han
garantizado esto, mas necesitan verificar si hay homogeneidad de varianza en los dos conjun-
tos de datos. Las varianzas se obtienen elevando al cuadrado las desviaciones estándar. La
varianza del grupo de terapia es 42.99 y la del control 58.37. Como la varianza del segun- •
do (la mayor) no es más que el triple de la del primero y la escala de ansiedad constituye
una medición de razón que está distribuida normalmente en la población, los investigado-
res deciden que es legítimo utilizar una prueba t.
Esta versión de la prueba t está formada por lo siguiente:
diferencia entre medias - diferencia entre medias si H 0 es correcta
error estándar de la diferencia entre medias

La diferencia entre las medias, si H 0 resulta correcta, es O, caso en el que la ecuación pue-
de reescribirse como sigue:
diferencia entre las medias
t entre sujetos
error estándar de la diferencia entre medias
• ___________ A
_n_á_li_si_s _de__
dl_.fe_r_e_nc_ia_s_e_n_
tr_
e_d_
o_s_
ni_ve_l_
es_d_e_u_n~a_v_a_ri_ab_l~e_in_d~e~pe~n~d~ie_n~te~_J~

En el presente caso, esto se vuelve:


71.5 - 79.5
2.2513 1
= - 3.553

Búsqueda de la significación estadística


de una prueba t entre sujetos
La misma tabla sirve para esta versión de la prueba t que para todas las demás (véase el
apéndice XIV). Sin embargo, antes de poder evaluar la probabilidad de este valor deben co-
nocerse los grados de libertad apropiados para dicha versión de la prueba t.

Grados de libertad para una prueba t entre sujetos


Esta versión de la prueba t se basa en las medias de dos grupos y, en consecuencia, tiene
dos gl menos que el tamaño de la muestra. Por tanto, en este caso, los gl son 40 - 2 = 38.
En seguida se muestra parte de las tablas t del apéndice XIV:

Tabla 15.2. Extracto de las tablas t (del apéndice XIV).


Probabilidades de una cola

gl 0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005

Probabilidades de dos colas

gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001

35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591

36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582

37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574

38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566

39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558

40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551

50 0.255 0.528 0.849 1.299 1.676 2.009 2.403 2.678 3.261 3.496
21QlL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
De buscar a lo largo de la fila para gl = 38, veremos que el valor t de 3.553 (recuerde que
debe obviar el signo negativo si el valor t calculado es negativo) se encuentra entre 3.319
y 3.566. Por tanto, la probabilidad de una cola del valor tes menor que 0.001, pero mayor
que 0.0005; podemos decir que 0.0005 <p < 0.001. En realidad, la computadora da el va-
lor exacto de p, que es 0.00052. Resulta claro que el valor de pes menor que el nivel de a
y que los investigadores pueden rechazar la hipótesis nula y concluir que su técnica tera-
péutica reduce la ansiedad de los aracnofóbicos.
Por lo general, no supone un problema que no se muestre el gl exacto en las tablas. El va-
lor de t será, con toda claridad, estadísticamente significativo cuando el gl sea más peque-
ño que el valor exacto (por ejemplo, cuando gl = 45 y t = 1.69), en cuyo caso el resultado
también será significativo con el nivel exacto; como alternativa, el resultado no será sig-
nificativo aun con el siguiente gl mayor para el que existe una entrada en la tabla (por ejem-
plo, cuando gl = 45 y t = 1.67), caso en el que no sería estadísticamente significativo con el
gl exacto. Un problema surge, si usted depende de las tablas, cuando el valor de t no es cla-
ro en una de estas dos posiciones; por ejemplo, si ha sido 1.682 con gl = 43. (En el apéndice
XIV se muestra cómo puede encontrar un valor de t crítico más exacto con la interpolación.)

Efecto en el poder de tamaños de muestra desiguales


En una prueba t entre sujetos el poder de la prueba se reduce de tener tamaños de muestra
desiguales. Por citar un caso, si en el ejemplo anterior los investigadores hubieran usado un
grupo control de 1O y uno experimental de 30, aunque el tamaño de muestra general fuera
idéntico, el poder para un tamaño de efecto grande de d = 0.8 se reduciría a 0.69, una caí-
da de 0.11. Por tanto, cuando diseñe la investigación trate de tener muestras de tamaño
igual. En el apéndice XV se indica cómo calcular el tamaño de la muestra apropiada a fin
de leer tablas de poder para una prueba t entre sujetos, cuando los tamaños de muestra para
los dos grupos son diferentes.

Heterogeneidad de varianza
Si las varianzas de las dos muestras difieren por más del triple (y las muestras tienen el
mismo número de participantes), se aconseja usar una versión modificada de la prueba t.
Cuando el tamaño de las muestras sea desigual, use la prueba t modificada si las varianzas
difieren más del doble. En la versión de la prueba t que se da arriba se han combinado las
varianzas de las dos condiciones, o se han resumido en una sola medida. Cuando las dos va-
rianzas son diferentes, conviene más estimar el error estándar para la diferencia entre las me-
dias sin combinar las dos varianzas.
Esta nueva versión de la prueba t, a veces conocida como prueba t de Weich, no se distri-
buye de la misma manera que las otras. Sin embargo, las tablas estándar pueden utilizarse
--~~~----------------------------- --- -- ----------------------~------~~~

____________A
_n_á_li_si_s_d_e_d_if_e_re_n_c_ia_s_e_n_t_re_d
_o_s_n_iv_e_l_es__
de__u_na__
va_r_ia_b_le__
in_d_e.:..._p_en en_t_e____Jj211
_d_i_

si se ajusta el grado de libertad. El cálculo de esta versión de la prueba t y de los gl se ob-


serva en el apéndice VI. Algunos programas de computadora, como SPSS, reportan esta
versión, junto con el valor de t más usual. Si las varianzas pasan la regla básica porque se
consideran suficientemente homogéneas, cite el valor de t más usual, con su gl y p . Sin em-
bargo, si las varianzas son heterogéneas, indique la versión modificada. Si reporta la última
versión, explíquelo.

Diseños intrasujetos o equiparados


En este ejemplo, los psicólogos deportivos han ideado una técnica que, según esperan, me-
jorará el desempeño de los ciclistas. Deciden compararlo antes de entrenar, tomando como
base el tiempo que les lleva completar una ruta, con el desempeño tras entrenar. Por tanto,
la variable independiente es la etapa de entrenamiento, con dos niveles: antes y después del
entrenamiento. La variable dependiente es el tiempo para completar la ruta. La hipótesis de
investigación es ésta:
HA: Los ciclistas toman menos tiempo en completar la ruta después del entrenamien-
to que antes de él.
La hipótesis nula es la siguiente:
H 0 : Los ciclistas toman el mismo tiempo en completar una ruta después del entrena-
miento que antes de él.

Para establecerla formalmente , la hipótesis nula consiste en que la media de la diferencia


{!.td) para cada ciclista, entre los tiempos tomados en las dos ocasiones, es cero; es decir,
fl.d =O. La hipótesis de investigación es fl.d >O.
Para elegir un tamaño de muestra apropiado los investigadores efectúan un análisis de
poder.

Anáus;s de poder
La naturaleza de la hipótesis significa que una prueba de una cola resulta apropiada. La al-
fa se establece en 0.05. Como el entrenamiento toma mucho tiempo, los psicólogos están
interesados en detectar sólo un efecto grande (d = 0.8) y desean un poder de 0.8 . Buscan
en las tablas de poder para la prueba t intrasujetos (véase el apéndice XV) y deciden que
se necesitan 11 ciclistas para el estudio. Como cada participante en un diseño intrasujetos
proporciona una puntuación para cada nivel de la VI, se requerirán menos participantes que
en un diseño entre sujetos para el mismo nivel de poder. Además, los diseños intrasujetos
cuentan con más poder que los entre sujetos, pues deben tener menos variabilidad en el
conjunto general de puntuaciones porque la misma persona proporciona dos puntuaciones,
2f2lL_______________I_nv_e_s_t_i~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
y así necesitan incluso menos participantes para lograr el mismo nivel de poder. Como ya
se verá, esta forma de evaluar el poder es muy aproximada y ha de usarse sólo cuando no se
dispone de otras directrices acerca del tamaño del efecto.

Grados de libertad para una prueba t


intrasujetos o pares equiparados
En este caso, el valor t se calcula sobre la base de las diferencias entre cada par de pun-
tuaciones de cada participante, y así los grados de libertad son uno menos el número de
pares de puntuaciones (o uno menos el número de participantes). Por tanto, en este ejem-
plo, gl = 11 - l = lO.
Los resultados del experimento se mues!ran en la tabla siguiente y en la figura 15.2:

Tabla 15.3. Medias y desviaciones estándar del tiempo (expresado en minutos) que los
ciclistas toman en completar la ruta antes y después del entrenamiento.
Etapa de entrenamiento
Antes Despúés
Media 184.0909 182.5455
DE 21.66 20.68

(He dado las medias con cuatro decimales para que los cálculos que se aprecian abajo pro-
duzcan resultados consistentes. No recomiendo que repo1te resultados con esos niveles de
exactitud.) ·
210

~ 200
....::Jo
.Ee 190
e
~
...."' 180
2
e
<11
o 170
Cl.
E
<11
¡= 160

150
Antes Después
del entrenamiento del ent renamiento
Condición
Figura 15.2. Medias y desviaciones estándar del tiempo que los ciclistas toman en
terminar la ruta antes y después del entrenamiento.
\

_ _ _ __ _A
_n_á_li_si_s_d_e_d_if_e_re_n_c_ia_s_e_n_t_re_d_o_s_n_iv_e_l_es_de_u_na_va_r_ia_b_le_in_d_e.:...p_en_d_ie_n_t_e_--Jf213

A partir de las estadísticas de resumen podemos ver que hay una ligera mejoría en la me-
dia del tiempo en la condición posterior al entrenamiento, pero que se tiene gran superpo-
sición entre las dispersiones de ambas condiciones.

Tamaño del efecto


El cálculo de d y las directrices que Cohen (1988) ha propuesto para lo que constituye ta-
maños del efecto pequeños, medios y grandes se basan en diseños entre sujetos. Ello signifi-
ca que cuando tenemos un diseño intrasujetos hay dos formas de calcular d: una con el fin
de juzgar la magnitud del efecto con relación a un diseño entre sujetos y una con el pro-
pósito de leer la tabla de poder. Para ser consistente con la manera en que se calcula el
tamaño del efecto para un diseño entre grupos, y debido a que la condición previa al entre-
namiento puede tratarse como una condición control, podemos usar la ecuación siguiente:

x antes del entrenamiento - i después del entrenamiento


d = DE condición control

Si ninguna condición puede tratarse como control, habríamos encontrado la desviación es-
tándar (DE) agrupada como en el diseño entre sujetos.
En el presente caso,
184.0909- 182.5455
d
21.66

= 0.07

De acuerdo con Cohen (1988), ello es menor que un tamaño del efecto pequeño.
Esta versión de la prueba t se forma con lo siguiente:

. . media de diferencia - media de diferencia si H0 es correcta


t mtrasujetos =
error estándar de diferencias

La media de diferencia si H 0 es conecta es igual a cero. Por tanto, la ecuación puede rees-
cribirse como sigue:

media de diferencia
t intrasujetos = - -- - - - - - -
error estándar de diferencias
En el presente caso,
t = 184.091 - 182.546
1.021
1.513
"'2'141 Investigación cuantitativa en psicología
~------------------=-------------~----~--------------------

En la parte correspondiente de las tablas t del apéndice XV, los investigadores encuentran
que con gl = 1O, p cae entre 0.1 y 0.05 para una prueba de una cola. De acuerdo con esto,
los psicólogos no pueden rechazar la hipótesis nula y están forzados a concluir que su téc-
nica de entrenamiento no mejora el desempeño.

Análisis de poder ret rospectivo


Como el resultado no era estadísticamente significativo, para guiar investigaciones futuras
los psicólogos desean conocer el poder de su prueba. Hay una ligera complicación con di-
seños intrasujetos. La medición del tamaño del efecto permite la comparación con diseños
entre sujetos, pero subestimará el poder de la prueba porque el valor de t para un diseño in-
trasujeros utiliza la desviación estándar de las. diferencias entre las puntuaciones para cada
participante (sdif) y, por tanto, si tenemos esta información, el tamaño del efecto (d~, que
podemos emplear para calcular el poder, se encuentra con lo siguiente:

Como sdif= 3.387,


184.0909-182.5455
d'
3.387

0.456
Cuando el valor de t intrasujetos se conoce, d' puede calcularse de

d' = _t_
¡;;
Por tanto,
3
d' = 1.5! = 0.456
..Jlí
Los investigadores notan que, con ese tamaño del efecto (d = 0.456) y una muestra de 11
participantes, el poder de su prueba estaba entre 0.32 (parad= 0.4) y 0.44 (para d = 0.5).
Por tanto, como el efecto cae aproximadamente a medio camino entre los dos valores
tabulados, el poder será alrededor de la media de los dos niveles; lo que significaría
(0.32 + 0.44)/2 = 0.38. A fin de alcanzar el poder de 0.8, los investigadores habrían nece-
sitado entre 30 y 40 participantes, o unos 35 ciclistas. Por ello, pueden concluir que vale la
pena repetir el estudio con el tamaño de muestra más grande.
(La discrepancia entre los dos valores, parad y d', calculados para el estudio se expli-
ca en el apéndice XV.)

-
_ _ __ __ A_n.:..ál....:is....:is_d....:e_d.:..i.:..fe_r_en_c_ia_s_e_n.:..
tr....:e_d....:o.:..s_n_iv....:e..:..:le.:..s....:d....:.e....:u....:n.:..a_v_ar_ia.:..b....:le..:...._in....:d....:.e!:...pe.:..n....:d_ie.:..n....:.te
..:....____Jf215

Pruebas no paramétricas
Pruebas para evaluar la diferencia entre dos niveles
de una variable independiente: por lo menos escala ordinal
Diseños entre sujetos: la prueba U de Mann-Whitney
La prueba U de Mann-Wbitney supone que las distribuciones en la población de los dos gru-
pos que se comparan son iguales. Por tanto, no es tan restrictiva como la prueba t y puede
usarse ante distribuciones anormales. Sin embargo, implica homogeneidad de varianza.
Esta última restricción puede resultar menos problemática porque la prueba requiere la
colocación de los datos en orden en lugar de anotar el tamaño de cualquier diferencia en-
tre puntuaciones y, por ello, se reducirá el efecto de puntuaciones extremas. No obstante,
si las puntuaciones originales tienen varianzas heterogéneas, valdría la pena convertir los
datos en clasificaciones escalonadas, ordenando juntas ambas muestras y luego compro-
bando que la varianza de los ordenamientos de un grupo no es mayor que el triple de la
varianza del otro. Si las varianzas petmanecen heterogéneas, Zimmerman y Zumbo (1993)
recomiendan llevar a cabo una prueba t para varianzas separadas, la prueba t de Welch, ya
mencionada en el capítulo, en los datos escalonados. Igual que con la prueba t entre suje-
tos, la U de Mann-Wbitney supone que las puntuaciones son independientes entre sí.
Los investigadores desean comparar las actitudes de dos grupos de estudiantes (los que
cursan física y los inscritos en sociología) hacia la caza de animales. A cada uno se pide
que estime su grado de acuerdo con la afirmación "Cazar animales salvajes es cruel". Las
estimaciones se realizaron sobre una escala de 5 puntos, de muy en desacuerdo a muy de
acuerdo, donde una puntuación alta denota una actitud contra la caza.
La hipótesis de investigación es ésta:
HA: Los estudiantes de sociología estarán más contra la caza que los de física.
Con la hipótesis nula siguiente:
H 0 : No hay diferencia entre los estudiantes de sociología y los de física en sus actitu-
des hacia la caza.
Expresada formalmente, la hipótesis nula es que las medianas de ambos grupos no difieren.

Decisión acerca del tamaño de la muestra


Tamaño del efecto. No hay una manera directa de presentar tamaños del efecto para prue-
bas no paramétricas que incluyen muestras pequeñas. Sin embargo, como veremos, podemos
formular ciertas suposiciones con base en la prueba paramétrica equivalente cuando desea-
mos realizar análisis de poder prospectivo. Además, con un tamaño de muestra suficien-
temente grande (a menudo entre 20 y 25 participantes, o pares de ellos en un diseño entre
216l~ _______________r_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
sujetos) es posible calcular un tamaño del efecto. Tal método se explicará más adelante en
el presente capítulo.
Poder. El poder de las pruebas no paramétricas tiende a reportarse con base en la manera
en que éstas se comparan con sus equivalentes paramétricas, cuando se cumplen las supo-
siciones de la paramétrica. El término eficiencia de poder se usa con el significado de "nú-
mero relativo de participantes que se necesitaría para alcanzar el mismo poder que para la
prueba paramétrica". Como se anotó en el capítulo 14, cuando las suposiciones de la prue-
ba paramétrica no se atienden, la no paramétrica puede tener más poder que su equivalente
paramétrica. Sin embargo, el cálculo del poder no es directo en tales circunstancias, pues
depende de cómo se han violado dichas suposiciones. De acuerdo con esto, el procedimien-
to que adoptaré, donde sea posible, consiste en utilizar las tablas que se dan para la prueba
paramétrica equivalente, pero sugeriré los ajustes procedentes del tamaño de la muestra para
compensar la eficiencia de poder relativa de la prueba no paramétrica.
En el caso de la pnteba U de Mann-Whitney, si multiplicamos por 1.05 el tamaño de
muestra sugerido para la prueba t, tendremos por lo menos el poder sugerido. Por tanto, si
los investigadores quisieran detectar un tamaño del efecto grande de d = 0.8, se les diría
que necesitan 20 participantes por grupo a fin de obtener un poder de 0.8 para una prueba t
entre sujetos de una cola, con a= 0.05. De acuerdo con esto, requerirían 20 x 1.05 = 21
participantes por grupo para la prueba U de Mann-Wbitney.
Los investigadores recolectan los datos y crean la tabla siguiente:

Tabla 15.4. Actitudes de los estudiantes de sociología y física hacia una pregunta
relacionada con la caza de animales.
Sociología Física

5 1
4 2
3 3
3 4
5 5
4 2
2 1
5 3
5 4
4 - 2 ~

4 1
3 3
(Continúa)
Análisis de diferencias entre dos niveles de una variable independiente j217
----------------------------------------------------~------~

Tabla 15.4. (Continuación)

3 2
5 3
4 3

.. 4
4
5
4
5 3
5 2
5 1
5 2
Media 4.14 2.67
Mediana 4 3

Significación estadística de la prueba U de Mann- Whitney


La prueba U de Mann-Whitney requiere la colocación de todos los datos en orden numéri-
co y luego el cálculo de cuántos puntos de datos no se encuentran en el orden establecido
en la hipótesis. En este caso, un punto de datos fuera de orden sería un estudiante de fisica
que estaba más contra la caza que algunos de sociología.
En el apéndice VI se aprecian los procedimientos requeridos para la prueba. El análi-
sis realizado dio una U de 79.5. Si el tamaño de la muestra para el grupo más pequeño es
de 20 participantes o menos, la probabilidad de que el resultado hubiera ocurrido por azar
se da en el apéndice XIV. Sin embargo, si el grupo más pequeño tiene más de 20 parti-
cipantes, puede usarse una versión de una prueba z para calcular la probabilidad (véase
el apéndice VI). En el presente ejemplo, con 21 participantes en cada grupo, z = - 3.5469,
p = 0.0002, prueba de una cola.

Corrección para empates


Es probable que su programa de computadora también le ofrezca un valor alternativo de z,
el cual ha considerado el número de puntuaciones del mismo valor (empatadas). El cálcu-
lo también se aprecia en el apéndice VI. La versión que permite empates da z = - 3.6389,
p = 0.00015, prueba de una cola. La corrección para empates es la versión más exacta, de
modo que reporta sólo ese resultado, cuando se da, y el tamaño de la muestra es suficien-
temente grande para que la prueba z resulte apropiada.
2181 Investigación cuantitativa en psicología
L-------------------=-------------~----=---------------------

Reporte del resultado de La prueba U de Mann-Whitney


Aquí diría que los estudiantes de sociología se oponían de manera más significativa a la ca-
za que los de física (U= 79.5, z = -3.64,p = 0.00015 , N= 42, prueba de una cola). Repor-
te el valor para U aunque el tamaño de la muestra sea suficientemente grande para que se
realice una prueba z. Resulta claro que si el tamaño de la muestra no fuera suficientemen-
te grande para garantizar la realización de una prueba z usted no podría reportar el valor z.

Repaso del tamaño del efecto


Ahora que tenemos una puntuación z para el resultado podemos convertirlo en un tama-
ño del efecto (r) mediante la ecuación proporcionada en el apéndice VI. Al poner la pun-
tuación z corregida para empates (- 3.64) en la ecuación se obtiene un tamaño del efecto de
r = -0.56, lo cual se consideraría de acuerdo con Cohen (1988) un tamaño del efecto grande.
(Esta medición del tamaño del efecto se analizará de manera más cabal en el capítulo 19.)

Diseños intrasujetos: la prueba de rango


con signo de Wilcoxon para pares equiparados
Cuando se comparan dos niveles de una variable independiente, en un diseño intrasujetos
con al menos datos ordinales que no se adecuan a las suposiciones de una prueba t intrasu-
jetos, sería apropiado utilizar la prueba de rango con signo de Wilcoxon para pares equipara-
dos. La prueba supone que la distribución de la diferencia de puntuaciones entre las dos
condiciones forma una distribución simétrica en la población. Por tanto, es menos restric-
tiva que la prueba t. Igual que con la prueba t intrasujetos, supone que las puntuaciones en
una condición determinada resultan independientes entre sí.
Esta prueba sería apropiada si los investigadores compararan si las personas conside-
ran la psicología una ciencia antes de escuchar una charla sobre la naturaleza de tal dis-
ciplina y tras oírla. Sus conceptos se desprenderían de sus respuestas a la afirmación la
psicología es una ciencia. Utilizaron una escala de estimación de 5 puntos, que iba de muy
de acuerdo a muy en desacuerdo; la puntuación mayor denotaba ahí la creencia de que la
psicología constituye una ciencia.

Poder
Los investigadores supusieron un tamaño del efecto grande, establecieron a en 0.05 y, co-
mo planteaban una hipótesis direccional (la gente clasificará la psicología más claramente
como una ciencia después de que hayan escuchado la charla acerca del tema), utilizarían una
probabilidad de una cola. Querían un poder de 0.8. La prueba de Wilcoxon tiene la misma
_ _ __ _ _A_n_ál_is_is_d_e_d_i_
f e_r_
en_c_ia_s_e_n_tr_e_d_o_s_n_iv_e_le_s_d_e_u_n_
a _v_
an_·a_b_le_in_d_e:....
pe_n_d_ie_n_te_ __.f219
eficiencia de poder que la U de Mann-Whitney. De acuerdo con esto, podemos buscar el
tamaño de muestra para una prueba t intrasujetos con un tamaño del efecto de d = 0.8 y po-
der de 0.8 y multiplicar el tamaño de muestra por 1.05. Con las tablas del apéndice XV
encontramos que el tamaño de muestra para la prueba t equivalente debería ser de 11. Por
tanto, el tamaño de muestra requerido para una prueba de Wilcoxon es 11 x 1.05 = 11.55.
Redondeamos esto al número entero más cercano, lo cual da un tamaño de muestra de 12
participantes.

Tabla 15.5. Las estimaciones de participantes de psicología antes y después de una


charla sobre el tema.

Participante Antes Después

1 1 4
2 1 4
3 2 2
4 2 4
5 3 5
6 2 4
7 3 4
8 4 4
9 5 5
10 4 5
11 2 3
12 3 3
Media 2.667 3.917
Mediana 2.5 4

La prueba de Wilcoxon busca el tamaño de diferencias entre los dos niveles de la VL Cla-
sifica éstas de acuerdo con su tamaño y da a cada una un signo positivo o negativo, consi-
derando si el segundo nivel es mayor o menor que el primero. Luego se suman los rangos
del signo que ocurre menos y el resultado forma la estadística T. En este caso, se realizó
una prueba de Wilcoxon con el resultado de que T = O (pues no había personas para quie-
nes el segundo resultado fuera menor que el primero); los trabajos se aprecian en el apén-
dice VI.
220lL_____________~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a--------------------
Puntuaciones empatadas
En la prueba de Wilcoxon hay dos tipos de puntuaciones empatadas: donde un participan-
te dio la misma puntuación para cada condición y donde las puntuaciones de diferencia de
pa1ticipantes distintos fueron iguales.
Esta prueba descarta los casos en que no hay diferencia entre los dos niveles de la VI,
y el tamaño de muestra incluye sólo a los que sí mostraron una diferencia. Por tanto, en el
presente ejemplo, como cuatro personas no cambiaron su estimación entre las dos ocasio-
nes, el tamaño de muestra se considera 12-4 = 8. Si el rango de puntuaciones posibles es
limitado, habría una proporción alta de esos empates y ello reduciría de modo considera-
ble el poder de la prueba por reducir el tamaño real de la muestra.

Signifkadón estadistka
Muestras pequeñas. Si el tamaño de la muestra es 25, o menor, utilice la tabla del apén-
dice XIV. Con el tamaño de muestra corregido a ocho, sabemos que p < 0.005 para una
prueba de una cola.
Muestras más grandes. Cuando el tamaño de la muestra es mayor que 25 puede utilizar-
se una prueba z para calcular la probabilidad de que T hubiera ocurrido por azar. Si más de
una persona tiene la misma diferencia de tamaño entre los dos niveles de la VI, los progra-
mas de computadora suelen calcular un valor z que permite tales valores empatados. Como
la prueba U de Mann-Whitney, la z corregida para empates es la más exacta. Las operacio-
nes correspondientes para la prueba z se proporcionan en el apéndice VI.

Reporte del resultado de una prueba de rango


con signo de Wilcoxon para pares equiparados
Igual que con la prueba U de Mann-Whitney, siempre reporte la estadística original de la
prueba, en este caso el valor de T, y luego, si es apropiado, el valor de z. Aquí, se diría que
las clasificaciones dadas después de la charla sobre psicología confirieron a ésta una clasifica-
ción más alta como ciencia que antes (T = O, p < 0.005, prueba de una cola; N= 8). Tam-
bién podría mencionar que cuatro participantes no mostraron cambio y se eliminaron del
análisis.

Pruebas para evaluar la diferencia entre dos


niveles de una variable independiente: escala nominal
Diseños entre sujetos: la prueba de contingencias ;(
Lá prueba de contingencias x2 es apropiada si tiene dos variables medidas en el nivel no-
minal (o de categoría) y desea ver si distintos niveles de una variable difieren en la pauta


____________A_n_á_li_sl_·s_d_e_d_i_fe_re
_ n_c_ia_s_e_n_t_re__
do_s_ n_i_v e_l_e_s_
de__u_
n_a _v_ar_ia_b_l_e_in_d_e~p_e_nd_i_e_nt_e__~¡-221

que forman en la otra variable. Sin embargo, es importante que ninguna persona se cuente
más de una vez; las entradas de la tabla deben ser independientes entre sí.
Por ejemplo, los investigadores han oído que, al parecer, gran número de estudian-
tes mujeres fuman. Quisieran ver si es diferente la proporción de hombres y mujeres que
fuman .

Tamaño del efecto. El tamaño del efecto para esta versión de la prueba x2 es el mismo que
para la x2 de bondad de ajuste de un grupo. La medición del tamaño del efecto dado por
Cohen (1988) es w, con 0.1, 0.3 y 0.5 , donde los valores de w que sugiere constituyen ta-
maños del efecto pequeño, mediano y grande.

Poda Los investigadores desean detectar al menos un tamaño del efecto medio (w = 0.3)
y, de este modo, buscan en las tablas del apéndice XV un tamaño del efecto medio, con
a= 0.05 y gl = 1 (que se explicará más adelante). Observan que para un poder de 0.8, el
tamaño de muestra recomendado es 88. Deciden que les gustaría un número igual de hom-
bres y mujeres para realizar comparaciones de proporciones más simples; así, trabajan con
muestras de 44 hombres y 44 mujeres.
Los investigadores preguntaron en su estudio a los participantes si fuman y colocaron
los resultados en una tabla:

Tabla 15.6. Números de fumadores y no fumadores entre hombres y muj eres en una
muestra.

Tabla de frecuencia observada

Hombre Mujer Totales

Fumador 17 21 38
No fumador 27 23 50

Totales 44 44 88

Esta versión de la prueba x2 prueba la hipótesis nula de que el estatus de fumador y el gé-
nero no están interrelacionados (son independientes uno del otro). Hace esto al anotar las
proporciones de hombres y mujeres en la muestra (44 de 88 o 0.5 para cada uno) y las pro-
porciones de fumadores y no fumadores (38 de 88, o aproximadamente 0.43, para fumado-
res; 50 de 88, o 0.57, para no fumadores). Si ambas vmiab1es (género y tabaquismo) no es-
tán relacionadas debe haber la misma proporción de fumadores entre hombres que entre
mujeres (es decir, 0.43 o 43 %). Por tanto, con la hipótesis nula de que la proporción de
hombres y muj eres fumadores es la misma, la frecuencia esperada produciría la tabla 15.7.
222lL______________~I~nv~e~s~ti~ga~c~ió~n_c~u~a~nt~it~a~ti_va~e_n~p~si~co~l~og~í~a____________________
Tabla 15.7. Las frecuencias esperadas de fumadores y no fumadores entre hombres y
mujeres no están intervinculadas.

Valores esperados

Hombre Mujer Totales

Fumador 19 19 38
No fumador 25 25 50
Totales 44 44 88

Sin embargo, 17 de los hombres, o 38.64%, fueron fumadores, mientras que 21, o 47.73%,
de las mujeres fumaban.

Tabla 15.8. Los porcentajes de fumadores y no fumadores entre hombres y mujeres.

Porcentajes de totales de columna

Hombre Mujer Totales

Fumador 38.64% 47.73% 43.18%


No fumador 61 .36% 52.27% 56.82%
Totales 100% 100% 100%

La prueba x2 compara las frecuencias esperadas con las ocurridas realmente (las observa-
das). Las operaciones correspondientes para el ejemplo se proporcionan en el apéndic_e VI.
El resultado es que x2 = O. 741. Al buscar en la tabla para la distribución de chi cuadrada en
el apéndice XIV se aprecia que la probabilidad de que este resultado, con gl = 1, ocurriera por
azar es de 0.3 < p < 0.5. La computadora reportó la probabilidad exacta como p = 0.3893.

Grados de libertad y x2 • Los elementos fijos en el cálculo de una prueba x2 en tablas de


contingencia son lo que se denomina totales marginales (el número de fumadores y no fu-
madores y el de hombres y mujeres), pues las frecuencias esperadas se calculan a partir de
ellos. Por tanto, en una tabla de 2 x 2, como la anterior, en cuanto una frecuencia se coloca
en la tabla todas las demás se fijan. Por ejemplo, ya que el tamaño de muestra fue 88, si se
nos dice que 17 hombres fumaron sabemos cuántas mujeres fumaban (38- 17 = 21) y
cuántos hombres no fumaban (44- 17 = 27), y cuántas mujeres no fumaban (44- 21 = 23).
Por ello, tenemos la libertad de modificar sólo una de las ruatro frecuencias y, así, gl = l .
Esta versión de la prueba x2 no es útil nada más en una tabla de 2 x 2; podemos tener más

/
--~--__:_A.:n~.á.: . lis~is:. :. .d.: . e:. _.: ._di:. :. .fe:. :.r~e:.:.nc:. :.ia:. :s:. :. .e:. :.n.:. :t:. .:re:. :. .d:. :o:.:s. . :.n:.:.iv:. .:e:.:.le:.:s:. . :..::d e:. . :u:. :.n:.:a:. . :v. :a: . .:ri-=ab:. :l:.:.e. . :.in:. :. .d:. :e~p:.:.en:. :. .d:. :.ie.:. :n.:. :t:.:.e_ _¡j223

mveles de cualquier variable (por ejemplo, el estatus de tabaquismo podia tener los niveles
nunca fumó, ex fumador y actualmente fuma). La regla para obtener los grados de libertad
consiste en restar uno al número de columnas de la tabla y uno al de filas y multiplicar los
resultados:
gl =(columnas - 1 ) x (filas- 1)

Por tanto, en una tabla de 2 x 2 tendríamos:

(2 - 1) X (2 - 1) = 1 X 1 = }

Pruebas de una y de dos colas y y}. Como se mencionó en el capítulo 14, la probabilidad
que se da en tablas de cbi cuadrada y en programas de computadora corresponde a hipóte-
sis no direccionales. Con una tabla de contingencia mayor que 2 x 2, un resultado signifi-
cativo podría ir en más de dos direcciones posibles. Por ejemplo, si buscamos un estudio
de fumadores que incluya tres estatus posibles de tabaquismo rechazaremos la hipótesis nu-
la de que no hay diferencias entre los géneros sí fumadores, no fumadores o ex fumadores
fueran particularmente altos (o bajos) en cualquier género. Sin embargo, si tenemos una hi-
pótesis direccional y el resultado va en la dirección de nuestra hipótesis, puede dividirse la
probabilidad dada por una hipótesis no direccional entre el número de maneras en que el
resultado podría dirigirse y contar con significación estadística.
El caso más simple para demostrar esto es con la tabla de 2 x 2. Imagine que el inves-
tigador predijo que habría una proporción más alta de fumadores entre las mujeres que entre
los hombres. El resultado, resumido en la tabla 15.6, se encaminó en la direccién predicha
y hay sólo dos formas en que esta tabla de contingencia podría tener significación estadís-
tica: una proporción más alta de hombres fumaba o una mayor proporción de mujeres lo
hacía. De acuerdo con esto, podemos dividir entre dos la probabilidad reportada origi-
nalmente; como resultado, p = 0.1946. Como señalamos en el capítulo 14, si calculó tal
probabilidad se aconsejaría que explicara el proceso porque, si bien legítima, no es una
práctica común. Para evitar la necesidad de explicación, como el resultado se mantuvo no
significativo incluso tras convertirse en una probabilidad direccional, yo simplemente re-
portaría la probabilidad no direccional.
Reporte de los resultados de una prueba x2 . Como es usual, debe reportar la prueba que
se usó; la conclusión que extrajo del resultado y sus pruebas para la conclusión. Por tanto,
yo diría: "Se realizó una prueba 2 de 2 x 2 para comparar las proporciones de fumadores x
y no fumadores entre hombres y mujeres. No hubo una proporción significativamente más
elevada de mujeres que de hombres fumadores (x2 = 0.741, gl = 1,p = 0.3893, N = 88)".
Si deja la probabilidad dada por la computadora o por ur.a tabla no hay necesidad de repor-
tar que es una probabilidad de dos colas.
224lL_______________I_n_ve_s_ti~ga_c_io_·n_c_u_a_n_ti_ta_tl_·v_a_e_n~p_si_co_L_o~gí_a ____________________

Nueva visita al tamGiio del efecto. El tamaño del efecto w puede calcularse con la ecua-
ción siguiente:

donde N es el tamaño total de la muestra. Por tanto, en el ejemplo:

lo.74I
w= f ss
= 0.0918

De acuerdo con Cohen, ése es un tamaño del efecto pequeño. Dado ese tamaño, el poder
fue menos de 0.2. Para alcanzar un poder de 0.8 con tal magnitud, se necesitaría un tama-
ño de muestra de más de 700 participantes.
Corrección para continuidad. La probabilidad de que el resultado de la prueba 2 hubie- x
ra ocurrido por azar se calcula tomando como referencia una distribución particular, la dis-
tribución chi cuadrada. Ésta es lo que se denomina dish-ibución continua, lo cual significa
que podrían existir todos los valores posibles para chi cuadrada. Sin embargo, las pruebas que
x
producen un valor de 2 no pueden generar una gama en verdad continua de valores posi-
bles; ello será particularmente cierto con tamaños de muestra pequeños y un número redu-
cido de categorías. Por tanto, debajo de cierto tamaño de muestra y número de categorías
x
se sugería que la estadística 2 no tenía una distribución representada con exactitud por la
distribución de chi cuadrada.
Yates ideó una forma de corregir la continuidad para una tabla de contingencia de 2 x
2, la cual se cita a menudo en programas de computadora. En el ejemplo de género por es-
x
tatus de tabaquismo, la versión corregida da 2 = 0.417, p = 0.5185. Hace 20 años todavía
se consideraba apropiado reportar la versión corregida de Yates de 2 . Sin embargo, desde x
entonces se ha presentado una polémica para definir si resulta apropiada. Mi consejo estriba
en que, si las versiones corregidas y las no co1Tegidas de la prueba coinciden en la signifi-
cación del resultado, como en el ejemplo de los fumadores, entonces no hay problema: repor-
te la versión incorrecta. Empero, si ambas versiones difieren, repórtelas y haga hincapié en la
discrepancia. El lector puede formar sus propios juicios.
Frecuencias esperadas pequeñas. Otra manera de tratar de evitar el problema de que x2
no se refleje en la distribución cbi cuadrada, en ciertas circunstancias, consiste en tener fre-
cuencias esperadas de tamaño razonable. La regla usual dicta que todas las frecuencias
esperadas en una tabla 2 x 2 deben ser por lo menos cinco. En el caso de tablas mayores
que 2 x 2, al menos 80% de frecuencias esperadas han de ser por lo menos cinco. Tales res-

_ _ _ _ _ _A_n_ál_is_is_d_e_d_i_fe_r_en_c_ia_s_e_n_:_tr....:.e_d_o_s_n_iv_e_le_s_d_e_u_n.:...a_v.:...an_·a:.....b:.....le.::..._in....:.d...:.e!:...pe:.....n....:.d_ie:.....n_te.::...____Jfll5

tricciones significan que, aun cuando no utilicemos poder estadístico para guiar el tamaño
de muestra, desearemos un mínimo de cinco participantes por celda en la tabla de contin-
gencia, lo cual implica que un estudio que se analizará con una tabla de 2 x 2 tendrá por lo
menos 20 participantes. En el capítulo 16 se muestra cómo resolver por distintas vías el
problema de frecuencias esperadas pequeñas en tablas de contingencia mayores que 2 x 2.
Prueba de probabilidad exacta de Fisher. Fisher ideó una prueba para hacer frente a las
tablas de contingencia de 2 x 2 con muestras pequeñas. Por desgracia, se aplica sólo cuan-
do todos los totales marginales son fijos (donde los números del total se han especificado
·antes de llevar a cabo el estudio). En el ejemplo de los fumadores, los totales para hombres
y mujeres se fijaron en 44, mientras que para fumadores y no fumadores quedaron libres;
es decir, no se conocieron hasta que se recolectaron los datos. En realidad, es inusual tener
todos los totales marginales fijos y carece de sentido en el ejemplo de fumadores porque
significaría especificar cuántos fumadores y no fumadores hay que incluir en la muestra,
además de cuántos hombres y mujeres. No obstante, en el apéndice VI se proporciona el
método para calcular la prueba de probabilidad exacta de Fisher y en el XIV sus tablas de
probabilidad.
Prueba rápida de tabla de frecuencia de 2 x 2. Una manera preferible de tratar con frecuen-
cias esperadas pequeñas es una versión modificada de la prueba x2 que utiliza la ecuación
siguiente (proporcionada aquí porque no suele estar disponible en programas de compu-
tadora):
(N- 1) X [(A D) - (B C)f
x2 modificada (A+ B) X (C + D)
X

X (A + C)
X

X (B + D)

Como ejemplo, imagine que los investigadores exploran si tener una mascota mejora la es-
peranza de vida de las personas de edad avanzada. Seleccionan a 1O individuos con más de
75 años que no tienen mascota y viven solos. Eligen al azar a la mitad de la gente que ha-
bt'á de cuidar un perro. Después de dos años anotan cuántos sujetos con mascotas y sin ellas
siguen vivos.

Tabla 15. 9. Número de personas de edad avanzada vivas y muertas, considerando


si se les dio a cuidar un perro previamente.

Se les dio un perro No se les dio un perro

Aún viven 4 (A) 1 (B) 5


Muertas 1 (C) 4 (D) 5
5 5
\
226lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
. (l0 - l ) x[(4x4) - (lxl)f
X2 modtficada = ------------
(4 + 1) X (1 + 4) X (4 + 1) X (1 + 4)
9 X (16 - 1)2
SxSxSxS
3.24
Como en el ejemplo anterior de una prueba x2 en una tabla de contingencia de 2 x 2,
gl = l. La probabilidad de dos colas de este resultado es 0.05 < p < 0.1. Sin embargo, si
los investigadores predijeron que sería mayor el número de personas que sobrevivirían
si se les daba un perro, la probabilidad de una cola es apropiada, lo cual constituye la mi-
tad de la probabilidad de dos colas; es decir, 0.025 < p < 0.05.

Diseños int rasujetos: prueba de cambio de McNemar


Si tenemos datos intrasujetos para dos niveles de una VI con niveles nominales de medi-
ción, los datos violan los requisitos de la prueba x2 porque los puntos de datos no son in-
dependientes entre sí. La prueba de cambio de McNemar permite analizar tales datos cuando
pueden formarse en una tabla de contingencia de 2 x 2. Por ejemplo, si estuviéramos estu-
diando otra vez si se considera la psicología una ciencia antes de una charla sobre el tema
y tras ella, pero esta vez simplemente preguntamos en cada ocasión si se cree o no que la
psicología constituya una ciencia.
Tamaño del efecto y poder. Aunque la prueba de McNemar produce un valor de x2, no ten-
go la certeza de que el tamaño del efecto (w), usado para la prueba x2 convencional, sea
aplicable en este caso. Calcular el poder también se antoja problemático, a menos que lo
hagamos mediante la eficiencia de poder de la prueba con relación a la t intrasujetos. Para es-
tar en el lado seguro, debemos tomar el peor caso: cuando la eficiencia del poder puede ser
tan baja como 0.63. De acuerdo con esto, habremos de encontrar el tamaño de muestra pa-
ra la prueba t intrasujetos, con el tamaño del efecto y el nivel de poder requeridos, y mul-
tiplicarlo por 1.6. Como se anotó, para una prueba de una cola, con a = 0.05, y un tamaño
del efecto grande (d = 0.8), necesitaríamos una muestra de 11 para tener un poder de 0.8
con una prueba t intrasujetos. Por tanto, contaremos con una muestra de 11 x 1.6 = 17.6 o
18 personas con la prueba de cambio de McNemar.
Los datos pueden ponerse como se indica en la tabla 15.10.


_ _ __ _ _A_n_ál_is_is_d_e_d_i_fe_r_en_c_ia_s_e_n_tr_e_d_o_s_n_iv_e_le_s_d_e_u_n_a_v_ar_ia_b_le_in_d_e;_pe_n_d_ie_n_te_ ___,[227
Tabla 15.10. Número de personas que están de acuerdo o en desacuerdo con que la
psicología es una ciencia, antes y después de escuchar una charla.
Después
De acuerdo En desacuerdo
En desacuerdo 9 3
Antes
De acuerdo 6 o
Para esta prueba interesan sólo quienes han cambiado de opinión. De acuerdo con ello, la hi-
pótesis nula que se prueba es que el número de personas que cambian en una dirección será
el mismo que el de las que cambian en el otro sentido. Si etiquetamos las cuatro celdas
Después
De acuerdo En desacuerdo
En desacuerdo A B
Antes
De acuerdo e D

podemos calcular la prueba de McNemar por

(A- D) 2
(A+D)

(9 - 0) 2
(9+0)

81
9
9

~a prueba tiene gl = l.
La significación estadística de la prueba de cambio de McNemar. Según las tablas de la
distribución chi cuadrada del apéndice XIV, la probabilidad de que el resultado ocurra por
azar es 0.001 < p < 0.01. Como con las otras pruebas x2 , tal probabilidad es para una hipó-
tesis no direccional. Si hubiéramos planteado una hipótesis direccional de que más personas
cambiarían para estar de acuerdo en que la psicología constituye una ciencia de las que cam-
biarían para estar en desacuerdo con ello, podríamos dividir la probabilidad entre dos. En
este caso, 0.0005 < p < 0.005.
1
~L__________________In_v_e_st_ig~a_c_io_·n__c_u_a_nt_i_
ta_t_iv_a_e_n~p_s_ic_o_lo~g~ía________________________

Resumen
Cuando se comparan dos niveles de la VI puede utilizarse la gráfica siguiente para decidir
cuál es la prueba estadística apropiada (sin embargo, recuerde que si la homogeneidad de·
la varianza no está presente pero se satisfacen los otros requisitos de una prueba t entre su-
jetos, debe usar una tipo t de Welch):

No----

l Nominal
\

Prueba de rango Prueba de


Prueba e Prueba t Prueba Ul!e con signo de Prueba de
contingencia cambio
entre sujetos lntrasujetos Mann-Whitney Wllcoxon para de McNemar
pares equiparados Xl

Figura 15 .3. Pruebas estadísticas para diseños de más de una variable independiente
con dos niveles.

En el capítulo siguiente se explicará el análisis preliminar que puede aplicarse en diseños


donde se requiere una variable independiente con más de dos niveles.
16
Análisis preliminar de diseños
con una VI de más de dos niveles

Introducción
Hasta ahora hemos mostrado el análisis de diseños que incluye una sola variable indepen-
diente (VI) con un máximo de dos niveles. En el presente capítulo se describe cómo reali-
zar análisis de diseños con una sola VI y más de dos niveles.

Pruebas paramétricas
Para ejemplificar, regresaré al caso presentado en el capítulo 9. Los investigadores desean
comparar el recuerdo de los participantes en tres condiciones: utilizando el sistema nemo-
técnico de palabras gancho, .el método de ubicación y la aplicación de ningún sistema ne-
motécnico (la condición control). Para evitar efectos de práctica y los problemas de tener
que igualar listas en grado de dificultad, se elige un diseño entre sujetos.
Los psicólogos tienen ahora un diseño que incluye una variable independiente (tipo
de nemotécnica) con tres niveles: palabras gancho, método de ubicación y condición con-
trol. También se cuenta con una sola VI (número de palabras recordadas). Cuando llegue
el momento de analizar los resultados del trabajo, podrían emplearse las pruebas t para com-
parar pares de niveles. Sin embargo, se efectuarán tres pruebas t: una entre palabras gancho
y método de ubicación, una entre palabras gancho y grupo control y una entre método de
ubicación y grupo control. Este enfoque sería posible, pero un problema estadístico lo vuel-
ve poco aconsejable.

----------------------------------------------------------~229
23QlL_______________I_nv_e_s_tig~a_c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si_co_l~og~ía_____________________
La razón de la prueba de significación estadística consiste en que cuando decidimos
aceptar nuestra hipótesis y rechazar la nula asumimos el riesgo de cometer un error tipo
l. Imagine que establecimos a= 0.05. Decimos que si el resultado que encontramos pu-
diera ocurrir realmente por azar, y si repetimos en gran número de ocasiones la investiga-
ción y analizamos los datos cada vez, esperaríamos que en alrededor de 5% de las veces
el resultado sería tan extremo o más extremo que éste y, por tanto, se tomaría estadística-
mente significativo. De este modo, si realizamos más de una vez la prueba aumentamos
la probabilidad de encontrar un resultado significativo, aunque el resultado se daba en rea-
lidad al azar.
Puede tratar de permitirse la realización de varias pruebas si se reducen el nivel de a
y, por ende, el peligro de cometer. un error tipo J. Sin embargo, tales técnicas son más bien
inexactas. Se considera mejor, al menos inicialmente, hacer una sola prueba que compren-
da todos los datos recolectados en una pieza de investigación. Si la prueba inicial demuestra
que hay una diferencia significativa entre los niveles de la variable independiente se justifi-
cará que exploremos más los datos para tratar de identificar las contribuciones específicas
de tal efecto significativo.
La prueba más apropiada para analizar el experimento sobre memoria descrito es el
análisis de varianza (denominado generalmente A NOVA, analysis ofvariance). El ANOVA
puede considerarse una extensión de la prueba t porque compara las medias de los diver- "'-.
sos niveles de la variable independiente y, como sucede con la prueba t, la hipótesis nula
radica en que las medias no difieren. En términos formales, la hipótesis nula es que en rea-
lidad los tres conjuntos de datos del grupo provienen de la misma población y, por tanto,
tienen la misma media. Además, como ocurre con la prueba t, aunque haya una diferencia
entre las medias, si la variación de las puntuaciones intragrupos es grande, no se obtendrá
una diferencia significativa. No obstante, como tratamos con tres y no con dos medias, la
manera de evaluar la diferencia entre ellas consiste en ver cuánto varían.
Para percibir la natUraleza del ANOVA es necesario volver a presentar ciertos concep-
tos y luego aplicarlos a los conocimientos existentes. Ello será de ayuda para leer la tabla
de resumen obtenida con la realización de un ANOVA.
Como se mostró en el capítulo 9, una forma de saber en qué medida una puntuación es
típica o atípica consiste en calcular la distancia que guarda respecto a la media de su grupo
(es decir, su desviación de la media del grupo). Si queremos medir la dispersión en un gru-
po de puntuaciones podemos elevar al cuadrado la desviación de cada una de éstas y sumar
todos los cuadrados respectivos; tal operación se conoce como suma de las desviaciones al
cuadrado y suele reducirse a suma de cuadrados. Si dividimos la suma de los cuadrados
entre los gl apropiados obtenemos la varianza del grupo de puntuaciones, descrita por lo
general como media de cuadrados en el ANOVA. Si la hipótesis nula es correcta, todas las
_______________A_n_á_li_si_s~p_re_l_im_i_na_r_d_e__
d,_·se_ñ_o_s_c_o_n_u_n_a_V_I_d_e_m_a_·s_d_e_d_o_s_n_i_ve_L_es______~f:ZJ1

puntuaciones provienen de la misma población; los diferentes niveles de la VI no producen


diferencias en la VD. El ANOVA depende de que hay más de una manera de estimar la va-
rianza de la población; en particular, requiere un estimado que se derive de la varianza en-
tre los niveles de la VI y otro de la varianza en los niveles.
El estimado de la varianza de la población proveniente de dentro de los niveles de la
VI puede deberse sólo a las diferencias individuales, definidas a veces como error. Ello re-
sulta cierto sin importar si la hipótesis nula es verdadera o falsa. El estimado de la varian-
za de la población proveniente de entre los niveles de la VI contendrá varianza debida a las
diferencias individuales sólo si la hipótesis nula es correcta. Sin embargo, si la hipótesis
nula es falsa, también contendrá varianza debida a la diferencia entre los tratamientos.
El ANOVA tiene su propia estadística: la prueba F o de razón F Se considera de razón
porque calcula la razón entre la varianza que puede explicarse debido a las diferencias en-
tre los grupos y el error o varianza sin explicar. Por tanto,

• estimado entre grupo de varianza de la población


Razon F = . d o .mtragrupo d e vananza
est1ma . d e 1a po bl ac10n
..

En el ejemplo, ello significa lo siguiente:

variación entre las condiciones de recuerdo


RazónF =
variación en las condiciones de recuerdo

Si la hipótesis ~la esy.e~a, ambos estimados de la varianza de la población deben ser


casi iguales. En este caso, la razón F habrá de ser aproximadamente igual a uno. &-
Sin embargo, si la ~tesis nula es falsa, el estimado de la variañZ'a de la población
que se obtiene de buscar la variación entre gtÜpos debe ser mayor. En este caso, la razón F
será ~qlle..!l~· k -
En el proceso de calcular los estimados de la varianza debidos a diferentes fuentes, la
suma general de los cuadrados de los datos (es decir, la variación total de los datos) está di-
vidida (o segmentada) en las diversas fuentes que lo producen. Con ello se identifica una
cantidad especifica de la variación general como si estuviera vinculada con un tratamiento
particular y su variación de error relacionada. Por tanto, otra forma de considerar la razón
Fes verla como sigue:
variación entre las medias
F = ----------------
variación (error) inexplicada

La manera en que ocurre la segmentación depende del diseño de investigación y se expli-


cará a medida que se presente cada diseño.
232lL-______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
Diseños entre sujetos
La forma más simple del ANOVA para interpretar (y calcular) es un diseño entre sujetos,
como el del ejemplo de la memoria. En seguida se muestra que la variación general está di-
vidida en dos fuentes:

Entre grupos lntragrúpo (error)


(tratamiento)

Figura 16. 1. Segmentación de varianza en un ANOVA entre sujetos.

Habrá sólo una razón F, que será de la forma siguiente:


Varianza entre grupos
F = Varianza intragrupos

Imagine que los investigadores seleccionaron a 1Opersonas para incluirlas en cada grupo
del experimento. (Dejaré para más adelante, en este capítulo, el análisis de poder.) Les die-
ron las instrucciones apropiadas y luego les presentaron 20 palabras. Después de 24 horas
les pidieron que dijesen todas las palabras que pudieran, en cualquier orden. La hipótesis
de investigación es que el método de ubicación produce el mejor recuerdo. Sin embargo,
note que el ANO VA no puede probarla directamente. En esta etapa, los investigadores só-
lo pueden preguntar si el recuerdo de los tres grupos difiere de manera significativa. Por
tanto, su hipótesis de investigación tiene otra hipótesis, preliminar, que se prueba primero:
HA: La media de recuerdo de las tres condiciones es diferente,
que tiene la hipótesic; nula
H 0 : La media de recuerdo de las tres condiciones no es diferente.

Formalmente, la hipótesis nula consiste en que son iguales las medias de la población de
las diferentes condiciones. En el caso de tres medias, H 0 sería !lt = !A:2 = !!J·
Si la hipótesis preliminar no está sustentada, la de investigación tampoco lo estará y no
valdrá la pena probarla. Sin embargo, si aquella hipótesis lo está, convendrá llevar a cabo un
análisis adicional (como se describe en el capítulo 18) para ver si la hipótesis de investiga-
ción también está sustentada.
_______________A_n~á~li~si~s~p~re~l~im~i~n~ar_d~e~d~is~en~-o~s_c~o~n~u~n~a_V~I~d~e~m~a~·s~d~e~do~s~n~i_ve~l~e~s____~¡-233

En seguida se presenta un resumen de los resultados del experimento:

Tabla 16. 1. Medias y desviaciones estándar de recuerdo de palabras para las tres
condiciones de memoria.

Control Palabra Ubicación


Media 7.2 8.9 9.6
DE 1.62 1. 91 1.58

12.---------------------------------------~

"'
10
~ 11
"'O
5u 10
~
"'
~ 9
.Cl
10
~ 8
CIJ
~ 7
~
E
.:;:¡
6
z
5 L---------~--------~--------~--------_J
Control Palabras gancho Método de ubicación
Estrategia nemotécnica

Figura 16. 2. Medias y desviaciones estándar de recuerdo de palabras para las tres
condiciones de memoria.

Podemos ver que ~as medias son diferentes. Sin embargo, en la figura se aprecia cierta super-
posición de los tres conjuntos de puntuaciones. Para probar si las diferencias entre las
medias son estadísticamente significativas, aplicaremos un ANO VA a los datos. Véase en el
apéndice VU un ejemplo trabajado. En seguida se advierten los resultados del análisis; el tér-
mino una vía se utiliza para describir un ANO VA realizado en un diseño con una sola VI:

Tabla 16.2. Tabla de resumen de un ANOVA de una vía entre sujetos donde se compara
el recuerdo mediante las tres estrategias nemotécnicas.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F p


Entre grupos 2 30.467 15.233 5.213 0.0122
lntragrupos 27 78.9 2.922
Total 29 109.367
2J4l~..________l_nv_e_s_ti.::.ga_c_io_·n_cuantitativa en psicología
Interpretación de un ANOVA de una via entre sujetos
Explicaré los diferentes elementos de la tabla 16.2. La primera columna ("Fuente") indica
a qué se refieren las cifras de las otras columnas y, en particular, a qué se atribuyen las
cantidades de la variación de los datos. En este caso, se observa que parte de la variación
de las puntuaciones se debe a las diferencias entre los grupos; ésta es la variación que nos
interesa, pues indica las diferencias entre la media de recuerdo de los tres grupos. A con-
tinuación tenemos la variación intragrupos, que es la variación de error y que obedece a las
diferencias entre personas en los grupos. Por último, tenemos la variación total para el
experimento.
En la columna siguiente se indican los gl. Observe que los gl de los grupos es 2. Ello
representa simplemente el número de grupos menos uno, pues buscamos la variación entre
las medias de éstos. Los gl del total son 29, el número de participantes usado en el experi-
mento menos uno. Los gl para intragrupos es 27, la diferencia entre los gl totales y los gl
entre grupos. El gl intragrupo también puede calcularse al saber que hay tres grupos y cada
uno tiene nueve grados de libertad; es decir, el número de cada grupo menos uno.
En la columna que sigue se presenta la suma de cuadrados de cada fuente de variación
en los datos. Recuerde que tal suma constituye una estadística que describe la cantidad de
dispersión de los datos. En la columna próxima se presenta la media de cuadrados para cada
fuente de variación del estudio. Si toma la suma de cuadrados de una fuente y la divide entre

-
su gl, obtendrá la media de cuadrados apropiada; ésta constituye los estimados de varian-
za. La columna siguiente proporciona la razón F, que se encuentra en este caso dividiendo
la media de cuadrados para entre grupos entre la media de cuadrados para intragrupo~
media de cuadrados d~rror).

Colas de prueba
Con las pruebas estadísticas presentadas hasta ahora queremos conocer la cola de prueba
por emplear. Sin embargo, cuando se prueban más de dos niveles de variables independien-
tes en un ANOVA no hay elección: la prueba equivaldrá a la de dos colas. Para encontrar
la razón de ello, regresemos a la naturaleza de la hipótesis nula en diseños de investigación
analizados con ANOVA. Dicha hipótesis establece que no difieren las medias de las diferen-
. tes condiciones (pues provienen de la misma población). Según la hipótesis alternativa, sí
difieren (ya que provienen de poblaciones distintas). Con el ANOVA descrito es imposible
probar hipótesis más precisas, como ésta: El recuerdo del grupo control será peor que el
de las otras dos condiciones.
Si piensa en ello, verá que cuando hay tres niveles de una VI, una hipótesis precisa
es sólo una de muchas otras hipótesis direccionales que podrían establecerse, en lugar de
las dos posibles cuando hay sólo dos niveles de una variable independiente. Si deseamos
probar una hipótesis direccional más precisa, primero comprobaremos si se sustenta la no
_ _ _ __ _ _A
_ :n_:á_:li_:_sT_:_
·s...!:p.:...re:..:l.:..:..im
.....:i.:..:.
na:..:r.....:d:..:e_:d:..:i:..:se.:..:._ñ_:_o.:..s_:_co.:..n.:...u.:..:..n_.::a.:...V
_I_.::d:..:
e _m.:..:.a::.:
' s_d:..:e_d::...:o_:_s_n_iv_.::
e_le__s _ _ __¡llli
direccional. En caso afmnativo, podemos explorar más mediante las técnicas descritas en
el capítulo 18. De lo contrario, tendremos hechos escasos para formular una hipótesis di-
reccional.

Evaluación de la significación estadistica de una razón F


Por lo general, cuando calcula un ANO VA por computadora se le presenta la significación
de cualquier razón F resultante. Sin embargo, vale la pena tener la posibilidad de leer las
tablas de significación para razones F. Una razón F se evalúa de manera un tanto diferen-
te de las otras pruebas descritas. Como es la razón entre dos estimados de varianza (media
de cuadrados), cada una con su propio gl, necesitamos ambos gl para evaluar la significa-
ción de una razón F. En seguida se observa un extracto de una tabla de las probabilidades
de razones F del apéndice XIV:

Tabla 16.3. Extracto de las tablas de probabilidad de a= 0.05 para una razón F.
gl1 ~ \.'\.\..{'~ o G <j

gl2 2 3 4 5 6 7 8 9 10 12 14
26 ~ 3.371 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09
27 4.21 3.35; 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08
28 14.Wl3.341 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06

Es común que las tablas de significación para razones F vengan en grupo, con una tabla
para cada nivel de significación. Con frecuencia, las tablas están limitadas a a = 0.05,
a= 0.025, a= 0.01 y a= 0.001, o inclus6 un rango más pequeño, como sucede en el pre-
sente libro, que incluye sólo tablas para a = 0.05 y a = 0.0 l. Así, sólo podemos decir que
una razón F alcanza o no alcanza significación estadística y no es posible ser mucho más
preciso que eso.
En la tabla 16.3, los grados de libertad para tratamiento se muestran en la primera fi la
(gl 1), de modo tal que hay una columna dedicada a cada diferente gl de tratamiento. El gra-
do de libertad del término de error se halla en la primera columna, de modo que cada hilera
tiene un gl distinto para el término de error (en este caso, la fuente de varianza intragru-
pos, gl 2). Por tanto, a fin de localizar el valor crítico para que F sea significativo a p = 0.05
buscaremos en la columna para gl = 2 y la fila para gl = 27. Ello revela que el valor crítico
es F = 3.3 5. Como el valor de F encontrado tras nuestro análisis ~ayor que iste, dir.iª:
m.os_que nuestro resultado es estadísticamente sigrlificativo en elni'{~p_::_ 0.05 . Podemos
seguir buscando en las tablas niveles de menor significación, en cuyo caso encontraríamos
que p cae entre 0.01 y 0.05 (es decir: 0.01 < p < 0.05).
236 Investigación cuantitativa en psicología

Por tanto, los investigadores pueden rechazar la hipótesis nula y aceptar la de investi-
gación preliminar de que el recuerdo es diferente en las tres condiciones. Recuerde que te-
nían una hipótesis más específica. Puesto que se ha sustentado la hipótesis de investigación
preliminar, se justifica la aplicación de análisis adicional para evaluar su hipótesis más es-
pecífica. Quiero posponer la descripción del análisis hasta el capítulo siguiente, ya quepa-
ra entonces habré presentado las diversas formas del ANOVA.

Reporte de los resultados de un ANOVA


Personalmente, prefiero reportar la tabla de resumen de ANO YA completa. Sin embargo, mu-
chos investigadores sólo informan los detalles de la razón F y su nivel de significación. Con
diseños más completos, que requieren muchas razones F, la última práctica puede volver-
se la preferida. Los detalles mínimos necesarios son los s iguientes: Hubo un efecto significa-
tivo de la estrategia nemotécnica (F(2.27) = 5.213, 0.01 < p < 0.05, MCeslralegia = 15.233).
Ello supone el reporte de la fuente de la razón F, los gl apropiados, la razón F, el nivel de
probabilidad y la media de cuadrados para el tratamiento. Tal grado de detalle permite al
lector reconstruir la tabla de resumen de ANOYA. Si se conoce la probabilidad exacta, de-
be informarse en lugar de 0.01 < p < 0.05.

Diseños intrasujetos
Los diseños intrasujetos se conocen también como de mediciones repetidas. En uno con
una sola variable independiente puede considerarse que la variación total de los datos tie-
ne dos fuentes principales: diferencias entre los participantes (varianza entre sujetos) y en
éstos (varianza intrasujetos); es decir, la manera en que los individuos varían entre condi-
ciones distintas. La varianza intrasujetos puede subdividirse en varianza entre los niveles
de Y1 (las condiciones, que son la varianza de los tratamientos) y la varianza por la manera
en que los diversos participantes mostraron una pauta distinta de respuesta entre las condi-
ciones (tratamiento por sujetos, conocido también como varianza de error o varianza de
residuo). Un ejemplo de lo último sería si el primer participante ha recordado más palabras
en la condición de palabras gancho, mientras que el segundo ha recordado más en la de ubi-
cación.
De acuerdo con la figura 16.3, podrían calcularse dos razones Fa pa1tir de este diseño:

variación entre sujetos


F =
variación de error

y
variación de tratamiento
F
variación de error
_______________A_n_á_lis_i_s~p_re_li_m_i_na_r_d_e_d_i_se_ñ_o_s_c_o_n_u_n_a_V_I_d_e_m_á_s_d_e_d_o_s_n_iv_e_le_s____~f:2J7

Tratamiento
por sujetos
(error)

Figura 16. 3. Segmentación de varianza en un ANOVA intrasujetos.

La primera razón F indica simplemente-si los participantes difieren de modo significativo


y, como no suele interesamos, a menudo los programas de computadora no lo reportan. La
segunda razón F nos muestra si las condiciones de tratamiento difieren de manera significa-
tiva. Aunque por lo general no nos interesa saber si hay diferencias entre los participantes, la
ventaja de este diseño radica en que puede eliminarse del análisis la variación de puntuacio-
nes que se considere debida a la diferencia entre participantes; así, permanecerá una peque-
ña cantidad de varianza no atribuible a la diferencia entre los tratamientos. Por tanto, éste
es un diseño más eficiente y con mayor poder estadístico que uno entre sujetos.
Tenga en cuenta que no puede haber varianza atribuible a la variación intraparticipan-
tes en un diseño entre sujetos, pues cada participante proporciona sólo un punto de datos y,
por tanto, no es posible saber cómo varía la misma persona entre niveles de una VI.
Para el ejemplo, imagine que un equipo de investigadores busca identificar los efectos
de la presencia de otras personas en el juicio contra transgresores de la ley. Los participan-
tes reciben la descripción de un delito y deben decidir cuánto tiempo pasará el delincuen-
te en la cárcel. El experimento incluye tres condiciones: en la primera, cada participante está
solo y no conoce los juicios de los demás; en la segunda, cada participante está solo, pero
puede ver en un monitor de computadora lo que los otros "decidieron"; en la tercera, cada
pa1ticipante está en un grupo y conoce lo que los demás "decidieron". Las decisiones que
los participantes saben que los demás tomaron son, por supuesto, preestablecidas por los
experimentadores, pero los participantes lo desconocen. Hay tres delitos, que un panel de
jueces ha considerado tienen una gravedad similar, de modo que los participantes no tienen
que formular sus tres juicios sobre el mismo crimen. Se instruyó a los cómplices de los ex-
perimentadores para que sugirieran una sentencia larga, aun cuando se estiman leves los
delitos.
~L__ _ _ _ _ _ _ _ _ _ _ _ _ _ _In_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

La hipótesis experimental es que los participantes recomendarán sentencias más lar-


gas cuando están enterados de lo que los demás recomendaron, e incluso mayores sen-
tencias cuando estén en presencia de los cómplices. Sin embargo, recuerde ·que el ANO VA
inicial no puede probar una hipótesis direccional; sólo la de investigación preliminar:
HA: La media de la duración de la sentencia recomendada por los participantes diferi-
rá entre las tres condiciones.
La hipótesis nula será la siguiente:
H 0 : La media de la duración de la sentencia no será diferente entre las tres condicio-
nes.
Si se sustenta la hipótesis preliminar de investigación estará justificado el análisis para eva-
luar la hipótesis de investigación específica.
El experimento se ejecuta con 1Oparticipantes y se anota para cada decisión la varia-
ble dependiente (duración de la sentencia, expresada en meses). Una vez más, el poder se
analizará posteriormente. En seguida se aprecian los resultados:

Tabla 16.4. Las medias y las desviaciones estándar del tiempo de la sentencia
(expresada en meses) sugerida por los partfcipantes.

Solo Computadora Grupo

Media 14.7 18.2 20.0


DE 6.55 4.52 5.48

~Cl.l
.§.
·~ 20
e
~
e
Cl.l
"'
~
~ 10
g_
E
Cl.l
i=

Solo Computadora Grupo


Condición en que se toma la decisión
Figura 16.4. Las medias y las desviaciones estándar del tiempo de la sentencia
(expresada en meses) sugerida por los participantes.
An_á_h_
_______________ - sJ_
·s~p_re_l_im_i_na_r_d_e_d_i_se_ñ_o_s_co_n__un_a_V_I_d_e_más_d_e_ d_o_s_n_iv_e_le_s____~j239
__

Los resultados sugieren que las sentencias recomendadas difieren entre las tres condiciones.
Sin embargo, note que también hay una dispersión alrededor de las medias y gran superpo-
sición entre las tres condiciones. Como es usual, las estadísticas descriptivas sólo pueden
indicar en qué dirección van los resultados; no reflejan la probabilidad de que éstos hubie-
ran ocurrido por azar. Por ende, no podemos decidir entre la hipótesis nula y la de investi-
gación hasta que hayamos aplicado un ANOVA a los datos.
En seguida se muestra la tabla de resumen para el análisis de varianza en el experi-
mento:

Tabla 16.5. Tabla de resumen para el ANOVA de una vía intrasujetos que compara las
sentencias dictadas a delincuentes cuando las decisiones se toman en tres
condiciones.
Fuente gl Suma de cuadrados Media de cuadrados Razón F p
Entre sujetos 9 776.3 86.256 24.491 0.0001
lntrasujetos 20 208.667 10.433
Tratamientos 2 145.267 72.633 20.621 0.0001
Residuo 18 63.399 3.522
Total 29 984.967

Observe que la tabla de resumen del ANOVA de un diseño intrasujetos parece más compli-
cada que la de uno entre sujetos, lo cual se debe a que podemos identificar más fuentes pa-
ra la variación entre todas las puntuaciones.
La primera columna divide inicialmente las fuentes de varianza en dos partes. Existen
la varianza entre sujetos y la intrasujetos. Ésta se subdivide en lo que se debe a Jos trata-
mientos (diferencias entre las condiciones) y el residuo (el error o la varianza que no pue-
de explicarse con las diferencias entre sujetos o entre las condiciones).
La segunda columna informa que los grados de libertad totales son 29; ello se produ-
ce tras anotar cuántas puntuaciones tenemos (tres por cada uno de los 10 participantes) y
restar 1 al resultado. Los 29 gl se dividen inicialmente en 9 para la varianza entre sujetos
(los 10 participantes menos uno) y en 20 para la intrasujetos (la diferencia entre el gl total
y el gl entre sujetos). El gl intrasujetos puede dividirse además en 2 para los tratamientos
(el número de tratamientos menos uno) y en 18 para el residuo (el número de condiciones
menos uno, multiplicado por el número de participantes menos uno: [3 - 1] x [ 1O- 1]).
La tercera columna indica el tamaño de la suma de las desviaciones al cuadrado (suma
de cuadrados) para cada una de las fuentes de varianza; véase en el apéndice VII una des-
cripción de cómo se obtiene esto. La suma de cuadrados total se ha dividido entre lo atri-
buible a la variación entre sujetos e iotrasujctos. Luego, ésta se subdivide en la variación
debida a los tratamientos y al error (el residuo).
~L----------------In_v_e_st_i~
ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________

Ahora estamos en posición de calcular los estimados de la varianza a partir de las diver-
sas fuentes (la media de cuadrados, o MC) dividiendo la suma de los cuadrados entre los
grados de libertad apropiados. Tales estimados se muestran en la cuarta columna. Recuer-
de q ue con la hipótesis nula cada uno es un estimado de la misma varianza, la de la pobla-
ción única de puntuaciones, de la que se considera proviene la muestra de puntuaciones.
Según la tabla de resumen (la 16.5), tenemos tres estimados para la varianza de la po-
blación y a partir de ellos se calculan las dos razones F: una para la diferencia entre suje-
tos y otra para la diferencia entre las condiciones.
La MC para el res iduo contiene la variación que no se explica por las variaciones ge-
neral entre sujetos o general entre condiciones. Si los participantes no difieren consistente-
mente en la duración de las sentencias que recomiendan, la MC para sujetos también debe
incluir sólo un estimado de la varianza general de puntuaciones. Un ejemplo de participan-
tes que difiere de manera consistente se tendría si el primer participante siempre diera una
sentencia más rígida que el segundo, sin impmtar la condición experimental. Ello s ignifi-
caría que la puntuación general para la sentencia dada por el participante uno sería mayor
que la del participante dos. Si los participantes difieren de manera consistente, la MC para
sujetos contendrá las variaciones general y entre sujetos. Por tanto, la razón F para sujetos
se encuentra con la MC para entre sujetos entre la MC para el res iduo:

MC entre sujetos
F(sujetos) = MC residuo

Si los partic ipantes no difiere n de manera consistente en sus juicios, F (sujetos) debe ser
aproximadamente igual a 1; si difieren, F(sujctos) será mayor que l. Sin embargo, tenga en
cuenta esto: no es una consecuencia automática que, como una razón Fes mayor que 1, re-
sulta estadísticamente significativa; que el nivel crítico de F sea estadísticamente significa-
tivo depende de factores como el tamaño de la muestra y el número de niveles de la VI.
De igualfT!odo, si las condiciones generales no producen una diferencia en la duración
recomendada de la sentencia, la MC para los tratamientos sería sólo un estimado de la va-
rianza general entre puntuaciones (error). Por tanto, la razón F para tratamientos se encuen-
tra d ividiendo la MC para tratamientos entre la MC para residuos:

MC tratamientos
F(tratamientos) = MC residuo

Si la hipótesis nula es correcta. F(tratamicntos) será aproximadamente igual a l. mientras que si


la hipótesis nula es falsa será mayor que l.
_ _ _ _ _ _ _A_n_á_li_si_s...:...p_re_l_im_i_na_r_d_e_d_i_se_ñ_o_s_co_n_u_n_a_V_I_d_e_m_a_·s_d_e_d_o_s_n_iv_e_le_s_ ___.rz¡.i

Interpretación de un ANOVA de una via intrasujetos


Se nos proporcionan dos valores de probabilidad: uno para la diferencia entre los participan-
tes y uno para la diferencia entre las condiciones. Si la computadora no da probabilidades,
pueden utilizarse las mismas tablas F descritas en la sección sobre ANOVA para diseños
entre sujetos (véase el apéndice XIV). Observe que ambas relaciones de F son estadísti-
camente significativas. La primera se relaciona con un factor que no estamos probando: si
los participantes difieren en su tendencia a sugerir duraciones de sentencia. Que esto sea
significativo nos indica simplemente que, al parecer, hay diferencias entre los participan-
tes en cuanto al tiempo de las sentencias que sugieren, pero esto no resulta sorpresivo ni,
como se mencionó, constituye algo en lo que por lo general estemos interesados.
La hipótesis experimental se estudia con la razón F para tratamiento. En este caso, se
sustenta la versión preliminar de la hipótesis experimental. Las recomendaciones sobre la
duración de la sentencia para un delito sufren la influencia del conocimiento de los juicios
ajenos. Para probar la hipótesis direccional de que el tiempo de la sentencia será mayor
cuanto más grande sea la proximidad a otros juicios, esperaremos hasta que sepamos cómo
comparar las condiciones individuales; ello se muestra en el capítulo 18. Lo que sí sabe-
mos es que vale la pena efectuar análisis adicional.

Reporte de los resultados de ANOVA de una via intrasujetos


Como he mencionado, prefiero repmtar la tabla de resumen completa para el ANOVA. Sin
embargo, la convención estriba en que informe simplemente los detalles relevantes de ca-
da razón F, incluida una explicación sobre las conclusiones que extraiga de ella. Aunque la
razón F entre sujetos no fue relevante, si no la reporta, quien lea el reporte no podrá recons-
truir la tabla de resumen original. De acuerdo con esto, lo idóneo consistiría en informar
los resultados como sigue:

Hubo un efecto significativo de participantes (F(9,JB) = 24.491, p = 0.0001, MCparticipantes =


86.256). Había también un efecto significativo de tratamiento (F(2.1B) = 20.621, p = 0.0001,
MCtratamiento = 72.633).

Los supuestos del ANOVA


Recordará que el uso de una prueba t requiere que se satisfagan ciertas suposiciones acer-
ca de la naturaleza de los datos. El uso del ANOVA también está restringido a determinadas
situaciones.
El tipo de ANO VA que he descrito es una prueba paramétrica. Las restricciones de su
uso se relacionan con el nivel de medición, la naturaleza de la distribución, la naturaleza
de la varianza y la independencia de las puntuaciones. Sin embargo, como demostraré, el
242l~ _______________l_n_ve_s_ti~ga_c_io_·n_c_u_a_n_tit_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
ANOVA puede tratar hasta cierto punto casos en que se contravienen algunas de tales
suposiciones. En otras palabras, el ANOVA es una prueba robusta.

Nivel de medición
Igual que otras pruebas paramétricas, esta versión del ANO VA es apropiada sólo cuando la
variable dependiente es una medición de intervalo o de razón con por lo menos 20 valores
posibles en la escala.

Homogeneidad de varianza
Como sucede con la prueba t entre sujetos, el ANOYA entre sujetos supone que la varian-
za para la población de puntuaciones de cada una de las condiciones es la misma.

Distribución normal
A semejanza de la prueba t entre sujetos, el ANOYA entre sujetos supone que las puntua-
ciones de cada una de las condiciones provienen de una población que tiene una distri-
bución normal.

Independencia
El ANOVA supone que las puntuaciones de una condición son independientes unas de otras;
en otras palabras: que las de una persona no se han afectado por las puntuaciones de otra.
Ello no implicaría un problema en un experimento sobre recomendaciones de tiempo de
sentencia, pues no incluimos en nuestro análisis las sugerencias de los cómplices. Sin em-
bargo, si hubiéramos atendido los juicios de los participantes después de analizar el tema
en grupos y los hubiéramos incorporado todos en el análisis, cada juicio en una condición
no sería independiente de los demás en un grupo.

La robustez del ANOVA


El ANOVA puede a~eptar, hasta cierto punto, la contravención de algunas de sus suposi-
ciones y aún ser una prueba válida. No obstante, si las suposiciones apenas se cumplen y si
más de una deja de cumplirse, aumentaremos la posibilidad de cometer un error tipo I o II.
Siempre que las muestras de un diseño entre sujetos sean casi del mismo tamaño, la re-
comendación consiste en que el ANOVA puede hacer frente a diferencias de varianza entre
los grupos, de tal forma que la varianza mayor puede ser basta el triple de la menor. Algu-
nos autores (por ejemplo, Howell, 1997) permiten que la diferencia sea hasta del cuádru-
ple. Observe que en ninguno de los ejemplos dados antes las varianzas difieren en más del
An_á_h_·s,_·s...:..p_re_l_im_i_na_r_d_e_d_i_se_ñ_o_s_co_n_u_n_a_V_I_d_e_m_ a_·s_d_e_d_o_s_n_iv_e_le_s_ ____J¡243
_ _ __ ____

triple. Si lo hacen, tal vez haya alguna manera de transformar los datos para reducir la va-
rianza (véase en el apéndice V cómo transformar datos). De modo poco usual, como con la
:a-
prueba t, hay una versión del ANO VA (la fórmula de Welch, F') diseñada para usarse con los
11'-
datos sin homogeneidad de varianza. En el apéndice VII se proporciona la fórmula de Welch
y un ejemplo de su empleo. Si hay tamaños de muestra desiguales, trate los datos como si
111.-
tuvieran varianzas heterogéneas si la varianza mayor es más del doble que la menor.
En cierta medida, también puede contravenirse la suposición de que la distribución es
normal en la población de puntuaciones. Por desgracia, a menudo no sabemos cuál es la
distribución de la población porque tenemos sólo las puntuaciones de la muestra. Reco-


miendo producir una gráfica de las frecuencias y, si la distribución difiere marcadamente


de la normal en cualquiera de las condiciones, los datos pueden transformarse otra vez
para tomarlos más normales.
Conforme al razonamiento de Zimmerman y Zumbo (J 993), si tiene tanto heterogenei-
dad de varianza como distribuciones no normales convierta los datos en rangos y analice
éstos mediante la fórmula de Welch.

Trato con falta de independencia


Si en cierta condición los datos no son independientes entre sí, podemos generar puntua-
ciones independientes. Si las puntuaciones se toman después de que los participantes ana-
lizaron las recomendaciones sobre el tiempo de la sentencia, podemos tomar la media de
las puntuaciones de cada grupo de discusión y utilizar las medias como la variable depen-
diente. El problema con este movimiento radica en que reducirá el número de puntuaciones
11.:- que estamos analizando y así disminuiremos el poder de nuestra prueba; en otras palabras:
m aumentaremos la posibilidad de cometer un error tipo II. Sin embargo, si no empleamos las
medias violaríamos seriamente las suposiciones del ANOVA y, por tanto, crecería la posi-
bilidad de incurrir en un error tipo l.

Diseños intrasujetos
Esfericidad (o circularidad)
El ANOVA intrasujetos comprende otra suposición que los datos deben satisfacer: la esfe-
ricidad. Si buscáramos para cada participante la diferencia entre su puntuación en dos de
los niveles de una VI (por ejemplo, la sentencia dada cuando está solo y cuando se encuen-
tra en grupo), tendríamos un conjunto diferente de puntuaciones; cuyas varianzas podría-
mos calcular. Si hallamos la diferencia de las puntuaciones en cada par de niveles de la VI
y calculamos la varianza de cada conjunto de diferencia de puntuaciones estaríamos en po-
¡¡:;._ sición de comprobar si la esfericidad se hallaba presente en los datos. Estaría presente si
11:... las varianzas de las puntuaciones diferentes fueron homogéneas.
244lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a ____________________

Cuando la esfericidad no está presente, hay por lo menos dos maneras de sortear el pro-
blema. Una consiste en utilizar otro tipo de ANOVA, el ANOVA multivariado o MANOVA.
Esta técnica se describe brevemente en el capítulo 21, pero su método de cálculo está más
allá del objetivo del libro. Otro método se deriva del hallazgo de que, incluso cuando la es-
fericidad no está presente, la razón F calculada de un ANO VA intrasujetos todavía es ade-
cuada para la distribución F.
Sin embargo, es necesario ajustar los grados de libertad para permitir la falta de esfe-
ricidad. Programas de computadora como SPSS y SuperANOVA reportan dos de tales ajus-
tes, de modo que vale la pena que conozca algo de ellos; ambos usan el símbolo E (la letra
griega épsilon). La primera es la épsilon de Greenhouse-Geisser (G-G); la segunda, la de
Huynh-Feldt (H-F). La primera es conservadora; en otras palabras, resulta más probable
que evite un error tipo 1 pero que aumente la posibilidad de un error tipo Il. La .segunda es
más liberal.
Al trabajar de nuevo el ANOVA intrasujetos, la computadora reportó que la épsilon G-
G era 0.913 y la H-F 1.134. Si la épsilon H-F es mayor que 1, se trata como si fuera 1, ca-
so en el que los gl originales permanecen inalterados. Para encontrar los nuevos gl utilice
las ecuaciones siguientes:

gl de tratamiento ajustado = gl de tratamiento x E


gl de error ajustado = gl de error x E

Por tanto, en el ejemplo, para la épsilon G-G

gl de tratamiento ajustado = 2 x 0.913 = 1.826


gl de error ajustado = 18 x 0.913 = 16.434

En realidad, la probabilidad del resultado, reportado por la computadora como p = 0.0001,


se ve poco afectado por el ajuste. Si dependemos de tablas. redondearemos los gl al entero
más cercano, que serian 2 y 16 en este caso. La lectura de las tablas revelaría que los resul-
tados fueron estadísticamente significativos en el nivel p < 0.0 l.
Si utiliza un programa de computadora que reporta los valores de épsilon, compruebe
si los tres valores de probabilidad que se dan para cada razón F coinciden·en que el resul-
tado posee significación estadística. Como es usual, no hay problema si coinciden. Si no es
así, ha de reportar los diferentes valores y analizar las diferencias.
Si el programa no calcula los valores de épsilon, lo siguiente puede mostrar si deben
calcularse:

l. Si la razón F no es estadísticamente significativa con gl sin ajustar, no lo será des-


pués de los ajustes, de modo que no hay necesidad de calcular épsilon alguna.
_ _ _ _ _ _ _A_n_á_li_sl_·s_,_p_re_l_im_i_na_r_d_e_d_i_se_ñ_o_
s_co_n_u_n_a_V_I_d_e_m
_a_
' s_d_e_d_o_s_n_iv_e_le_s_ _ ----'[245

2. Si la razón F es estadísticamente significativa con los gl sin ajustar y todavía lo es


con un gl de 1 para el tratamiento y n - 1 (número de participantes menos uno) para
el término de error, no hay necesidad de calcular épsilon porque el resultado es con
toda claridad estadísticamente significativo.
3. Si la razón Fes estadísticamente significativa con Jos gl sin ajustar pero no con un
gl de 1 y n - 1, necesita calcular las epsilones.

En el ejemplo, como el resultado fue estadísticamente significativo con el gl sin ajustar,


comprobaremos la probabilidad de la razón F con gl de 1 y 9 (porque había 1O participan-
tes). Como el nivel crítico de F para p s 0.01 es 10.56, el nivel calculado de Fes con toda
claridad estadísticamente significativo y, por tanto, no habríamos necesitado calcular las
epsilones, en caso de que la computadora no las proporcionara.
Las ecuaciones para los dos tipos de épsilon se ofrecen en el apéndice VII.

Tamaños de muestra desiguales en ANOVA entre sujetos


Como apuntamos. para reducir al máximo los efectos de no contar con homogeneidad de va-
rianza en un diseño entre sujetos es mejor tratar de tener un número igual de participantes

en cada nivel de la variable independiente (un diseño equilibrado). Sin embargo, en ocasio-
nes ello no será posible. Cuando las muestras no son iguales, el cálculo del ANOVA difie-
re de cuando sí lo son. Sin embargo, el análisis puede conducirse de dos maneras, según las
razones de que las muestras sean desiguales.
En ciertas circunstancias puede haber una buena razón para tener muestras desiguales;
por ejemplo, si fuéramos a comparar gente con memoria común y con una inusualrnente
buena. En este caso, habría menos personas del último grupo en la población. En tales cir-
cunstancias, tiene sentido utilizar lo que se describe como medias ponderadas, es decir, las
medias provenientes de una muestra mayor se ponderan más en el análisis. Éste es el usa-
do por la mayoría de los programas de computadora frente a muestras desiguales.
Sin embargo, en ciertas situaciones la razón para tener muestras desiguales es arbitra-
ria. Un ejemplo consistiría en si algunos participantes del estudio, que debieron incluirse, no
estaban disponibles cuando se les requirió. Si las razones para su ausencia no son sistem á-
ticas, tendrá más sentido emplear medias no ponderadas. Un ejemplo de ausencia sistemáti-
ca sería si hubiéramos seleccionado originalmente la muestra de modo que pudiéramos
comparar personas de diferentes orígenes socioeconómicos, pero encontramos que un nú-
mero desproporcionado de personas de un tipo de antecedentes no estaría disponible después
para tomar parte de la investigación.
Los dos métodos para calcular e l ANOVA cuando los tamaños de la muestra son desi-
guales se describen en el apéndice VII.

-
246lL--------------~I~nv~e~s~ti~ga~c~ió~n_c~u~a~nt~it_a~ti_va~e~n~p~si~co~l~og~í~a____________________

Tamaño del efect o y ANOVA


Hay varias mediciones del tamaño del efecto de un tratamiento en ANOVA. La más sim-
ple de encontrar es 112 (eta al cuadrado), la proporción de la suma de cuadrados generales
que puede atribuirse al tratamiento y utilizarse para ver la proporción (o porcentaje) de va-
rianza general atribuida a un tratamiento dado. Por tanto,

2 _ suma de cuadrados para tratamiento


11 - suma total de cuadrados

Por tanto, en el ejemplo del recuerdo

112 - 30.467
109.367
= 0.279
En tal caso, 0.279 x 100 = 27.9% de la varianza general en puntuaciones puede explicarse
como si se debiera a las diferencias entre las estrategias nemotécnicas.
Mientras, en el ejemplo de la sentencia
145.267
112 = -----
984.967

= 0.147
Cohen ( 1988) utiliza una medición diferente del tamaño del efecto que puede derivarse de
11 2. Sin embargo, por razones de consistencia he convertido las recomendaciones en valores
de 112 . De acuerdo con ello, establezco que una 112 de 0.01 es un tamaño del efecto peque-
ño, una 11 2 de 0.059 es uno medio y una 11 2 de 0.138 es uno grande. Por tanto, ambos estu-
dios produjeron tamaños del efecto grandes.

Cálculo del poder de un ANOVA paramétrico de una vía


En el apéndice XV se presentan tablas de la relación entre tamaño del efecto, poder y
tamaño de la muestra para ANOVA. Ello refleja que con 10 participantes en cada grupo
y 112 = 0.279, el poder de la prueba para el gl de tratamiento de 2 estaba entre 0.77 y 0.87
(la cifra exacta es 0.83).

El poder del ANOVA int rasuj etos


El cálculo del poder del ANO VA intrasujetos se complica porque en ciertas circunstancias
para el mismo número de puntos de datos tendría más poder que su diseño entre sujetos equi-
valente, mientras que, en otras condiciones, el poder se reduciría. A fin de simplificar en lo


...
An_á_h_
_______________ ·sl_
·s~p_re_l_im_i_na_r_d_e_d_i_se_ñ_o_s_co_n__
un_a_V_I_d_e_m_a_'s_d_e_d_o_s_n_iv_e_le_s____~~

posible el proceso he seguido a otros autores y proporciono sólo tablas de poder para
ANOVA entre sujetos, donde los valores pueden especificarse de manera más precisa. Tales
tablas resultan utilizables para dar directrices aproximadas de tamaño de muestra y poder
en diseños intrasujetos.

La relación entre t y F
Si analizáramos un diseño experimental con una variable independiente que tiene sólo dos
niveles, podríamos utilizar desde luego una prueba t. Sin embargo, también podemos apli-
\ car un ANOVA a los mismos datos. En realidad, en tales condiciones, y sólo en éstas, nos
dará la misma respuesta en cuanto a la probabilidad. Mas ello es cie.rto sólo cuando em-
pleamos una prueba de dos colas para la prueba t, pues ANOVA prueba únicamente hipó-
tesis no direccionales. En esas condiciones, el valor de la razón Fes el cuadrado del valor
de t. En términos matemáticos:

F t2
Es decir:

t = -JF
Por tanto, si F = 4 con 1 y 15 gl, entonces t = 2 con 15 grados de libertad. Para confirmarlo,
busque los valores críticos de F y ten las tablas respectivas. Verá que cuando a= 0.05, el
valor crítico de F con 1 y 15 gl es F = 4.54. El valor critico equivalente para la prueba de
tde dos colas con 15 gl es 2. 131 o ~4.54.

Equivalentes no paramétricos del ANOVA


Por lo menos datos ordinales
Diseños entre sujetos: ANOVA de Kruskal-Wallis de una vía por rangos
Cuando el diseño de investigación es entre sujetos con más de dos niveles de la variable in-
dependiente y no se satisfacen los requisitos de un ANO VA paramétrico, el análisis puede
llevarse a cabo con el de varianza de una vía de K.ruskal-Wallis, basado en su equivalente
paramétrico. Tal prueba no supone que la distribución de la población es normal sino que las
distribuciones de las diferentes condiciones son iguales. Por tanto, no se antoja tan restric-
tivo como el ANOVA paramétrico de una vía entre sujetos. No obstante, supone que las
puntuaciones individuales resultan independientes entre sí.
En un estudio, los investigadores deseaban comparar las calificaciones que profeso-
res dieron a ensayos presentados por un hombre, por una mujer o por alguien sin género
24Bl~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
especificado. La hipótesis de investigación consistía en que las calificaciones dadas a las
tres categorías de autor diferirían. De manera formal , la hipótesis nula es que las medianas
de las tres condiciones no difieren.
A 24 profesores universitarios se proporcionó un ensayo para que lo calificaran y se les
dijo que el autor era un o una estudiante, o no se les dio indicación alguna de su género. En
realidad, se entregó el mismo escrito a todos. A cada ensayo se asignó una calificación en-
tre C- y A+, que se convirtió en una numérica que iba de 1 a 9. Las medias y las medianas
de los tres "autores" se muestran en seguida:

Tabla 16. 6. La media de las calificaciones dadas al ensayo y el supuesto género del
autor.
Género del autor

Mujer Neutral Hombre

Media de calificaciones 3.25 4 4.25

Mediana de calificaciones 3 4 4

Se aplicó un ANOVA de Kruskai-Wallis a los datos; el desarrollo se halla en el apéndice


VII. Como en el caso de la prueba de rango con signo de Wilcoxon para pares equiparados,
se da un rango a cada calificación y se calcula una estadística, H en este caso, a partir de
tales calificaciones. En el ejemplo, H = 2.086. Para una variable independiente con tres ni-
veles y tamaño de muestra no mayor que 5 en cualquiera de los grupos, los valores de pro-
babilidad de H se dan en el apéndice XIV. De otro modo, H se distribuye como x2, con gl
del número de niveles de la VI menos uno. De acuerdo con ello, en el mismo caso podemos
buscar en la tabla de la distribución chi cuadrada en el apéndice XIV para gl = 2 y encontra-
remos que p cae entre 0.5 y 0.3 (es decir, 0.3 < p < 0.5). Eso significa que hay elementos
insuficientes para rechazar la hipótesis nula. Cuando algunas puntuaciones son iguales, hay
una versión de la prueba que se ajusta para empates. En el ejemplo hubo cinco lugares con
calificaciones empatadas y la H corregida para empates fue 2.231. La probabilidad se en-
cuentra en el mismo rango que la versión no corregida para empates, con la probabilidad
exacta de p = 0.3278. La H corregida para empates es la cifra más exacta.

Reporte de resultados del ANOVA de Kruskal-Wallis. El resultado anterior se reportaría


así: No hubo diferencia significativa en la mediana de calificaciones dada a los tres auto-
res (H = 2.231, gl = 2, p = 0.3278, N= 24). De ahí, concluiríamos que los profesores no
difieren en las calificaciones que dieron a los ensayos con base en su conocimiento del gé-
nero del autor.
Análisis preliminar de diseños con una VI de más de dos niveles ¡249
------------------~----------------------------------------~

Poder y el ANO VA de Kruskal-Wallis. Como sucede en las pmebas no paramétricas ante-


riores, el poder del ANOVA de Kruskal-Wallis se da en términos de la eficiencia del poder.
Es decir, cuánto poder estadístico guarda con relación al equivalente paramétrico, cuando
se cumplen las suposiciones de éste. Por lo mismo, aconsejo encontrar el tamaño de la
muestra que se requeriría para el ANOVA paramétrico entre sujetos y luego ajustar el ta-
maño de la muestra según la regla dada más adelante. Si los investigadores hubieran espera-
do un tamaño del efecto medio, habrían encontrado, para a= 0.05, que necesitaban una
muestra de 52 en cada grupo para tener un poder de 0.8 cuando se ejecuta un ANO VA pa-
ramétrico. Como usaban la pmeba de Kruskal-Wallis, necesitaron 52 x 1.05 = 54.6; en otras
palabras, 55 personas en cada grupo para el mismo nivel de poder. Como con otras pme-
bas no paramétricas, si las suposiciones del ANOVA paramétrico no se cumplen, el Krus-
kal-Wallis tal vez tenga mayor poder que su equivalente paramétrico.

Diseños intrasujetos: ANOVA de Friedman de dos vías


Cuando el diseño es intrasujetos y la variable independiente tiene más de dos niveles pero
no se cumplen las suposiciones del ANOVA paramétrico, si el nivel de medición es por lo
menos ordinal, el ANOVA de Friedman de dos vías es la pmeba apropiada. La pmeba en-
traña en su nombre cierta confusión porque se utiliza para diseños de una vía, intrasujetos.
Como es usual, se supone que los datos en una condición determinada son independientes
entre sí.
Los investigadores desean ver si un grupo de siete estudiantes evaluará un curso en
particular de manera diferente, a medida que dedicaba más tiempo al curso. Se pidió a ca-
da estudiante evaluar el curso en una escala de 7 puntos, la cual iba de no lo disfruto en ab-
soluto a lo disfruto mucho, en tres ocasiones: después de una, de cinco y de 10 semanas.
El ANOYA de Friedman pmeba si son iguales las medianas de los niveles de la VI. Las
medianas de las evaluaciones para las semanas 1, 5 y 1Ofueron 4, 4 y 5, respectivamente, lo
cual sugiere una mejora ligera en la evaluación con el correr del tiempo. Sin embargo, para
ver si ello se debía al azar, el ANOVA de Friedman se utilizó para analizar los datos; los
desarrollos se presentan en el apéndice VII. La prueba produce una estadística llamada x2F
(a veces dada como x2) . También tiene una versión corregida para empates, la estadística
más exacta. En el ejemplo, x2 F = 4.071 y x2F corregida para empates= 5.429. Cuando el
número de niveles y el tamaño de la muestra son suficientemente grandes, la distribución
de x2F es como chi cuadrada, con grados de libertad que representan el número de niveles de
la VI menos uno. Sin embargo, cuando el número de niveles es mayor que tres, el valor crí-
tico mostrado, para el gl apropiado, en la tabla de distribución de chi cuadrada indicará una
probabilidad que no es más pequeña que la real. El uso de este método para encontrar la pro-
babilidad dará como resultado una prueba que, en algunos casos, será conservadora y, por
tanto, aumentará la posibilidad de cometer un error tipo II. Por el 9ontrario, para una VI
25Ql~_______________l_n_ve_s_ti~ga_c_io_·n_c_u_a_n_ti_ta_tl_
·v_a_e_n~p_si_co_l_o~gí_a____________________

con tres niveles, el uso de la distribución de chi cuadrada puede ser en verdad liberal, de-
bajo de un tamaño de muestra de 10. Para una VI con niveles de 3 o 4, en la tabla Al4.9
del apéndice XIV se dan probabilidades más exactas para x2F basadas en tamaños de mues-
tra pequeños.

Reporte de los resultados de la prueba de Friedman. Si el tamaño de la muestra y el núme-


ro de niveles de la VI son demasiado grandes para la probabilidad dada en dicha tabla,
reporte el resultado de la manera siguiente: No se le dio una evaluación significativamente
diferente a las tres semanas distintas (;(F = 5.429, g/ = 2, p = O. 0662, N= 7). Sin embargo,
si la probabilidad se da en la tabla referida, reporte el resultado sin los grados de libertad
(x!F = 5.429, p = 0.085, N= 7). Observe que la primera probabilidad, basada en la distri-
bución de chi cuadrada, es más pequeña que la exacta tomada de esa tabla.

Poder y prueba de Friedman. La eficacia del poder de la prueba de Friedman depende del
número de niveles de la VI: cuanto más pequeño sea el número de niveles, tanto peor será
la eficiencia del poder. En el apéndice VII se dan directrices sobre cómo ajustar el tamaño
de muestra necesario para el ANOVA paramétrico intrasujetos a fin de obtener el poder de
un tamaño específico de prueba de Friedman. Por ejemplo, cuando la VI tiene sólo tres ni-
veles, el tamaño de muestra para la prueba de Friedman tendría que ser casi una vez y me-
dia superior al del ANOVA paramétrico.

Análisis adicional tras un ANOVA no paramétrico inicial


Si los resultados de un ANOVA no paramétrico muestran una diferencia significativa entre
los niveles de la VI puede realizarse un análisis adicional que ayudará a determinar la fuen-
te de la significación. En el capítulo 18 se aborda ese análisis.

Datos nominales
Diseños entre sujetos: prueba de contingencia de :x!
Cuando una tabla de contingencia tiene más de dos niveles en una VI, el análisis es bás i-
camente igual para uno que para dos niveles. Por tanto, la prueba apropiada es la de con-
tingencia de x2 (conocida a veces como prueba de independencia), descrita en el capítulo
15. Por ejemplo, si la VI fuera del tipo fumador (con fumador, ex fumador y no fumador)
y el género fuera la VD, tendríamos una tabla de contingencia de 3 por 2. En realidad, los
términos VI y VD no son adecuados para la prueba de x2, pues ninguna se ha manipulado;
la prueba busca indagar si la pauta de una variable es diferente para distintos niveles de otra
variable (por ejemplo, ¿difiere la relación entre hombres y mujeres en cada categoría?).
_ _ _ __ _ _A
_ n_á_h_·s¡_·s_,_p_re_l_im_i_na_r_d_e_d_i_ un_a_V_I_d_e_m_a_·s_d_e_d_o_s_n_iv_e_le_s_ ___,j251
se_ñ_o_s_co_n_

Recuerde que las frecuencias deben ser independientes (cada persona aparecerá sólo
en una categoría) y que no más de 20% de las frecuencias esperadas han de ser menores
de 5; véase en el capítulo 15 una explicación más completa. Si demasiadas frecuencias
esperadas se encuentran debajo de 5 es posible combinar categorías para variables que tienen
más de dos niveles. Por tanto, si las categorías de ex fumadores tenían frecuencias espera-
das demasiado pequeñas, podría formarse una nueva categoría que combinara ex fumadores
y no fumadores. Esto tendría sentido sólo si los investigadores estuvieran particularmente
interesados en comparar a quienes fuman ahora con quienes no lo hacen. Si les interesara
comparar a quienes han fumado en algún momento con quienes nunca lo han hecho tendría
más sentido combinar a ex fumadores con fumadores.

Diseños intrasuj etos: Q de Cochran


Si la medida tomada es dicotómica (por ejemplo, sí o no) o puede convertirse en una o más
dicotomías, puede usarse la Q de Cochran. Un ejemplo sería si los investigadores desea-
ran comparar la elección de los estudiantes de módulos en psicología social, métodos de
investigación y temas de historia para saber si algunos son más populares que otros. Se re-
comienda que la prueba se conduzca con al menos 16 participantes y, por tanto, los inves-
tigadores preguntarían a ese número sus elecciones. Doce eligieron psicología social, ocho
métodos y seis historia. En el apéndice VII se muestran los desarrollos de la Q de Cochran.
Con por lo menos ese tamaño de muestra Q está distribuida como chi cuadrada con gl =
número de niveles de la VI menos uno. En el ejemplo, Q = 4.668 y gl = 3- 1 = 2. Confor-
me a la tabla de la distribución chi cuadrada del apéndice XIV, 0.05 < p < 0.1. De ahí se
concluye que había hechos insuficientes para rechazar la hipótesis nula de que los núme-
ros de elección de los diferentes módulos son iguales.

Conversión de datos nominales con más


de dos niveles en datos dicotómicos
Para utilizar la Q de Cochran y algunas otras pruebas se necesitaría crear variables dicotó-
micas de datos (categóricos) nominales no dicotómicos. A veces se describe esto como
creación de variables ficticias. En realidad, eso se ha hecho a los datos para el ejemplo de
la elección del módulo. Cada estudiante podría escoger más de un módulo, pero la respues-
ta a cada módulo se trató como un nivel separado de la VI; y sí o 1 es la puntuación si el
estudiante tomó ese módulo y no o O si no lo ha hecho.
Análisis de poder y Q de Cochran. No conozco una media para realizar análisis de poder
en la Q de Cochran, pues no hay un equivalente paramétrico para tales datos.
~L_________________In_v_e_st_ig~a_c_io_·n__cu_a_n_t_it_a _ti_v a__e_n~p_s_ic_o_lo~g~ía_______________________

Resumen
Cuando hay más de dos niveles de una variable independiente no se considera apropiado
usar una serie de pruebas de la diferencia entre pares de tales condiciones. En cambio, co-
mo etapa preliminar, se aconseja ver si hay una diferencia general entre las condiciones. El
análisis puede realizarse con la forma apropiada del de varianza (ANOVA), o su equivalen-
te para datos nominales (fig. 16.5). Sin embargo, recuer~e que si no está presente la homo-
geneidad de la varianza pero se cumplen los otros requisitos de un ANO VA paramétrico en-
tre sujetos, habrá de usar la prueba F de Welch.

Nominal

ANOVA ANOVA Prueba de


entre sujetos fntrasujetos contingencia
de una vía de una vía deXl

Figura 16. 5. Pruebas estadísticas para diseños con una variable independiente con más
de dos niveles.

Si hay una diferencia general entre las condiciones, puede buscarse su fuente precisa utili-
zando técnicas referidas en el capítulo 18.
En el capítulo siguiente se verá el análisis de diseños con más de una variable indepen-
diente.
17
Análisis de diseños con más
de una variable independiente

Introducción
En muchos experimentos de psicología no sólo nos interesan los efectos de una sola varia-
ble independiente (VI), sino también los de dos o más. La razón principal para esperar eso
consiste en que podemos plantear hipótesis acerca de que dichas variables tienen efectos con-
juntos (es decir, que éstas interactúan entre sí). En el presente capítulo se ofrecen ejemplos
completos donde intervienen dos VI y luego se describe cómo esto puede extenderse a si-
tuaciones que incluyen más de dos de tales variables.
También se analiza cómo evaluar el tamaño del efecto y aplicar un análisis de poder en
tales diseños. En el apéndice VIII se presentan ejemplos desarrollados de cada una de las
etapas.

Interacciones entre variables independientes


Una interacción ocurre cuando la tendencia de cierta variable independiente se afecta por
la presencia de otra VI. Imagine que, en un estudio de reconocimiento de rostros, los inves-
tigadores tienen dos variables independientes: reconocimiento, con dos niveles (conocido
y poco conocido); y orientación del rostro, también con dos (correcta e invertida). La varia-
ble dependiente (VD) es el tiempo que toma reconocer el rostro mostrado en una fotogra-
fia. Existiría una interacción entre ambas variables si las caras conocidas se reconocieran
más rápidamente que las poco conocidas cuando se presentan en la orientación correcta,
mientras que con caras invertidas no habría diferencia en la velocidad de reconocimien-
to entre los dos niveles de reconocimiento.

--------------------------------------------------------~253
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

100 ~---------------0

90
-D- Invertida
-<>- Correcta
80

70+------------------+----------------~
Conocido Poco conocido

Reconocimiento

Figura 17. 1. Ejemplo de interacción entre dos variables independientes.

También habría interacción si las caras conocidas se reconocieran con más lentitud que las
no conocidas cuando se presentan de cabeza.
130

o 120
e-o
·-
·O e
~
110
~~
á'l"'
.._V
-D- Invertida
Q¡"'O 100
-o.,. -<>-Correcta
&.E
e·v; 90
cu·cu
i=~
.S 80

70
Conocido Poco conocido

Reconocimiento

Figura 17.2. Ejemplo adicional de interacción entre dos variables independientes.

Es importante notar que si la tendencia a que los rostros familiares se reconozcan más rá-
pidamente fuera cierta en el mismo grado, sin importar la orientación, no habría interac-
ción, aun cuando las orientadas de manera correcta se reconocieran con mayor rapidez que
las invertidas. Si las líneas que representan los dos niveles de una de las VI son casi para-
lelas, resultará improbable que haya una interacción entre éstas.
:.~----------------------~------------------

_________________A_na_'L_is_is_d_e__
di_se_ñ_o_s_c_o_n_m_a_'s_d_e_u_n_a_v_a_r_ia_b_le_l_·n_d_ep~e_n_d_ie_n_t_e______~¡-255

130

<::
•O <::
:g 120

"8 ~ 110
~
....
VI
Q) -{]- Invertida
Q)
""O
-o
VI
100
-o- Correcta
8.~
E 90

Fg
·¡¡¡
Q.¡ ' Cl.>

80

Conocido Poco conocido


Reconocimiento

Figura 17.3. Ejemplo de falta de interacción entre dos variables independientes.

Pruebas paramétricas
Dos variables independientes entre sujetos
La versión más simple del ANO VA, con dos VI, para cálculo e interpretación es donde am-
bas VI son entre sujetos.
Para el primer ejemplo ampliaré el caso entre sujetos del capítulo anterior. Esta vez
imagine que los investigadores no sólo desean conocer el efecto de la estrategia nemotéc-
nica sobre el recuerdo, sino que quieren también explorar el de la naturaleza de la lista de
palabras por recordar. Como antes, una variable independiente es la estrategia nemotécni-
ca, con grupos que no reciben capa itación (el grupo control), que se les capacita con el
uso de palabras gancho o con el método de ubicación. Se introduce una segunda VI, la na-
turaleza de la lista, con dos nivele : una lista de palabras vinculadas conceptualmente (ar-
tículos que se encuentran en la cocina) y palabras que no lo están. Tal diseño significa que
tenemos seis condiciones (tabla 1 .1 ).

Tabla 17. 1. Condiciones relacionadas con un diseño para la prueba de una estrategia de
memorización y el tipo de lista de palabras.

Tipo de lista Control Palabras gancho Método de ubicación


· Vinculadas X X ·x
Desvinculadas X X X

El diseño del experimento es totalmente entre sujetos, esto es, cada participante se halla sólo
en una condición. Por tanto, hay seis grupos. Un diseño del todo entre sujetos se denomi-
na en ocasiones factorial.
256l~ _______________l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
Pueden analizarse los datos de tal tipo de diseño con una versión del análisis de varian-
za (ANOVA). En este caso, es un ANOVA de dos vías porque hay dos variables indepen-
dientes: naturaleza de la lista y estrategia nemotécnica.
Un ANOVA de dos vías probará tres hipótesis; el uso de números ayuda a distinguir
las hipótesis.
H 1: Las medias para los niveles de la primera VI son diferentes.
Con la hipótesis nula
H 01 : Las medias para los niveles de la primera VI no son diferentes.
H 2 : Las medias para los niveles de la segunda VI son diferentes.
Con la hipótesis nula
H 02: Las medias para los niveles de la segunda VI no son diferentes
H 3: Las pautas de las medias para una VI difieren entre los niveles de la otra VI.
Con la hipótesis nula
H03 : La pauta de medias para una VI no difiere entre los niveles de la otra VI.
La tercera hipótesis trata con la interacción entre las VI.
Los investigadores llevan a cabo el experimento con cinco participantes en cada con-
dición. Calculan las medias (tabla 17.2) y las grafican (fig. 17.4).

Tabla 17.2. Media de recuerdo para participantes que muestra efectos del tipo de lista
y la estrategia nemotécnica.

Estrategia nemotécnica
Lista Control Palabras gancho Método de ubicación Totales

Vinculadas 11 10.6 10.6 10.73


Desvinculadas 6.4 8.4 8.8 7.87

Totales 8.7 9.5 9.7 9.3

Si observamos las medias de columna de la tabla 17.2, veremos las de cada estrategia ne-
motécnica, sin importar cuál lista se presente. Ello sugiere que hay una diferencia entre las
estrategias y que el mejor recuerdo lo muestran quienes usan el método de ubicación (9.7
palabras), seguidos por quienes emplean palabras gancho (9.5) y por Jos que no utilizan es-
trategia, el grupo control (8. 7).
________________A_n_á_lis_is_d_e__
di_se_ñ_o_s_c_on__
m_á_s_d_e_u_na__ in_d~ep~e_n_d_ie_n_
va_n_·a_b_le__ te______~¡257

"'m 12
"....
m
"o 10
:rl....
"'m.... 8
.o
m
¡¡¡ ---+--- Vinculadas
c. 6
Q)
----- Desvinculadas
"e
Q) 4
E
•::J
e:
Q) 2
"'6
10
Q) o
::E Control Palabras gancho Método
de ubicación
Estrategia nemotécnica

Figura 17 .4. Media de recuerdo de participantes por tipo de lista y estrategia


nemotécnica.

De observar la fila de medias de la tabla 17 .2, se verán las medias de los dos tipos de lis-
ta, sin importar la estrategia nemotécnica utilizada. Ello sugiere que quienes ven la lista de
palabras vinculadas recuerdan más (10.73 palabras) que quienes observan la desvinculada
(7.87).
Por último, la media de cada uno de los seis grupos (llamada a veces celda de medias)
de la tabla 17.2 y su posición relativa en la figura 17.4 sugieren que hay una pauta diferen-
te entre ambas listas para las esrrategias nemotécnicas. Al parecer, quienes se encuentran
en el grupo control tienen un recuerdo particularmente malo en comparación con quienes
aplican las otras dos estrategias nemotécnicas cuando la lista comprende palabras desvincu-
ladas. Sin embargo, con la otra lista el grupo control no era peor que el con·espondiente a
quienes utilizaban las otras dos estrategias para recordar. Tal diferencia de las dos pautas
sugiere que hay una interacción entre las variables independientes; el desempeño relativo de
los participantes en las tres condiciones nemotécnicas depende del tipo de lista utilizada.

Segmentación de la varianza en un ANOVA de dos vías entre sujetos


Cuando hay dos variables entre sujetos existen sólo fuentes de varianza entre sujetos. Co-
mo en el ANO VA de una vía entre sujetos, la varianza total puede dividirse en varianza en-
tre grupos e intragrupos. De éstas, la primera puede dividirse además en varianza debida a
una variable independiente, a la otra VI y a la interacción entre las dos varia~les indepen-
dientes. La varianza intragrupos es el término de residuo (o de error) que se necesita para
formar razones F con cada una de las fuentes de varianza entre grupos.
258lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p-si_co_l~og~ía_____________________

Dentro de grupos
Entre grupos
(error)

Tratamiento 1 Interacción
entre
tratamientos

Figura 17.5. Segmentación de varianza en un ANOVA de dos vías entre sujetos.

De regreso al ejemplo, como es usual, queremos saber si las impresiones que las estadísti-
cas de resumen dan se sustentan por las estadísticas inferenciales. Por tanto, aplicaremos
un ANOVA de dos vías entre sujetos, cuyos resultados se proporcionan en la tabla 17.3. A
veces, cuando se describe el ANO VA de varias vías (es decir, con más de una VI), el núme-
ro de niveles de cada VI se incluye en la descripción. De acuerdo con eUo, el análisis actual
es un ANOVA de dos vías de 2 x 3.

Tabla 17.3. Tabla de resumen para un ANOVA de 2 x 3, dos vías, entre sujetos.

Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P

Lista 1 61.633 61.633 37.354 0.0001


Nemotécnica 2 5.600 2.800 1.697 0.2045
Lista * nemotécnica 2 11.467 5.733 3.475 0.0473
Residuo 24 39.600 1.650

Interpretación del resultado


de un ANOVA de dos vias entre sujetos
Una vez más, la primera columna muestra las fuentes de variación de los datos (las pun-
tuaciones de recuerdo). Se advierte que la cantidad total de variación puede dividirse en
cuatro fuentes:
i. La variación atribuible a las diferencias entre los dos tipos de lista.
_________________ di_se_ñ_o_s_c_o_n_m_á_s_d_e_u_n_a_v_a_n_
A_na_'L_is_is_d_e__ ·a_b_ --J¡-259
le_i_n_d~ep~e_n_d_ie_n_te______

zz. La variación atribuible a la diferencia entre estrategias nemotécnicas.


iii. La variación atribuible a la interacción entre el tipo de lista y la estrategia nemo-
técnica. En otras palabras, la manera en que la pauta de recuerdo entre las estrate-
gias nemotécnicas difiere entre las dos listas; y
iv. El residuo o variación que no puede atribuirse a las acciones de las VI (la varia-
ción intragrupos).
La segunda columna muestra los grados de libertad (gl) de cada fuente de variación. Los gl
son el número de puntuaciones menos uno; es decir, 30- 1 = 29. El gl para cada tratamien-
to es simplemente el número de niveles del tratamiento menos uno: gl de lista= 2 - 1 = 1;
el gl de la estrategia nemotécnica = 3 - 1 = 2. Para calcular el gl de la interacción se mul-
tiplica el gl de cada tratamiento: gl de interacción= 1 x 2 = 2. El gl de intragrupos (residuo)
es el número de grados de libertad restantes tras eliminar del total todos los gl de trata-
miento: gl de residuo = 29- 1 - 2 - 2 = 29 - 5 = 24. Otra forma de buscar el gl de residuo
considera que hay seis grupos, cada uno con cinco participantes. Hay un grado de libertad
menos en cada grupo que el número de participantes en ese grupo: 5 - 1 = 4. Por tanto, gl
de residuo = 6 x 4 = 24.
La tercera columna muestra la suma de las desviaciones cuadradas para cada fuente de va-
rianza. Es necesario explicar más la variación de la interacción: ésta mide la variación entre
los grupos permanecientes una vez que las variaciones debidas a las diferencias entre los tipos
de listas y las estrategias de recuerdo se restaron de la variación general entre los grupos.
La cuarta columna muestra la media de cuadrados de cada una de las fuentes de varia-
ción. Dicha media es el estimado de la varianza de la población. Como siempre, cada me-
dia de cuadrados se calcula dividiendo la suma de los cuadrados entre su gl.
La quinta columna muestra las razones F para el análisis.
En el experimento nos interesa evaluar las tres fuentes de variación entre grupos. La
última fuente, intragrupos, es una variación no deseada, en Jo que nos concierne. J>or tan-
to, hay tres razones F que se calcularán para probar nuestra hipótesis: una para cada uno de
los tratamientos (tipo de lista y estrategia nemotécnica) y una para la interacción entre
ellos. En este diseño en particular, la fuente de variación intragrupos es el término de error
apropiado para cada una de las tres razones F
Por tanto:
estimado de varianza del tipo de lista
F(lista) estimado de varianza de intragrupos

estimado de varianza de estrategia nemotécnica


F(nemotécnica) estimado de varianza de intragrupos

estimado de varianza de interacción entre tipo de lista y estrategia nemotécnica


F(interacción) estimado de varianza de intragrupos


26QlL_______________I_nv_e_st_ig~a_c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si_co_lo~g~ía_____________________
Como sucede con el ANOVA de una vía, si una hipótesis nula es con·ecta, la razón F para
ella es la razón entre dos estimados de la misma varianza. Es decir, la varianza en una so-
la población de puntuaciones inafectada por las manipulaciones experimentales. Por tanto, la
razón F será casi l. Sin embargo, si la hipótesis nula resulta incorrecta, el estimado de va-
rianza entre grupos apropiado contendrá una cantidad adicional de varianza debido al efec-
to del tratamiento o tratamientos dados. En este caso, la razón F será mayor que l .
Note que la razón F para el tipo de lista está muy arriba de 1, mientras que las razones
F para la estrategia nemotécnica y la interacción se hallan cerca de esa cifra. Como es común,
aún debemos identificar las posibilidades de que cada uno de tales resultados haya ocurri-
do por azar.
La sexta columna muestra la probabilidad de cada razón F A partir de ello podemos
ver que, en general, las listas produjeron recuerdos significativamente distintos; que, en ge-
neral, los tipos de nemotécnica no produjeron un recuerdo significativamente diferente; y
que las listas y las estrategias nemotécnicas interactuaron para producir una diferencia sig-
nificativa.

Interpretación de un ANOVA de dos vias entre sujetos


Un diseño de dos vías supone la necesidad de probar la interacción entre las dos varia-
bles independientes sin importar si tenemos una hipótesis acerca de una interacción. Ello
entraña una complicación porque los efectos de las VI se evalúan en el contexto de una in-
teracción.
Cuando hablamos de una sola VI en un ANOVA con más de una VI nos referimos al
efecto p1incipa/ de esa VI. Ello se debe a que hay más de una manera de buscar el efecto de
esa VI. El efecto principal de la VI es cuando ignoramos cómo varía a consecuencia de la
otra VI. Por ende, en el presente caso, la pauta de las medias para la estrategia nemotécnica
(el efecto principal) no está continuada en cada caso cuando se usa sólo un tipo de lista de
palabras. Cuando estaban presentes palabras vinculadas, la condición control produjo el me-
jor recuerdo, mientras que cuando estaban presentes palabras desvinculadas produjo el peor.
Podemos decir que hay un efecto principal significativo de tipo de lista (F( ~_ 24) =
37.354, p = 0.0001. MC 1ista = 61.633) y. también, que no hay un efecto principal significa-
tivo de estrategia nemotécnica (F(2,24) = 1.697,p '""- 0.2045, MCnemotécnica = 2.800). Sin em-
bargo, tales resultados se complican con la presencia de una interacción significativa entre
el tipo de lista y la estrategia nemotécnica (F1 ~-~ 41 = 3.-PS. p = 0.0473, MCinleracción =
5.733). Sin análisis adicional sólo podemos decir que la interacción parece producida por
la marcada mejoría del recuerdo del grupo control cuando se le da una lista de palabras
vinculadas en contraposición a una con vocablos desvinculados. El tipo de análisis adicio-
nal apropiado depende de nuestra hipótesis y de la naturaleza de los resultados prelimina-
res. Consulte las secciones correspondientes a contrastes y efectos !Jimples en el capítulo
siguiente para obtener más detalles acerca de cómo analizar aún más los resultados.
________________A_n_á_
lis_is_ d_e__
di_se_ñ_o_s_c_on__ va_n_·a_b_le_T_·n_d~ep~e_n_d_ie_n_te______~~
m_á_s_d_e_u_na__

Tamaño de muestra desigual


En el capítulo anterior se estableció que hay dos maneras básicas de analizar un diseño que
no tiene el mismo tamaño de muestra en cada condición (un diseño desequilibrado): me-
diante med ias ponderadas o medias no ponderadas. También está el método de los mínimos
cuadrados. La mayoría de los programas de computadora utilizan medias ponderadas como
estándar para el ANOVA de una vía, mas no para el ANOVA multivía.
Por lo menos en tres situaciones podría tener un diseño desequilibrado. Una ocurre si
las muestras son proporcionales y reflejan un desequilibrio en la población de que pro-
vienen. Por tanto, si sabemos que dos terceras partes del estudiantado de psicología corres-
ponden a mujeres y una tercera a hombres, podríamos tener una muestra de estudiantes de
psicología con una razón de 2: 1 entre ambos géneros. Por ejemplo, podríamos buscar la
manera en que difiere el desempeño de los estudiantes y las estudiantes de psicología en
los exámenes tras recibir dos técnicas de enseñanza: seminarios y cursos. Las muestras po-
drían ser las siguientes:

Tabla 17 .4. Números de hombres y mujeres que estudian psicología utilizados en un


estudio sobre género y técnica de enseñanza.

Técnica de enseñanza
Género Seminario Curso
Hombre 10 10
Mujer 20 20

Con esos datos proporcionales resulta legítimo aplicar el análisis de medias ponderadas.
Una segunda razón posible para un diseño desequilibrado estriba en que los participan-
tes no estuvieran disponibles para tratamientos en particular, pero no hubiera una razón sis-
temática para su falta de disponibilidad; es decir, no hay conexión entre el tratamiento a
que se les asignó y la falta de datos provenientes de ellos. En tales circunstancias. resulta
legítimo el método de las medias no ponderadas o de análisis de mínimos cuadrados.
Una tercera razón posible para un diseño desequilibrado sería que hubiera un vínculo
sistemático entre el grupo de tratamiento y la falla al obtener datos de los participantes; ello
se vuelve más probable en un cuasiexperimento. Por ejemplo, si la investigación se rela-
ciona con delincuentes asignados a diferentes gmpos con base en la gravedad de sus delitos.
Si el diseño carecía de más de un tipo de delincuente, aunque el desequilibrio no fuera un
reflejo de la población, entonces, en este caso de autoselección de los participantes, ningu-
na de las tres opciones resolvería el problema.
Por las dificultades con los diseños desequilibrados, a menos que trate con muestras
proporcionales, algunas personas recomiendan la eliminación aleatoria de puntos de datos
de los tratamientos que tienen más que otros. Como alternativa, pueden reemplazarse da-
tos faltantes con la media del gmpo, o incluso con la media general. Si coloca la media del
262l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
grupo puede mejorar artificialmente cualquier diferencia entre condiciones; si utiliza la me-
dia general para sustituir datos faltantes podría oscurecer cualquier diferencia genuina entre
grupos. Si se emplea cualquiera de dichos métodos, los gl totales (y, como consecuencia,
el de error) deben reducirse en uno por cada punto de datos estimado.
Preferiría eliminar datos, pero lo recomiendo sólo si tiene un tamaño de muestra razo-
nable por el efecto que la eliminación de datos tendrá en el poder estadístico de la prueba.

Dos variables independientes intrasujetos


Para el ejemplo de un diseño de dos vías intrasujetos ampliaré el diseño de una vía utiliza-
do en el capítulo anterior a fm de evaluar las diferencias entre los participantes con relación
a la duración de la sentencia que recomiendan para un delincuente, según las condiciones
en que lo decide. Como antes, la primera variable independiente (la condición en que se
decidió) tiene tres niveles: solo, comunicándose con otros mediante la computadora y en
presencia de los demás. Ahora se introduce una segunda VI: la naturaleza del acusado. En
este caso, los acusados serán de dos tipos: quienes no tienen antecedentes (novatos) y de-
lincuentes habituales (experimentados).
Ahora tenemos seis condiciones posibles en el experimento (tabla 17 .5) y, como am-
bas variables independientes son intrasujetos, cada participante proporciona una puntua-
ción para cada una de las seis condiciones.

Tabla 17.5. Condiciones incluidas en un diseño de dos vías intrasujetos.


Contexto
Acusado Solo Computadora Cara a cara
Novato X X X
Experimentado X X X

Igual que ocurre con el diseño entre sujetos, el ANOVA probará tres hipótesis: dos efectos
principales y una interacción.
Los investigadores recolectan los datos de cinco participantes y producen una tabla (ta-
bla 17 .6) y grafican los resultados (fig. 17 .6).

Tabla 17.6. Media del tiempo de sentencia, expresada en meses, sugerida en


diferentes contextos para los acusados.
Contexto
Solo Computadora Cara a cara Totales
Novato 13.2 13.6 16.2 14.33
Experimentado 16.0 17.6 20.6 18.07
Totales 14.6 15.6 18.4
__________________A_na_'l_is_is_d_e_d_i_se_ñ_o_s_c_o_n_m_á_s_d_e_u_n_a_v_a_n_
·a_b_Le_i_n_de~p_e_n_d_ie_n_te______~¡-263

rtl 22
"(j
<::
...,
(])
<:: 20
(])
V>

--+--
(])

"~
o (])
V>
18 Novato
O."'
E <lJ - D- Experimentado
(]) E
·--
..., 16
O)
"rtl
14
:0
(])
~ 12
Solo Computadora Cara a cara
Contexto

Figura 17. 6. Media del tiempo de sentencia recomendado en diferentes contextos


para los acusados.

Al parecer, un acusado novato recibiría una sentencia más corta que uno experimentado,
pero ambos obtendrían una pena más fuerte si el juez conoce las recomendaciones de otros.
Que las líneas para ambos tipos de procesados resulten casi paralelas sugiere que no hay
interacción entre el tipo de acusado y el contexto en que se planteó la sentencia.

Segmentación de la varianza
en un ANOVA de dos vias fntrasujetos
En diseños con dos variables independientes intrasujetos, como en el diseño de una vía in-
trasujetos, hay dos fuentes principales de varianza: entre e intrasujetos.
La varianza intrasujetos puede dividirse adicionalmente en varianza debida a la

i. Primera variable independiente.


ii. Interacción entre suj etos y la primera variable independiente.
iii. Segunda variable independiente.
iv. Interacción entre los sujetos y la segunda variable independiente.
v. Interacción entre las dos variables independientes.
vi. Interacción entre las dos variables independientes y los sujetos.

Cada una de las interacciones que incluye sujetos representa un término de error que habrá
de usarse en el cálculo de la razón F
~L________________In_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Tratamiento 1
por
tratamiento 2
Tratamiento 1
por sujetos
(error 1) Tratamiento 1
Tratamiento 2 por tratamiento 2
por por sujetos
sujetos (error 2) (error 3)

Figura 17. 7. Segmentación de varianza en un ANOVA de dos vías intrasujetos.

Antes de que los investigadores puedan evaluar su hipótesis apropiadamente realizarán un


ANOVA de dos vías intrasujetos en sus datos. Sus resultados se muestran en seguida:

Tabla 17.7. Tabla de resumen para un ANOVA de 2 x 3, dos vías, intrasujetos.


Suma de Media de Valor Valor
Fuente gl cuadrados cuadrados de F de P G-G H·F
Sujeto 4 2.467 0.617
Acusado 1 104.533 104.533 93.612 0.0006 0.0006 0.0006
Acusado por sujeto 4 4.467 1.117
Contexto 2 77.600 38.800 46.099 0.0001 0.0007 0.0001
Contexto por sujeto 8 6.733 0.842
Acusado por contexto 2 3.467 1.733 1.455 0.2892 0.2946 0.2948
Acusado por contexto por sujeto 8 9.533 1.192

Interpretación de un ANOVA de dos vias intrasujetos


La primera columna muestra las fuentes de variación del experimento. La varianza entre
sujetos es simplemente el efecto principal de sujetos (la variación de la sentencia entre par-
ticipantes, sin importar las condiciones). En un diseño intrasujetos se trata al sujeto como
si fuera una variable adicional. Por tanto, es posible dividir en lo siguiente la variación in-
trasujet0s:
i. La varianza debida a cualquier diferencia entre la manera en que se trata a los dos
acusados.
_________________A~n~ál~is~is~d~e~dl=·s~eñ~o=s~c=o~n~m=a=·s_d=e~un~a~v~a=r~
ia=b~le=l=·n=d=e~
pe=n~d=ie=n~t=
e ______~¡-265

ii. La manera en que los tres contextos varían.


iii. La interacción entre acusado y contexto.
iv. La interacción entre sujetos y tipo de acusado.
v. La interacción entre contexto de sentencia y sujeto.
vi. La interacción de tres vías entre tipo de acusado. contexto de sentencia y sujeto.
Por tanto, hay en total siete fuentes identificables de variación de las sentencias: una entre
sujetos y seis intrasujetos.
La segunda columna muestra los gl. Los totales son el número de puntuaciones menos
uno: gl totales= 30 - 1 = 29. Ello puede dividirse en el gl para cada una de las otras fuen-
tes de varianza. El gl para la varianza entre sujetos es el número de participantes menos
uno: gl = 5 - 1 = 4.
El gl para fuentes de varianza intrasujetos puede dividirse en:
gl acusado = 2 - 1 = 1;
gl contexto = 3 - 1 = 2;
gl interacción entre acusado y contexto = 1 x 2 = 2;
gl interacción acusado por sujeto = 1 x 4 = 4;
gl interacción contexto por sujeto = 2 x 4 = 8; y
gl interacción acusado por contexto por sujeto = 1 x 2 x 4 = 8.
La tercera columna muestra la suma de desviaciones cuadradas para cada fuente de varia-
ción del experimento, mientras que la cuarta incluye la media de cuadrados para las mis-
mas fuentes, creada tras dividir cada suma de cuadrados entre su gl.
La quinta columna muestra las razones F para cada fuente de variación intrasujetos. El
tétmino de enor apropiado para cada fuente de variación intrasujetos es la interacción en-
tre el sujeto y tal fuente. Por tanto:

MCacusado
F (acusado)
MCacusado por sujeto

MCcontexto
F (contexto)
MCcontexto por sujeto

MCacusado por contexto


F(acusado por contexto)
MCacusado por contexto por sujeto

Como es habitual, en cada caso la hipótesis nula supone que la variación obedece sólo a di-
ferencias aleatorias intrasujetos, en tanto que, si la liipótesis nula resulta incorrecta, la MC
de tratamiento tendrá variaciones debidas a éste.
266l~ _______________l_n_ve_s_ti~ga_c_io_·n_c_u_a_n_ti_ta_tl_·v_a_e_n~p_si_c_ol_o~gí_a____________________
La sexta columna indica la probabilidad de que cada efecto de tratamiento haya sido un
evento al azar. A partir de ello podemos apreciar que hubo un efecto principal significativo
del tipo de acusado (F(l,4 ) = 93 .612, p = 0.0006, MCacusado = 104.533) y un efecto signifi-
cativo de contexto (F(2 ,8) = 46.099,p = 0.0001, MCcontexto = 38.8), pero no una interacción
significativa entre tipo de acusado y contexto (F(2,8) = 1.455, p = 0.2892, MCinteracción =
1.733).

Esfericidad
El término esfericidad se presentó en el capítulo anterior y se refiere a la necesidad de que
los diseños intrasujetos tengan homogeneidad de varianza entre las puntuaciones de dife-
rencias. Las columnas con los rótulos G-G (de Greenhouse-Geisser) y H-F (de Huynh-
Feldt) de la tabla 17.7 muestran dónde para compensar la posible falta de esfericidad se han
hecho ajustes a los grados de libertad y a los efectos que los ajustes tienen en la probabili-
dad de una razón F dada. Como las probabilidades mostradas para los ajustes concuerdan
con las probabilidades sin ajustar, no hay un problema de esfericidad.
Los resultados del experimento podrían analizarse más si se comparan las medias para
identificar la fuente del efecto principal significativo del contexto. Recuerde que un resul-
tado significativo en unANOVAno especifica las contribuciones precisas a esa significación
si hay más de dos niveles en la variable independiente. En el caso del tipo de acusado, co-
mo participan sólo dos medias, sabemos que la diferencia significativa obedece a las sen-
tencias más elevadas que se aplican a los delincuentes habituales. En el capítulo siguiente
se indicará cómo llevar a cabo el análisis adicional necesario.

Diseños mixtos (esquema dividido o mezclado)


Los diseños descritos hasta ahora han sido sencillos porque suponen variables independien-
tes en que ambas son entre sujetos, en cuyo caso el diseño es entre sujetos o factorial, o en
que ambas han sido intrasujetos, caso en el que el diseño es intrasujetos o de mediciones
repetidas. Sin embargo, ahora podemos pasar a un diseño que contiene una VI entre suje-
tos y una intrasujetos. Tal diseño se conoce como mixto, mezclado o de mediciones repeti-
das con un factor entre sujetos.
Imagine que los experimentadores desean comparar la manera en que los hombres y
las mujeres evalúan el IQ de sus padres. En este diseño, la variable independiente, género,
que tiene dos niveles (hombre y mujer), es entre sujetos. La independiente, padre, con dos
niveles (madre y padre), es intrasujetos, pues cada participante proporciona datos para cada ni-
vel de ella.
Los investigadores plantean la hipótesis de que habrá diferencias en la manera en que
hombres y mujeres evalúan el IQ de sus padres, de modo que ambos evaluarán más alto
el IQ de sus padres que el de sus madres, pero que los hombres mostrarán una diferencia
________________A_n~á~li~si~s~de~d~is~en~
-o~s~c~o~n~m~á~s~d~e~u~n~a_v~an~·a=b=le~in~d=e~pe~n~d~ie=n=te~----~~

mayor entre las evaluaciones. Por tanto, están prediciendo un efecto del estimado del IQ de
los padres y una interacción entre género e IQ de los padres; y recolectan los estimados
de cinco hombres y cinco mujeres. Los resultados se muestran en seguida:

Tabla 17.8. La media de los estimados hechos por hombres y mujeres respecto
al IQ de los padres.

Padres
Padre Madre Totales
Hombre 115 103 109.0
Mujer 109 108 108.5
Totales 112.0 105.5

116

114
Vl
....
Q)

'O
.gc.
Vl "' 112

---
E-2
--+---
"'Vl

·¡:; (lJ 110 Padre


"'"O
vCI Madre
Q)_
'0- 108
"'"'
·-o
-o..,
Q) u
;:EQJ 106
c.
Vl
~ 104

102
Hombre Mujer
Género del estimador
Figura 17.8. Media de estimados de IQ hechos por hombres y mujeres respecto aliQ
de los padres.

Los resultados sugieren que los hombres estiman que el IQ de su padre es mucho más ele-
vado que el de la madre, pero las mujeres consideran que el IQ de su padre sólo es ligera-
mente superior que el de la madre. Por tanto, existe en apariencia un efecto principal del
IQ del padre, aunque no concuerda del todo con la hipótesis, mientras que hay una interac-
ción entre género e IQ de los padres que sí concuerda.

Segmentación de la varianza en un ANOVA de dos vias mixto


El diseño que combina variables independientes entre e intrasujetos sigue las reglas ya des-
critas para los otros tipos de diseño. Por consiguiente, la varianza general puede dividirse
~L_______ __ ______ _In_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

en fuentes de varianza entre sujetos e intrasujetos. La primera pertenece a la variable en-


tre sujetos y se divide en varianza debida a la diferencia entre los niveles de la variable
entre sujetos (tratamiento 1 o varianza entre grupos) y diferencia entre sujetos en los gru-
pos (varianza de sujetos intragrupos). Esta última forma el términ~ de error para la varian-
za de grupo.
La varianza intrasujetos se divide como sigue:
i. Debida a las diferencias entre niveles de la segunda variable independiente Cintra-
sujetos) (tratamiento 2).
ii. Debida a la interacción entre las dos variables independientes (tratamiento 1 por
tratamiento 2); y
iii. Debida a la interacción entre la segunda variable independiente y los sujetos den-
tro de los grupos para la primera VI.
Esta última fuente de varianza forma el término de error para las otras dos fuentes de va-
rianza intrasujetos.

Varianza
total

Entre sujetos lntrasujetos

1\
Entre grupos
Sujetos Tratamiento 1 Tratamiento 2
Tratamiento 2 por
dentro por sujetos
(tratamiento 1)
de grupos tratamiento 2
dentro
(error 1) de grupos
(error 2)

Figura 17.9. Segmentación de varianza en un ANOVA de dos vías mixto.

La etapa siguiente consiste en aplicar un ANOVA de dos vías mixto sobre los datos para
indagar si los efectos son estadísticamente significativos (tabla 17.9).
A_na_'l_is_is_d_e_d_i_se_ñ_o_s_c_o_n_m_á_s_d_e_u_n_a_v_a_n_
_________________ ·a_b_le_i_n_de~p_e_n_d_ie_n_te______~¡-269

Tabla 17.9. Tabla de resumen de un ANOVA de 2 x 2 de dos vías mixto.

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados de F de P G·G H-F
Género 1 1.250 1.2 50 0.007 0.9376
Sujeto (grupo) 8 1530.000 191.250
Padres 1 211.250 211.250 5.633 0.0450 0.0450 0.0450
Pad res por género 1 151.250 151.250 4.033 0.0795 0.0795 0.0795
Padres por sujeto (grupo) 8 300.000 37.500

Interpretación de la tabla de resumen de un ANOVA de dos vias mixto


La primera columna de la tabla 17.9 muestra las fuentes de variación del estudio. Su total
puede dividirse en variación entre e intrasujetos. Ello puede dividirse aún más. La varia-
ción entre sujetos puede dividirse en
a) Variación entre los géneros, sin importar de cuál padre realizan el estimado.
b) La variación entre sujetos dentro de los dos géneros (sujeto dentro de grupos).

La variación intrasujetos puede dividirse en


e) Las diferencias de estimados para ambos padres;
d) La interacción entre padre y género; y
e) La interacción entre padre y sujeto intragrupos.
La segunda columna muestra que los grados de libertad totales son el número de puntuacio-
nes menos 1: 20- 1 = 19. El gl total puede dividirse en fuente entre sujetos e intrasujetos:
Entre sujetos
gl de género = 2 - 1 = 1
gl de sujetos intragrupos, cada grupo tiene g1 = 5 - 1 = 4; por tanto, el gl
de sujetos intragrupos = 2 x 4 = 8.
Intrasujetos
gl de padre = 2 - 1 = 1
interacción entre padre y género = 1 x 1 = 1
padre por sujeto intragrupo = 1 x 8 = 8.
Las columnas tercera y cuarta muesh·an la suma y la media de cuadrados para cada fuente
de varianza, mientras que la quinta refleja las razones F, formadas de las ecuaciones si-
guientes:
MCgénero
F(género)
MCsujetos dentro de género
'
27Ql~_______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________

F(padre)
MCpadre pOr sujetos dentro de grupOs

F · MCgénero p0r padre


(interacción) = MC
padre pOr sujetos dentro de grupOs

Interpretación de un ANOVA de dos vias mixto


La tabla de resumen muestra que no hay un efecto pri.ncipal significativo de género
(F(I,S) = 0.007, p = 0.9376, MCgénero = 1.25). Hay un efecto principal significativo de pa-
dre (F(l,S) = 5.663 , p = 0.045, MCpadre = 211.25). No hay interacción significativa entre
género y padre (F(l,S) = 4.033, p = 0.0795, MCinteracción = 151.25).
Note que la tabla reporta sólo probabilidades ajustadas para las razones F que suponen
un elemento intrasujetos. En el ejemplo, los ajustes no crean una diferencia en las probabi-
lidades.
Datos faltan tes. En diseños con al menos una variable independiente intrasujetos las
computadoras suelen eliminar todos los datos de los participantes a quienes faltan datos,
aunque a veces hay otras opciones. También caben aquí dos posibilidades, ya menciona-
das, con muestras desiguales para diseños entre sujetos: estimar los datos faltantes con la
media para la condición o con la media general. Una vez más, tendrán que reducirse los
grados de libertad apropiados para tener en cuenta cada punto de datos estimado.

Diseños con más de dos variables independientes


Los principios delineados para los diseños previos pueden extenderse a diseños con tres o·
más variables independientes. El problema con ellos es que tendrán lo que se denomina
interacciones de orden superior. Imagine que ampliamos el diseño donde hay sujetos que
recomiendan una sentencia para un acusado de modo que una VI es el género del partici-
pante, otra la naturaleza del acusado y una tercera el contexto en que se realiza el juicio.
Además de los tres efectos principales, tendríamos las interacciones siguientes: acusado
por contexto, acusado por género, contexto por género y acusado por contexto por género.
Ello dificulta más la interpretación de los resultados. Incluso complica la presentación grá-
fica de los resultados, pues necesitaremos representar de algún modo la nueva dimensión. Si
resulta dificil su lectura, puede representarse un diseño de tres vías en una sola gráfica, pero
una vez que adopta un diseño de cuatro vías deja de ser factible.
La explicación ofrecida respecto al ANOVA ha resultado simplificada en temas como
el referente a si pueden considerarse fijos (seleccionados arbitrariamente) o aleatorios (elegi-
dos al azar) los niveles de la variable o variables independientes (consulte el capítulo 3). El
análisis descrito ha comprendido los niveles de la variable o variables independientes como
----~~-------A_n_á_li_si_s_d_e_d_ise_ñ_o_s_c_on__ un_a_v_a_ri_ab_l_e_in_d_e~pe_n_d_ie_n_te_______Jj271
m_ás_d_e__

fijo. Ello limita las conclusiones extraídas de los resultados; no podemos generalizar con
seguridad los efectos de los niveles usados a los posibles efectos de otros niveles. Si ha se-
leccionado de modo aleatorio los niveles y desea generalizar, recomiendo que lea las expli-
caciones dadas en Myers y Well (1991), Howell (1997) o Winer, Brown y Michels (1991).

Tamaño del efecto y ANOVA


Es posible calcular la misma medición (rJ 2) para los tamaños del efecto en un ANOVA de
varias vías, como se mostró en el capítulo anterior para un ANOVA de una vía.

Poder y ANOVA
Las tablas de poder usadas para un ANO VA de una vía (apéndice XV) sirven para estimar
el poder y el tamaño de la muestra requerido para un ANOVA de varias vías. Sin embargo, el
poder de cada razón F puede estimarse por separado. Si trata de encontrar el tamaño de
muestra necesario para alcanzar un nivel determinado de poder, incluirá el mayor tamaño
de muestra que sugiere su análisis de poder.

Pruebas no paramétricas
Por lo general, no están disponibles en computadora las pruebas estándar para un ANOVA
de varias vías con datos que no se adecuan a las suposiciones del ANO VA paramétrico. Sin
embargo, Meddis (1984) describe el ANOVA de dos vías para datos al menos ordinales y
para datos nominales. Además, Neave y Worthington (1988) detallan pruebas que pueden
evaluar las interacciones entre esas dos variables. También resulta factible utilizar técnicas
más avanzadas (modelación logarítmica lineal y regresión logística) sobre tales datos, las cua-
les se estudiarán de manera breve en el capítulo 21, pero su uso pleno escapa del objetivo
del presente libro.

Resum en
El ANOVA de varias vías (para diseños con más de una VI) permite que se evalúe la in-
teracción entre las variables independientes, además de los efectos principales de cada una
de ellas. Más allá del ANOVA de dos vías, la interpretación empieza a complicarse y se di-
ficulta la graficación de los resultados.
Se ha presentado el análisis preliminar para ANO VA de una y de dos vías. En el capí-
tulo siguiente se explican los tipos de análisis que pueden efectuarse para dar seguimiento
a los hallazgos de un ANOVA a fin de probar hipótesis más específicas que los investiga-
dores suelen plantear.
18
Análisis subsiguiente después
del ANOVA o de x2

Introducción
En los dos capítulos anteriores se estudió la primera etapa del análisis cuando el diseño
respectivo tiene una sola variable independiente (VI) con más de dos niveles o más de una
VI. Como se indicó, el análisis preliminar plantea la pregunta ¿parecen diferir las medias
de los niveles de una o más VI? Si es así, tal vez no resulte tan obvia la fuente de la dife-
rencia. Por tanto, para identificarla se realiza análisis adicional. Sin embargo, pese al título
del capítulo, los métodos descritos en él pueden utilizarse sin haber evaluado que las razo-
nes F de un ANOVA eran estadísticamente significativas.
En el capítulo se describen tres tipos de análisis subsecuente: contrastes, pruebas de
tendencia y efectos simples.

Contrastes
Pruebas paramétricas
Los contrastes son comparaciones entre medias en el caso de pruebas paramétricas. Para
analizarlas, regresaré al experimento de recuerdo de palabras descrito en el capítulo 16, que
supone un grupo que usa palabras gancho, uno que utiliza el método de ubicación y uno con-
trol. Se encontró una media de recuerdo significativamente distinta para las tres condicio-
nes. Los tipos de contraste realizables resultan casi infinitos. La distinción principal es entre
contrastes por pares, donde usted compara dos medias a la vez. y otros tipos de contraste,
digamos una comparación de la condición control con la media de las otras dos condiciones.

272
·s~s~ub~s~ig~u~ie~n~t~e~d~e~sp~u~é~s~d~e~l~A~N~O~VA~o~d~e~x~2__________~¡:273
____________________A~n~á~li~Sl~

Hay numerosas pruebas de contrastes. En lugar de describirlas todas proporcionaré un con-


junto que abarca la mayoría de las situaciones y explicaré cuándo resulta apropiada cada una.
El razonamiento subyacente a todas las pruebas de contrastes consiste en un intento de
sortear el problema que describí al presentar el ANOVA. Si tiene más de dos medias para
determinar cuáles son significativamente distintas, requerirá más de una prueba; en el caso de
tres medias, necesitará tres comparaciones por pares. La probabilidad dada por la estadística
inferencia! descrita en el presente libro es la de que un resultado ocurra por azar; es decir,
la posibilidad de que ocurriera si la hipótesis nula es correcta. Tal probabilidad se basa en la
observación de que, si se realiza varias veces la misma prueba sobre conjuntos de datos para
los cuales resulta correcta la hipótesis nula, el resultado será estadísticamente significativo
en el nivel de p = 0.05 en alrededor de 5% de las ocasiones. En otras palabras, se comete-
rá un error tipo I en 5% de las veces. Por tanto, cada vez que se repita una prueba estadís-
tica se incrementará la probabilidad de cometer un error tipo I.

La familia de contrastes
Un grupo de contrastes suele describirse como una familia de ellos. Las pruebas de contras-
tes ajustan el nivel de probabilidad de modo que ésta se relacione con dicha familia (la
razón de error por familia, EF) y no con el contraste individual (razón de error por con-
traste, EC). Por tanto, la probabilidad de la familia de contrastes se establece en a= 0.05.
Cómo se realicen los ajustes depende de la naturaleza y el tamaño de tal familia. Como regla
Wll
básica, trate la familia como los contrastes relevantes para una sola razón F del ANOVA
llf
original. Por ello, en un ANO VA de dos vías habrá tres familias de contrastes: una para cada
uno de los efectos principales y una para la interacción.
La prueba que realiza un ajuste demasiado amplio y, en consecuencia, disminuye en
gran medida la posibilidad de cometer un error tipo I se describe como conservadora. Re-
cuerde que una prueba conservadora aumenta la posibilidad de cometer un error tipo II. Es
111.
importante que elija la prueba de contraste correcta y, por ello, el ajuste correcto a fin de
evitar la reducción innecesaria del poder de la prueba.

Co_mparaciones planeadas y no planeadas


Una distinción ·importante entre comparaciones es si usted decide cuáles efectuar antes o
'll después de inspeccionar los datos. Si elige cuáles comparaciones realizará antes de ello, se
describen como comparaciones planeadas o a priori. Si las elige después, se definen co-
mo no planeadas, post hoc o a posteriori.
La distinción no resulta fútil porque la prueba empleada en comparaciones no planea-
das será más conservadora que la aplicada a comparaciones planeadas. Un ejemplo debe
aclarar el razonamiento. Si busco las medias para el experimento de recuerdo y luego de-
!.. cido comparar por pares las medias de los grupos control y el método de ubicación porque
~~----------------ln_v_e_st_ig~a_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________

son las más separadas es como si hubiera realizado las tres comparaciones posibles. Por
tanto, la familia de contrastes será en este caso de tres y el ajuste del nivel de a se hará tam-
bién conservador. Sin embargo, si antes de mirar los datos he planeado efectuar un contras-
te entre las medias de los grupos control y el método de ubicación, la familia de contrastes
contendrá sólo uno y no habrá ajustes del nivel de a.
Otra distinción entre contrastes planeados y no planeados estriba en que si son planea-
dos, resulta del todo legítimo conducirlos, aunque no baya sido estadísticamente signifi-
cativa la razón F original del ANO VA. Los contrastes no planeados deben llevarse a cabo
sólo cuando la razón F sea estadísticamente significativa, pues son exploratorios en vez de
probar una hipótesis específica.
Antes de presentar las pruebas de contraste específicas trataré un último concepto: la
ortogonalidad.

Ortogonalidad
Recordará que el ANOVA toma la variación general de las puntuaciones de un estudio y
trata de identificar sus fuentes; en otras palabras, segmenta la varianza de las puntuaciones.
Los contrastes segmentan de manera similar la varianza. La cantidad de varianza identifi-
cable como debida al tratamiento puede dividirse en fuentes específicas de varianza, cada una
basada en un contraste diferente.
Si va a dividir la varianza general en partes, de modo que cada una evalúe una porción
de la varianza, el contraste se describirá como ortogonal. En la figura 18.1 se encuentra una
representación esquemática de la varianza explicada por un tratamiento determinado, por
ejemplo, la estrategia nemotécnica: el rectángulo representa la varianza general para el tra-
tamiento y cada círculo la varianza explicada por un contraste. Los dos contrastes son or-
togonales porque explican partes diferentes de la variación general de las puntuaciones.

Varianza no explicada por contrastes

Varianza explicada Varianza explicada


por contraste entre por el contraste 2
control y palabras gancho

Figura 18. 1. Varianza explicada por dos contrastes ortogonales.


____________________A_n~á~li~s'~·s~s~
ub~s~ig~u~ie~n~t~e~d~e~sp~u~é~s~d~e_l_A_ _Jr:z75
N~O_VA~o~d~e~x~2__________

Cuando la varianza explicada por un contraste incluye parte de la varianza explicada por
otro, los contrastes son no ortogonales. En seguida se muestra el caso donde dos contras-
tes son no ortogonales porque tratan de explicar parte de la misma varianza:

Varianza no explicada por contrastes

Varianza explicada
por los contrastes
1y 2

Varianza explicada
por contraste entre Varianza explicada
control y palabras por el contraste 2
gancho (contraste 1)

Figura 18.2. Cantidad de varianza explicada por dos contrastes no ortogonales.

Una consecuencia de limitar sus contrastes ortogonales radica en que el número de contras-
tes aplicables debe ser igual a la cantidad de grados de libertad existentes en el tratamien-
to. Por tanto, en el caso del experimento de recuerdo, como el tratamiento (condición de
memoria) tiene dos gl, pueden conducirse sólo dos contrastes para que siga siendo ortogonal.
Sin una descripción matemática suficiente resulta dificil comprender cómo se com-
P':leba que un conjunto de contrastes es ortogonal. La comprobación se presenta en el
apéndice IX. Sin embargo, aunque los expertos en estadística consideraban importante que
los contrastes se mantuvieran ortogonales, ya no es así y todas las pruebas de contrastes
mencionados en el capítulo pueden llevarse a cabo legítimamente con contrastes no orto-
gonales. Por tanto, debe poder comprenderse el resto del capítulo sin consultar dicho apéndi-
ce. No obstante, resulta preciso conocer la noción de ortogonalidad, pues algunas pruebas
de contrastes son más conservadoras cuando éstos son no ortogonales.
El contraste más simple y usado con mayor frecuenc ia es el contraste por pares, donde
se comparan dos medias. Por consiguiente, la descripción del presente capítulo habrá de
restringirse a los contrastes por pares. La manera de efectuar contrastes más complejos se
detalla en el apéndice IX.
Los tres contrastes por pares descritos en el capitulo se basan en un valor de t que lue-
go se compara con un valor crítico de t para ver si es estadísticamente significativo. El mé-
todo de cálculo de t cambia si los datos provienen de un diseño entre o intrasujetos.
276l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~ía_____________________
Contraste de datos de diseños entre sujetos. Para los diseños entre sujetos, utilice la ecua~
ción siguiente:
media 1 - medí~
Ec. 18.1

donde media 1 es la media de una de las condiciones (condición 1)


medí~ es la media de la otra condición (condición 2)
n 1 es el tamaño de la muestra del gmpo que produjo la media 1
n2 es el tamaño de la muestra del grupo que produjo la media2
MCerror es la media de cuadrados del término de erTor apropiado en la razón
F original

Cuando hay números iguales en los grupos la ecuación se simplifica así:

media 1 - medí~
f Ec. 18.2

donde n es el tamaño de la muestra ~el grupo que produce una de las medias.

Varianzas heterogéneas
Si los grupos para el ANOVA no tienen varianzas similares no son apropiadas las ecuacio-
nes anteriores. Conforme la regla básica expuesta en el capítulo 16, si la varianza más gran-
de no es más del triple de la varianza más pequeña·tendremos suficiente homogeneidad de
varianza para utilizar las ecuaciones anteriores siempre que los tamaíios de la muestra sean
iguales. Si tenemos falta de homogeneidad, se aconseja para contrastes por pares utilizar la
prueba t para varianzas separadas (prueba t de Welch) que se explica en el capítulo 15 y en
el apéndice VI. Con tamaños de muestra desiguales, la varianza más grande no debe ser
mayor del doble de la más pequeña para que se considere homogénea.
Contrastes en datos de diseños intrasujetos. Si el diseño es intrasujetos y los datos care-
cen de esfericidad (en el capítulo 16 se explica el término), una vez más ninguna de las
ecuaciones anteriores resultará correcta. Para estar seguro, en el caso de contrastes por pares,
debe calcularse por tanto la t de cada contraste mediante la ecuación estándar para un diseño
intrasujetos con dos niveles, dada en el apéndice VI y referida en el capítulo 15. Myers y
Wcll ( 1991) señalan que en su mayoría, si no todos, los programas de computadora utilizan
esa versión de t para contrastes en diseños intrasujetos. La opción no se halla disponible
NO_V_A__o_d_e~x~2__________~¡-277
____________________A_n_á_li~si~s~s~ub~s~ig~u_ie_n_t_e_d_e~sp_u_é_s_d_e_l_A_

para una de las pruebas, la de Scheffé; ésta no se recomienda para contrastes por pares por-
que se considera demasiado conservadora para tales contrastes.

Aplicación de un solo contraste


En el caso de datos de cualquier diseño, si sólo realiza un contraste, como en un contraste
planeado, la probabilidad del valor de t para ese contraste puede comprobarse con las ta-
blas t estándar. Sin embargo, de incluir más de un contraste, usará uno de los procedimien-
tos descritos más adelante.
En seguida se proporcionan tanto las medias y las desviaciones estándar del experi-
mento de memoria como el resumen del ANOVA conducido en esos datos:

Tabla 18. 1. Medias y desviaciones estándar de evaluación de palabras para tres


condiciones de memoria.

Control Palabras gancho Método de ubicación


Media 7.2 8.9 9.6
DE 1.62 1. 91 1.58

Tabla 18.2. Tabla de resumen para el ANOVA de una vía entre sujetos en los datos
de recuerdo.
Suma de Media de
Fuente gl cuadrados cuadrados Prueba F p
Entre grupos 2 30.467 15.233 5.213 0.0122
lntragrupos 27 78.9 2.922
Total 29 109.367

Por tanto, si deseamos comparar la condición del método de ubicación con la condición
control tendríamos las cifras siguientes:

media 1 9.6
media2 7.2
n 10
MCerror = 2.922
glerror = 27

y podemos usar la ecuación 18.2 porque el diseño es entre sujetos y los grupos tienen el
mismo tamaño de muestra.
ltl
27Bl~ _______________l_nv_e_st_ig~a_c_ió_n_c_u_a_nt_lt_a_ti_va__en~p-sic_o_lo~g~ía_____________________
9.6-7.2
t(27) = -;:::===
~(~)x2.922
\ 10

= 3.139

t de Bonferroni
La t de Bonferr0ni (conocida a veces como prueba de comparación múltiple de Dunn) con-
sidera el número real de co;:-.trastes que se realizarán. Es más apropiada cuando ha planea-
do sus comparaciones y se mantienen al mínimo. Se toma conservadora sí los contrastes
no son ortogonales. El ajuste que realiza se basa en una ecuación que, cuando la ex. original
se establece en 0.05 o en una cifra menor, se simplifica aproximadamente a la división de
ex. entre el número de contrastes por conducir. El nivel de ex. del ajuste es para cada contras-
te. Sin embargo, resulta más común expresar el nivel de ex. de la familia. En el apéndice XIV
se presentan los niveles de ex. para la familia de contrastes.
Elija el número de contrastes por efectuar. Busque el valor de t crítico en las tablas de
correcciones de Bonferroni para contrastes en el apéndice XIV para ese número de contras-
tes, utilizando el gl de la MCerror apropiado para el tratamiento que investiga; en el caso de
un diseño entre sujetos con homogeneidad de varianza, el gl apropiado para una prueba t
con \ arianzas independientes cuando hay heterogeneidad de varianza, o el gl para la prue-
ba t estándar intrasujetos en el caso de un diseño intrasujetos. Para que el contraste sea esta-
dísticamente significativo, la t calculada para el contraste será igual o mayor que la t crítica.
A continuación se presenta una parte de la tab.Ia AXIV 1O del apéndice XIV:

Tabla 18.3. Extracto de las tablas de Bonferroni para una razón de error por familia
de o: = 0.05 .

Número de contrastes
gl de error 2 3 4 5 6 7 8 9 10 12 15
25 2.385 2.566 2.692 2.787 2.865 2.930 2.986 3.035 3.078 3.153 3.244
26 2.379 2.559 2.684 2.779 2.856 2.920 2.975 3.024 3.067 3.141 3.231
27 2.373 2.552 2.676 2.771 2.847 2.911 2.966 3.014 3.057 3.130 3.219
28 2.368 2.546 2.669 2.763 2.839 2.902 2.957 3.004 3.047 3.120 3.208
29 2.364 2.541 2.663 2.756 2.832 2.894 2.949 2.996 3.038 3.110 3.198
30 2.360 2.536 2.657 2.750 2.825 2.887 2.941 2.988 3.030 3.102 3.139

---
___________________An~á~li~si~s~su~b~s~ig~u~
ie~n~te~d~e~s~p~
ue~·s_d~e_I_A_N~ o~d~e~x~2 __________~¡279
OV._A~

En el ejemplo, sí planeamos aplicar los tres contrastes en el experimento de recuerdo con


gl de 27 la t critica seria 2.552. La t calculada para el contraste (3.139) nos muestra que las
medias para el control y el método de ubicación son significativamente diferentes del nivel
de p < 0.05.
El valor de t de contraste para control en comparación con palabras gancho es 2.224;
para las palabras gancho en comparación con el método de ubicación, 0.91 6. Por tanto,
ninguna de las dos resulta estadísticamente significativa en a= 0.05. Podemos concluir
que, con la t de Bonferroni, el método de ubicación produce un recuerdo significativamen-
te mejor que la condición control, pero no que el método de palabras gancho. Además, la
condición de tales palabras no produr.e un recuerdo significativamente mejor que la condi-
ción control.

t de Dunnett
La t de Dunnett (conocida a veces también como d) suele usarse cuando una media espe-
cífica (digamos, la de un grupo control) se contrasta con otras, una por una. Es menos con-
servadora que la t de Bonferroni porque no supone que los contrastes sean ortogonales.
En primer lugar, busque el valor crítico de t, con el gl de error (o el de la prueba t de
Welch para diseños entre sujetos con varianzas heterogéneas o el de la prueba t intrasuje-
tos en diseños intrasujetos), en la tabla para la t de Dunnett del apéndice XIV, y compare
la t calculada para el contraste con el valor crítico. Si la t calculada es igual o mayor que el
valor crítico, resultará estadísticamente significativa.
En seguida se presenta un extracto de la tabla AXIV.ll del apéndice XIV.

Tabla 18.4. Extracto de las tablas t de Dunnett para una razón de error por familia
de a= 0.05.

Número de medias (incluido el control)

gt de error 3 4 5 6 7 8 9 10 11 12 13 16 21

24 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90 2.94 2.97 3.00 3.07 3.16

30 2.32 2.47 2.58 2.66 2.72 2.77 2.82 2.86 2.89 2.92 2.95 3.02 3.11

Si se supone que se conducen dos contrastes, cada uno con 27 grados de libertad, tenemos
un valor crítico entre 2.32 y 2.35, pues la tabla 18.4 no da valores para gl = 27. Ello con-
cuerda con la pauta de resultados sugeridos por la t de Bonferroni: el contraste entre las
condiciones de ubicación y control fue estadísticamente significativo, mas no entre las con-
diciones de palabras gancho y control.
28Ql~_______________l_nv_e_s_
ti~ga_c_ió_n_c_u_a_nt_it~a~ti_v~a~e_n~p_si~co_l_
og~í_a____________________

t de Scheffé
La t de Scheffé es muy conservadora y permite realizar cualquier tipo de contraste post hoc.
Resulta suficientemente conservadora para considerar irrelevante su aplicación si la razón
F original no era estadísticamente significativa. Hay una cantidad confusa de formas de
calcular y expresar la prueba de Scheffé; en ciertas ocasiones como un valor t y en otras
como una razón F Sin embargo, todas dan la misma protección contra la comisión de un
error tipo J. Aquí he dado una versión. En el apéndice IX se ofrecen otras tres porque los
programas de'computadora las producen.
Tratado como una prueba t, podemos tomar el valor calculado de t y comprobarlo me-
diante tablas F estándar (véase el apéndice XN; sí, me refiero a las tablas F). Utilice la
ecuación siguiente para encontrar el valor crítico de t:

t CrÍtiCO = ~glllOtonuento xF(glltalamtt:nto>gJtrror)

En otras palabras, tome el valor crítico de F que dan las tablas F para el gl de tratamiento
y el de error (es decir, los grados de libertad originales para la razón F que intentamos ex-
plicar) y multiplíquelo por los grados de libertad del tratamiento. La raíz cuadrada del re-
sultado es el valor crítico con el que se evaluará el valor calculado de t.
En seguida se muestra la parte relevante de las tablas F del apéndice XIV:

Tabla 18.5. Extracto de las tablas de probabilidad de a =0.05 para una F.


gl,
gl2 2 3 4 5 6 7 8 9 10 12 14
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08

28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06

Los gl de tratamiento y de error para la razón F original fueron 2 y 27, respectivamente.


Según la tabla 18.5, la razón F crítica para tales gl es 3.35 para p = 0.05. Por tanto:

t crítica = ~(2 x 3.35)


= 2.588
Ello significa que el único contraste estadísticamente significativo en p < 0.05 es el grupo
control en comparación con el del método de ubicación.
___________________A~n~á~li~si~s~su~b~s~ig~u~ie~n~te~de~s~p~ue~·s~d~e~I~A~N~O~VA~o~d~e~x~2 ----------~~

La prueba de Scheffé es tan conservadora que no se recomienda para comparaciones


por pares. En el apéndice IX se muestra su uso con comparaciones más complejas.
Diseños intrasujetos. Como se mencionó, si los datos de un diseño intrasujetos carecen de
esfericidad no es apropiado utilizar las ecuaciones 18.1 o 18.2 para efectuar contrastes. Co-
mo no se usará la prueba de Scheffé para contrastes por pares, no tenemos la opción de
calcular una prueba t estándar (es decir, una para comparar dos medias) para los contrastes
más complejos, para los cuales la prueba de Scheffé es apropiada. En cambio, si deseamos
emplear la prueba de Scheffé, primero comprobaremos la esfericidad de los datos. Si el
ANOVA original no muestra la necesidad de ajustar los grados de libertad, los datos tienen
esfericidad. Si su programa de computadora no le da esa información, en el apéndice VII
se indica cómo puede comprobar la necesidad del ajuste. Si los datos poseen esfericidad,
podemos proseguir con la prueba de Scheffé como se describió.

Diferenda honestamente significativa de Tukey


La prueba de diferencia honestamente significativa (DHS) se usa cuando los tamaños de
los grupos son iguales. Una variante (la prueba de Tukey-Kramer) procede si los grupos no
son del mismo tamaño.
El método es menos conservador que el de Scheffé, pues supone que no se realizarán
todos los tipos posibles de comparación entre las medias. Sin embargo, resulta más conser-
vador que la t de Dunnett.
Para calcular la DHS de Tukey busque el valor critico de q en las tablas de la estadís-
tica de rango estudentizado (dada en el apéndice XIV) para el número de medias incluido
en los contrastes y el gl de error (o gl de la prueba t de Welch para diseños entre sujetos
con varianzas heterogéneas o gl de la prueba t estándar intrasujetos, en diseños intrasuje-
tos). Coloque en la siguiente ecuación el valor encontrado para q:

t crítica = ~
,Y2

Compare después el valor de t calculado para el contraste con la t crítica. Una comparación
será significativa sólo cuando el valor para la t calculada sea igual o mayor que la t crítica.
La siguiente tabla es parte de la estadística de rango estudentizado (q) de la tabla
AXIV.l2, del apéndice XIV:

Tabla 18.6. Extracto de la estadística de rango estudentizada (q), ex= 0.05.


Número de medias por contrastar
gl de error 3 4 5 6 7 8 9 10 11 12 15
24 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 6.01 5.10 5.32
30 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 5.00 5.21
282lL______________~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti~v~ae~n~p~si~co~l~og~í~a____________________
Con tres medias y gl de error de 27, la q critica se encuentra entre 3.49 y 3.53 para p = 0.05.
Por tanto:

.. . 3.49 3.53
t cntlca esta entre r:: y -r
'1/2 ' '2
= entre 2.468 y 2.496

En este caso, sólo el contraste entre el método de ubicación y las condiciones control re-
sulta estadísticamente significativo en p < 0.05.

Tukey-Kramer
La prueba Tukey-Kramer es para contrastes por pares entre sujetos cuando los tamaños de
muestra para los dos grupos no son iguales. Utiliza una variante de la ecuación 18.1 para
contrastes:
media1 - media 2
t Ec. 18.3

donde n 1 y n 2 son los tamaños de las dos submuestras que intervienen en el contraste.
La t crítica se encuentra exactamente de la misma manera que en el método DHS de Tukey.

Otras pruebas de contraste


Las pmebas de contraste descritas bastan para casi toda situación. No obstante, para mayor
plenitud en el apéndice IX se describen brevemente pruebas adicionales. Tal vez las en-
cuentre en programas de computadora. Además, como investigadores experimentados que
a menudo tienen pmebas de contraste favoritas, tal vez le pidan usarlas.

Pruebas de una y dos colas y contrastes


Todas las probabilidades citadas en las tablas para las pruebas de contraste son de dos co-
las. Resulta claro que, cuando se utilizan comparaciones no planeadas. la hipótesis para la
prueba es no direccional. Sin embargo, cuando se emplea una comparación planeada, si prue-
ba una hipótesis direccional cabe emplear una probabilidad de un¡i cola. En consecuencia,
en el apéndice XIV se presentan las tablas de probabilidades de una cola para las t de Bon-
fcrroni y de Dunnett en el caso de a= 0.05.
~-- --= ---- --- ~ - - ~- - -- - - -- - -- - - - - -- - - .....

----------~A~na~·l~is~is~s~u~bs~ig~u~ie~n~te~d~es~p~u~és~de~l~A~N~O~V~A~o~d~e~x~2_ _ _ _ _~¡2i3

Tabla 18.7. Resumen de ecuaciones con que se calcularán valores t y gl de valores


de t crítica para contrastes por pares.
Diseño Ecuación para t gl para t crítica
Entre sujetos
Varianza homogénea Ecuación 18.1 gl para MCerror del ANOVA
original
Varianza heterogénea Prueba t de Welch gl ajustado para prueba
(capítulo 15 y apéndice VI) t de Welch (apéndice VI)
lntrasujetos Prueba t estándar para n - 1, donde n es el número
diseños intrasujetos de participantes
(capítulo 15 y apéndice VI)

Resumen de pruebas de contraste para pruebas paramétrkas


Debe tener la seguridad de que todas las pruebas recomendadas están de acuerdo en cuáles
contrastes resultan estadísticamente significativos y cuáles no. Sin embargo, la t de Dun-
nett, la menos conservadora, habría producido que el contraste entre el método de ubica-
ción y la condición control resultara estadísticamente significativo en p < 0.01 (aunque se
hayan aplicado los tres contrastes), mientras que las otras establecen la probabilidad en
0.01 < p < 0.05. (Por cierto, debido a razones de espacio, para la t de Dunnett incluí sólo
tablas de probabilidad para a = 0.05 en el libro.)

Tabla 18.8. Resumen de las pruebas de contraste y especificación de cuándo es


apropiada cada una.
Prueba Cuándo usarla
Bonferroni Un pequeño número de contrastes planeados o no planeados
Dunnett Comparación de una media con otras
Scheffé Cualquier contraste post hoc
DHS de Tukey Un conjunto de contrastes por pares post hoc, tamaños de
1 muestra iguales
Tukey-Kramer Un conjunto de contrastes por pares post hoc, tamaños de
muestra desiguales

Pruebas no paramétricas
Por lo menos datos ordinales
Una fo nna de contrastar dos niveles de una variable independiente a la vez, siguiendo un
ANO VA de una vía de Kruskal-Wallis o un ANOVA de dos vías de Friedman, sería efectuar
'
284lL_______________I_nv_e~s~ti~ga~c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l~og~í~a____________________

la prueba apropiada a cada contraste para una VI con dos niveles. Por tanto, una prueba U
de Mann-Whitney se utilizará para contrastes en diseños entre sujetos, y una de rango con
signo de Wilcoxon para pares equiparados para contrastes en diseños intrasujetos. Empe-
ro, se necesitaría ajustar el nivel de a, utilizando un ajuste de Bonferroni al dividir el nivel
de a entre el número de contrastes que se hace. Por tanto, para cuatro contrastes la rela-
ción de error por contraste (EC) se vuelve:

EC = 0.05
4
= 0.0125

También hay pruebas específicas de contraste para estos datos si todos los niveles de la VI
tienen cinco o más participantes y la prueba estadística original es estadísticamente signi-
ficativa. Hay dos tipos de tales pruebas: uno se usa cuando se contrasta cualquier par de ni-
veles de la Vl y el otro es análogo a la t de Dunnett porque se emplea para contrastar una
condición control con otro nivel de la VI. Incluyo la primera técnica en el apéndice IX.
Quienes deseen aprender la segunda pueden consultar a Siegel y Castellan ( 1988).

Datos de categorías
Cuando se analiza una tabla de contingencia que representa más que una tabla de 2 x 2, hay
varias maneras de que el resultado sea estadísticamente significativo; por ejemplo, si los
investigadores buscan la proporción de hombres y mujeres fumadores, no fumadores y ex
fumadores. Puede aplicarse análisis adicional si se secciona la tabla de contingencia en va-
rias subtablas de 2 x 2. Por tanto, los investigadores podrían centrarse en fumadores en
comparación con no fumadores y en otras comparaciones más específicas que las propor-
cionadas por el análisis original.
El análisis es más especializado y se proporciona por tanto en el apéndice IX, en lugar
de incluirlo aquí.

Pruebas de tendencia
Las pruebas de tendencia constituyen una extensión de los contrastes entre medias y usan
un procedimiento muy similar. Están diseñadas para probar si un grupo de medias forma una
sola pauta o una tendencia. Su uso más apropiado es cuando los niveles de la variable inde-
pendiente que se prueban son cantidades más que categorías. Por ejemplo, los investigado-
res plantean la hipótesis de que los tiempos de reacción serán más lentos como resultado de
la cantidad de alcohol consumido. Predicen que el erecto del alcohol incrementará el tiem-
po de reacción en una cantidad regular; es decir, que hay una tendencia lineal de que el
tiempo de reacción aumente con el alcohol consumido.
------------------~A~n~á~li=sl=·s~s=ub~s~ig~u~ie~n~t=e~d~e~sp~u~é=s~d~e~l~A~N=O~VA~o~d~e~x~2__________~¡:285
En el ejemplo, se coloca a 24 pruticipantes en tres grupos de igual tamaño. A cada uno
de éstos se da una cantidad diferente de alcohol: una, dos o tres unidades. A cada parti-
cipante se asigna luego una tarea en que debe detectar la presencia de un objeto en una pan-
talla de computadora.
Pueden probarse varias tendencias posibles, pero el número depende del número de
medias consideradas y es igual que el gl del tratamiento que se analiza. Por tanto, en el caso
de tres medias hay dos tipos de tendencias posibles: lineal y cuadrática. En seguida se
muestran las pautas que constituirán tendencias lineales y cuadráticas:

10

...,
~
e 8
~
:0
e
~
a.
~
"O 6
~
:0
"' 4
~
2
Uno Dos Tres
Niveles de la variable independiente

Figura 18.3. Tendencia lineal.

10

3 8
e
~
:0
e
~
a. 6
~
"O
~
.CJ
-~ 4
~
2
Uno Dos Tres
Niveles de la variable independiente

Figura 18.4. Tendencia cuadrática .

..
~L________________In_v_e_st_i~ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~í____________________
a __

En el caso de cuatro medias, otra tendencia posible es la cúbica.


10
...,

e

'5 8
e

a.

-e 6

:0
"'
·e 4
~

2
Uno Dos Tres Cuatro
Niveles de la variable independiente
Figura 18.5. Tendencia cúbica.

A continuación se muestran los resultados del experimento:

Tabla 18. 9. Medias y desviaciones estándar de los tiempos de reacción (expresados en


décimas de segundo) por número de unidades de alcohol consumidas.
Unidades de alcohol consumidas
Una Dos Tres
Media 151.25 163.38 168.75
DE 14.12 10.53 12.94

190

180
e
:2
o~
t{ ~ 170
~ ~
QJ QJ
-o-o 160
8.~
E·¡:;
150
~~
140

130
Uno Dos Tres
Unidades de alcohol

Figura 18.6. Media de tiempos de reacción (expresados en décimas de segundó) por


número de unidades de alcohol consumidas.
------------------~A~na~·l~is~is~s~ub~s~ig~u~ie~n~te~de~s~p~u~és~d~e~l_A_N~O_VA~o~d~e~x~2----------~~
~ote que las medias van en la dirección sugerida pero no forman una línea del todo recta.
Antes de buscar alguna tendencia debemos encontrar si el efecto del tratamiento es estadís-
ticamente significativo. Si no lo es, no tiene caso realizar un análisis de tendencia. En se-
guida se muestran los resultados de un ANOVA entre sujetos de una vía en los datos:

Tabla 18.10. Tabla de resumen del ANOVA entre sujetos sobre los efectos del alcohol en
los tiempos de reacción.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F


Entre sujetos 2 1285.75 642.875 4.039
lntrasujetos 21 3342.875 159.185 p = 0.0328
Total 23 4628.625

Que las medias no formen una linea perfectamente recta sugiere que la tendencia podría ser
de un tipo no lineal.
Para un análisis de tendencia con tres medias y tamaños de muestra iguales debe crear
una suma de cuadrados (SC) para la tendencia que prueba, de acuerdo con la ecuación si-
guiente:

setendencia =
n X ( (coefl XX¡) + (coef2X x2)+ (coef3x x3)
coef; + coef; + coer;
r
donde n es el número de participantes en cada grupo
coef1, coef2 y coef3 son los coeficientes designados para probar una tendencia
particular
x x
i ¡. 2 y 3 son las medias de los tres grupos
En el apéndice IX se presenta la ecuación general para las pruebas de tendencia de la que
ésta se ha derivado. Una tabla de los coeficientes obra en el apéndice XVI. En seguida se
muestran los coeficientes para tendencias que incluyen tres medias:

Tabla 18. 11. Coeficientes para análisis de tendencias con tres medias.

Número de niveles de VI Nivel de VI


Tipo de tendencia 2 3 4 5 6 7 8 9 10
o
~1
3 Lineal
Cuadrática 1 -2

...
288l~_______________l_n_ve_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________

2
8 X (C-1 X 151.25) +(O X 163.38) + (1 X 168.75))
c-v + co) + (1)
2 2

2450
2
1 225

Cada prueba de tendencia siempre tiene 1 grado de libertad. Por tanto, MCtendencia también
es 1 225.
La razón F para MCtendencia se encuentra dividiendo MCtendencia entre MCerror' que en
este caso es 159.185 (de la tabla 18.10). Por tanto,

F(l,ZI) = 7.695
Podemos utilizar las pruebas F estándar para evaluar la significación estadística de tal re-
sultado. La F crítica para la prueba de tendencia es 4.32, en cuyo caso hay una tendencia
lineal s ignificativa en el estudio entre la cantidad de alcohol consumido y los tiempos de
reacción.
Los coeficientes para las pruebas de tendencia se han elegido de modo que las pruebas
de tendencia segmenten la suma de cuadrados del tratamiento en fuentes de variación sepa-
radas; son ortogonales. En otras palabras, si agrega la suma de cuadrados de todas las prue-
bas de tendencia permisibles el resultado será el mismo que el de la suma de cuadrados de
tratamiento.
Podemos saber por tanto si vale la pena buscar otras tendencias. Como la suma de cua-
drados general para el consumo de alcohol fue 1 285.75 (tabla 18.1 O) y la suma de cuadra-
dos para la tendencia lineal 1 225, la suma de cuadrados para cualquier tendencia restante
(en este caso cuadrática) es
1285.75 - 1225 = 60.75
Como el gl para cualquier tendencia es 1, la MC para una tendencia cuadrática también se-
rá 60.75 y así la razón F para esta tendencia sería:

60.75 = 0.382
159.185

que no es estadísticamente significativo. De acuerdo con ello, concluiremos que hay sólo
una tendencia lineal significativa.

Efectos simples
Cuando hay una interacción entre dos variables independientes vale la pena trata¡; de explo-
rar más la naturaleza de aquélla. Regresemos al ejemplo del capítulo 17, donde se mostró a
VA__o_d_e~x~2 __________~¡2i9
An_á_h_.sl_·s_s_ub_s~ig~u_ie_n_te__de_s~p_ue_·s_d_e_l_A_N_O_
____________________

los participantes una lista de palabras y se les pidió que recordaran el mayor número de
ellas. Las dos VI eran tipo de lista (con palabras vinculadas o desvinculadas) y estrategia
nemotécnica (método de ubicación, palabras gancho o condición control). Un método de
análisis de la interacción entre ambas VI consiste en separar los efectos del tratamiento de una
de esas variables para cada uno de los niveles de la otra. En el ejemplo, ello significaría
buscar los efectos de la estrategia nemotécnica en el recuerdo de palabras vinculadas y en el
recuerdo de palabras desvinculadas. También podría significar la búsqueda del efecto del
tipo de lista en el recuerdo de quienes usan el método de ubicación, palabras gancho y en
el grupo control. Cada uno de estos análisis se describe como un efecto simple.
Algunos libros aconsejan buscar efectos simples sólo cuando hay una interacción sig-
nificativa. No estoy de acuerdo porque en ocasiones se encuentra información útil cuando
la interacción no es significativa, como el descubrimiento de la pauta de un efecto princi-
pal significativo que se reproduce sólo en ciertos niveles de la segunda VI. Sin embargo, si
la interacción está lejos de ser estadísticamente significativa no vale la pena buscar Jos
efectos simples. El método utilizado para encontrar los efectos simples varía si la variable
que se considera es intrasujetos o entre sujetos. Seré más específico y diré que debe utili-
zar una técnica cuando el diseño es totalmente entre sujetos y otra cuando es del todo in-
trasujetos o combinado (es decir, tiene algunas VI intrasujctos).

Diseños entre sujetos


El ANOVA de dos vías produjo la tabla de resumen siguiente:

Tabla 18. 12. Tabla de resumen del ANOVA correspondiente a un ANOVA de 3 x 2, dos
vías, entre sujetos.
Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P
Lista 1 61.633 61.633 37.354 0.0001
Nemotécnica 2 5.600 2.800 1.697 0.2045
Lista por nemotécnica 2 11.467 5.733 3.475 0.0473
Residuo 24 1
39.600 1.650

Eso nos indica que hubo una interacción significativa entre tipo de lista y estrategia nemo-
técnica.

Una advertencia acerca de la heterogene;dad de vadanza


El procedimiento siguiente resulta apropiado sólo si las varianzas de todas las condiciones
de la interacción son similares. Por tanto, examine aquéllas antes de aplicar un análisis de
29QlL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_v_a_e_n~p_si~co_l_og~í_a____________________
efectos simples en un diseño entre sujetos. Si son diferentes, debe seguir el procedimiento
sugerido para diseños intrasujetos combinados mostrado a continuación. En el ejemplo de
la siguiente tabla se muestran las varianzas de las seis condiciones:

Tabla 18.13. Varianzas de las seis condiciones de memoria.


Estrategia nemotécnica
Lista Control Palabras gancho Método de ubicación
Vinculada 1.50 1.86 1.30
Desvinculada 2.30 1.30 1.70

Si la varianza más grande no es mayor que el doble de la más pequeña, podemos continuar
el procedimiento. En este caso, 2.3 es menos del doble de 1.3. Observe que en esta situa-
ción las varianzas deben estar más cerca de lo que tenían que estar para realizar el ANOVA
inicial. Consulte en Myers y Well (1991) un análisis acerca de los problemas de heteroge-
neidad de varianza cuando se realizan efectos simples.
Para analizar éstos, formaremos una razón F para cada efecto simple. Cuando el dise-
ño es completamente entre sujetos y hay homogeneidad de varianza, dicha razón para cada
nivel de una de las VI se forma a partir de la ecuación siguiente:

F = MCnivel de VI

MCerror para interacción

Por tanto, en el caso del ejemplo anterior, si buscamos el efecto simple de la estrategia nemo-
técnica en palabras desvinculadas, buscaríamos la MC para palabras desvinculadas y la divi-
diríamos entre la MC de error de la interacción original (es decir, MCresiduo). Los grados de
libertad apropiados para la razón F, como siempre, serían los de la MC para el nivel, en el ca-
so de palabras desvinculadas (2), y los del término de error de interacción original (24).
Para simplificar el proceso, puede encontrar la MC para cada nivel si ejecuta un ANOVA
de una vía únicamente en los datos del nivel que le interesa. En este caso, sólo incluiría los
datos de los participantes a quienes se hubieran mostrado palabras desvinculadas. La tabla
de resumen siguiente corresponde a un ANO VA de una vía entre sujetos que compara el re-
cuerdo para las tres estrategias nemotécnicas en las listas desvinculadas:

Tabla 18. 14. ANOVA de una vía entre sujetos en estrategia de nemotécnica para listas
desvinculadas.

Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P
Nemotécnica 2 16.533 8.267 4.679 0.0315
Residuo 12 21.200 1.767
--
------------------~A~na~'l=is=is~s=u~bs~ig~u~ie~n=te~d~es~p=u~és~d~e~l~A~N=O~VA~o~d~e~x~2----------~~
A partir del análisis podemos ver que la MCdesvinculado es 8.267 con gl = 2. El término de
error para el efecto simple es el mismo que el usado por el ANOVA de dos vías: 1.650 con
gl = 24 (tabla 18.12).
Por tanto, el efecto simple para palabras desvinculadas es:
8.267
F (2, 24) 1.650
5.010

La consulta de las tablas F indica que la razón F crítica para p = 0.05 con gl de 2 y 24
es 3.4. En este caso, podemos señalar que, para palabras desvinculadas, el recuerdo di-
fiere significativamente entre las tres estrategias nemotécnicas (F(2 ,24) = 5.010, p < 0.05,
MCdesvinculado = 8.267).
El análisis podría repetirse para palabras vinculadas:

Tabla 18.15. ANOVA de una vía entre sujetos en estrategia de nemotécnica para listas
vinculadas.

Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P

Nemotécnica 2 0.533 1
0.267 0.174 0.8425
Residuo 12 18.400 1 1.533

Aquí,

F = MCvinculado
vinculado MC
error

0.267
1.650

= 0.162

Como tal valor de Fes menor que 1, resulta claro que no es estadísticamente significativo.
Ahora tenemos una imagen más nítida de lo que produjo la interacción significativa en el
ANOVA de dos vías. La estrategia nemotécnica afecta el recuerdo cuando las listas están
vinculadas, pero no cuando no lo están.
Sería posible ahora realizar comparaciones sobre las medias de las condiciones des-
vinculadas para identificar incluso de manera más específica la fuente del efecto signifi-
cativo.
292lL_______________I~n_ve~s~ti~ga~c~io~·n_c~u~a~n~ti~ta~t¡~·v~a~e~n~p~si~co~l~o~gí~a____________________
Segmentación de las sumas de cuadrados en efectos simples
En el análisis de efectos simples usted toma la suma de cuadrados para la interacción y el
tratamiento del ANOVA original de dos vías y divide eso en partes separadas para cada
efecto simple. Al buscar en el ANO VA original de dos vías, la suma de cuadrados para la
interacción es 11.467 y para nemotécnica 5.600. Tras agregar todas, se obtiene una suma
de cuadrados de 17.067. Tenga en cuenta que la suma de cuadrados para las palabras des-
vinculadas es 16.533 y para las vinculadas 0.533. La suma de todo esto da 17.066 (que
difiere de 17.067 sólo porque se han redondeado las cifras).

Diseños con variables intrasujetos


Diseños totalmente intrasujetos
Para buscar efectos simples en una variable independiente, simplemente obvie los datos de
otros niveles de ésta y aplique un ANOVA de una vía intrasujetos en los datos restantes. La
razón F de tal análisis es la apropiada para el efecto simple, con los gl del mismo análisis.
Recuerde el estudio, descrito en el capítulo 17, cuyos participantes decidían la senten-
cia para un delito. Había dos VI: el contexto en que se tomaba la decisión (solo, ante una
computadora o cara a cara con otro juez) y la naturaleza del acusado (delincuente experi-
mentado o novato). Los resultados no mostraron interacción significativa (tabla 18.16) y la
gráfica de los resultados no daba una razón para suponerla (fig. 18.7). Sin embargo, con fi-
nes ilustrativos, analizaré los efectos simples para cada nivel del contexto.

Tabla 18. 16. Tabla de resumen para el ANOVA de dos vías intrasujetos para los efectos
del tipo de acusado y el contexto en que se decide la duración de la
sentencia sugerida.

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados de F de P G-G H-F

Sujeto 4 2.467 0.617

Acusado 1 104.533 104 .533 93.612 0.0006 0.0006 0.0006

Acusado por sujeto 4 4.467 1.117

Contexto 2 n.6oo 38.800 46.099 0.0001 0.0007 0.0001

Contexto por sujeto 8 6.733 0.842

Acusado por contexto 2 3.467 1.733 1.455 0.2892 0.2946 0.2948

Acusado por contexto por sujeto 8 9.533 1.192


------------------~A~n~á~li~sl~·s~s~ub~s~ig~u~ie~n~t~e~d~e~sp~u~é~s~d~e~l~AN~O~~~A~o~d~e~x~2__________~¡:293


e
"'
....e
(!) 22
Q.>

"O
"'
(!)
20
e Vi' ~Novato
•O
(!)
18
'u -D- Experimentado
VI
(!)

.."'::::>. . .S 16
"O
Q.>
"O 14
"'Q.>
'5
:E 12
Solo Computadora Cara a cara
Contexto

Figura 18. 7. Media de la duración de la sentencia recomendada en contextos distintos


y para acusados diferentes.

A continuación se muestran los efectos simples que comparan los tipos de acusados para
cada uno de los tres contextos:

Tabla 18.17. ANO VA de una vía intrasujetos de los efectos del tipo de acusado en la
duración de la sentencia sugerida (para participantes que deciden solos).

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados de F de P G-G H-F

Sujeto 4 2A 0.6

Experiencia 1 19.6 19.6 12.25 0.0249 0.0249 0.0249

Experiencia por sujeto 4 6_4 1.6

Tabla 18. 18. ANOVA de una vía intrasujetos de los efectos del tipo de acusado en la
duración de la sentencia sugerida (para participantes que deciden
mientras ven en la pantalla de una computadora las decisiones de otros
jueces).

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados de F de P G-G H-F

Sujeto 4 5_4 1.35

Experiencia 1 40.0 40.00 160 0.0002 0.0002 0.0002

Experiencia por sujeto 4 1.0 0.25


294l Investigación cuantitativa en psicología

Tabla 18.19. ANOVA de una vía intrasujetos de los efectos del tipo de acusado en la
duración de la sentencia sugerida (para participantes que deciden en
presencia de otros jueces).
Suma de Media de Valor Valor
Fuente gl cuadrados cuadrados de F de P G-G H·F
Sujeto 4 1.4 0.35
Experiencia 1 48.4 48.40 29.333 0.0056 0.0056 0.0056
Experiencia por sujeto 4 6.6 1.65

A partir de esos efectos simples podemos ver que, cual sea el contexto, al acusado expe-
rimentado se dictará una sentencia significativamente más fuerte que a un novato. Como
hubo sólo dos niveles en cada efecto simple, pudimos aplicar el análisis con pruebas t in-
trasujetos.

Diseños combinados
El ejemplo del capítulo 17 respecto a este diseño fue de hombres y mujeres que daban las
evaluaciones del IQ de su madre y de su padre. Cuando busque los efectos simples de la
variable intrasujetos (padre), debe realizar un ANOVA de una vía entre sujetos sobre la va-
riable entre sujetos para cada nivel de la variable intrasujetos. Por tanto, llevará a cabo un
ANOVA de una vía entre sujetos en cada nivel de padre. Cuando busque los efectos sim-
ples de la variable entre sujetos (género), practicará un ANOVA de una vía intrasujetos en
cada uno de los niveles de la variable entre sujetos. Por tanto, conduciría un ANOVA de
una vía entre sujetos en cada nivel de género. Tales recomendaciones tienen por objeto
simplificar el análisis. Quienes deseen saber más acerca de ello leerán en la explicación
de Howell ( 1997) una manera más completa de buscar efectos simples en las circunstan-
cias referidas.
La predicción original de los investigadores fue que hombres y mujeres evaluarían de
modo diferente a sus padres. La gráfica de las medias sugirió que había una interacción en-
tre el género y el IQ del padre (fig. 18.8).
Sin embargo, la razón F para la interacción no alcanzó significación estadística.
Tabla 18.20. Tabla de resumen de un ANOVA de dos vías combinado.
Suma de Media de Valor Valor
Fuente gl cuadrados cuadrados de F de P G-G H-F
Género 1 1.250 1.250 0.007 0.9376
Sujeto (grupo) 8 1530.000 191.250
Padre 1 211.250 211.250 5.633 0.0450 0.0450 0.0450
Padre por género 1 151.250 151.250 4.033 0.0795 0.0795 0.0795
Padre por sujeto (grupo) 8 300.000 37.500
------------------~A~n~á~l~~·s~is~s~u~bs~ig~u~i~en~t~e~d~e~sp~u~é~s~d~e~l~A~N~O~VA~o~d~e~x~2----------~~
116

"'....q¡
"O 114
"'c.

"O 112
r;!

"O 110 -+---Padre
"'
o
"O
---Madre
"'
E 108
·¡:¡
"'

Q¡ 106
"O

"'
'6
Q¡ 104
~

102
Hombre Mujer
Género de quien estima

Figura 18.8. Media de evaluación deliQ de los padres por hombres y mujeres.

El efecto simple de las evaluaciones de IQ realizadas por mujeres produjo el resultado si-
guiente:

Tabla 18. 21. ANOVA de una vía intrasujetos de los juicios de mujeres sobre el IQ de sus
padres.

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados de F de P G·G H-F
Sujeto 4 315.00 78.75
Padre 1 2.50 2.50 0.286 0.6213 0.6213 0.6213
Padre por sujeto 4 35.00 8.75

Y el efecto simple de las evaluaciones de IQ realizadas por hombres produjo el resultado


sigu iente:

Tabla 18. 22. ANO VA de una vía intrasujetos de los juicios de hombres sobre el IQ de sus
padres.

Suma de Media de Valor Valor


gl cuadrados cuadrados de F de P G-G H-F
Sujeto 4 1215.00 303.75
Padre 1 360.00 360.00 5.434 0.0802 0.0802 0.0802
Padre por sujeto 4 265.00 66.25
296l Investigación cuantitativa en psicología
~------------------~------------~--~~--------------------

Los investigadores se ven forzados a concluir que los efectos simples par.a hombres y mu-
jeres no muestran diferencia significativa en sus evaluaciones del IQ de sus madres y pa-
dres. No obstante, parece que hay un posible efecto que vale la pena investigar más.
Mi consejo estribaría en repetir la investigación con un tamaño de muestra mayor para
dar más poder a la prueba. Tenga en cuenta que al analizar los efectos simples habremos
basado cada ANOVA en cinco evaluadores. El tamaño del efecto (11 2) del padre evaluado
por hombres es 0.196, un tamaño del efecto grande de acuerdo con los criterios de Cohen.
Sin embargo, con el tamaño de muestra pequeño la prueba sólo tendría un poder de alrede-
dor de 0.29. Para alcanzar un poder de 0.8, con este tamaño del efecto, necesitamos alre-
dedor de 16 evaluadores hombres. El tamaño del efecto para evaluadores mujeres es de
0.007, pequeño.

Una advertencia sobre los errores tipo 1


Observe que podríamos aplicar varios análisis para efectos simples. Si seguimos utilizan-
do un nivel de alfa de p = 0.05 aumentamos el peligro de cometer un error tipo l. Es mejor
mantener el número de análisis de efectos simples al mínimo. Como alternativa, podríamos
usar un ajuste de Bonferroni. En el caso de los tres efectos simples sobre pautas de senten-
cia, el ajuste del nivel de a. para cada efecto simple sería:

O.~S = 0.0167

para dejar el nivel de a. general en 0.05.


Note que con ese nivel de a. más riguroso, el efecto simple para toma de decisiones
cuando los participantes estaban solos no sería estadísticamente significativo. Cuando la
probabilidad de cierto análisis alcanza p < 0.05 pero no el nivel ajustado, sugeriría que no
se descarte como no estadísticamente significativo sino que se trate con más cuidado y que se
centre la atención de los lectores en la necesidad de investigar más sobre ese aspecto del
estudio.

Resumen
Después de aplicar un ANOVA, a menudo los investigadores desean explorar aún más los
datos. Los contrastes permiten comparar medias para investigar hipótesis más específicas
de las que se prueban con unANOVA. Los contrastes pueden planearse antes de que se rea-
lice el ANOVA, o no planearse y conducirse una vez que se hayan examinado las medias.
Puede aplicarse una variante sobre contrastes (análisis de tendencia) cuando los niveles de
una variable independiente son cuantitativos más que cualitativos. El análisis de tendencia
permite que las pautas entre las medias se exploren para ver si hay una tendencia entre los
------------------~A~n~á~h~·s~is~s=u=bs~ig~u~i=en~t=e~d~e=sp~u=é=s~d~e~l~A~N=O~VA~o~d~e~x~2__________~¡:297
niveles de la VI. Como en el caso de los contrastes no planeados, es apropiado llevar a cabo
un análisis de tendencia sólo si la razón F original resulta estadísticamente significativa.
El análisis de efectos simples permite ahondar más en el examen de la interacción en-
tre dos VI. Aísla un nivel de una VI a la vez para detectar cómo varían los niveles de la otra.
Los efectos simples pueden resultar estadísticamente significativos, aunque no lo sea la
razón F de la interacción original.
El análisis introducido en el presente capítulo y en el anterior intentan responder si la
media de la variable dependiente difiere entre niveles de una VI. En los dos capítulos si-
guientes se explicarán técnicas para analizar relaciones entre dos o más variables.
19
Análisis de relaciones 1: correlación

Introducción
Los investigadores se interesan a menudo en la relación entre dos o más variables. Por ejem-
plo, quizá quieren saber cómo se relaciona la variable IQ con la correspondiente a ingresos.
En el capítulo se explican las medidas, incluida la conelación, utilizadas para cuanti-
ficar la relación entre las variables y cómo interpretar esas medidas. Se analizan las formas
básicas de correlación para las distintas formas de datos. Luego se amplían tales técnicas y
el uso de la correlación para indagar la confiabilidad y la validez de medidas.

Correlación
Dos variables están correlacionadas si hay cierta fonna de predecir la relación cmtre ellas.
Si las personas de IQ bajo tuvieran ingresos bajos, las de IQ medio ingresos medios y las de
IQ alto ingresos altos, entonces, si conociéramos el IQ de un individuo podríamos prede-
cir, con cierto grado de exactitud, su ingreso. Éste constituiría un ejemplo de correlación
positiva; cuando una variable crece, la otra también. Por otro lado, si se investiga la rela-
ción entre el tamaño de la familia y el ingreso, encontraríamos que los individuos de fami-
lias grandes tienen ingresos bajos, los de familias medianas ingresos medios y los de familias
pequeñas ingresos altos. Se podría predecir entonces con cierto grado de exactitud el ingreso
de alguien a partir del tamaño de su familia. Sin embargo, el ejemplo sería el de una corre-
lación negativa (o inversa); cuando una variable aumenta, la otra disminuye.
Una medida de la relación entre dos variables es la covarianza entre ellas.

298
• _________________________
A_n_ál_is_is_d_e
__re_l_ac_i_on_e_s_l_:_co_r_re_l_a_ci_ó_n______________~¡-299

Covarianza
Imagine que en el ejemplo del IQ y el ingreso se encontró la información siguiente para
una muestra de cinco personas:

Tabla 19.1. IQ e ingreso de cinco personas.

Participante IQ Ingreso
1 85 12 000
2 90 11 000
3 95 15 000
4 100 16 000
5 110 20 000
Media 96 14 800
DE 9.618 3 563.706

La covarianza, como su nombre sugiere, es una medida de cómo varían juntas dos varia-
bles. Para encontrarla se calcula cuánto se desvía la puntuación de cada persona en una va-
riable de la media para la variable y el resultado se multiplica por cuánto se desvía de su
media su puntuación en la otra variable.
Así, para la primera persona esto sería:
(85- 96) X (12 000- 14 800) = 30 800
Repítalo para cada persona y sume los resultados; ello es igual a 131 000. Para tener cuen-
ta del tamaño de la muestra, divida entre el número de personas que proporcionaron las me-
didas menos uno. En este caso, la covarianza es

13 1000 = 32750
5-1

Si la covarianza es grande y positiva, se explica porque quienes tuvieron una puntuación


baja en una variable tendieron a lo mismo en la otra, y las personas con una puntuación alta
en una tendieron a lo mismo en la otra, lo cual hace pensar en una relación positiva entre
ambas variables. De manera similar, una covarianza negativa grande sugiere una relación
negativa. La covarianza cero no muestra relación entre las dos variables.
Hay un problema, sin embargo, con la covarianza usada como medida de la relación;
no tiene en cuenta el tamaño de la varianza de las variables. De ahí que, si en un estudio la
varianza de la variable o variables fue grande, la covarianza sería mayor que en otro estu-
dio con variaciones pequeñas, aun cuando el grado de relación en los dos estudios fuese si-
milar. Por consiguiente, por medio de la covarianza no podríamos comparar las relaciones
para ver si una estuvo más próxima que otra. Por ejemplo, si deseáramos identificar si el
IQ y el ingreso muestran una relación tan estrecha en un país como en otro.
30Ql~_______________l_nv_e_s_ti~ga_c_io_
·n_c_u_a_nt_it_a_ti_v_a__e_n~p_si_co_l_
og~í_a____________________

En consecuencia, necesitamos una medida que tenga en cuenta las varianzas, la cual se
conoce como coeficiente de correlación.

Coeficientes de correlación
El coeficiente de correlación (r), conocido como coeficiente de correlación producto mo-
mento de Pearson, puede hallarse mediante la ecuación siguiente:
Covarianza entre dos variables
r = ------~--~~-----
XDE1 DE2
donde DE1 y DE2 son las desviaciones estándar de las variables.
En ese caso, para el ejemplo del IQ y el ingreso:
32 750
r = 9.618x3563.706

= 0.9555
El efecto de dividir entre las desviaciones estándar es limitar, matemáticamente, el dominio
de r de manera que las mayores correlaciones positiva y negativa que pueden lograrse son
+1 y - 1, en ese orden. Si r está cerca de O significa que no hay relación entre las variables.

Importancia estadistica de un coeficiente de correlación


La hipótesis nula contra la cual se prueba generalmente r consiste en que no hay relación
entre las dos variables. Para ser precisos, la hipótesis nula es respecto al parámetro equiva-
lente a r, la correlación en la población, que por lo común se representa como p (la letra
griega rho). Expresada de manera formal , la hipótesis nula sostiene que la muestra resulta
de una población en la cual la correlación entre dos variables es p = O. Por consiguiente,
con un tamaño de muestra suficientemente grande, la distribución de frecuencia de r, con
esa hipótesis nula, tiene más o menos la forma siguiente, con O como el valor que ocurre
con más frecuencia y con +1 y - 1 como los valores con menos probabilidades de ocurrir
cuando no hay relación:

-1 o 0.5

Figura 19. 1. Distribución de frecuencia de r cuando las muestras se toman de una


población donde no hay correlación.
_________________________
A_n_ál_is_is_d_e__ : _co_r_re_l_ac_i_ó_n______________~~
re_la_c_io_n_e_s_l_

La forma exacta de la distribución depende del tamaño de la muestra o, para ser precisos,
de los grados de libertad de r, que son dos menos el tamaño de la muestra porque r se basa
en las medias de las dos variables. Cuanto mayor sea la muestra, tanto más próxima estará
la distribución de contar con una distribución normal. En el apéndice XIV se dan las proba-
bilidades para r (cuando la hipótesis nula es p = O) y lo siguiente es un extracto de esa tabla
(cómo encontrar la probabilidad de r, cuando la hipótesis nula no es p = O, se explica des-
pués en este capítulo):

Tabla 19.2. Extracto de las tablas de probabilidad para r (cuando la hipótesis nula
es p = 0).
Probabilidades para la prueba de una cola

0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005 1

Probabilidades para la prueba de dos colas

gl = n- 2 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001

0.3090 0.5878 0.8090 0.9511 0.9877 0.9969 0.9995 0.9999 1.0000 1.0000

2 0.2000 0.4000 0.6000 0.8000 0.9000 0.9500 0.9800 0.9900 0.9980 0.9990

3 0.1577 0.3197 0.4919 0.6870 0.8054 0.8783 0.9343 0.9587 0.9859 0.9911

4 0.1341 0.2735 0.4257 0.6084 0.7293 0.8114 0.8822 0.9172 0.9633 0.9741

Observe que en esa tabla se dan las probabilidades para las pruebas de una y de dos colas.

ProbabWdades de r para una prueba de una cola


Si la hipótesis de investigación es direccional, resulta apropiada la probabilidad de una co-
la. Un ejemplo sería si la hipótesis de investigación fuera:
HA: el IQ y el ingreso tienen una correlación positiva.
Con la hipótesis nula
H 0 : no hay relación entre IQ e ingreso.

La hipótesis nula es que no hay relación lineal entre las dos variables en la población. La
habría si se creara un diagrama de dispersión entre ambas variables y los puntos del dia-
grama formaran 1,1na línea recta.
Como había cinco participantes, gl =: 3. En ese caso, la probabilidad de una cola es
p = 0.0056. Respecto al resultado se informaría: había una correlación positiva significa-
tiva entre IQ e ingreso (r = 0.9555, gl = 3, p = 0.0056, prueba de una cola).
3Q2lL--------------~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a____________________

La predicción de una correlación negativa entre las variables también sería una hipó-
tesis direccional. Un ejemplo sería si la hipótesis de investigación fuera
HA: hay una correlación negativa entre el tamaño de la familia y el ingreso.
Con la hipótesis nula
H 0 : no hay relación entre el tamaño de la familia y el ingreso.
Para encontrar la probabilidad de una correlación negativa obvie el signo negativo y lea
la tabla como si el resultado hubiera sido una correlación positiva; una correlación de
r = -0.9555 tiene la misma probabilidad que una correlación de r = 0.9555.

ProbabWdades para r de una prueba de dos colas


Si la hipótesis de investigación es no direccional, se usaría una probabilidad de dos colas.
Un ejemplo de hipótesis no direccional sería si la hipótesis de investigación fuera
HA: hay una relación entre IQ e ingreso.
Con la hipótesis nula anterior:
H 0 : no hay relación entre IQ e ingreso.
Usaríamos aquí una probabilidad de dos colas, con r = 0.9555 y gl = 3, p = 0.0112.

Interpretación de r
Causalidad y correlación
Una trampa por evitar con la correlación, pero en la que se cae a menudo, es suponer que,
como dos variables están correlacionadas, una afecta a la otra o provoca que varíe. Un ejem-
plo muestra los peligros de tal razonamiento. Durante el año se correlacionan el consumo
de helado y el número de ahogamientos. Ello no significa que consumir helado conduzca
al ahogamiento. La relación se produce aquí por el hecho de que cada variable está asocia-
da al tiempo: cuanto más cálido sea el clima, tanto mayores probabilidades habrá de que
las personas consuman helado, vayan a nadar y, por tanto, se pongan en Jiesgo.
Incluso, cuando hay un eslabón causal entre dos variables no sabemos cuál es la cau-
sa y cuál el efecto. Si el estado socioeconómico (ES) y la aparición de enfermedad mental
estuvieran relacionados positivamente, no sabríamos si el ES de las personas afecta la pro-
babilidad de desarrollar una enfermedad mental o si la presencia de ésta modifica su ES.
Como se ha dicho en los capítulos anteriores, la causa y el efecto se identifican mejor
mediante experimentos donde los investigadores manipulan la variable o variables inde-
pendientes y buscan los efectos de las manipulaciones en la o las VD.
co_r_re_ l_a_c i_ó_n______________~~
__________________________A_n_á _lis_i_s _d_e_r_e _la_c_io_n_e_s_l:__

Naturaleza de la correlación
Sin importar cuáles correlaciones se investigan, es trascendental producir un diagrama de
. dispersión de la relación entre las dos variables y considerar aspectos de éstas. Ello se de-
be a que, en ciertas situaciones, puede producirse una correlación importante cuando hay
poca o ninguna relación (una correlación espuria) y, en otras, podría haber una relación que
no se descubre mediante r.
En seguida se muestra la pauta que cabría esperar cuando hay una correlación positi-
va alta entre dos variables:
22 000

20000 o

18 000
o
...
VI
QJ
on 16 000 o
E o
14000

12 000 o
o
10000
80 90 100 110 120
IQ
Figura 19.2. Diagrama de dispersión para una correlación positiva alta (r = O. 9555).

En el diagrama puede trazarse una línea, conocida en ocasiones como línea del mejor ajus-
te, para ilustrar la relación entre las dos variables. Dicha línea es la que pasa por los pun-
tos de datos con la distancia mínima entre ella y los puntos.
22 000

20000 o

18000
oVI
~
on
16 000 o
E o
14000

12 000 o
o
10 000
80 90 100 110 120
IQ
Figura 19.3. Línea del mejor ajuste en un diagrama de dispersión de una correlación
positiva alta (r = O. 9555).
~~----------------ln_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________

Observe que, en el caso de una correlación positiva, la línea va de la esquina inferior iz-
quierda a la superior derecha de la gráfica.
En seguida se muestra el diagrama de dispersión que cabria esperar de una correlación
negativa alta:

7r--------------------------------------,

o o
-1 ~---,----~----~----~----,-----~--~
10000 12000 14000 16000 18000 20000 22000 24000
Ingreso

Figura 19.4. Diagrama de dispersión de una correlación negativa alta (r = -0.877).

En el caso de una correlación negativa, la línea va de la esquina superior izquierda a la in-


ferior derecha de la gráfica.
Para un caso donde no hay relación entre dos variables, imagine que se han considera-
do la talla de zapato y el ingreso:

24000

22000 o
o o
20000 8 o
o
o 18000
VI
....
Q)

""
.E
16000

14000 o
o
12000 o

10000
30 32 34 36 38 40 42
Talla de zapato

Figura 19.5. Diagrama de dispersión para una correlación baja entre dos variables.
------------------------~A~n~ál~is~is~d~e~re~l~ac~i~on~e~s_l_:_co_r_re~l~ac~i~ó~n--------------~~

En el ejemplo, el coeficiente de correlación es r = -0.041 (gl = 8, p = 0.9104, prueba de dos


L

colas). Observe que si bien la computadora produjo la mejor línea de ajuste, no representa
m en forma satisfactoria los datos.

Situaciones en las cuales resulta


espuria una r estadísticamente significativa
Como sucede con la media, r se afecta en gran medida por los puntos alejados. Por ello, si
al ejemplo anterior se añadieran una persona sola con una talla de zapato y un ingreso gran-
des se obtendría el resultado siguiente:

40000

o
o 30000
..."'
(])
on
E o
o o
20000 8 o
o

o
o
o
10000
30 40 50 60
Talla de zapato

Figura 19.6. Diagrama de dispersi ón que incluye un punto alejado.

En este caso, la adición de una persona cambió la correlación de una negativa muy baja a
una positiva grande estadísticamente significativa (r = 0.666, gl = 9,p = 0.0252, prueba de
dos colas).
30000

o o
o
20000 8 o
5l o
!!:
Oll
E ~ o
10 000

o o
10 20 30 40 50
Talla de zapato

Figura 19.7. Diagrama de dispersión obtenido cuando ~e combinan las muestras de dos
poblaciones.
J06lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a__________
Otra situación que podría producir una correlación significativa sería si la muestra incluye-
ra un intervalo irrazonablemente grande en una o en ambas dimensiones. Por ejemplo, si
se incluyeran los niños en el estudio del ingreso y la talla de zapato.
En la figura 19.7 la correlación se volvió grande, positiva y significativa (r = 0.912,
gl = 13,p < 0.0001, prueba de dos colas). En el diagrama de dispersión se observa que, en
realidad, se incluyeron las muestras de dos poblaciones, ninguna de las cuales mostraría
por sí misma la correlación.

Situaciones en las que r no detecta relación


Relación no lineal. En el ejemplo del tamaño de la familia y el ingreso pudo haberse en-
contrado la pauta siguiente:
7
~ 6 o o
.E 5
~
~ 4 o
Cll
"O 3 o o
o
IC 2 o o o
"'
E 1
{!
o

o o

-1
12 14 16 18 20 22 24 26 28 30 32 34
Ingreso (en miles)
Figura 19.8. Diagrama de dispersión de una relación no lineal.

La correlación se da aquí como r = ~.0243 (gl = 8, p = 0.947, prueba de dos colas). Note
que el diagrama de dispersión forma una curva con forma de U. Abajo de un ingreso de
alrededor de 22 000 dólares hay una relación negativa entre el tamaño de la familia y el in-
greso. Arriba de alrededor de 26 000 hay una relación positiva. Es evidente que hay una
relación, pero no puede representarse con una linea recta. El coeficiente de correlación pro-
ducto momento de Pearson (r) es una medida de las relaciones lineales o de línea recta. El
análisis de las relaciones no lineales queda fuera del objetivo del libro. Esa forma de rela-
ción no lineal se describe como polinómica. En ciertas circunstancias pueden transformar-
se una o ambas variables en una relación no lineal para que la relación se vuelva lineal y
entonces pueda aplicarse a Jos datos lar de Pearson. Ello se estudia en el apéndice V.
Rango demasiado restringido. El rango de puntuaciones de una o ambas variables puede
restringirse al menos de dos maneras. La primera es consecuencia de la naturaleza de la co-
rrelación; ambas variables deben tener cierta variabilidad porque, de otro modo, no·puede
tenerse una correlación.
r ----------------------~A~na~·t~is~is~d~e~r~e~la~c~io~n~es~l:~c~or_r~el~a~ci~ó~n--------------~~
Si en el ejemplo del TQ y el ingreso todos los sujetos de la muestra hubiesen tenido
1 un IQ de 100, la correlación sería r = O, pues no tiene sentido preguntar si el ingreso varía
con el IQ si éste no lo hace. (Recuerde la ecuación para r: como la covarianza de IQ y el
ingreso serán O, r debe ser 0.)
1 Puede ocurrir un segundo problema cuando se ha muestreado sólo parte del rango. Por
1 ejemplo, si se practicara nada más el muestreo de los ingresos de las personas con un IQ
en el rango de 120 a 150, quizá no haya relación entre el ingreso y el IQ, en tanto que en
el de 85 a 115 podría darse muy bien una.
Para reiterar, cuando calcule la correlación entre dos variables construya y considere
siempre un diagrama de dispersión de éstas para ver si la relación es lineal y no la afectan
puntos alejados o gmpos separados de puntuaciones o resultados. Asimismo, considere
siempre el rango muestreado de cada variable para verificar si las restringió artificialmen-
te y ocultó así una posible relación, o bien amplió tanto Jos rangos que se creó u.na relación
artificial.

Tamaño del efecto y correlación


Hay una medida útil del tamaño del efecto en la conelación obtenible del coeficiente de la
correlación:
Tamaño del efecto (TE) = 12 x 100

Así, en el caso del IQ y el ingreso:


TE = (0.9555)2 X lOO

91.298
El tamaño del efecto es una medida de la cantidad de la varianza de una variable explicable
mediante la varianza de la otra. En el ejemplo, afmnaríase por consiguiente que 91 .298%
de la varianza del ingreso se explica conforme la varianza del IQ. En otras palabras, me-
nos de 9% de la varianza del ingreso no se explica en términos de la varianza del IQ.
Cohen ( 1988) prefiere usar r como medida del tamaño del efecto y aquí seguiremos su
convención en las tablas de exponentes para r. Cohen juzga que r = 0.1 constituye un ta-
maño de efecto pequeño, r = 0.3 uno mediano y r = 0.5 uno grande en la investigación psi-
cológica. Convirtiéndolos al porcentaje de varianza explicado, se tiene que 1% es un TE
pequeño, 9% uno mediano y 25% uno grande.

Poder y correlación
En el apéndice XV se proporcionan las tablas de poder para 1: En la tabla 19.3 se reprodu-
ce parte de éstas.
3o8l Investigación cuantitativa en psicología

Tabla 19.3. Extracto de las tablas de poder parar, cuando a"' 0.05, para una prueba
de una cola (* denota que el poder es mayor de O. 995).

Tamaño del efecto (r)


n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99
20 0.10 0.20 0.35 0.54 0.74 0.89 0.98 •
25 0.12 0.24 0.42 0.64 0.83 0.95 0.99 * •
60 0.19 0.45 0.76 0.94 0.99 * • * • • •
70 0.20 0.51 0.81 0.97 • • • • •
600 0.79 * * * * * * • •
700 0.84 • • • • * • •

En la tabla se observa el poder que se logra para cierto efecto y tamaño de muestra. Así, si
deseáramos lograr uno de 0.8 en a = 0.05 con una hipótesis direccional, necesitaríamos
entre 600 y 700 participantes para detectar un TE pequeño, entre 60 y 70 participantes para
uno mediano y entre 20 y 25 para uno grande.

Los supuestos de la correlación producto momento de Pearson


La estadística introducida hasta el momento en el capítulo es paramétrica y, por tanto, cuan-
do se utiliza para estadística deductiva, efectúa ciertos supuestos respecto al nivel de me-
dición obtenido y a la naturaleza de las poblaciones de que proviene la muestra. El primer
supuesto es que ambas variables son de un nivel de medición de intervalo o de razón, u ordi-
nales con al menos 20 valores diferentes en la escala. El segundo supuesto consiste en que
las variables son bivariablemente normales en la población. Esto significa que no sólo cada
variable tendrá una distribución normal en la población sino que también, para cada valor
de una de las variables, la otra tendrá una distribución normal en la población. Así, si tomá-
ramos un nivel de IQ, la distribución de ingresos de las personas con este nivel de IQ de-
. be tener una distribución normal. Un supuesto más estriba en que las puntuaciones de una
variable resultarán independientes; es decir, no se afectarán por otras puntuaciones en ella.
Una vez más, tenemos el problema de que, por lo general, se trata cQn muestras y no
CQn poblaciones y, por tanto, es poco probable que sepamos cómo son las distribuciones de
población. De hecho, pocos investigadores verifican la distribución normal bivariable para
la correlación simple, aunque se vuelve importante al usar la estadística de multivariables
descrita en el capítulo 21. No obstante, vale la pena verificar la distribución de cada varia-
ble. Si una de las distribuciones está sesgada o si ambas se hallan sesgadas en direcciones
opuestas, ello puede limitar el tamaño del coeficiente de correlación. ·
...
________________________A_n~ál~is_is_d~e~r~e~la~c~io_n_e_s_l:~c~o_rr~e~
la~cl~·ó_n______________~~

Cuando no se cumplen los supuestos de la correlación producto momento de Pearson,


hay varios coeficientes de correlación que pueden calcularse.

Correlación de punto biserial


A veces, una variable se medirá en una escala dicotómica; por ejemplo, masculino y feme- ·
nino. Hay una variante de la correlación del producto momento de Pearson, denominada
correlación de punto biserial, utilizable en tal situación. Por poner un caso, los investigado-
res podrían estar interesados en la relación entre los fumadores y entre el género y el nú-
mero de cigarrillos fumados. Sin embargo, en lugar de comparar el número promedio de
cigarrillos fumados por los hombres y las mujeres para ver si hay una diferencia (por me-
dio de una prueba t entre individuos o una prueba U de Mann-Whitney), podrían considerar
la correlación entre el género y el hábito. La manera usual de codificar la variable dicotó-
mica es llamar a un nivel Oy al otro l. No importa en qué sentido, sólo que afectará si la
correlación es positiva o negativa. En la tabla siguiente se codificó de nuevo a los varones
como O y a las mujeres como 1:

Tabla 19.4. Número de cigarrillos fumados al día por hombres y mujeres.

Género Codificación Fumadores


Hombre o 15
Hombre o 15
f-
Hombre o 20
Hombre o 30
Hombre o 35
f- Hombre o 10
e Hombre o 25
h Hombre o 20
Hombre o 15
Hombre o 20
Mujer 1 5
Mujer 1 7
Mujer 1 3
Mujer 1 20
Mujer 1 15
Mujer 1 20
Mujer 1 7
Mujer 1 10
Mujer 1 20
Mujer 1 25
J10lL--------------~I~nv_e~s~ti~ga~c_ió_n_c~u_a_nt_it_a_ti_va~e_n~p_si_co_l~og~í_a____________________

En seguida se observa el diagrama de dispersión de los datos recodificados:


40
"'
'5
o
~
o
a.
~
"O
30 o
"'
E
2

~ 20
"'
ctl

"'
"O 10
e
"'E
'"z o
- 1.0 0.0 1.0 2.0
Recodificación de género
Figura 19.9. Línea del mejor ajuste para la relación entre el género y el número de
cigarrillos fumados (entre fumadores).

La línea del mejor ajuste corta los niveles de las VI en sus medias. Por consiguiente, ínter-
seca a los hombres en 20.5 y a las mujeres en 13.2.
El coeficiente de correlación es r = -0.4478, lo cual muestra una relación media a gran-
de entre el género y el hábito de fumar. Si a las mujeres se hubiera identificado como O y
a los varones como 1, la correlación habría sido positiva.
Para encontrar la probabilidad de la correlación de punto biserial se usa el mismo mé-
todo que para probar la probabi lidad de 1: Si la hipótesis fuera que habría una relación ne-
gativa entre el género y el hábito de fumar (ello significa, dada la clasificación de varones
como O, que éstos fuman más que las mujeres), podría realizarse una prueba de una cola.
Así, con r = - 0.4478, gl = 18, la probabilidad es p = 0.0239, prueba de una cola.
El análisis de la correlación de punto biserial muestra que la distinción entre pruebas
diseñadas para buscar diferencias entre grupos y las que buscan relaciones entre las varia-
bles es un poco artificiaL En el capítulo próximo se retomará el tema.

Correlación biserial
En el ejemplo anterior, el género es auténticamente dicotómico. Sin embargo, a veces la di-
cotomía se ha impuesto a una variable que no lo es en realidad; por ejemplo, si se coloca a
las personas en dos grupos: viejo y joven. En estos casos hay una variante de la correlación
de punto biserial conocida como correlación biserial. Este método se usa rara vez; en par-
te, porque su cálculo y uso conllevan ciertos problemas cuando las distribuciones no son
normales y, por consiguiente, los lectores interesados deben consultar a Howell ( 1997). Co-
mo alternativa, en tal situación sería perm isible usar phi o la phi de Cramer, que se descri-
ben después en este capítulo como "Correlación y datos nominales".
_________________________ re_la_c_io_n_e_s_l_:_co_ r_re_l_ac_i_ó _n ______________~¡:311
A_n_ál_is_is_d_e__

Correlación n_o paramétrica


Por lo menos datos ordinales
Cuando los datos están al menos en el nivel de medición ordinal puede usarse una de dos
medidas de correlación: la rho de Spearman (p ), que se conoce a veces como coeficiente
de correlación rango-orden de Spearman; y la tau de Kendall (1:), denominada también
coeficiente de correlación rango-orden de Kendall. La rho de Spearman se ha vuelto más
popular en los programas estadísticos, debido en parte a que antes de las computadoras era
la más fácil de calcular. Sin embargo, su desventaja radica en que, simplemente, no puede
usarse para calcular correlaciones parciales, a diferencia de la tau de Kendall. La correla-
ción parcial, que se explica después con más detalle, permite eliminar de la relación entre
dos variables los posibles efectos de una tercera variable.
Como ejemplo de correlación no paramétrica, imagine que los investigadores desean
analizar la relación entre el tiempo que los alumnos han estudiado psicología y el grado en
que la consideran una ciencia. Se preguntó a 11 alumnos de psicología cuánto tiempo la ha-
bían estudiado y se les pidió evaluar, en una escala de 5 puntos --que varía de 1 = no en
absoluto a 5 = definitivamente una ciencia-, sus creencias acerca de si es una ciencia. En
seguida se muestran los datos del trabajo:

Tabla 19.5. Tiempo durante el que los alumnos han estudiado psicología y su opinión
acerca de si es una ciencia.

Años de est udiar Evaluación de la psicología


Participante psicología como ciencia
1 1 1
2 2 1
3 3 2
4 4 3
5 5 4
6 1 3
7 2 3
8 3 2
9 4 5
10 5 5
11 6 5

- 1 1 1 1 111111
J12l~ _______________l_n_ve~s~ti~ga_c_io_'n_c_u_a_n_ti_ta_tl_·v_a_e_n~p_si_co_l_o~gí_a____________________
La rho de Spearman y la tau de Kendall pueden calcularse convirtiendo las puntuaciones
de una variable en rangos, si bien ese procedimiento no es necesario con la tau de Kendall.
Como de costumbre en tales pruebas, las puntuaciones del mismo valor (empates) reciben
el rango medio. Así, como dos participantes habían estudiado psicología durante un año,
ocupan los primeros dos rangos y se les asigna la media de ellas: 1+ 2 = 1.5. Véase la des-
2
cripción de la prueba de rangos con signo de Wilcoxon para pares igualados en el apéndi-
ce VI para una explicación completa de datos ordenados por rango.

Tabla 19.6. Años durante los cuales se ha estudiado psicología y opinión acerca de si es
una ciencia, más los rangos.
Años de estudiar Evaluación Rango Rango
Participante psicología de la psicología de años de la evaluación
1 1 1 1.5 1.5
2 2 1 3.5 1.5
3 3 2 5.5 3.5
4 4 3 7.5 6
S 5 4 9.5 8
6 1 3 1.5 6
7 2 3 3.5 6
8 3 2 5.5 3.5
9 4 5 7.5 10
10 5 5 9.5 10
11 6 5 11 10

La rho de Spearman
El cálculo de la rho de Spearman produce el mismo resultado que si las puntuaciones de
cada variable se convirtieran a los rangos para esa variable y se calculara la correlación
de producto momento de Pearson. Sin embargo, en una versión de rho se supone que nin-
guna puntuación es la misma en una variable específica y éste es un valor comúnmente
dado por las computadoras. En el apéndice X se da un ejemplo resuelto.
Con la ecuación simplificada, rho = 0.77.
Observaciones empatadas. Cuando no hay empates en los datos ambas versiones de la rho
de Spearman generan el mismo resultado. Sin embargo, cuando dos o más puntuaciones
son las mismas en cierta variable, la ecuación simplificada es incorrecta y hay una versión
de rho que corrige los empates y produce el mismo resultado que se obtendría de aplicar el
procedimiento de la correlación producto momento de Pearson a los rangos. En el presente
..
________________________ l: _c_or_r_el_a_ci_ó_n______________~~
A_na_'l_is_is_d_e_r_e_la_c_io_n_es__

ejemplo hay más de un estudiante en cada uno de los primeros cinco años y más de una
persona dio las valuaciones 1, 2, 3 o S. El valor de rho con los empates corregidos es igual
1 a O. 762. La versión de rho respecto a la cual usted debe informar es la que corrige los
empates.
Probabilidad de la rho de Spearman. Con una muestra de 100 o menos participantes, uti-
lice la tabla de probabilidades del apéndice XIV. Cuando el tamaño de la muestra es supe-
rior a 100, hay una ecuación que convierte rho en un valor t y permite usar las tablas de t
para verificar la probabilidad.
Como alternativa, cuando el tamaño de la muestra es mayor que 100 hay una aproxi-
mación z utilizable para calcular la probabilidad de rho que, si bien menos precisa que la
conversión de rho en t, podría usarse si se tiene acceso a tablas de z más detalladas. En el
apéndice X se presentan las ecuaciones para convertir rho en t y z. La probabilidad de es-
te resultado, como una prueba de una cola, es 0.0025 < p < 0.005. Sobre el resultado debe
informarse: se encontró una correlación positiva estadísticamente significativa entre el
tiempo que los alumnos han estudiado psicología y su opinión acerca de si es una ciencia
(rho = O. 762, 0.0025 < p < 0.005, prueba de una cola. N = 11). Si el tamaño de la mues-
tra fue tan grande para justificar el uso de una prueba t o z para encontrar la probabilidad,
informe respecto al valor de t o z.

La tau de Kendall
La tau de Kendall difiere de la rho de Spearman. Ésta ordena numéricamente las puntuacio-
nes originales (o rangos) para una variable y examina el orden creado para la otra variable.

Tabla 19.7. Tiempo durante el que se ha estudiado psicología y las puntuaciones,


ordenadas numéricamente según el tiempo de estudiarla.
Años de estudiar Evaluación
Participante psicología de la psicología
6 1 3
1 1 1
2 2 1
7 2 3
3 3 2
8 3 2
9 4 5
4 4 3
10 5 5
5 5 4
11 6 5

...
'
J14l Investigación cuantitativa en psicología
~------------------~------------~----~--------------------

Si ambas variables tuvieran una relación positiva perfecta, el orden de las puntuaciones en
la segunda debería ser de la evaluación menor a la mayor y ninguna estaría fuera de lugar.
En el ejemplo anterior, si tomamos la evaluación de la psicología como una ciencia, se ve
que el participante 6 había estudiado psicología sólo durante un año y, sin embargo, le dio
una puntuación de 3, en tanto que los participantes 2, 3 y 8 la habían estudiado durante mu-
cho más tiempo pero le asignaron una evaluación menor. La tau de Kendall tiene que ver
con el cálculo de cuántas puntuaciones están fuera de lugar con relación a cada persona. Si
no hay puntuaciones fuera de lugar, tau = l. Si todos los rangos posibles están fuera de lu-
gar, tau = - 1, que es la misma pauta dada por otros coeficientes de correlación; una corre-
lación positiva perfecta es + l y una inversa perfecta - l.
Si se analizan de nuevo los datos del ejemplo anterior mediante la tau de Kendall, se
obtiene el resultado tau = 0.564.
Observaciones empatadas. Como sucede con la rbo de Spearman, hay un ajuste para los
empates, que da en este caso un valor de tau = 0.639. Véase en el apéndice X un ejemplo
resuelto.
Probabilidad de tau. A semejanza de la rbo de Spearman, existe una aproximación a la
distribución normal para la tau de Kendall. Sin embargo, ésta ofrece la ventaja de que tal
aproximación es exacta para las muestras pequeñas. Así, si el tamaño de la muestra es lO
o menos, se usa la tabla respectiva del apéndice XIV. Para muestras mayores se aplica la
aproximación z mostrada en el apéndice X. La probabilidad en el ejemplo presente puede
calcularse mediante la prueba z, pues la muestra tiene tamaño mayor que 1O. Ello da un
valor de z (ajustado para los empates) de z = 2.738, con una probabilidad de una cola de
p = 0.0031. Para informar acerca del resultado se utiliza el mismo formato que para la rho
de Spearman.

Méritos relativos de rho y de tau


Como se explicó, los coeficientes rho y tau se basan en cálculos distintos y, a menudo, pro-
ducen valores diferentes. Por ello carece de sentido comparar los valores derivados de am-
bas pruebas para ver si difieren dos relaciones. Con el advenimiento de las computadoras, que
sea más fácil calcular la rho de Spearman, en especial para muestras grandes, ya no cons-
tituye una razón para preferirla. Aquí se da preferencia a la tau de Kcndall porque tiene
medios directos para hallar una correlación parcial y porque, como señala Howell (1997),
proporciona una mejor estimación del valor que se obtendría para la población de donde
proviene la muestra que con la rho de Spearman.
________________________
A_n a_'l_is_is_d_e_r_e_la_c_io_n_es_l_:_
c_
o r_re
_ l_ac _______~
_ i_ón

Poder y medidas ordinales de la correlación

Los niveles de poder de tau y de rho se dan en ténninos de su eficacia de poder respecto a
su equivalente paramétrico, la correlación del producto momento de Pearson. Para lograr
el mismo nivel de poder al usar la rho de Spearman o la tau de Kendall, se encuentran el
tamaño de la muestra necesario para el tamaño del efecto y el poder requeridos para la r de
Pearson y se multiplica el tamaño de la muestra por l. l. Por ej emplo, si buscáramos unta-
maño del efecto medio (r = 0.3) con una prueba de una cola y un nivel alfa de 0.05 y de-
seáramos un poder de 0.8, precisaríamos de 68 pa1ticipantes. Por ello, si usáramos la rho
de Spearman o la tau de Kendall necesitaríamos 68 x 1.1 = 74.8 o 75 participantes para lo-
grar el mismo nivel de poder.

1 Correlación y datos nominales


En el capítulo 15, la proporción de hombres y mujeres en una muestra con fumadores se
comparó con la de no fumadores, mediante una prueba de x2 para las tablas de contingen-
i cia. Pueden reanalizarse los datos para preguntar si hay una relación entre el género y la
1 condición de fumador.

1 Tabla 19.8. Número de fumadores y no fumadores en una muestra de hombres y


t mujeres.
1li
Tabla de frecuencia observada
t
Hombre Mujer Totales
Fumador 17 21 38
No fumador 27 23 50
Totales 44 44 88

El valor de x2 para esa tabla de contingencia fue 0.741.


Hay varias medidas de correlación utilizables con datos categóricos, los cuales se ba-
san en x2: el coeficiente de contingencia (C), phi (<j>) y phi de Cramer (<l>c).
e

Coeficiente de contingencia = ~ x+i N


2

:..
J16l~ _______________ln_v_es_tl~·g_ac_io_'n_c_u_a_nt_it_a_ti_va__en~ps_ic_o_lo~g_ía____________________
Howell (1997) señala que el coeficiente de contingencia está limitado de dos maneras: nun-
ca puede tener el valor 1, debido a cómo se calcula; y el valor máximo que puede tener
está acotado por el número de celdas en la tabla de contingencia, por lo cual sólo puede al-
canzar 0.707 con una tabla de 2 x 2.
(;2
Phi = f f¡
Phi se limita al análisis de tablas de 2 x 2, pero hay otra versión que no: la phi de Cramer.

. ~
Pht de Cramer = ~ ~

donde k es el número de filas o el número de columnas de la tabla de contingencia, el que


sea menor. Con una tabla de 2 x 2, la phi de Cramer es igual que phi. Además, con tal ta-
bla, ambas dan el mismo resultado que la correlación producto momento de Pearson, con
cada dicotomía recodificada en ceros y en unos.
En el presente caso:

0.741
Coeficiente de contingencia =
0.741 + 88

~0.00835
0.091

Phi = ~0.741
88
~0.00842
0.092

Cálculo de la probabilidad de correlaciones


basada en datos categóricos
Como cada una de las medidas descritas utiliza x2 , no es necesario encontrar una fuente se-
parada para la probabilidad; podemos usar la probabilidad para el valor de x2 .

Tamaño del efecto y reconsideración de x2


En el capítulo 15 se presentó el tamaño del efecto (w) para x2. Si se comparan la ecuación
de w y la de phi, se verá que son las mismas. Así, para una x2 de 2 x 2, la medida del ta-
maño del efecto es igual que la medida de correlación recomendada para los mismos datos.
Además, observe que phi da el mismo resultado que una correlación de producto momento
________________________
A_ ·l_is_is_d_e_r_e_la_c_io_n_es_l_:_c_or_re_l_ac_i_ón______________~~
na_

(r) realizada sobre los mismos datos y que los valores recomendados para tamaños del efec-
to pequeño, medio y grande para w son los mismos (0.1, 0.3 y 0.5, respectivamente) que
los recomendados para r.

Resumen de métodos de correlación


Tabla 19.9. Resumen de los diferentes tipos de correlación presentados en el capítulo.

Coeficiente Símbolo Cuando sea apropiado


Producto momento de Pearson r Ambas variables por lo menos ordinales.
De punto biserial rpb Una variable por lo menos ordinal; la
otra, una dicotomía verdadera.
Biserial rb Una variable por lo menos ordinal; la
otra, una dicotomía artificial.
Rho de Spearman p Ambas variables por lo menos ordinales,
pero sin reunir los criterios para la r
de Pearson (no puede usarse, simple-
mente, para la correlación parcial) .
Tau de Kendall 't Ambas variables por lo menos ordinales,
pero sin cumplir los criterios para la r
de Pearson (puede usarse para la
correlación parcial).
Coeficiente de contingencia e Ambas variables nominales (proporciona
un intervalo de valores restringido).
Phi <P Ambas variables nominales, pero sólo
con dos niveles cada una.
Phi de Cramer <Pe Ambas variables nominales.

Otros usos de la correlación


En el presente apartado se muestra cómo eliminar de la relación entre dos variables las
posibles influencias de una tercera variable, cómo comparar lo mismo dos coeficientes de
correlación que el coeficiente de correlación de una muestra con el de correlación real o hi-
potético de una población y cómo obtener los intervalos de confianza de r.

Correlaciones parcial y semiparcial


A veces, como en el ejemplo del helado y los ahogamientos, podría haber una correlación
entre dos variables, pero ello se debe a una tercera correlacionada con las dos originales.
En tales casos, si sabemos cómo se correlaciona cada par de variables puede eliminarse el
efecto de la tercera; es decir, podemos remover ese efecto mediante la correlación parcial
o la semiparcial.

J18l~ ______________l_nv_e_s_tig~a_c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si_co_l~og~ía_____________________
Correlación pardal con la r de Pearson
En un estudio, los investigadores quisieron ver si se correlacionaban las aptitudes para las
matemáticas y el inglés entre los niños, pero notaron que la edad podría correlacionarse con
cada una y podría explicar cualquier relación que guardasen. A 10 individuos de una mues-
tra, con edades entre 12 y 14 años, se entregaron pruebas de matemáticas e inglés y se ob-
servó la edad de cada chico.
Cuando se ha calculado un coeficiente de correlación para toda combinación posible
de pares de un conjunto de variables, los resultados se representan por lo general en lo que
se denomina matriz de correlación. En seguida se da la matriz de COJTelación para ias co-
rrelaciones entre las aptitudes para las matemáticas y el inglés y la edad:

Tabla 19.1 O. Matriz de correlación de las aptitudes para matemáticas e inglés y la


edad.

Matemáticas Inglés Edad


Matemáticas 1
Inglés 0.888 1
Edad 0.748 0.862 1 1

Las cifras de la matriz de correlación son los coeficientes de correlación entre pares de va-
riables. La correlación para cierto par de variables se da en el punto donde la columna
rotulada con el nombre de una variable se encuentra con la fila identificada con el de la
otra. En la primera columna se muestran las correlaciones con las matemáticas y en la se-
gunda las del inglés. Ello refleja que la correlación entre las aptitudes para matemáticas e
inglés es r = 0.888, que con gl = 8 es estadísticamente significativa con p < 0.0005 (prueba
de una cola).
Observe que la diagonal de la esquina superior izquierda a la inferior derecha de lama-
triz contiene la cifra 1 en cada celda, pues se trata de la correlación de cada variable con sí
misma. También note que la parte superior derecha de la matriz está vacía, ya que todas las
celdas en esa parte representarían correlaciones que ya se muestran en la matriz. Algunos
programas de computadora dan toda la matriz, pero el presente formato facilita la lectura.
La matriz indica que hay una correlación grande entre las aptitudes para las matemáti-
cas y el inglés, pero hay también una correlación grande entre cada aptitud y la edad. La
ecuación para calcular el coeficiente de correlación de aptitud en matemáticas e inglés re-
moviendo el efecto de la edad es

~'mi.e = 1 2 2
-v(l - r.") x (1-1;..)
A_na_'l_
________________________ is_
is_d_e_r_e_la_cl_
·o_ne_s_l_:_c_or_~_l_
ac_i_ón______________~~

donde rm i.e es la correlación entre la aptitud para matemáticas y para inglés, removiendo
el efecto de la edad
rmi es la correlación entre la aptitud para matemáticas y para inglés
rme es la correlación entre la aptitud para matemáticas y la edad
·- rie es la correlación entre la aptitud para inglés y la edad
Por consiguiente,
0.888-0.748 X 0.862
r . =
mt.e ~(1 - (0.74W) x (1- (0.862)2 )
= 0.723

Para evaluar la significación estadística de una correlación parcial, lea las tablas estándar
de r, pero con tres grados de libertad menos que el tamaño de la muestra. En las tablas de
r vemos que la correlación entre la aptitud para matemáticas y la aptitud para inglés con el
efecto de la edad removido todavía es estadísticamente significativo (0.01 < p < 0.025,
gl = 7, prueba de una cola).
Una manera de ver las correlaciones original y parcial entre las aptitudes en matemáticas
e inglés es notar que la primera sugiere que la varianza de la capacidad para inglés explica
(0.888? x 100 = 78.85% de la varianza de la aptitud para matemáticas. Sin embargo, a la
varianza de la edad explica (0.748? x 100 = 55.95% de la varianza de matemáticas y
(0.862)2 x 100 = 74.30% de la varianza de la aptitud para inglés. La correlación parcial
elimina la parte de la varianza de la aptitud para inglés que se explica en términos de la va-
rianza de la edad y la parte de la varianza de la aptitud para matemáticas ex¡)licable por
la edad, y considera la cantidad de Yarianza compartida restante; es decir; (0.723)2 x 100 =
52.27%.
Es posible remover los efectos de más de una variable en una relación. Por ejemplo,
podríamos remover el efecto del nivel socioeconómico y la edad. Ello se estudia en el apén-
dice X.

Correlación sem;parcial con la r de Pearson


En ocasiones, en lugar de considerar la relación entre dos variables una vez removido el
efecto de una tercera variable en cada una de ellas, los investigadores desean remover sólo
el efecto de la tercera variable en una de ellas; ello se denomina correlación semiparcial.
Nunca he usado la correlación semiparcial en este contexto, pero se vuelve útil como par-
te de la regresión múltiple, según se mostrará en el capítulo próximo.
Si los investigadores estuvieran interesados en encontrar cuán bien la aptitud para in-
glés predice la aptitud para matemáticas cuando se ha removido el grado en que la edad
predice la aptitud para ese idioma, puede usarse la correlación semiparcial mediante la
ecuación que inicia la página siguiente.
320 Investigación cuantitativa en psicología

rm(i.e) =

donde rm(i.c) es la correlación semiparcial entre la capacidad para matemáticas y para in-
glés, ya removida la relación entre la capacidad para inglés y la edad
r mi es la correlación entre la capacidad para inglés y matemáticas
r me es la correlación entre la capacidad para matemáticas y la edad
ric es la correlación entre la capacidad para inglés y la edad

En el ejemplo:
0.888-0.748 X 0.862
r m(i.e)
~(1 - (0.862)2 )
0.4798
Expresada como el porcentaje de varianza (0.4798) 2 x 100 = 23.02%, esa correlación se-
miparcial puede interpretarse como muestra de que la capacidad para inglés explica 23.02%
adicional de la varianza de la aptitud para matemáticas, además de la varianza de la apti-
tud para matemáticas explicada por la edad.

Correlación parcial mediante la tau de Kendall


La ecuación para la correlación parcial mediante la tau de KeodaU es básicamente la mis-
ma que la de la correlación parcial con la correlación de producto momento de Pearson. Si
los datos para la edad, las aptitudes para matemáticas e inglés se analizan de nuevo por me-
dio de la tau de Kendall, encontramos que se correlacionan la aptitud para matemáticas y
la aptitud para inglés, tau = 0.786. Sin embargo, la edad se correlaciona con matemáticas,
tau = 0.593, e inglés, tau = 0.723. Con la ecuación siguiente, el efecto de edad puede re-
moverse de la relación entre matemáticas e inglés:

donde Taumi.c es la correlación entre matemáticas e inglés con el efecto de la edad ya re-
movido
'tmi es la correlación entre matemáticas e inglés
't¡e es la correlación entre inglés y edad
'tme es la correlación entre matemáticas y edad
------------------------~A~n~ál~is~is~d~e~re~l~ac~i~on~e~s_l~:~co~r~re~l=a~ci=ó~n______________~¡:i21

Así,
0.786-0.593 X 0.723
Taumi.e
~(1 - (0.593i) X (1 - (0.723)2 )
0.357
~0.309
0.6422

Probabilidad de la correlación parcial mediante la tau de Kendall. Para encontrar la pro-


babilidad de la tau de Kendall como una correlación parcial, utilice la tabla AXIV.16 del
apéndice XIV. Se observa que, con un tamaño de muestra de 1O, una tau de 0.6422 tiene
una probabilidad de una cola de 0.00 l < p < 0.005.

Diferencia entre dos correlaciones


Los investigadores desean a veces comparar dos coeficientes de correlación para ver si son
significativamente diferentes. No basta comparar los niveles de significación de las dos co-
rrelaciones y notar que una reviste mayor importancia estadística que otra. Es necesario
realizar una prueba estadística donde se comparen ambas correlaciones. Como sucede con
otros tipos de análisis, se usan pruebas diferentes cuando las dos correlaciones son de grupos
de participantes distintos (grupos independientes) o de los mismos grupos de participantes
o relacionados (los grupos no independientes).

Grupos ;ndepend;entes
Los investigadores predijeron que los adultos tendrían una idea más exacta de su habilidad
para recordar (su metamemoria) que los niños. Diseñaron una medida de metamemoria que
dieron a un grupo de 30 adultos y a uno de 30 niños. Asimismo, probaron los recuerdos rea-
les de ambos grupos. Se obtuvieron los resultados siguientes: la correlación para la meta-
memoria de los niños y la memoria real fuer = 0.5; y la correlación para la metamemoria
de los adultos y la memoria real, r = 0.8. Antes de introducir la ecuación para la prueba,
cabe analizar una complicación.
Como estamos probando la diferencia entre dos coeficientes de correlación, no un coe-
ficiente de correlación c~ntra la hipótesis nula de que la correlación es cero, la distribución
no se distribuye normalmente. Fisher creó una manera de transformar r en r', que tiene una
distribución normal y petmite usar una prueba z para comparar las correlaciones. (De mo-
do confuso, esa transformación se describe a veces como Zr de Fisher. Sin embargo, se pre-
fiere r' para evitar confusión con las pruebas z.)
322lL______________~I~nv~e~s~ti~ga=c~io~·n~c=u~a~nt~it=a~tl~·v~a~e~nLp~si~co=l~og~í~a____________________
En el apéndice XVI se proporciona la r' equivalente para distintos valores de r y la
ecuación creada por Fisher para quienes desean una transformación más exacta cuando no
está tabulado el valor de r.
La ecuación para comparar dos coeficientes de correlación independientes es

z =
1 1
---+--
n,- 3 n2 - 3

donde r' 1 es la transformación de Fisber de un coeficiente de correlación


r'2 es la transformación de Fishcr del otro coeficiente de correlación
n1 es el tamaño de la muestra de un grupo
n2 es el tamaño de la muestra del otro grupo
En las tablas de conversión de r a r' se observa que r = 0.8 se convierte en r' = 1.099 y
r = 0.5 en r' = 0.549. Por ello, la prueba z para la comparación entre los dos coeficientes
de correlación es:
1.099 - 0.549
z
~ 30~3 1
+ 30 - 3

= 2.02

Al buscar la probabilidad de una cola de ese valor en las tablas de z (apéndice XIV) se en-
cuentra que p = 0.0217. Por consiguiente, los investigadores concluyen que los adultos tie-
nen metamemorias más exactas que los niños.

Grupos no ;ndepend;entes
La ecuación para la diferencia entre los coeficientes de correlación no independientes di-
fiere de la anterior y, por su complejidad, incluí su explicación en el apéndice X.

Diferencia entre la correlación de una muestra


y la de una población (cuando H0 no es p = O)
Como se mencionó, r tiene un parámetro equivalente para la población: p (no confundir
con la rho de Spcarman). Los investigadores desean a veces comparar el coeficiente de co-
rrelación de un estudio con el que se sabe, o se supone existe para una población. Por ejem-
plo, pueden saber, de un trabajo anterior, que la correlación entre las puntuaciones de
extraversión de gemelos monocigóticos (idénticos) criados juntos es r = 0.7. Se tiene una
muestra de 20 gemelos monocigóticos criados aparte cuyas puntuaciones de extraversión
________________________ l:_c_or_r~el~a~d~ó_n______________~j323
A_na_·l_is_is_d_e_r_e_la_c_io_n_es__

se correlacionan, r = 0.4, y quieren ver si los segundos tienen una correlación significati-
vamente menor que los primeros.
Esa forma de comparación es similar a la de dos correlaciones independientes y usa la
ecuación siguiente:
r' - p'
z = --

fS
donde r' es la transformación de Fisher del coeficiente de correlación de la muestra
p' es la transformación de Fisher del coeficiente de correlación de la población
n es el tamaño de la muestra (en este caso, el número de pares de gemelos)
Una p de 0.7 se convierte en p' = 0.867 y una r de 0.4 en r' = 0.424. Por consiguiente,
0.424- 0.867

&
z =

= - 1.83

Los investigadores supusieron que los gemelos criados aparte tenían una correlación menor
(por supuesto, antes de reunir los datos) y que así se justificaba el uso de las probabilidades
de una cola en las tablas de z; recuerde obviar el signo negativo al leerlas. La probabilidad de
tal resultado (o de uno más extremo) ocurrido por casualidad se da como p = 0.0336 y, por
tanto, se justificaba que los investigadores rechazaran la hipótesis nula de que las correla-
ciones no diferían y concluyeran que los gemelos monocigóticos criados aparte muestran
menos similitud en la puntuación de extraversión que los otros gemelos.

Intervalos de confianza y correlación


Los coeficientes de correlación tienen una función dual. Por un lado, se usan como estadís-
ticas inferenciales; los investigadores pueden probar la probabilidad de un coeficiente de
correlación ocurrido por azar. Por otra parte, son estadísticas descriptivas que representan
la relación entre dos variables. Como otras estadísticas descriptivas de muestra, pueden
emplearse a fin de estimar el intervalo de confianza para el parámetro equivalente: la co-
rrelación dentro de la población (p ).
En el apéndice X se da un ejemplo resuelto del cálculo del intervalo de confianza para
la población. Recuerde que la correlación entre la metamemoria y la memoria real fue de
0.8 con una muestra de 30 adultos. En el nivel de confianza de 95%, se encontró que p cae
en el intervalo 0.62 y 0.90 .


J24l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a_____________________
Medidas de acuerdo entre más de dos personas
A veces, los investigadores desean conseguir jueces independientes para evaluar los obje-
tos a fin de proporcionar una escala no prejuiciada por sus propios puntos de vista. Por
ejemplo, si los psicólogos quisieran considerar el vínculo entre el atractivo fisico de alguien
y la conducta altruista de otros hacia éste, necesitarían una medida de atractivo fisico . Para
no usar sus juicios, podrían presentar a ciertos jueces los materiales que descaran emplear
en su estudio (por ejemplo, fotografias) y pedirles que los clasificaran según su concepto
de atractivo fisico. Antes de utilizar los criterios como base de su escala, sería importante
conocer cuán bien concuerdan los jueces porque, si hay falta de acuerdo, ello haría pensar
que la medida no era confiable. Mediante el coeficiente de concordancia de Kendall puede
evaluarse el grado de acuerdo entre los jueces.

Coeficiente de concordando de Kendall


La prueba de coeficiente de concordancia de Kendall da una estadística W que es una me-
dida de cuánto concuerda un grupo de jueces cuando se le pide ordenar un conjunto de ob-
jetos según su importancia. Los datos se muestran a continuación:

Tabla 19. 11 . Ordenamiento por rango del atractivo dado por los jueces a cinco
fotografías.

Fotografía

Juez A B e D E
Uno 1 2 3 4 5
Dos 2 1 4 3 5
Tres 3 2 1 5 4
Cuatro 1 3 2 4 5
Ordenamiento por rango total (R) 7 8 10 16 19
Media de R 1.75 2 2.5 4 4.75

Suma de medias de los ordenamientos por rango


Media del rango general =
k

donde k es el número de casos por clasificar. En el presente ejemplo,


1.75+2+2.5+4+4.75
Media del rango general
5
3
_______________________ l:_c_o_rr_e_la_ci_ó n_ ____________--J~
A_na_'l_ist_·s_d_e_re_l_ac_io_n_e_s_

Para hallar W se usa la ecuación


W = 12 x I (R media - R media genera1) 2
k x(e - 1)

donde I(Rmedia-Rmediageneral)~ es la suma de las desviaciones al cuadrado de cada R


media de la R media general
k es el número de fotografías sometidas a juicio
(la ecuación siempre tiene un multiplicador 12)

12 x ((l.75 - 3)~ + (2 - 3)~ + (2.5- 3)1 + (4 - 3) 2 + ( 4.75- 3) 2 )


W= --~------------~--------------~
1
5x(5 - l)

12 X (1.5625 + 1+ 0.25 + 1+ 3.0625)


5x24
82.5
=
120
0.6875

Mediante la tabla AXIV.l7 del apéndice XIV se encuentra que ese nivel de W es estadísti-
camente significativo y que p < 0.01. Por tanto, podemos concluir que hay un grado de
acuerdo entre los jueces acerca del atractivo de las personas representadas en las fotogra-
fías. Así que podrían usarse las evaluaciones medias de cada fotografía para proporcionar
el orden de atracción de las cinco.
W no puede tener valores negativos. Varía entre O, lo cual significaría ningún acuerdo
entre los jueces, y +1, que denotaría un acuerdo perfecto entre ellos.
El coeficiente de concordancia de Kendall también permite a un juez dar la misma cla-
sificación a dos objetos. En tal caso, hay una ecuación modificada para calcular W que se
ajusta para tales empates. En el apéndice X se proporcionan la ecuación y un ejemplo re-
suelto.

Uso de correlación para evaluar


confiabilidad y validez de las medias
Confiabilldad
En el capitulo 2 se definió medida confiable como la que producirá una puntuación consis-
tente de una ocasión a otra. Puede medirse mediante un coeficiente de confiabilidad, que
es en teoría la proporción de la varianza de la entidad que se mide explicada por la medida
que se utiliza para medir la entidad; por ejemplo, la proporción de la varianza de la ansie-
dad en un grupo de personas, que se mide por una escala de ansiedad.
J26lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
Se tratarán dos tipos de confiabilidad. Llamaré a la primera confiabilidad de test, la
confiabilidad de una medida cuando se toma de varias personas; por ejemplo, una medida
de depresión o un test de aptitud. La segunda es la confiabilidad entre jueces, el grado de
acuerdo entre dos o más jueces que usan una medida (digamos, dos investigadores que eva-
lúan el tipo de interacción que ocurre entre una madre y su niño).

Confiabilidad de test
Hay tres tipos de confiabilidad del test que los investigadores podrian querer evaluar, se-
gún el uso por dar a una medida: test-retest, forma alternativa (o paralela o equivalente) y
la consistencia interna.
Confiabilidad test-retest. Si un test se diseña para medir algo considerado relativamente
fijo, como algunas personas consideran el IQ, se querrá una medida que producirá los mis-
mos resultados de una ocasión a la siguiente. Para comprobarlo, los diseñadores de una
prueba se la darán a un grupo de personas en dos ocasiones; Kline (1993) recomienda que
se pruebe por lo menos a 100 personas y que el lapso sea de tres meses mínimo entre las
ocasiones. Puede usarse la correlación de producto momento de Pearson para correlacionar
los resultados de las dos ocasiones. Kline (1993) ver = 0.8 (o?= 0.64) como un mínimo
debajo del cual no querriamos ir; recuerde: esto significa que 64% de la varianza de los re-
sultados de la prueba en una ocasión se explica por la de los resultados de la otra ocasión.

Confiabilidad de forma alternativa. En ciertas situaciones, no será práctico dar la misma


prueba o test dos veces y tomarla en una ocasión afectará la forma en que se desempeña un
individuo en la prueba la segunda vez. En tales circunstancias, los investigadores preparan
dos versiones de la prueba. Quizá se desee medir un cambio con el tiempo, por ejemplo, en
una habilidad antes de la capacitación y tras ella. Los psicólogos querrán estar seguros de
que cualquier diferencia del desempeño entre ambas ocasiones no se debe a las diferencias
inherentes a las dos formas de la prueba, lo cual podria traer la amenaza a la validez interna
conocida como instrumentación. Por ello, al intentar establecer la confiabilidad de ambas
versiones, correlacionarán el desempeño de sus participantes en éstas, que puede tomarse
en la misma sesión; una vez más, puede usarse lar de Pearson. (Kline - 1993- dice que,
con suerte, r sería por lo menos 0.9; es decir, confiabilidad de 0.81, pero que ello se logra
rara vez.)

Con.fiabilidad de consistencia interna. En ausencia de dos formas de la prueba, puede ve-


rificarse que ésta tenga elementos consistentes entre sí. Hay varias medidas de consistencia
interna; la más simple es correlacionar el desempeño en dos mitades de la prueba: confia-
bilidad de mitad dividida.
Análisis de relaciones 1: correlación l3ll
------------------------------------------------------------~

Confzabilidad de mitad dividida. La prueba o test puede dividirse en dos partes de varias
maneras. Una sería correlacionar las mitades primera y segunda. Sin embargo, comq mu-
chas pruebas de desempeño incrementan la dificultad de los elementos a medida que avan-
za la prueba, ello no sería idóneo. Una opción es tratar todos los elementos con número par
como una mitad de la prueba y los de número impar como la otra. Una vez más, la r de
Pearson podría emplearse para tal propósito (y luego elevar al cuadrado para obtener un
coeficiente de confiabilidad). Una crítica al respecto radica en que esa medida de confiabi-
lidad se afecta en parte por el número de elementos de una prueba: cuantos más elementos
haya, tanto más confiable aparecerá la prueba. Spearman y Brown produjeron un ajuste que
tomó en cuenta lo anterior (véase en el apéndice X la ecuación de ambos).
Otra crítica sobre el método simple de mitad dividida se refiere a la un tanto arbitraria
asignación de.elementos en las dos mitades. Para evitarla se creó un coeficiente de confia-
bilidad que es el equivalente de haber llevado a cabo todas las posibles mitades divididas
(alfa de Cronbach). Kline (1993) hace notar que alfa nunca debe ser menor de 0.7. Por otro
lado, según Pedhazur y Schmelkin (1991), el usuario de la medida determinará cuán con-
fiable debe ser la prueba conforme a las circunstancias del estudio. No obstante, vale la pena
señalar que el nivel 0.7 se cita con tanta frecuencia, que tendría que argumentarse mucho
para bajar de él, en particular si esperara conseguir que se publique su estudio basado en la
medida. (En el apéndice X se incluye la ecuación para el alfa de Cronbach.)
Una opción ante el alfa de Cronbach, el Kuder-Richardson 20 (KR 20), está disponi-
ble cuando la prueba implica preguntas que tienen sólo dos respuestas posibles, conocidas
como elementos binarios o dicotómicos; por ejemplo, sí/no, correcto/incorrecto o verdade-
ro/falso. (En el apéndice X se proporciona la ecuación para KR 20.)

Error estándar de medjdón


Cuando una medida no es totalmente confiable, la puntuación que alguien logra en una oca-
sión no siempre resultará igual en otra. El error estándar de la medición, una estadística
basada en la confiabilidad de la medida, puede usarse para encontrar un intervalo de con-
fianza respecto a la puntuación de una persona, así que el rango de puntuaciones en el in-
tervalo contendrá la puntuación verdadera de la persona. (En el apéndice X se muestra
cómo hallar el intervalo de confianza para una sola puntuación.)

ConfjabWdad entre evaluadores


A menudo, los investigadores desean comprobar que una medida puede utilizarse de forma
consistente por observadores distintos. Las verificaciones más simples podrían consistir en
usar el porcentaje de acuerdo entre los dos observadores o un coeficiente de correlación. El
porcentaje convenido no tiene en cuenta la cantidad de acuerdo que podría esperarse por azar.
Un coeficiente de correlación positivo grande no siempre muestra que dos observadores

- 11 11 11111•
J28lL-------------~I~nv~e~st~i~ga~c~ió~n_c~u~a~nt~it~a~ti_va~en~p~si~co~l~og~ía~-------------------
están de acuerdo. Dos profesores podrían calificar un conjunto de ensayos y no dar la misma
calificación a ninguno y aun así podría mantenerse perfecta la correlación entre sus califica-
ciones. Ello ocurriría si un profesor diera 10 puntos más a cada ensayo que el otro; recuer-
de que la correlación informa sólo sobre la dirección en que las dos medidas se mueven una
respecto a otra. Una medida que resuelve ambos problemas es la kappa de Cohen (K) . (En
el apéndice X se incluyen la ecuación y un ejemplo resuelto para la kappa de Cohen.)

Validez
La correlación también sirve para verificar aspectos de la validez de una medida al evaluar
el grado de similitud entre una medida de un concepto y la que está construyéndose. Un
ejemplo sería si los investigadores correlacionaran su medida de depresión con los juicios
clínicos de los psiquiatras.

Error estándar de la estimación


Así como el error estándar de la medición puede usarse para encontrar un intervalo de con-
fianza respecto a la puntuación de una persona en una medida cuando ésta no es del todo
confiable, el error estándar de la estimación constituye una estadística utilizable a frn de
hallar un intervalo de confianza para la puntuación de una persona cuando se expresa la va-
lidez de la medida como un coeficiente de correlación. (En el apéndice X se muestra cómo
encontrar tal intervalo.)

Resumen
Un coeficiente de correlación describe la relación entre dos variables. Además, puede usar-
se para encontrar la significación estadística de una relación. Es necesario producir un dia-
grama de dispersión de los datos para las dos variables y pensar sobre la naturaleza de la
muestra que se prueba; de otra forma, se corre el riesgo de pasar por alto una relación por-
que es no lineal o de sugerir una relación que es un artefacto de la muestra.
El grado en que una prueba o test producirá la misma puntuación de una ocasión a otra,
su confiabilidad, y el grado en el que los jueces acuerdan la forma de utilizar un sistema de
puntuación, confiabilidad entre jueces, puede determinarse mediante pruebas basadas en la
correlación. Además, ciertos tipos de validez de una medida pueden verificarse mediante
la correlación.
En el capítulo siguiente se presenta otra forma, afín, de analizar las relaciones: la re-
gresión.
20
Análisis de relaciones 11: regresión

• Introducción
El análisis de regresión constituye otra manera de describir y evaluar relaciones entre las va-
riables. Empero, a diferencia de la correlación, se supone que una es la variable dependiente
(VD) o de criterio y otra u otras son independientes o predictoras. El análisis de regre-
sión se considera una forma de representar modelos, ya que se elabora un modelo matemá-
tico de la relación entre las variables. La regresión permite plantear predicciones específicas
a partir de la variable o variables independientes (VI) respecto a la VD en casos individuales.
En la regresión simple interviene sólo una VI, mientras que la múltiple permite utilizar más
de una a fm de predecir la dependiente y mejorar así la exactitud de la predicción. En este
capítulo se estudia únicamente la regresión lineal; es decir, con la relación entre variables
que, cuando se representa en un diagrama de dispersión, se muestra mejor como una recta.
La regresión no lineal excede los alcances del libro.
Se presupone que usted efectuará los cálculos necesarios mediante una computadora.
Con el presente capítulo se intenta ayudarle a entender la regresión y a interpretar los resul-
tados. Algunos de los aspectos más simples de las matemáticas se incluyen en el apéndice XI.

Regresión simple
Remóntese al ejemplo de la aptitud para las matemáticas, la aptitud para inglés y la edad
expuesto en el capítulo anterior. Supóngase que los investigadores desean, primero, prede-
cir la capacidad respecto a matemáticas a partir de los conocimientos de inglés. En otras

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ __ _ _ _ _ ___J 3·29
3JOlL---------------'~n~ve=s~ti~ga~c~io=·n~c=u=a~n=ti=ta=tl=·v~a~e~n~p~si~c=ol=o~gí~a____________________

palabras, consideran el dominio de tal idioma una VI y la aptitud para las matemáticas una
VD. Ello no significa que se crea que la aptitud para inglés determina la correspondiente a
matemáticas; sólo permite a los investigadores ver cuán precisas son las predicciones que
pueden formular acerca de la aptitud de alguien para matemáticas si se conoce su aptitud
para el inglés. Para hacerlo, encontraron la recta que sintetiza mejor la relación entre am-
bas variables (la línea del mejor ajuste). En seguida se aprecian el diagrama de dispersión
de los puntos de aptitud para matemáticas y conocimientos de inglés y la línea del mejor
ajuste:

90
80
111
~ 70
u
¡:;
-~ 60 o o
...E
~
Q)
50
E
~
'- 40
~
Q.

"·¡:;...
::J
30
Q. 20
<
10
o
o 10 20 30 40 50 60 70 80
Aptitud para inglés

Figura 20. 1. Relación entre las aptitudes para matemáticas y para inglés.

Los ejes de la gráfica se prolongaron a propósito más de lo necesario para mostrar los da-
tos; las razones se aclaran después. La línea del mejor ajuste es la recta que da la distancia
mínima entre sí misma y los puntos de la gráfica.
Si desea averiguar qué valor se predice respecto a la aptitud para matemáticas de un
niño con puntuación de 30 en una prueba de aptitud para inglés, busque primero en el eje
horizontal (aptitud para inglés) el valor 30. Trace luego una linea vertical desde tal valor has-
ta la línea del mejor ajuste. Dibuje después una línea horizontal desde el punto donde en-
contró la linea del mejor ajuste hasta el eje vertical (la aptitud para matemáticas). El punto
que toque en el eje vertical será el valor predicho sobre la aptitud para matemáticas.
La figura 20.2 hace pensar que alguien con puntuación de 30 en inglés tendría una de
alrededor de 32 en matemáticas.
------------------------~A~n~á~li~si~s~d~e~r~e~la~cl~·o~n~es~ll~:~re~g~re~s~ió~n~------------~f:3J1
tl 90-
o
so -
le o
V>
70 o o
a: "'
u
·.;;

·-m:.
•lO 60 o o
E
...,Ql 50
"'
E
o
"'.... 40
"'
0..
30
"¡:;...,
::;:¡

0.. 20
<
10
o-,
o 10 20 30 40 50 60 70 80
Aptitud para inglés

Figura 20.2. Predicción de la aptitud para matemáticas a partir de la aptitud


para inglés mediante la línea del mejor ajuste.

Quienes tienen conocimientos matemáticos suficientes saben que cualquier recta de una
gráfica puede representarse mediante una ecuación prototipo, la cual permite especificar
cualquier punto de la recta. Se logra con ello una predicción más precisa que al intentar leer
la gráfica.
A menudo se sigue la convención de llamar Y a un valor del eje vertical y X a uno del
horizontal. La ecuación para una recta de una gráfica tiene siempre esta forma:
Y predicha = a + b x X
donde a es el valor de Y cuando la línea del mejor ajuste corta el eje Y (ordenada al origen)
il- b es una medida de la inclinación de la línea del mejor ajuste (pendiente)
A veces, a y b se denominan coeficientes de regresión.
(En algunas versiones de la ecuación se usan letras diferentes para representar los dis-
tintos elementos de la ecuación e, incluso, puede cambiarse el orden. Sin embargo, sigue
siendo la misma ecuación.)
"'- Cuanto mayor es·el valor de la pendiente, tanto más pronunciada es ésta. Intuitivamen-
te, cuanto más grande es el número por el que usted multiplica el valor horizontal para ob-
tener el vertical, tanto más rápido crecerá éste respecto de aquél.
Otra forma de ver la ecuación de la regresión es la siguiente:

VD predicha = a + b x VI
J32lL______________~I~n~ve=s~ti=ga~c~io=·n~c~u=a~n~tit=a=t¡~·v~a~e~n~p~si~co~l~og~í~a____________________
En este caso:
Aptitud para matemáticas= 4.28832 + 0.94891 x aptitud para inglés
Así, la ecuación de la regresión predice que si un niño tuvo puntuación de 50 en la prueba
de inglés, entonces:
Aptitud para matemáticas= 4.28832 + 0.94891 x 50
= 51.734

La siguiente constituye una amplificación del diagrama de dispersión en el área donde la


aptitud para inglés es 50:

65

60 o
"'u<O
·.;:;
·<O
E 55
...,C1l
<O
E
e 5o
<O
a.

·ªo.
"O

45
<(

40 o

35+-~~~T-~~~~~~~~~~~~~~-+
45 46 47 48 49 50 51 52 53 54 55
Aptitud para inglés

Figura 20.3. Amplificación del área que rodea las puntuaciones de 50 para inglés.

De hecho, quien obtuvo 50 en la prueba de inglés también consiguió 50 en la de matemá-


ticas. Por consiguiente, la predicción es cercana, mas no perfecta. Esto no representa más
de lo que podría esperarse a partir del coeficiente de correlación, r = 0.888, entre aptitud
para inglés y para matemáticas según se estableció en el capítulo 19, lo cual significaba que
78.85% de la varianza de la aptitud para matemáticas podría explicarse por la varianza de
la aptitud para inglés. Entonces, 100 - 78.85 = 21.15% es la varianza inexplicada.

Prueba de la significación estadística del análisis de regresión


El análisis de regresión puede presentarse, igual que la con·elación, como porcentaje de la va-
rianza explicada. Ello significa que podría someterse a un análisis de varianza, separando
----------------------~A~n~á~li~si~s~de~re~l~ac~io~n~e~s_ll_:_re~g~r~es~io~·n__________~--~¡383

ésta de la VD en la que puede ser explicable por la VI y la varianza que sigue sin explicar-
se (residuo). La razón F está formada por:

F = Varianza de VD explicada por la Vl


Varianza de VD no explicada por la VI

La tabla donde se resume el análisis es igual que la resultante de calcular un ANO VA de


una vía entre sujetos (tabla 20.1).

Tabla 20. 1. Resumen del análisis de varianza en una regresión simple con aptitudes para
inglés como predictor y para matemáticas como variable dependiente.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F

Regresión 1 1 381.606 1 381.606 29.801

Residuo 8 370.894 46.362 p = 0.0006


Total 9 1 752.5

Interpretación de la tabla
de resumen de una regresión simple
Las fuentes de la varianza son claramente la regresión, el residuo y su suma, el total. Los gra-
dos de libertad (gl), para el total son uno menos el número de participantes: 10- 1 = 9.
El gl para la regresión es el número de VI del análisis, que es 1 en este caso. El gl del
residuo se encuentra sustrayendo del gl total el correspondiente a la regresión: 9- 1 = 8.
Las sumas de cuadrados son las correspondientes a las desviaciones de la media eleva-
das al cuadrado; y la suma total de cuadrados, la de los cuadrados para la VD. Para calcu-
lar la suma de los cuadrados de la regresión se resta la media para la VD del valor predicho
de la VD para cada persona, se eleva al cuadrado el resultado y se suman esos valores al
cuadrado (véase un ejemplo en el apéndice XI). La suma de cuadrados del residuo es la su-
ma de las diferencias elevadas al cuadrado entre los valores predicho de la VD y real para
cada persona; también se halla con sustraer la suma de los cuadrados para la regresión de
la suma total de cuadrados.
Las medias de cuadrados (MC) se forman, como de costumbre, dividiendo la suma de
cuadrados entre su respectivo grado de libertad. Para calcular la razón F se divide la MC
de la regresión entre el correspondiente al residuo. El valor p se encuentra en las tablas F
normales que usan los dos valores apropiados para los gl, en este caso 1 y 8. Como suce-
de con el ANOVA, el valor pes para una prueba de dos colas.


334 Investigación cuantitativa en psicología

Vinculos entre correlación y regresión simple


Si se divide la suma de cuadrados debida a la regresión entre la suma total de cuadrados se
encuentra la proporción de la varianza global debida a la regresión. De multiplicar el resul-
tado por 100 se obtendrá el porcentaje de la varianza explicada por la regresión.
138 606
1. X lOO= 78.84o/!
1752.5 o

Ese valor es el mismo (permitiendo los errores introducidos por redondeo) que el dado por
el coeficiente de correlación.
En el apéndice XI se examinan otras similitudes entre regresión y correlación.

Regresión múltiple
La regresión múltiple puede considerarse una generalización de la regresión simple a situa-
ciones donde hay una variable dependiente y más de una independiente (o predictor). En el
ejemplo de aptitud para matemáticas, podrian medirse varios factores, digamos IQ y estado
socioeconómico, así como aptitud para inglés y edad. Entonces, podria buscarse qué com-
binación de tales variables predice mejor la aptitud para matemáticas. Así se podría ser
capaz de explicar más de la varianza de la aptitud para matemáticas y tener con ello un mo-
delo mejor que permitiría predecirla con mayor precisión. Una regresión múltiple se expre-
sa tanto en términos de una ecuación que relaciona las VD y las VI como por un coeficiente
R de correlación múltiple.

¿Por qué se necesita la regresión múltiple?


Usted podría opinar que basta correlacionar múltiples variables con la aptitud para matemá-
ticas y ver con cuáles se obtiene la correlación más alta y conservarlas como medidas utili-
zables a fin de predecir la aptitud para matemáticas. Según se demostró con el análisis sobre
correlaciones parcial y semiparcial en el capítulo 19, puede haber superposición entre las
VI en la varianza explicada por ellas en la VD. Ello significa que sin la regresión múltiple
no se tendría un modelo matemático para predecir la aptitud para matemáticas. Además,
por la posible imbricación entre las variables independientes, algunas tal vez no aporten
mucho al modelo; la varianza explicada por ellas quizá la expliquen otras variables. Saber-
lo ahorraría la toma innecesariamente grande de medidas de un individuo cuando se desea
predecir su aptitud para matemáticas.
La ecuación para una regresión múltiple es una generalización de la ecuación para la
regresión simple. Si hubiera sólo dos VI:
VD= a+ b 1 x VI 1 + b2 x VI 2


• ________________________A_n_á_li_si_s_de__re_L_
ac_io_n_e_s_ll_:_re~g~re_s_io_·n______________~¡385

En consecuencia, si se deseara estimar la relación entre las aptitudes para matemáticas e


inglés y la edad, la ecuación sería ésta:

Aptitud para matemáticas = a + b 1 x aptitud para inglés + b2 x edad


El análisis de regresión (con la edad expresada en meses) da los valores siguientes:
Aptitud para matemáticas = 16.979 + 1.012 x aptitud para inglés - 0.107 x edad

Ahora, si se supiera que un niño obtuvo 50 en la prueba de inglés y que su edad era de 150
meses (12.5 años), el modelo predeciría esto:
Aptitud para matemáticas= 16.979 + 1.012 x 50-0.107 x 150
= 51.529
Ese valor es ligeramente más cercano al valor real de 50 predicho sólo mediante aptitud
para inglés, pero no muy cercano. Veamos el coeficiente de correlación múltiple (R) y el
análisis de varianza:

Tabla 20. 2. Resumen de una regresión múltiple con la aptitud ~ara matemáticas
como variable dependiente y la aptitud para inglés y la edad como
independientes.

Cuadrado Cuadrado
Casos R de R de R ajustado
10 0.889 0.79 0.729

Tabla del análisis de varianza


Suma Media
Fuente gl de cuadrados de cuadrados Prueba F
Regresión 2 1 383.705 691.852 13.132
Residuo 7 368.795 52.685 p = 0.0043
Total 9 1 752.5

R se da como 0.889, lo cual es sólo ligeramente mayor que el coeficiente de correlación


para inglés y matemáticas (r = 0.888). R 2 es igual que 0.79; y con cuatro decimales, 0.7896.
Puede usarse R2 para encontrar la proporción de varianza explicada de la misma manera
que para r2. Así, la proporción de varianza de la aptitud para matemática~ explicada por la
aptitud para inglés y la edad juntos es 0.7896 x 100 = 78.96%. (Como sucede con la regre-
sión simple, el porcentaje de varianza explicado también se encuentra dividiendo la su;:na de
1383 705
cuadrados de la regresión entre la suma total de cuadrados: · x 100 = 78.96%.) Ello
1 752.5
336 Investigación cuantitativa en psicología

significa que por agregar la edad en la ecuación se ha explicado 78.96 - 78.84 =0.12% de
la varianza de la aptitud para matemáticas. El valor de 0.12%, o bien, 0.0012 (como pro-
porción de la varianza) constituye el cuadrado de la correlación semiparcial de la aptitud
para matemáticas y la edad, y la aptitud para inglés no se considera en la edad. Según lo
anterior, la regresión puede verse como sigue:

Rm.ie2 = r mi2+ r m(i.e)2

donde Rm.ie es el coeficiente de la correlación múltiple de las variables independientes ap-


titud para inglés y edad con la dependiente habilidad para matemáticas
rmi es la correlación simple de aptitud para matemáticas y para inglés
rm(i.e) es la correlación semiparcial de la aptitud para matemáticas y la edad, y la
aptitud para inglés eliminada de la edad (según se definió en el capítulo 19)

Si se agregara otra VI al modelo, por ejemplo, estado socioeconómico (ES), la varianza


adicional sería el cuadrado de la correlación semiparcial de ES con la aptitud para matemá-
ticas cuando la de inglés y la edad se han eliminado del ES.

R2 ajustada

La R2 ajustada es una estimación de R2 en la población y considera lo mismo el tamaño de


la muestra que el número de variables independientes: cuanto más pequeña sea la muestra,
tanto mayor será el ajuste. Según la experiencia del autor, los psicólogos quizá presenten
la R2 ajustada en la tabla de resultados, pero raramente se refieren a ella. La ecuación para
R2 ajustada se proporciona en el apéndice XI.

Tipos de regresión múltiple


Hay varias maneras de realizar una regresión múltiple. Difieren en cómo se eligen las va-
riables independientes para incorporarse en el modelo.

Regresión múltiple estándar

En la regresión múltiple estándar simplemente se incorporan todas las variables indepen-


dientes en el modelo. El ejemplo tratado hasta ahora es de esa clase. Resulta muy útil cuan-
do usted pretende explicar en lo posible la varianza de la VD y no desea tomar medidas que
agregan sólo un ápice de información.
________________________A_n_á_
li_ s~de~re~l~ac~io~n~e~s_ll_:_re~g~re_s_io_'n______________~f387
si_

Regresión múltiple jerárquica (o secuencial)


En la regresión múltiple jerárquica (o secuencial) se introducen las VI en el modelo en un
orden preestablecido, el cual se determina mediante el modelo que tiene el investigador. Lo
anterior puede generalizarse de manera que un modelo se construya con lo que constituye
una VD en una regresión pero que se vuelve VI en otra. De esta manera, puede efectuarse un
análisis de trayectoria según los datos. Un ejemplo sería si los psicólogos industriales de-
searan probar un modelo que evalúe las contribuciones relativas de personalidad y del IQ
a la predicción del desempeño en el trabajo anterior, y del IQ, la personalidad y el desem-
peño en el trabajo anterior a la predicción del desempeño presente. El análisis de trayecto-
ria se describe con mayor detalle en el capítulo siguiente.

Regresión múltiple que considera todos los subconjuntos


Con la regresión múltiple que considera todos los subconjuntos se exploran todas las com-
binaciones posibles de variables independientes para identificar la mejor de ellas. Hay varios
criterios a fin de evaluar lo que la constituye. Si bien está disponible en diversos paque-
tes para computadora, la referida no es una técnica recomendada en general.

Regresión estadística múltiple


En la regresión estadística múltiple, denominada en ocasiones técnicas secuenciales, la
computadora escoge las VI que se incorporan en el modelo, según cierto criterio estadístico.
Con tales técnicas se pretende producir la solución que genera la combinación de VI que
explican la cantidad máxima de varianza de la variable dependiente y que omitirá de la
ecuación las VI que no contribuyen de manera significativa al modelo. Como cualquier
procedimiento que cede la toma de decisiones a la computadora, es polémico y se usa sólo
cuando el investigador explora la información y no prueba un modelo específico.
Hay tres tipos de regresión estadística múltiple: la selección hacia delante, la elimina-
ción hacia atrás y la regresión gradual.
Selección hacia delante. Las variables se incorporan una a la vez en el modelo con base
en qué VI explica la mayor parte de la varianza de la VD. Una vez que la primera VI se in-
corporó en el modelo, las restantes se evalúan para identificar cuál explica la mayor parte
de la varianza restante. El proceso continúa hasta que ninguna de las demás variables con-
tribuya en forma significativa al modelo.
Eliminación hacia atrás. Todas las variables se incorporan en el modelo y luego se retira
la de menor contribución al modelo para ver si hay una reducción significativa de la va-
rianza explicada. Si dicho retiro no demerita en forma significativa el modelo, se elimina
tal variable.
338l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í~a____________________
Regresión gradual. En la regresión gradual, como en la selección hacia delante, las varia-
bles se incorporan una a la vez en el modelo. Pero, después de agregar cada una, se revalora
la contribución de todas las ya incorporadas y se elimina la añadida antes que no contribu-
ya significativamente.
La regresión gradual se considera el procedimiento más seguro de los tres. Por consi-
guiente, úsela si explora los datos para encontrar la solución que explica la varianza máxima
para un mínimo de variables independientes. En cambio, si prueba un modelo explícito,
emplee la regresión jerárquica.
En el ejemplo siguiente de regresión gradual, la aptitud para matemáticas es la VD; y
la aptitud para inglés, la edad, el ES y el IQ, posibles VI. Como se verá después, la mues-
tra de 1O debía ser mucho más grande. A continuación se aprecian las correlaciones entre
cada par de variables:

Tabla 20.3. Matriz de correlación de las aptitudes para matemáticas e inglés, la edad,
el ES y eliQ.

Matemáticas Inglés Edad ES IQ


Matemáticas 1
Inglés 0.888 1
Edad 0.748 0.862 1
ES - 0.256 - 0.473 - 0.521 1
IQ 0.564 0.7 0.626 - 0.791 1

El primer paso del análisis de regresión identificó la aptitud para inglés como la VI que ex-
plica la mayor parte de la varianza. Esa fase del análisis es igual que la regresión simple
referida antes.
Las tres variables restantes se evaluaron. Se observó que el ES tenía la mayor correla-
ción parcial con la aptitud para matemáticas y por eso se agregó al modelo.

Tabla 20 .4. Correlaciones parciales entre la aptitud para matemáticas y las VI


restantes tras la primera etapa del análisis de regresión múltiple.

Correlación
Variable parcial

Edad - 0.075
ES 0.403
IQ - 0.177
-
re_l_ac_i_on_e_s_ll_:_re~g~re_s_io_·n______________~j339
________________________A_n_á_li_si_s_de__

Se observó que las dos variables restantes explicaban poco la varianza restante y por ~so
se rechazaron. La aptitud para inglés y el ES explican 82.3% de la varianza de la aptitud
para matemáticas; con agregar la edad y el IQ se habría explicado sólo O. 71% más.

Tabla 20.5. El segundo (y último) paso del análisis de la regresión múltiple gradual en
que se consideró el ES en el modelo.

R R2 ajustada RMS del residuo


0.907 0.823 0.772 6.662

Tabla de análisis de varianza


Suma Media
Fuente gl de cuadrados de cuadrados Prueba F
Regresión 2 1 441 .853 720.927 1 6.245
Resi duo 7 310.647 44.378
Total 9 1 752.5

Variables de la ecuación
Variable Coeficiente E. est. Coef. est. F que se elimina
Ordenada al origen - 7.68
Inglés 1.055 0.193 0.987 29.899
ES 2.053 1.762 0.21 1.358

Variables que no están en la ecuación


Variable Corr. parcial F que se introduce
Edad 0.031 0.006
IQ 0.1 88 0.22

Error estándar (e. est.) es el error del coeficiente de la regresión. Cuanto menos eficaz re-
sulte la VI como predictor de la VD, tanto mayor será el error estándar. Además, cuanto
más se correlaciona una VI con las otras del modelo, tanto mayor es el error estándar. El
error estándar del coeficiente de regresión se usa para encontrar la significación estadísti-
ca del coeficiente de regresión y un intervalo de confianza (véase en el apéndice XI el cálcu-
lo respectivo). La intercorrelación entre variables independientes se analiza después, en el
apartado "Multicolinealidad".
340 Investigación cuantitativa en psicología

Coeficiente estándar (coef est.) es el coeficiente de regresión estandarizado que se expli-


ca después en este capítulo.
RMS del residuo (llamado a veces error estándar de estimación ) es la raíz de la media de
cuadrados del residuo. Un residuo, en una regresión, constituye la diferencia entre el valor
predicho para alguien sobre la VD, con base en el modelo, y el valor real de tal persona so-
bre la VD. En la regresión, el RMS del residuo es el mismo que la raíz cuadrada de la media
de cuadrados para el residuo. Un RMS del residuo de valor muy alto denotaría un modelo
inexacto porque los residuos son grandes. Los residuos se analizan posteriormente con ma-
yor detalle.
F que se elimina y F que se introduce son razones F cuyo valor lo predefme el programa
de computadora, pero también el usuario puede establecerlo. Cada valor actúa como una
medida de contribución de las variables independientes al modelo. Si la contribución de
una Vl ya considerada en el modelo queda debajo de cierto nivel durante los pasos poste-
riores de manera que su razón F también es menor que la F que se elimina, la VI se suprime
del modelo. Si la contribución de una VI que todavía no está en el modelo es suficiente para
superar la F que se introduce, esa VI se incorporaría en el modelo.
A partir de la tabla 20.5, la ecuación relativa a la aptitud para matemáticas es:
Aptitud para matemáticas= -7.68 + 1.055 x aptitud para inglés+ 2.053 x ES
Entonces, la puntuación pronosticada en la prueba de matemáticas para quien obtiene 50
puntos en inglés y presenta un ES de 5 es 55.335. En realidad, la persona obtuvo 5Q en ma-
temáticas. Podría parecer curioso que ahora, cuando ya se cuenta con un modelo que explica
más de la varianza de la VD que los anteriores, se llegue a una predicción deficiente. La
cuestión es que, aunque en este caso se llega a una predicción deficiente, se logre un error
menor en la predicción para todos los participantes que con los modelos previos.

Interpretación de la regresión múltiple


Si quiere saber más y no simplemente observar si la regresión explica una cantidad importan-
te de la varianza de la VD, puede fijarse en el tamaño de los coeficientes de la regresión. En
el ejemplo de la aptitud para matemáticas, los coeficientes significan que el valor predicho
de la aptitud para matemáticas se incrementaría en 1.055 unidades por cada unidad de au-
mento de la aptitud para inglés, si se conservaran constantes todas las otras variables del
modelo. Ésta es una idea muy singular porque se sabe que la otra variable, el ES, se corre-
laciona con la aptitud para inglés y entonces sería improbable que permaneciera constante
al cambiar la aptitud para inglés.
Hay el peligro de comparar sólo la magnitud de los coeficientes de regresión para ver
qué variable independiente ocasiona el mayor efecto sobre la dependiente. El coeficiente
de regresión para ES resulta mayor que el de la aptitud para inglés, y ya se sabe que ésta


Análisis de relaciones 11: regresión ¡341
----------------------------------------~~----------------~

explica más de la varianza de la aptitud para matemáticas. La anomalía obedece a que la


magnitud del coeficiente de regresión es una función de la desviación estándar (DE) de esa
variable. Una medida que resuelve tal problema es el coeficiente de regresión estandariza-
do (a menudo se identifica con~ y se llama coeficiente beta).
Un coeficiente de regresión estandarizado se calcula mediante la ecuación siguiente:

~ = bxDEx
DE_.,

donde b es el coeficiente de regresión para una VI


DEx es la desviación estándar de la misma VI
DEY es la desviación estándar de la VD
Al volver a la tabla de resumen, se observa que los coeficientes estandarizados cuentan una
historia distinta a partir de los coeficientes de regresión y ahora se considera que la aptitud
para inglés contribuye más al modelo, como era de esperar.
No tiene mucho sentido utilizar como un criterio, por lo que se refiere a la importan-
cia, el orden en que una VI se incorpora en el modelo. Como la descripción de regresión
gradual debe haberlo aclarado, la VI que se introduce primero podría eliminarse después
cuando se han considerado otras variables.

Multicolinealidad
Si la correlación entre algunas variables independientes es muy alta, por ejemplo, 0.8 o
más, los valores predichos resultan más inestables. Puede contrarrestarse lo anterior si se
crea una combinación de variables independientes, ya <;ea agregándolas o aplicando el aná-
lisis de componentes principales, técnica similar al análisis factorial pero que, aparte de la
descripción incluida en el capítulo 21, queda fuera del objetivo del libro. Los lectores inte-
resados deben consultar a Stevens ( 1996) y Tabachnick y Fidell ( 1996).

Tamaño de muestra recomendado


En la regresión múltiple, el requisito es usar un tamaño de muestra razonable para aumen-
tar al máximo la confiabilidad del resultado. Se proponen varios valores. Algunos reco-
miendan 15 por VI, otros lO y unos más 5 (aunque más para la regresión gradual), pero
otros afirman que el número de participantes debe ser el de variables independientes más 50.
Otra forma de mirar el tamaño de la muestra necesario se relaciona con el poder (la
probabilidad de evitar un error tipo II). Cohen ( 1988) recomienda un poder de al menos 0.8.
Sin embargo, también tiene en cuenta el tamaño del efecto que usted desea descubrir.
J42lL_______________I~n~ve=s~ti~ga~c~io=·n~c=u=a~n~ti~ta=t~iv~a~e~n~p~si~c=ol~o~gí=a--------------------
Tamaño del efecto y regresión
Una medida conveniente del tamaño del efecto es R2, la cual indica la proporción de va-
rianza explicada en la VD y es la misma medida TJ 2, usada como el tamaño del efecto en el
ANOVA. Cohen (1988) emplea un tamaño del efecto diferente del que utiliza el autor. Sin
embargo, si se atienden sus criterios se obtiene R2 = 0.0196 como un tamaño del efecto pe-
queño, 0.13 como uno medio y 0.26 como uno grande. Usted observará que difieren de los
re~omendados para el ANOVA, donde el tamaño del efecto también es una medida de la
proporción de la varianza que se explica. Recuerde que Cohen identificó esos grados luego
de revisar la investigación que utiliza cada técnica. Además, recuerde que son sólo pautas
y que si, a fin de escoger un tamaño de muestra para un estudio, usted tiene una estimación
mejor del efecto, siempre use ésta y no tales pautas.

Poder y regr esión


El poder de regresión depende no sólo del nivel alfa propuesto, del tamaño de la muestra y
del efecto sino, también, de la cantidad de las VI del modelo. Las tablas de poder para la
regresión múltiple se proporcionan en el apéndice XV.
El análisis de poder muestra que si alfa se conserva en 0.05, se tiene una VI en el mo-
delo y el poder deseado es de 0.8, para un tamaño del efecto medio se requieren a proxima-
damente 55 participantes. Sin embargo, cuando se tienen 10 VI y se usa el poder como base
para escoger el tamaño de la muestra, se necesitarían alrededor de 120 participantes a fin
de tener el mismo poder para un tamaño del efecto medio. Además, si se precisa de un tama-
ño del efecto menor, el tamaño de la muestra aumentaría aún más. Una manera de mejorar
la situación si usted tiene una muestra relativamente pequeña es usar de nuevo el análisis
de los componentes principales para reducir el número de VI.
Recomiendo que si explora la significación estadística de la regresión, seleccione el ta-
maño de la muestra con base en los cálculos de poder. Pero si se interesa sólo en la propor-
ción de varianza de la VD que explican las variables independientes, use la regla de al menos
50 participantes más que la cantidad de VI.

Validación del modelo


Evidentemente, se desea saber cuán buenas son las predicciones a partir del modelo; es de-
cir, ¿pueden generalizarse a otros datos? Se mencionarán dos formas de hacerlo.

División de los datos


Si la muestra es suficientemente grande, puede efectuarse el análisis de regresión con la mi-
tad de los datos y luego ver cuán bien explican las predicciones para ese modelo los datos
restantes.
----------------~------A_n_á_li_
si_s_de__re_l_ac_io_n_e_s_ll_:_re~g~r_
es_io_·n______________~~

La técnica PRESS
Como a menudo usted no tendrá información suficiente para dividirla, puede usar otra
técnica, PRESS, que repite la regresión anulando un elemento y recalculando el valor pre-
dicho para él a partir de los datos restantes. Entonces puede calcularse una versión de R2 ,
basada en PRESS; si es notablemente distinta de R2 original, cuestionaría la confiabilidad
de la última.

Verificaciones del diagnóstico


Es aconsejable realizar ciertas verificaciones para ver si los supuestos de la regresión son
defendibles. Dos se relacionan con Jo que se designa como residuos.

Residuos
Un residuo es la diferencia entre el valor predicho para la VD y el real. Se mencionó que
la aptitud de un individuo para matemáticas era 55.335, pero la calificación real fue 50. En
este caso, el residuo sería 50 - 55.335 = -5.335. Los residuos pueden estandarizarse median-
te una transformación que les da una media de O y una DE de l. Ello significa que puede
tratarse cada residuo del mismo modo que un valor z para señalar cuán extremo es éste. Por
ello pueden analizarse los residuos estandarizados para ver si alguno se considera extremo,
para lo cual se necesitaría una investigación extensa. En seguida se aprecia que ninguno qe
Jos residuos, tomado del análisis del ejemplo, está fuera del rango ± 1.8 y, por consiguien-
te, se halla en el intervalo normal, pues no son mayores que 3 DE de la media:

Tabla 20.6. Aptitud para matemáticas, aptitud para matemáticas predicha, residuo y
residuo estandarizado obtenidos a partir de la regresión de aptitud para
inglés y ES sobre matemáticas.

Aptitud para matemáticas AM predicha Residuo Residuo est.


50 55.344 - 5.344 -0.802
40 45.021 - 5.021 -0.754
60 51.180 8.820 1.324
50 48.072 1.928 0.289
70 69.118 0.882 0.132
60 63.956 - 3.956 -0.594
75 77.616 - 2.616 -0.393
70 72.398 - 2.398 -0.360
85 73.510 11.490 1.725
75 78.786 - 3.786 -0.568
~~----------------ln_v_e_st_i~ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________

Gráfica de residuos
La gráfica de residuos requiere el trazo del diagrama de dispersión entre los valores predi-
chos de la variable dependiente y los residuos estandarizados. No debe mostrar pauta evi-
dente alguna, lo cual revela que los residuos son aleatorios.
2~~--~--~--~--~--._--~~
o
.g"' 1.5
:S o
·e
!U
-o
e:
~ 0.5
~ o
"'o o
o ···············.................... .................. .
::>
-o
·¡¡¡
o o
& ~.5
o o
o o
-1
40 45 50 55 60 65 70 75 80
Valor predicho respecto a la aptitud para matemáticas
Figura 20.4. Gráfica de los residuos de la regresión de la aptitud para inglés y ES sobre
la aptitud para mate máticas.

La gráfica anterior no muestra relación evidente alguna entre las dos medidas. En ciertas
formas podría sugerir que se violaron los supuestos de la regresión.
Varianza heterogénea. El ejemplo de referencia muestra mayor varianza de Jos errores en
cuanto a los valores predichos más altos, lo cual hace pensar que el modelo será mejor para
predecir los valores más bajos de la VD. Homocedasticidad es el término con que se deno-
ta que un conjunto de residuos tiene varianza homogénea, y heterocedasticidad, cuando la tie-
ne heterogénea.

o
~ 1.5
-o
!U o
N
'¡ij o
-o
e: o
~ 0. 5
Q) o
"'o::> o ............ ........................................ ....
-o
·¡¡¡ o o
& ~.5 o
o o
e
1 +----~--....--~....----.-----.-----,--~--+
~ ~ ~ ~ 60 ~ ro w
Valor predicho para la variable dependiente
Figura 20. 5. Ejemplo de varianza heterogénea de los residuos a partir de un análisis
de regresión.
Análisis de relaciones 11: regresión
----------------------------------------~~----------------~
íJ45
Curvilinealidad. El ejemplo sugiere que el modelo subestimará los valores medios de la
VD y sobreestimará los de los extremos.

"' 1.5
o
"O
:3
·e
"'e
"O
o
t!<11 0.5 o o
o
"'o o
-5 o
·¡¡;
& o o
-0.5
o
o
o
40 45 50 55 60 65 70 75 80
Valor predicho para la variable dependiente

Figura 20.6. Ejemplo de la relación curvilínea entre los residuos y los valores predichos
de la VI a partir de un análisis de regresión.

Ambos tipos de violación se contrarrestan adoptando una transformación conveniente de


los datos originales.
Apalancamiento e influencia. El resultado de un análisis de regresión puede recibir la in-
fluencia de casos extremos en las VI. Una medida de si los datos de alguien contienen valo-
res extremos es el apalancamiento (conocido también como elemento del sombrero). Stevens
(1996) recomienda que si el apalancamiento es mayor que 3 x (p + 1) (donde pes el número
11
de VI del modelo y 11 el de participantes), se verifiquen los datos para esa persona. Enlata-
bla 20.7 se proporciona el apalancamiento para cada participante. Como el nivel crítico sería
3 x ( 2 + 1) = 0.9, ningún participante tiene un problema en particular de valores extremos.
10
Una forma adicional de juzgar cuánto influyen los datos de una persona en la regresión
es la distancia de Cook, una medida del grado en que los valores extremos afectan la regre-
sión. Stevens ( 1996) hace notar que los datos de una persona cuya distancia de Cook es ma-
yor que 1 deben investigarse más. En la tabla 20.7 se observa que ninguna distancia de Cook
para la regresión causa problemas.
J46lL--------------~In~ve~s~ti~g~ac_io~
·n_c~u~a_nt~it~a~ti_va~e~n~ps~ic~o~lo~g~ía____________________

Tabla 20. 7. Apalancamiento y distancia de Cook para la regresión cuando matemáticas


es la VD y la aptitud para inglés y ES las VI.

Participante Distancia de Cook Apalancamiento


1 0.26246 0.31655

2 0.81278 0.51997

3 0.28688 0.16515

4 0.01375 0.16558

5 0.00295 0.16918

6 0.01829 0.02039

7 0.02793 0.18091

8 0.00986 0.06081

9 0.49073 0.16635

10 0.08160 0.23512

Similitud entre el ANOVA y la regresión múltiple


Salvo el análisis de x 2 y la correlación de punto biserial, el autor ha conservado la distinción
entre las técnicas diseñadas para probar diferencias y las construidas para probar relaciones.
Es una distinción útil cuando usted pretende aprender las técnicas; como se sabe, la clasi-
ficación ayuda a la memoria. Sin embargo, los especialistas en estadística critican a menudo
a los psicólogos por ignorar que una técnica está detrás de ambos enfoques. El autor desea
cerrar el capítulo con una demostración de que el ANO VA es un caso especial de regresión
múltiple.
Recuerde que la regresión examina la relación entre una variable dependiente y una o
más independientes. En cambio, el ANO VA considera la diferencia entre los niveles de una
o más VI. Los niveles son categorías; por ejemplo, hombre o mujer. Sin embargo, los es-
pecialistas en estadística señalan que no son más que lo que ellos llaman variables ficticias
incorporadas en un análisis de regresión.
En el capítulo 16 se describe un experimento donde se pidió a tres grupos de partici-
pantes recordar una lista de palabras. Cada grupo usó un auxiliar nemotécnico diferente
(palabras gancho, método de ubicación y grupo control que no empleó estrategia alguna).
Los datos se analizaron mediante un ANOVA de una vía y se resumen en la tabla 20.8.
• ________________________A_n_á_Li_
si_
s_de__re_l_ac_io_n_e_s_ll_:_re~g~r_es_io_·n______________~¡347

Tabla 20.8. Resumen del ANOVA de una vía entre sujetos sobre el recuerdo d e una
lista de palabras en grupos con auxiliares nemotécnicos.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F


Entre grupos 2 30.467 15.233 5.213
lntragrupos 27 78.9 2.922 p = 0.0122
Total 29 109.367

Sin embargo, se usan variables ficticias para distinguir los tres grupos:

Tabla 20.9. Información relacionada con las palabras recordadas mediante estrategias
nemotécnicas donde se usaron variables ficticias para identificar los
grupos.

Grupo Palabras recordadas Variable ficticia 1 Variable ficticia 2


Método de ubicación 10 1 o
Método de ubicación 8 1 o
Método de ubicación 11 1 o
Método de ubicación 9 1 o
Método de ubicación 12 1 o
Método de ubicación 10 1 o
Método de ubicación 7 1 o
Método de ubicación 11 1 o
Método de ubicación 8 1 o
Método de ubicación 10 1 o
Palabras gancho 11 1 1
Palabras gancho 7 1 1
Palabras ¡;¡ancho 9 1 1
Palabras.¡;¡ancho 10 1 1
Palabras gancho 8 1 1
Palabras gancho 6 1 1
Palabras gancho 12 1 1
Palabras ¡;¡ancho 9 1 1
Palabras ¡;¡ancho 10 1 1
Palabras gancho 7 1 1
Control 10 o o
Control 7 o o
Control 7 o o
Control 9 o o
Control 5 o o
o o
-.
Control 6
Control 8 o o
Control 5 o o
Control 7 o o
Control 8 o o
348lL______________~I~nv~e~s~ti~ga~c~ió~n~c~u=a~nt~it=a~ti~va~e~nLp~si~co~l~og~í~a____________________
Hay una variable ficticia menos que el número de niveles de la VI. Entonces, los sujetos
de la estrategia del método de ubicación se codifican como l sobre la primera variable y O
sobre la otra; los individuos del grupo de palabras gancho se codificaron como 1 1 y el gru-
po control como O O.
De tratar las variables ficticias como VI, el mismo diseño puede analizarse como una
regresión múltiple (tabla 20.1 0).

Tabla 20. 1O. Resumen del análisis de regresión de los tres grupos gue intentaron
recordar palabras.

Casos R R2 ajustada RMS del residuo


30 0.528 0.279 0.225 1.709

Tabla del análisis de varianza


Fuente gl Suma de cuadrados Media de cuadrados Prueba F
Regresión 2 30.467 15.233 5.213
Residuo 27 78.9 2.922 p = 0.0122
Total 29 109.367

Nótese que la suma de cuadrados de la regresión es igual que la suma de cuadrados entre
grupos del ANOVA de una vía y que la suma de cuadrados del residuo es igual que la su-
ma de cuadrados intragrupos.
Por consiguiente, el ANO VA puede tratarse como un ejemplo de análisis de regresión.
Los dos son modelos descritos por lo que se denomina modelo lineal general, como lo son
tres técnicas abordadas en el capítulo siguiente: análisis de covarianza (ANCOVA), ANOVA
multivariado (MANOVA) y ANCOVA multivariado (MANCOVA). En el libro no se por-
menorizan dichas técnicas. Los lectores que desean mayor información deben consultar a
Howell (1997). La posible moraleja de tales cuestiones consiste en que buscar diferencias,
como con el ANOVA, y relaciones, como con la regresión, son dos maneras de ver lo mis-
mo. Uno puede preguntarse !>i hay una diferencia a l recordar palabras entre los tres grupos
con estrategias nemotécnicas o si hay una relación entre el tipo de estrategia nemotécnica
empleada y el recuerdo de palabras.

Resumen
Es posible explorar las relaciones entre las variables mediante el análisis de regresión. La
regresión simple se usa si hay sólo una variable independiente y la múltiple cuando hay dos
_________________________A
_n_á_li_si_s _d_e_r_e_
la_c_ ll _
io_n_es__ :_re~g~re_s_io_
' n________________~¡-3.49

1" o más. Este análisis cumple dos funciones: identificar cuánto de la varianza de la VD pue-
de explicar la variación de la o las VI y elaborar un modelo de la relación entre la variable
dependiente y la o las VI a fm de permitir así que la VD sea predicha para unos valores es-
pecíficos de las VI.
lllU A veces se considera que la regresión múltiple es un ejemplo de estadística multivaria-
da. En el capítulo siguiente se presentan otros tipos de estadísticas multivariadas y se ex-
plica brevemente su empleo.
21
Análisis multivariado

Introducción
La definición rigurosa del análisis multivariado es que más de una variable dependiente (VD)
interviene en el análisis. Sin embargo, el autor ha incluido en este capítulo cuatro técnicas
que no cumplen con la defmición: el análisis de covarianza, la modelación logarítmico-li-
neal, el análisis logit y la regresión logística. A fin de aplicarlas, debe aprender más de ellas
de lo que se explica en esta obra.
La mayoría de los psicólogos entienden menos las técnicas descritas en el capítulo que
muchas de las tratadas en los anteriores. En parte, ello se debe a que a menudo no se estudian
en los cursos de métodos de investigación de nivel licenciatura, excepto quizá como materia
optativa avanzada en el último año. Para entender cómo se calculan se requieren conoci-
mientos de matemáticas que muchos estudiantes no poseen, y la mayor parte de las técnicas
no se abordan en los libros de texto de licenciatura. Además, sus resultados son a veces más
dificiles de interpretar. Quizá esos factores contribuyan a que las técnicas referidas se usen
mucho menos que las de una y de dos variables explicadas en los primeros capítulos.
Otro factor que se suma a lo anterior es que el número de participantes debe ser gran-
de para que los resultados de las técnicas multivariadas tengan cierta validez. Por ejemplo,
por cada variable predictora incluida en un análisis discriminante debe haber al menos 20
participantes.
El objetivo del capítulo consiste en que el lector cobre conciencia de la función de cada
técnica descrita y advierta las restricciones en su uso. As1 podrá juzgar cuándo son útiles.
Además, con la información del capítulo será capaz de interpretar y criticar otras investí-

350 •
A_na_·l_is_is_m_u_l_ti_va_n_·a_d_o__________________~~
_____________________________

gaciones en las que se hayan empleado las técnicas. Este capítulo no lo capacitará para apli-
car las técnicas descritas; quienes desean emplearlas deben consultar Stevens (1996), Tabacb-
nick y Fídell (1996) o las referencias más específicas mencionadas a lo largo del capítulo.

¿Por qué usar técnicas· multivariadas?


Muchas técnicas multivaríadas tienen equivalentes uni o bívariados. Cuando se tiene más
t
de una VD hay por lo menos dos ventajas de usar una técnica multivaríada en lugar de re-
petir una unívariada para cada VD. Tales ventajas son las mismas que al preferir ANOVA
multívía por encima de una serie de ANOVA de una vía o incluso de pruebas t. Primero,
porque no se efectúan numerosos análisis que aumentarían la probabilidad de lograr resul-
tados con significación estadística, aun cuando los datos en análisis no estén sujetos a algún
efecto real. Segundo, porque se puede observar cómo se comportan las variables al combi-
narlas en vez de verlas aisladas.
El autor clasificó las técnicas según su uso: para buscar diferencias entre los niveles de
variables independientes o para descubrir las relaciones entre las variables. Ya se demostró
en el capítulo anterior que tal separación es artificial; ficción conveniente ésta, pues refle-
ja el tipo de pregunta que quizá se plantee al escoger cierta técnica estadística para anali-
zar los datos.

En busca de una diferencia


Modeladón logaritmico-Uneal para datos categóricos
La modelación logarítmico-lineal (log-lineal) puede considerarse una extensión del análi-
sis de x2 de tablas de contingencia. Recuerde que x2 se utiliza cuando se tienen datos cate-
góricos en una o dos dimensiones.
En ocasiones una clasificación simple de dos entradas no es suficiente; entonces se de-
sea un análisis de tres entradas o más. Por ejemplo, quizá se quiera ver si algunas diferen-
cias en las proporciones de fumadores guardan relación con el género, o con que los padres
sean fumadores, o con ambas situaciones. Por ello, la modelación log-lineal se denomina a
veces análisis de frecuencia multivía.
El análisis log-lineal permite comparar varios modelos para ver en cuál se ajustan mejor
los datos. Con tres variables hay varios modelos posibles de los que se tiene que escoger.
En el ejemplo de los fumadores puede haber una combinación de las variables solas, interac-
cíopes de pares de variables e interacción de tres de ellas. Sin duda hay más de 15 modelos
posibles. Se describe sólo una de las diversas maneras de realizar un análisis log-lineal. El
diseño se llama jerárquico, pues presupone que si hay interacciones en el modelo, entonces
los efectos principales también estarán presentes. Por consiguiente, sí había una interacción
entre el género y que los padres fumaran, los efectos de género y fumar, individualmente,
352 Investigación cuantitativa en psicología

también quedarían incluidos en el modelo. Recuerde, sin embargo, que con el ANOVA es
posible hallar una interacción con significación estadística sin tener un efecto principal que
la presente. El método que se aplica en el análisis se describe como una solución hacia
atrás; se empieza con el modelo completo, es decir, incorpora todos los posibles 'factores y
luego se eliminan de manera selectiva algunos de ellos hasta que se encuentra la solución
óptima. Es análogo a la solución hacia atrás de la regresión múltiple.
En seguida se dan los datos que se desea analizar con modelación logarítmico-lineal.

Tabla 21. 1. Cantidad de hombres y mujeres que fuman y si fuman sus padres.
Género de los participantes
Masculino Femenino
Padres fumadores Fumador No fumador Fumador No fumador
Sí 30 6 40 6
No 12 68 6 32

El modelo log-lineal que mejor se ajustó a los datos fue uno que incluía las interacciones
género por padres fumadores y participantes fumadores por padres fumadores. Se exclu-
yó la interacción tres vías y la interacción de participantes fumadores y género. El modelo
se probó estadísticamente, con el resultado que x2 = 0.225, gl = 2, p = 0.894. Observe que en
este caso se prueba el ajuste de un modelo, no una hipótesis nula. Entonces, si ésta hubie-
ra tenido significación habría tenido que rechazarse el modelo. Este resultado puede inter-
pretarse como muestra de que cualquier nexo entre el género y ser fumador es explicable en
términos de los vínculos entre los factores padres fumadores y participantes fumadores y
entre padres fumadores y el género del participante. En Agresti ( 1990; 1996) encontrará
los detalles de cómo efectuar la modelación log-lineal.

T 2 de Hotelling
La T 2 de Hotelling puede considerarse una generalización de la prueba t a situaciones donde
hay dos niveles de una VI pero más de una VD. Por ejemplo, se presentaría cuando se com-
- paran los efectos de dos técnicas terapéuticas. Sin embargo, en lugar de considerar sólo una
medida de resultado, podría verse cuán satisfechos estaban los clientes con el tratamiento,
en qué grado sentían que tenían el control de sus vidas y lo angustiados que estaban.

Análisis de varianza multivariado (MANOVA)


El análisis de varianza multivariado (MANOVA) es la generalización del ANOVA a situa-
ciones donde hay más de una VD y a) una variable independiente con más de dos niveles,


m_u_lt_iv_a_ri_a_do____________________~¡:i53
______________________________A_n_á_lis_is__

o bien, b) más de una variable independiente. Entonces, podrían compararse tres o más técni-
cas terapéuticas sobre varios resultados. También se usa para aplicar el ANO VA intrasujetos.

Control de los covariados


Cuando se busca una diferencia entre los niveles de VI pero se sospecha que otra variable
podría influir en la situación es posible controlar esa variable y así minimizar la influencia
con la que contribuye a la variación de los datos.

Análisis de covarianza (ANCOVA)


El análisis de covarianza (ANCOVA) es similar ·al ANOVA, sólo que tiene en cuenta va-
riables que quizá afecten los resultad_os pero que no son a las que se da la principal consi-
deración. Hay por lo menos dos ocasiones en las que ANCOVA se emplea. La primera, en
las situaciones en que una variable se confunde con la VI y podría afectar la variable de-
pendiente. La segunda, cuando un diseño test-retest se usa para considerar las diferencias
iniciales entre los grupos que podrían enmascarar las diferencias en las mejorías.
Como ejemplo del primer tipo de ANCOVA, imagine que se desea comparar la edad
en que aprenden a leer los niños en tres planteles: femenil , varonil y mixto. Así, hay una
VI: el tipo de escuela, con tres niveles, y una VD: edad en que se aprende a leer. Sin duda,
el autor analizaría este caso como ANOVA de una vía:

Tabla 21. 2. ANO VA de una vi a entre suj etos que compara la edad en que aprenden
a leer los alumnos de sendas escuelas: una de mujeres, otra de hombres
y una mixta.

Análisis de la tabla de varianza


Suma Media
Fuente gl de cuadrados de cuadrados Prueba F

Entre grupos 2 49.71 7 24.858 3.887

lntragrupos · 27 172.65 6.394 p = 0.0328


Total 29 222 .367

El ANOVA hace pensar en una diferencia entre las escuelas con respecto a las edades en
que se aprende a leer. No obstante, supongamos que se sabe que dicha edad se correlacio-
naba con el IQ en la muestra (r = 0.64 1); sería entonces sensato volver a examinar las eáa-
des en que se aprende a leer mientras se controla el IQ para ver si se conservan las diferencias
entre las escuelas; ANCOVA hará esto .
...
J54lL_______________I~n~ve~s~ti~ga~c~io~·n~c~u~a~n~ti~ta~tl~·v~a~e~n~p~si~c~ol~o~gí~a--------------------
Tabla 21.3. Análisis de covarianza que compara la edad en que se aprende a leer en
sendas escuelas: una de mujeres, otra de hombres y una mixta, con
control del JQ.

Suma Media
Fuente de la variación gl de cuadrados de cuadrados F $ig. de F

JQ covariado 1 91.289 91.289 19.866 0.000

Efectos principales
de escuela 2 11.600 5.800 1.262 0.300

Residuo 26 119.478 4.595

Total 29 222.367 7.668

El ANCOVA muestra que ya no hay diferencia con significación estadística entre las es-
cuelas y que el covariado, IQ, explicaba la discrepancia mostrada en el ANOVA de una
vía original.

Análisis multivariado de la covarianza (MANCOVA)


El análisis multivariado de la covarianza (MANCOVA) es la extensión a varias variables
del ANCOVA. Por ejemplo, se podría ver la habilidad de lectura y la aptitud matemática de
los niños en los tres tipos de plantel, mientras se controla el IQ.

Identificación de la base de la diferencia


Análisis discriminante
El análisis discriminante puede considerarse el complemento de la T 2 de Hotelling y el
MANOVA. Se usa en dos situaciones: a) cuando se presume una diferencia en una variable
categórica (o clasificatoria) y se utiliza más de una variable predictora para identificar la na-
turaleza de tal diferencia, y b) cuando se explora un conjunto de variables predictoras para
ver si es posible clasificar a los participantes en categorías con base en las diferencias de las
variables predictoras. Huberty (1994) usa la expresión análisis discriminante descriptivo
para delinear la primera, un ejemplo de la cual seria pedir a dos culturas que evaluasen varias
descripciones de personas con respecto a la inteligencia. Imagine que usted compara perso-
nas inglesas y japonesas por la forma en que evalúan la inteligencia de cinco personas hipo-
téticas cuyas descripciones usted proporcionó. Cada individuo hipotético tendría que ser
evaluado en una escala que va de Inteligente a Poco inteligente. Así, la variable clasificato-
ria sería la raza y las predictoras las calificaciones otorgadas para cada persona hipotética.
_____________________________
A_na_'l_
i s_ _a_r_ia_d_o__________________~~
is_m_u_lt_iv

El análisis discriminante permite ver si los perfiles de evaluación entregados por las
dos razas difieren en forma significativa. Si es así entonces usted puede seguir explorando
para averiguar qué contribuyó a la diferencia.
Huberty (1994) designa el segundo enfoque análisis discriminante predictivo. Un ejem-
plo de su uso es cuando una institución quiere distinguir a quienes tendrán éxito en la ca-
pacitación y los que no con base en sus perfiles delineados por una prueba de personalidad.
Si el análisis logra su objetivo, los alumnos exitosos tendrían perfiles similares entre sí pero
diferentes de los de quienes fracasaron . Entonces, podrían usarse las maneras en las que di-
fieren los perfiles de los dos grupos para descubrir en quienes solicitan capacitación quiénes
tienen más probabilidad de tener éxito.

Exploración de relaciones
Cuando se buscan relaciones entre variables hay dos forma s básicas de hacerlo. Primero,
igual que con la correlación y la regresión, se averigua cualquier relación entre las medi-
das que se han tomado: las variables observadas. Esto presupone que las variables se han
medido de modo directo e, implícitamente, que las medidas usadas no están sujetas a error.
También pueden verse las medidas como indicadores de ciertas variables de orden supe-
rior: las latentes. Así, más de una de las variables observadas podría estar midiendo la misma
variable latente.

Relaciones entre las variables observadas


Análisis logit
El análisis logit es el equivalente de la regresión múltiple pero con datos categóricos. Por
ejemplo, usted podría querer averiguar cuán bien se predice la VD fumar por medio del gé-
nero y de si los padres y los amigos fumaron.

Regresión logística
La regresión logística se considera una versión más manejable de análisis logit porque la
restricción en los niveles de medición no es tan rigurosa. Por tanto, las variables predicto-
ras no tienen que ser categóricas y aunque se supone que la VD es discreta, es posible re-
codificar otras variables de manera que formen una escala discreta. Además, antes del
análisis las VI se codifican de nuevo como dicotómicas, ficticias, como se explicó en el ca-
pítulo anterior. El paralelismo de la regresión logística y la múltiple es grande. Es posible
poner todas las VI en el modelo - usando la entrada directa- a fin de especificar el orden
(en el análisis secuencial) o delegar la responsabilidad en la computadora usando regresión
hacia atrás, hacia delante o por pasos. En Agresti (1990; 1996) se encuentran los detalles
de cómo efectuar el análisis logit y la regresión logística .


'
J56l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
AnáUsis de conglomerados
En el análisis de conglomerados se supone que los elementos -digamos, los participan-
tes- pueden clasificarse en cierto tipo de jerarquía. Se empieza por formar pares de parti-
cipantes, los más cercanos en alguna dimensión (o combinación de dimensiones), y luego
las combinaciones (o conglomerados) de esos pares y se continúa formando combinacio-
nes de orden SUP.erior hasta que todos los elementos están en un conglomerado. Por ejem-
plo, uno podría estar interesado en clasificar a los pacientes que han proporcionado sus
puntuaciones en varias pruebas. A veces usan esta técnica quienes aplican cuadriculas de
repertorio derivadas de la teoría del constructo personal de Kelly (véase capítulo 6). Permite
al investigador ver si los elementos (por ejemplo, los individuos) a quienes evalúa una per-
sona forman conglomerados con base en los constructos atribuidos a ellos. De esta mane-
ra, un analista podría averiguar la clase de individuos que una persona considera semejantes
a alguno de sus padres. El análisis discriminante empieza con el conocimiento del grupo al
que se pertenece y busca la combinación de medidas que distinguen los grupos, mientras que
el análisis de conglomerados indaga posibles grupos con base en las medidas. De hecho, el
análisis discriminante se usa a veces para explorar más la naturaleza de las agrupaciones
que se identificaron con el análisis de conglomerados.

Correlación canónica
La correlación canónica es una extensión de la regresión múltiple a situaciones donde hay
más de una VD y más de una VI. Por ejemplo, podría considerarse la correlación entre el
nivel A, Iocus de control, motivación de logro y varias medidas de inteligencia como VI y
los resultados de diferentes cursos que cada estudiante tomó como las VD. Contraria a la
regresión múltiple porque hay más de una VD, en la correlación canónica hay más de una
posible relación entre las VI y VD que podría identificarse.

AnáHsis de trayectoria
El análisis de trayectoria se conoce a veces como regresión múltiple jerárquica. Permite a
los investigadores observar dire<.;ta e indirectamente las relaciones entre las variables. La
regresión múltiple juzga cuán bien un conjunto de VI predice una sola VD, en tanto que en
el análisis de trayectoria puede tenerse la misma variable como una VD en una etapa del
modelo y como una VI en otra. En el modelo simple de la figura 21.1, personalidad e IQ se
consideran predictores de la hoja de servicios de una persona en un empleo anterior. Además,
también predicen el desempeño de la misma persona en el empleo actual, directamente y
por medio de su empleo previo. Por consiguiente, un análisis de regresión considera el empleo
anterior como una VD, y la personalidad y el IQ como VI, y para una segunda regresión el
empleo presente es una VD, y la personalidad, el IQ y el empleo anterior como las VI.
______________________________A_n_ál_is_is__
m_u_lt_iv_a_ri_ad_o____________________~¡:357

Personalidad

Desempeño
actual

IQ

Figura 21.1 . Análisis de trayectoria de un modelo de las relaciones entre la personalidad,


eliQ, el empleo anterior y el presente.

Es usual poner lo que se llama coeficientes de trayectoria en cada una de éstas. De ordina-
rio son coeficientes de regresión estandarizados y así dan una idea de la importancia rela-
tiva de trayectorias dadas en el proceso de la predicción.
Un riesgo de este análisis radica en que los investigadores olviden lo que se les ha dicho
acerca de las técnicas de correlación: que no pueden identificarse relaciones causa-efecto.
Hay la tentación de considerar la flecha en un diagrama de trayectoria como la dirección
de una causa. Igual que en la regresión, sólo señala el grado en el que una variable puede
usarse para predecir otra.

En busca de variables latentes


Hay dos maneras básicas en que pueden buscarse variables latentes (no observadas). La
primera, hasta el momento la más común, es delegar la responsabilidad a la computadora
y pedirle que examine las variables para ver sí identifica alguna latente que explique las re-
laciones entre las observadas. Otra opción es probar un modelo teórico preguntando a la
computadora si las variables latentes que supuestamente existen explican bien las relacio-
nes entre las variables observadas. El problema con lo primero --técnicas exploratorias--
estriba en que pu~den capitalizar la oportunidad y producir modelos que quizá reflejen sólo
relaciones en el·conjunto específico de datos. Lo segundo --técnicas confirmatorias-- es
preferible porque prueba explícitamente una teoría en lugar de confiar en que la genere la
computadora. No obstante, con tal de que las técnicas exploratorias se traten puramente como
eso y que la colección de datos posteriores confirme los resultados de la exploración, son
absolutamente legítimas.

Escalamiento multidimensional (EMD)


El escalamiento multídimensional (EMD) se diseñó para investigar similitudes entre las en-
tidades para intentar ver sí un conjunto de ellas se describe mejor en dos o más dimensiones.
~L________________In_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Por ejemplo, si hubiera 20 vinos y se pidiera a los participantes que los compararan por
pares y evaluaran cuán semejantes saben se tendrían 190 juicios por cada participante. Podría
ejecutarse un programa de EMD con los datos. El resultado podría ser que se tuvieran dos
dimensiones, una de sequedad/dulzura y otra de variación entre blanco y tinto.
El siguiente es un ejemplo con algunos datos reales. Se tomó la distancia en millas en-
tre lO ciudades inglesas y se corrió un programa de EMD con los datos. El resultado es el
que se ofrece a continuación:

·+····+ ····+····+····+····+····+····+······

2.1 ·+ +

: Cambridge

Londres
1.0 ·+ +

Nottingham:
Leeds
0.0 ·+··················· ···················
·········+
: Birmingham
Stoke : Gloucester
Manchester

Liverpool
-1.0 ·+ +
Exeter :

·2.1 ·+ +

·+····+····+ ····+····+····+····+····+ ····+ . ...


-2.5 ·1.5 -0.5 0.5 1.5 2.5

Figura 21 . 2. Resultados de un escalamiento multidimensional de las distancias entre


diversas ciudades inglesas.

Al principio parece erróneo que Cambridge quede al norte de Manchester, lo cual se debe
a que se pidió a la computadora que encontrara las dimensiones, pero no se le indicaron los
conceptos norte y sur. Gire la página 90 grados en el sentido de las manecillas del reloj.
Ahora ya puede ver que Liverpool, Manchester y Stoke están en el noroeste, Gloucester y

A_na_'l_is_is_m_u_l_ti_va_n_·a_d_o__________________~~
_____________________________

Exeter en el suroeste, Leeds y Nottingham en el noreste, Cambridge y Londres en el sures-


te, y Birmingham en el centro de la región. La relación entre este modelo y el mapa de In-
glaterra no es perfecta, pero entonces los datos originales se basaban en la red de carreteras
y no en las distancias en línea recta. Este análisis podría parecer no muy exhaustivo, pero
sí demuestra que si bien no se le dieron las dimensiones al programa, éste las descubrió.

Anális;s del componente pr;ndpal (ACP)


El análisis del componente principal (ACP) permite explorar las relaciones entre múltiples
variables a fm de ver si hay algunos factores --menos que las variables-- de orden superior
que expliquen la pauta de intercorrelaciones entre un conjunto de variables observadas. En
otros términos, permite ver si la pauta de las respuestas de los participantes sugiere que
ciertas variables miden un factor similar o una variable latente, mientras otras variables
miden factores distintos.
Por ejemplo, si usted tuviese interés en la naturaleza de la aptitud matemática, podria
entregar a un grupo de participantes una batería de pruebas de matemáticas que abarcaran
desde las de habilidad para realizar cálculos simples e interpretar gráficas, hasta las de álge-
bra y cálculo. El análisis del componente principal permite probar si los participantes poseen
un perfil semejante de habilidad en todas las pruebas, lo cual haría pensar en una aptitud
matemática unitaria, o bien, si hay una pauta que sugiera que allí existe más de un tipo de
aptitud matemática; por decir algo, la que comprende el cálculo, la que necesita conceptos
más abstractos y la que precisa razonamiento espacial.
En la figura 21.3 se muestran los resultados idealizados de un análisis del componen-
te principal realizado en una prueba de seis preguntas matemáticas. Identificó tres factores
o variables latentes (observe que las variables medidas, las preguntas, aparecen en rectán-
gulos, y las latentes, en los círculos; se trata de una convención).

Figura 21.3. Resultados de un análisis del componente principal sobre seis preguntas .

J60lL-------------~I~nv~e=s~ti~ga~c~ió~n~c=u=a~nt~it~a=ti_va~e~n~p~si=co~l~og~í~a____________________

Análisis factorial
El análisis factorial puede considerarse una extensión del ACP en la que se plantean su-
puestos diferentes con respecto a las posibles pautas entre las variables. Es una técnica que
ha provocado grandes polémicas y cuya aplicación ha contribuido a desacuerdos entre los
investigadores; por ejemplo, en la investigación sobre la naturaleza de la inteligencia. Basta
una anécdota para manifestar la esencia polémica de la técnica. El autor preguntó a un ma-
temático, profesor titular de estadística, si abordaría el análisis factorial. Contestó que no,
pues no creía en él. Es difícil imaginar una respuesta similar si se pregunta por cualquier
otro procedimiento matemático, por ejemplo, el álgebra.
Tanto el análisis factorial como el del componente principal exigen al investigador to-
mar ciertas decisiones sobre cómo llevar a cabo el análisis, las cuales afectarán los resulta-
dos de éste. Por consiguiente, cualquiera que informe acerca de tales análisis debe reportar
las opciones que escogió para realizarlo. Sin esa información el lector ignora cómo se ob-
tuvieron los resultados. Es importante porque pudiera trastocar un aspecto tan fundamen-
tal como cuántos factores se seleccionaron.
A diferencia del análisis factorial, el ACP mantiene la información de modo que las
correlaciones entre las variables originales puedan reconstruirse por completo a partir de
las relaciones entre los factores. Comprende toda la varianza de las puntuaciones, en la que
se incluye toda la que es propia de la variable y la varianza del error. Por ende, el ACP
resume las variables en un conjunto de componentes (posiblemente menor). El análisis fac-
torial, en cambio, sólo intenta explicar la varianza que comparten las variables, con la su-
posición de que esas variables son indicadores de variables latentes o factores.

Modelación de ecuación estructural (MEE)


La modelación de ecuación estructural (MEE) posibilita a los investigadores realizar un
análisis confirmatorio, es decir, probar explícitamente un modelo teórico. Les permite ha-
cerlo mediante varias de las técnicas ya descritas, una por una o combinadas. Además, per-
mite suponer que las medidas observadas podrían contener un elemento de error. También se
aplica para combinar varias de las otras técnicas en un modelo.
En la figura 21.4 se muestra cómo el anterior análisis de trayectoria puede extenderse
de manera que en lugar de comprender únicamente las variables medidas abarque también
las latentes que supuestamente están siendo medidas por las variables observadas. Este mo-
delo combina el análisis de trayectoria (el cual, si recuerda, es resultado de una serie de
análisis de regresión) y el factorial.
Ya se dispone de programas de computadora especiales para analizar los modelos de
ecuación estructural, por ejemplo, LISREL, EQS y AMOS. Para obtener información más
detallada acerca de la modelación de ecuación estructural consulte a Schumacker y Lomax
(1996) y el capítulo que trata el tema en Tabachnick y Fidell (1996).


______________________________A_n_á_lis_is__ ____________________~¡-361
m_u_lt_iv_a_ri_a_do

Extr • extraveJ>ión
Neur ~ neuroticismo
Raz. num. = razonamiento numérico
Raz. verb. = razonamiento verbal

Figura 21.4. Modelo de ecuación estructural que relaciona la personalidad, eliQ, el


empleo anterior y el presente.

Resumen
Hay varias técnicas multivariadas que extienden las analíticas (tratadas en el resto del libro)
a fin de abarcar situaciones en las que se incluye más de una variable dependiente u otros con-
juntos de datos más complejos. Es más complicado conducir e interpretar estas técnicas que
las otras, y requieren tomar más decisiones sobre cómo tratar los datos. Tales decisiones
puede tomarlas el investigador o un programa de computadora; pueden estar sujetas a uso
inadecuado o aprovechar la oportunidad y dar una solución sólo aplicable a los datos da-
dos y no proporcionar un modelo confiable. Debe informarse acerca de todas las decisiones
tomadas por un investigador o una computadora con objeto de que el lector pueda ubicar
los resultados en el contexto de esas decisiones. Por lo general, se requiere un tamaño mucho
más grande de muestra, tanto para seguridad como para obtener un análisis confiable, que
en la técnica univariada equivalente.
En el siguiente capitulo se explica cómo realizar un metaanálisis, un método cuanti-
tativo para combinar los resultados de la investigación a partir de estudios relacionados
con objeto de producir una medida general del tamaño del efecto y de la probabilidad es-
tadística .
..
J62l~_______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________ 10

Tabla 21.4. Resumen de técnicas multivariadas usadas para explorar diferencias.

Variables Variables
dependientes predictoras Covariados Test

1 1+ sí ANCOVA
>1 1 (2 niveles) - T2 de Hotelling
>1 1+ - MANOVA
>1 1+ sí MANCOVA
1 (nominal) >1 (nominal) - Modelo log-lineal
1 1+ - Análisis discriminante

Tabla 21.5. Resumen de técnicas multivariadas usadas para explorar relaciones


entre variables.
Variables ¿Variables
VD predictoras latentes? Test

1 (nominal) >1 (nominal) - Análisis logit


1 >1 - Regresión logística
>1 - - Análisis de conglomerados
>1 >1 - Correlación canónica,
análisis de trayectoria
>1 - sí Análisis del componente
principal, análisis factorial
exploratorio y confirmatorio, EMD
>1 >1 sí Modelación de ecuación estructural
F

22
Metaanálisis

Introducción
El metaanálisis es el equivalente cuantitativo de la recensión de artículos publicados, pero
con tres ventajas respecto a ésta. En primer lugar, permite a quien reseña cuantificar las ten-
dencias presentadas en las publicaciones, combinando los tamaños de los efectos y las pro-
babilidades encontradas en varios estudios. En segundo, por combinar los resultados de
diferentes estudios se incrementa el poder de la prueba estadística, en cuyo caso es posible
que, tras combinarse, varios hallazgos no significativos y con la misma tendencia se tomen
significativos. En tercer sitio, el proceso de preparar los resultados de trabajos anteriores
para realizar el metaanálisis obliga a leer los estudios con mayor detenimiento que el que
dedicaría quien lleva a cabo una reseña narrativa.
En el presente capítulo se describen las etapas del metaanálisis. Las ecuaciones nece-
sarias para realizarlo figuran en el apéndice XIII, donde se incluye también un ejemplo de
cada etapa, el cual se basa en un metaanálisis sobre el dolor pélvico crónico (McGowan,
Clark-Carter y Pitts, en prensa).

Elección del tema del metaanálisis


Como en todo estudio, el psicólogo debe decidir en qué área concreta centrarse. Además,
necesita una hipótesis específica que comprobará con el metaanálisis. Sin embargo, la na-
turaleza exacta de la hipótesis podría no ser específica en un principio y refinarse posterior-
mente, tras establecer el alcance de la investigación.

------------------------------------------~----------_J 363
J64lL_______________I~n_ve~s~ti~ga~c~io~·n~c~u_a_nt_i~ta_tJ_'v_a_e_n~p_si_co_l_o~gí_a____________________
Identificación de la investigación
La fase siguiente del metaanálisis, como sucede con la reseña narrativa, consiste en identi-
ficar las investigaciones relevantes. Esto puede hacerse mediante los sistemas estándar de
resúmenes; por ejemplo: PsychLit, Psychological Abstracts y Social Science Citation
Index. Los textos recogidos en ellos podrían aportar más artículos a sus listas de referen-
cias. Internet constituye otra fuente de material y de personas interesadas en el campo de
la investigación. Además, el metaanalista puede escribir a autores conocidos por su traba-
jo en el área para ver si tienen algún estudio aún no publicado cuyos resultados valga la pena
divulgar.
El proceso de referencia demuestra la complejidad del área. En él puede verse la gama
de diseños utilizados, los grupos usados como controles, los rangos de edades considera-
dos y si se ha trabajado con niños o con adultos. Por ejemplo, en los estudios acerca de la
naturaleza del dolor pélvico se utilizan diferentes grupos de comparación. Se han hecho
comparaciones entre las mujeres con dolor pélvico sin causa discernible y las que presen-
tan una causa fisica identificable. Además, se ha comparado a las personas con ese dolor
con las que sufren otros tipos de dolor crónico y con quienes no lo padecen.
Los artículos recolectados muestran también las medidas que se han tomado; es decir,
las variables dependientes (VD) utilizadas. Por ejemplo, en el caso del dolor pélvico las
medidas van desde la ansiedad y la depresión hasta la experiencia de abuso sexual infantil.

Elección de la hipótesis por comprobar


Tras distinguir la amplitud de diseños y medidas, cabe identificar la o las hipótesis relevan-
tes por comprobar en el metaanálisis. Con frecuencia, se utiliza más de una VD en un
solo trabajo. El metaanálisis ofrece la opción de realizar, a su vez, metaanálisis de cada VD
o de elegir una definición más global de la variable dependiente que permita incluir más
estudios en cada metaanálisis. Por ejemplo, la experiencia de abuso sexual en la infancia y
en la adultez puede combinarse con el título "Experiencia de abuso sexual a cualquier
edad". Tales definiciones son válidas si el análisis las explicita en el informe.
En cada metaanálisis debe haber una hipótesis direccional por comprobar; si no se tu-
viera en cuenta la dirección del efecto en cada estudio, los resultados que apuntan hacia
un sentido se combinarían con otros que apuntaran en el contrario, lo cual sugeriría que el
hallazgo es más significativo de lo real. De hecho, los efectos positivos y los negativos tien-
den a anularse entre sí. El término dirección del hallazgo no implica que los resultados apo-
yen la hipótesis general a prueba porque son estadísticamente significativos, sino si tales
resultados han ido en la dirección de la hipótesis o en la opuesta.
Es irrelevante si los investigadores originales tuvieron hipótesis direccionales o no; la
del metaanálisis determina la dirección.
------------------------------~M~et=a=a~na='l=is=is______________________~~

Extracción de la información necesaria


Es necesario que el analista identifique, para cada medida, el número de participantes de
1:-
cada grupo, un nivel de significación para los resultados, un tamaño del efecto y una direc-
ción del hallazgo. Por desgracia, no siempre se encuentra de manera directa toda la infor-
mación y, en tal caso, se trabaja más.
:r-
ce
1!:- Cómo trabaj ar con estudios presentados incorrectamente
Varios factores tornan inadecuado incluir cierto estudio en el metaanálisis. Algunos podrían
resolverse simplemente con reanalizar los resultados. En otros podría presentarse la nece-
sidad de escribir al autor para que proporcione más detalles.
Con frecuencia, la información requerida puede calcularse a partir de los detalles in-
cluidos en el artículo original. En ocasiones no se habrá evaluado una hipótesis específica
porque la variable independiente tiene más de dos niveles y los resultados guardan forma
de análisis de varianza con más de un grado de libertad para el efecto del tratamiento. Si se
c.-
presentan las medias y las desviaciones estándar en los grupos de comparación, pueden calcu-
larse niveles de significación y tamaños del efecto mediante una prueba t. De manera similar,
si se informó sobre frecuencias, pueden calcularse niveles de significación y tamaños del
efecto mediante una prueba x2.
Sin embargo, en ocasiones incluso se carecerá de tales detalles, en particular si el as-
pecto del estudio de interés es sólo parte de otro trabajo y se hace referencia a él únicamen-
te de pasada. En este caso, se escribirá al autor para obtener la información necesaria. Ello
podría tener un efecto colateral positivo: el autor nos podría enviar los resultados de sus in-
1'-
vestigaciones no publicadas o dar detalles acerca de otros colegas en ese campo. Escribi-
mos a los autores también cuando tenemos más de un artículo d~ una fuente y no estamos
seguros de si se trata de informes referentes a distintos aspectos de un estudio. No debe in-
cluirse a los mismos participantes más de una vez en la misma parte del metaanálisis; de
hacerlo, se daría a esa investigación concreta una influencia indebida sobre el resultado del
metaanálisis.

.
Si los investigadores no responden, nos veremos forzados a cuantificar informes tan
vagos como "los resultados fueron significativos". En el apéndice XIII se presentan formas
de trabajar con esto.

El problema del archivero


Los autores y las publicaciones tienden a divulgar resultados estadísticamente significati-
vos, lo cual implica que podrían haberse realizado otras investigaciones que no produjeron
resultados de esa índole y que no se publicaron. Eso se llama el problema del archivero
porque los investigadores podrían tener archivados los estudios no publicados, lo cual

...
J66l~ ______________l_nv~e~s~ti~ga~c~ió~n_c~u_a_nt_it_a_ti_va~e_n~p_si_co_l_og~í~a____________________
supondría que nuestro metaanálisis soslaya hallazgos no significativos y que por ello da
una falsa impresión de significación. Más adelante se mencionan las formas estándar para
considerar dicho problema. En esencia, en ellas se calcula cuántos estudios no publicados
con hallazgos no significativos debe haber para poner en duda los hallazgos del metaaná-
lisis. Si el número es demasiado grande, no hay problema del archivero; si es pequeño, los
resultados del metaanálisis se verán con mayor cautela.

Clasificación de estudios anteriores


Tras recolectar los estudios puede decidirse acerca del metaanálisis por efectuar. Ello puede
realizarse con base en los grupos de comparación y en las variables dependientes utiliza-
dos. Cuanto más estudios se incluyan en cierto análisis, tanto mejor. Por ello se recomienda
utilizar inicialmente un proceso de clasificación amplio e identificar después subcategorías
relevantes. Por ejemplo, en el caso del dolor pélvico podrían clasificarse los artículos en
que se ha comparado a los pacientes con dolor pélvico con cualquier otro grupo. Podrían di-
vidirse luego en aquellos donde se utiliza como grupo de comparación a pacientes con otros
tipos de dolor y a pacientes que no lo sufren.
El metaanálisis puede componerse de dos análisis: uno de la probabilidad combinada
de todos los estudios y otro del tamaño combinado de su efecto. En cada uno de ellos debe
convertirse cada medición de probabilidad y del efecto a un valor estándar.
En algunos artículos de investigación se incluyen los resultados de varios subgrupos.
Por ejemplo, en estudios sobre diferencias de género en la aptitud para matemáticas, losar-
tículos comprenderían los resultados obtenidos en más de una escuela e incluso en más de
un país. El metaanálisis permite elegir cómo tratar los resultados de tales artículos. Por otra
parte, los resultados de cada submucstra pueden incluirse como un elemento separado en
el metaanálisis. No obstante, quizá se diga que ello significarla dar un peso indebido a
un artículo y a su método. En este caso, convendría más crear un solo tamaño del efecto y
de probabilid:t0 para todas las submuestras del artículo. Para estar más seguros, lo mejor
será realizar dos metaanálisis: uno con cada subestudio considerado estudio en sí mismo y
otro donde los artículos respectivos se urilicen una sola vez en el metaanálisis. Que ambos
metaanálisis se contradigan indicaría claramente que los resultados son cuestionables.

Ponderación de los estudios


En algunos textos sobre el metaanálisis se recomienda dar una importancia relativa adecua-
da a los diferentes estudios. En otras palabras, en lugar de considerar que todos éstos tie-
nen un valor equivalente, debe ponderarse la calidad de cada uno de ellos según el tamaño
de la muestra y la solidez metodológica. Sin embargo, hay opiniones opuestas respecto a
lo que constituye una base adecuada para asignar la importancia relativa, e incluso a si es vá-
lido hacerlo. El autor prefiere conferirla a cada estudio según el número de participantes.
______________________________M_e_t_aa_ n_á_lis_is____________________~~

Los estudios con más participantes tienen así mayor influencia en los resultados del meta-
análisis que los de muestras menores.

Combinación de los resultados de los estudios


Tamaño del efecto
• Producción de una medición estándar del tamaño del efecto
El coeficiente de correlación res una medición estándar útil del tamaño del efecto. Se pre-
fiere tal valor a otras medidas porque no lo afectan las diferencias del tamaño de las sub-
muestras en diseños entre sujetos. Ello se convierte en un problema sólo si el investigador
no tiene la información necesaria sobre los tamaños de las muestras para calcular los del
efecto en los cuales se toman en cuenta submuestras desiguales. En el apéndice XIII se pre-
sentan ecuaciones para convertir en r diferentes estadísticas descriptivas y comparativas. Sin
embargo, el uso de r como medida del tamaño del efecto debe convertirse en una transfor-
mación Z de Fisher. Como existe el riesgo de confundir ese valor con la z estándar utiliza-
da en la ecuación para combinar la probabilidad, el autor indica con el símbolo r' la Z de
i
Fisber. La ecuación para convertir r en r' figura en el apéndice XVT, junto con tablas para
convertir r en r'.

Cálculo de un tamaño del efecto combinado


Una vez que se calculó r' para cada estudio, los valores correspondientes pueden usarse a
fin de producir una r' combinada, la cual puede transformarse de nuevo en r para obtener
el tamaño combinado del efecto, con la ecuación respectiva presentada en el apéndice XVI
o con las tablas de éste.

Probabilidad
Producción de una medida estándar de ·probabilidad
La medida estándar para calcular la probabilidad recomendada por el autor es la puntua-
ción z. En el apéndice XIIJ se presentan las ecuaciones para convertir diferentes estadísti-
cas inferenciales en una puntuación z.

Cálculo de una probabilidad combinada


Tras calcular la puntuación z y el tamaño de la muestra de cada estudio es factible calcular
una puntuación z combinada que puede considerarse una puntuación z convencional; su
probabilidad se halla mediante la consulta de la tabla z estándar (apéndice XIV).
J68lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
Homogeneidad
Una parte importante del metaanálisis consiste en valorar si los estudios de un metaanáli-
sis dado son heterogéneos. En otras palabras, si difieren de manera importante entre sí. El
proceso guarda similitud con el que se realiza para hallar una medida de·dispersión de las
puntuaciones de una muestra. Si difieren significativamente, es necesario localizar el o los es-
tudios que contribuyan a esa heterogeneidad. Deben examinarse después todos los estudios
para identificar la parte de los aberrantes que podría contribuir a la heterogeneidad.
Recomiendo poner a prueba la heterogeneidad de los estudios de acuerdo con el tama-
ño del efecto y retirar los aberrantes hasta obtener un conjunto de estudios con heteroge-
neidad mínima. Así podrá informarse sobre los resultados del metaanálisis con la inclusión
de los estudios aberrantes o sin ella. En el caso de la probabilidad, sugiero informar sim-
plemente si hubo resultados heterogéneos o no. Recuerde que, como la probabilidad depen-
de en gran medida del tamaño de la muestra, un estudio podría producir una probabilidad
muy distinta de la correspondiente a otros sólo porque el tamaño de la muestra fue distin-
to, incluso si en todos los estudios se obtuvo un tamaño del efecto similar.

Comprobación de la heterogeneidad de los tamaños del efecto


La heterogeneidad de los tamaños del efecto se calcula mediante una ecuación que analiza
la variación de las puntuaciones r transformadas de Fisher (r') correspondientes a los estu-
dios para averiguar si difieren de manera significativa (apéndice XIII). Si hay diferencias
significativas, las probabilidades son heterogéneas. En tal caso, se retirará el estudio cuya
r' difiera en mayor medida de las de los demás estudios y se recalculará la variabilidad. Si
el conjunto reducido de estudios también es heterogéneo, nuevamente deberá retirarse el de
la r' que más difiera del resto, hasta que el conjunto resultante no sea heterogéneo de ma-
nera significativa. Tras ello, puede afirmarse que la r combinada de los demás estudios es
homogénea.

Comprobación de la heterogeneidad de las probabilidades


Conforme al razonamiento presentado líneas arriba, se consideraría que no vale la pena ve-
rificar si las probabilidades de los estudios son heterogéneas. El método se describe por
cuestiones de integridad, pero resulta innecesario continuar probando hasta tener un con-
junto no heterogéneo respecto a sus probabilidades. Sígase el mismo procedimiento que el
utilizado para calcular la heterogeneidad de los tamaños del efecto, pero esta vez úsese la
ecuación correspondiente a fin de comprobar la variabilidad de las puntuaciones z estándar
para el conjunto de estudios (apéndice XIII).

.... -
_______________________________Met_a_an_a_'h_.sl_·s______________________~~
__

Intervalos de confianza
Resulta útil calcular e indicar el intervalo de confianza del tamaño del efecto combinado.
En él se tiene en cuenta el total de participantes de todos los estudios del metaanálisis. Re-
cuerde que un intervalo de confianza es una estimación, basada en datos de una muestra,
sobre el sitio en que podría estar el parámetro de la población. Si el intervalo de confianza
del tamaño del efecto no contiene un cero, cabe confiar en que se ha detectado un efecto
• real. Por ejemplo, si un intervalo de confianza refleja que el tamaño del efecto de la rela-
ción entre género y tabaquismo en cierta cantidad de estudios fue de -0.1 y +0.4 (donde un
valor negativo denota mayor proporción de mujeres fumadoras, y uno positivo, mayor pro-
porción de varones), entonces, como esa gama incluye la posibilidad de que el tamaño del
efecto sea cero, podría poner en tela de juicio que haya una diferencia real entre las con-
ductas de tabaquismo de cada género.

Cómo manejar el problema del archivero


El método para manejar el problema del archivero consiste en calcular cuántos estudios no
significativos podrían añadirse al metaanálisis para volverlo no significativo. Ello se cono-
ce como N fracaso-éxito y su cálculo se halla en el apéndice XIII. Para Rosenthal (1991),
cabe suponer que el número de estudios no significativos no divulgados es de cerca de
(5 x k)+ 10, donde k es la cantidad de estudios del metaanálisis. Por ejemplo, si en éste se
han encontrado seis estudios, es razonable creer que hay (5 x 6) + 10 = 40 estudios no sig-
nificativos. Si la N fracaso-éxito supera ese número crítico de estudios, puede considerar-
se que en el metaanálisis se ha obtenido un resultado robusto (que no presenta el problema
del archivero).

Comparación centrada

,
Una manera de trabajar con un conjunto de estudios no homogéneo es buscar una base con-
sistente de la falta de homogeneidad y probarla con estadística. Por ejemplo, un metaaná-
lisis de la relación entre el género y las capacidades matemáticas podría revelar que los
estudios presentan resultados heterogéneos. En el metaanálisis cabe plantear la hipótesis de
que eso se debe al tipo de aptitudes matemáticas valoradas en cada estudio. Entonces, será
factible clasificar los estudios de acuerdo con el tipo de habilidades matemáticas valoradas
para ver si producen resultados significativamente diferentes. Tal técnica rebasa el objeti-
vo del libro. Quienes deseen realizar una comparación centrada deben consultar la obra de
Rosenthal (1991) .


~~----------------ln_v~e~st_íg~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Presentación de los resultados del metaanálisis


Deben informarse los sistemas de categorización aplicados para identificar los estudios y
los años cubiertos. Se presentarán de manera explícita todas las decisiones tomadas sobre
la clasificación de los estudios y las bases para incluir o no ciertos estudios en un metaaná-
lisis. Asimismo, han de mencionarse en un apéndice todos los artículos consultados para rea-
lizarlo.
La mejor manera de presentar los resultados del metaanálisis quizá sea una tabla resu-
men que incluya los detalles siguientes:
• La variable dependiente
• La naturaleza de los grupos experimental y control
• El número de estudios
• E l total de patticipantes del metaanálisis
• El tamaño del efecto combinado (r) y su intervalo de confianza
• La probabilidad combinada, como valor z y como probabilidad
Y si el resultado es significativo:
Tanto el número de estudios no significativos que podrían haberse necesitado para evi-
tar que el metaanálisis fuese robusto ante el problema del archivero (la N fracaso-éxito)
como el probable de los no significativos. Si el resultado no es estadísticamente sig-
nificativo, no puede estar sujeto al problema del archivero.
En seguida se muestra la tabla resumen de un metaanálisis basado en las puntuaciones
de depresión de pacientes con dolor pélvico y de controles sin él (los cálculos respectivos
se hallan en el apéndice XIII):

Tabla 22.1 . Resumen de un metaanálisis de estudios donde se abordó la depresión


de pacientes con dolor pélvico y de controles.

· Tamaño
del Número
Número Total efecto critico
Grupos de de combinado Intervalo z p N fracaso· del
comparados estudios participantes (r) de confianza combinada combinada éxito archivero

Dolor pélvico
contra
controles

Todos los 0.2703


estudio! 6 620 0.3427 a 8.066 <0.0001 860 40
0.4111
Estudios 0.2627
homogéneos 5 510 0.3828 a 8.134 <0.0001 607 35
0.4179
_______________________________ M
__ _ á_h_·sl_·s______________________~~
et_a_an

La tabla anterior puede interpretarse como la presentación de un metaanálisis acerca de la


depresión que sufren los pacientes con dolor pélvico y Jos controles sin éste. Al principio,
en él se utilizaron seis estudios con un total de 620 participantes. Sin embargo, en los es-
tudios hubo tamaños del efecto significativamente heterogéneos. Se identificó un conjunto
no heterogéneo de cinco estudios. El tamaño del efecto combinado del conjunto homogéneo
fue de r = 0.3828, considerado por Cohen (1988) superior a un tamaño del efecto medio.
Es muy poco probable que los resultados se hayan obtenido por azar. Se habrían necesita-
do 607 estudios no significativos para que el metaanálisis no fuera significativo, lo cual
refleja que el problema del archivero no afecta ese estudio, pues quizá existan sólo 35 es-
tudios no significativos. Obsérvese también que los intervalos de confianza no abarcan
valores positivos y negativos, lo que apoya aún más el hallazgo.

Resumen
Para realizar un metaanálisis se identifican todos los estudios disponibles relacionados con
el área que se explora. Éstos deben clasificarse de acuerdo con su diseño y con las varia-
bles dependientes que se utilizan en ellos. Se deciden cuántos metaanálisis se necesitan
para describir plenamente el área. Pueden calcularse un tamaño del efecto y una probabili-
dad combinados para cada metaanálisis. Además, debe calcularse la heterogeneidad de cada
una de tales medidas. Cuando se identifica la heterogeneidad del tamaño del efecto, se elimi-
nan estudios del metaanálisis basta identificar un conjunto homogéneo. Se presentan en
el informe tanto las probabilidades combinadas de todos los estudios y del conjunto homogé-
neo como el tamaño del efecto combinado del conjunto completo de estudios y del homo-
géneo. Todas las decisiones sobre la inclusión y la exclusión de estudios se plantean de
manera explícita en el informe respectivo.
En el capítulo siguiente se explica cómo presentar informes de investigación.
23
Cómo presentar la investigación

Introducción
El investigador debe comunicar cuatro puntos a quien lea o escuche un recuento de su tra-
bajo: qué hizo, cómo lo hizo, por qué lo hizo y qué encontró. Un lineamiento indica que el
autor se expresará con toda claridad según el medio elegido y el público que, razonable-
mente, espera que lo lea o escuche.
·Por lo anterior, un informe escrito para una publicación académica diferirá de una ex-
posición verbal ante una concurrencia del mismo tipo. Un informe escrito para académicos
diferirá también de uno dirigido a otro tipo de personas. Además, es necesario atender las
convenciones existentes, pues el público podría tener ciertas expectativas respecto al nivel
de detalle que se presentará y en qué parte del recuento habrá de exponerse.
Hay cuatro tipos de público, cada uno de los cuales exige un método de exposición dis-
tinto. En primer lugar está el público en general, para el que es necesario hacer el mayor
número de concesiones, explicar y modificar la terminología e incluso simplificar la estruc-
tura de los enunciados. En segundo lugar está el público de legos con preparación acadé-
mica, el cual también requiere que se le explique la terminología. En tercer sitio están las
personas de la misma disciplina que el investigador, quienes quizá necesiten sólo que se
les aclaren ciertos aspectos del área concreta abordada. Finalmente, están los colegas del
mismo ámbito del investigador, a quienes se realizan concesiones mínimas.

372
__________________________C_ó_
m_o~p_r_
e_
se_n_ta_r_l_a_i_
nv_e_s_
ti~ga_c_io_'n________________~¡-373

Lenguaje no sexista
Para muchas personas ya no es aceptable que se considere neutral el pronombre él y no refe-
rido sólo a varones. Una forma de evitar la necesidad de mencionar explicitamente el género
de alguien es con el plural. Por ejemplo: Los investigadores estudiaron el efecto de la es-
trategia nemotécnica en el recuerdo y seleccionaron tres grupos ... De esa manera, ellos se
utiliza en lugar de él o ella. No obstante, en ocasiones el psicólogo desea referirse a una
persona en concreto. Si bien algunos emplean el plural por creerlo pronombre neutral y sin-
gular, su uso es incorrecto y puede molestar a ciertos lectores. En este caso estimo preferi-
ble recurrir a la fórmula él o ella y no él (ella) . Por ejemplo: Cada participante recibió
capacitación para utilizar la estrategia nemotécnica; posteriormente, se pidió al o a la
participante que recordara tantas palabras como le fuese posible.

Informe escrito
Hay muchos tipos de informe escrito: por ejemplo, puede elaborarse para incluirlo en una
publicación académica, en una revista destinada a profesionales como The Psychologist, en
un periódico o en una revista popular, para un organismo patrocinador o para un cliente.
Por lo general, se pide a los estudiantes que adopten un estilo similar al de las publicacio-
nes académicas cuando presenten sus investigaciones. Me centraré en los informes escritos
para el público académico. Para comenzar, describiré el informe de un experimento o de un
cuasiexperimento y explicaré algunas variaciones del tema.

Informes académkos escritos


de experimentos o cuasiexperimentos
Los informes académicos escritos de un experimento o de un cuasiexperimento tienen un
conjunto de secciones definido claramente. Sin embargo, a los estudiantes les preocupa
estar repitiéndose en el texto porque deben decir lo mismo en los distintos apartados. Cada
parte del documento tiene una función específica y el conocimiento respecto a ésta ha de
servir para decidir lo que se incluye en la sección.
El informe académico escrito de una investigación tiene dos diferencias fundamenta-
les respecto al ensayo. En primer lugar, los lectores podrían decidir no revisarlo de manera
lineal, de principio a fin, y saltar de una parte a otra. Por ello, cada apartado será autosufi-
ciente en lo posible. En segundo lugar, debe suponerse que los lectores poseen conocimien-
tos sobre la práctica de la investigación. Por tal motivo, hay muchos elementos que no se
requiere explicar. Por ejemplo, si se utiliza en el trabajo una técnica estadística estándar, re-
sulta innecesario pormenorizar sus principios.
Dos aspectos del informe de una investigación, presentado por escrito para un grupo de
colegas, deben orientar el nivel de detalle a que ha de llegarse. En primer lugar, se incluirán
J74lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si_co_lo~g~ía_____________________
detalles suficientes para que otro pueda reproducir el estudio, de manera que se duplique
cada elemento esencial. En segundo sitio, tos lectores habrán de saber con precisión qué im-
plica la investigación, de modo que puedan juzgar su mérito.
Una convención adoptada en la mayoría de los informes académicos estima preferible
usar la tercera persona del impersonal en lugar de la primera. En otras palabras, debe es-
cribirse Se realizó un estudio y no Realicé un estudio.

El titulo
El título reviste gran importancia, pues con frecuencia será lo primero que vean todos los
lectores del informe y podría encontrarse en el índice de contenido de una publicación o
como entrada en una lista de publicaciones. Por ello, en él debe indicarse de qué trata la in-
vestigación para que los lectores decidan si quieren conocerla. Ha de ser breve e indicar
asimismo el área de estudio y detaflar más la subárea. Un título como fl¡forme sobre un ex-
perimento de psicología social constituye un ejemplo extremo de lo que no debe hacerse.
Es cierto que informa acerca del área global de la investigación, pero no va más allá. La
mayor parte de ese título reSulta redundante: el lector sabe que se trata de un informe, puede
averiguar que atañe a un experimento si revisa la síntesis y la psicología social representa
ün área muy vasta. En general, como los lectores tienen intereses más específicos, eligen
lo que han de estudiar con base en el tema de la investigación. Por ello, un mejor título sería
Los efectos de la presencia de terceros en la conducta altruista.
Según otro principio, el título debe reflejar de modo adecuado el contenido del infor-
me. Ello podría parecer obvio, pero un uso descuidado de la terminología quizá desoriente
al lector. Un colega se vio inundado de solicitudes de copias de un artículo en cuyo título
estaba la palabra biorretroalimentación, cuando el texto trataba simplemente acerca de la
retroalimentación.

La sintesis
La síntesis es un resumen muy breve de la investigación que se divulga; recomiendo usar
no más de 100 palabras. Si el trabajo está registrado en alguna base de datos como Psych-
Lit, dicha parte podría constituir la única información que Jos lectores tengan acerca de él,
aparte del títu lo. Quienes se hayan interesado tras leer el titulo irán a la síntesis y, según lo
que ahí encuentren, decidirán si prosiguen. La brevedad de la síntesis significa que de-
be incluir sólo detalles esenciales. El autor ha de indicar lo que hizo. cómo lo hizo y qué
encontró; por qué lo hizo resulta menos importante en esa sección. No creo que el lector
necesite conocer, al revisarla. la hipótesis del estudio. También sugiero omitir las referen-
cias en la síntesis, pues los detalles de éstas no se hallarán disponibles para quien cuente
sólo con la síntesis y el título. Sin embargo, si el trabajo citado es suficientemente conoci-
do, parece razonable hacer referencia a él. Por ejemplo : En el experimento se estudió el
__________________________C_ó_ln_o~p~r_e_se_n_t_ar_l_a_i_nv_e_s_ti~ga_c_io_'n________________~¡-J75

modelo de Baddeley y Hitch de la memoria de trabajo. El siguiente es un ejemplo de cómo


escribir una síntesis:
El investigador puso a los participantes en una habitación en una de tres situaciones:
solo, con un extraño que era comparsa o con un amigo. Luego entró en una habitación
adyacente y, tras cierto periodo, se creó la impresión de que había sufrido un accidente.
El comparsa indicó, con su conducta, que no sucedía nada malo. Un número significa-
tivamente menor de los participantes que estaban con comparsas acudieron a ayudar al
investigador respecto a los que se hallaban en las otras dos situaciones; las dos condi-
ciones restantes no difirieron de manera significativa.

Los errores comunes entre los estudiantes incluyen que éstos dan demasiados detalles acer-
ca del diseño, del número y de la naturaleza de los participantes (en ocasiones cuando tales
pormenores son innecesarios) y tanto del procedimiento como de las pruebas estadísticas
específicas que utilizaron. En contraste, ofrecen información escasa sobre los resuJtados; con
frecuencia, sólo dicen al lector que "fueron significativos" o incluso que "a continuación se
presentan los resultados". Debe indicarse qué dirección tomaron éstos.

La introducdón
El propósito de la introducción es poner la investigación en el contexto de otros estudios
relevantes anteriores y explicar por qué valió la pena efectuarla. El nivel de detalle debe es-
tar entre dos extremos: lanzarse directamente a la hipótesis sin ninguna otra explicación o
ser demasiado minucioso, al grado de explicar la psicología social. Han de resumirse los
trabajos previos y evitar exponer hasta el mínimo detalle.
Al citar a un autor, simplemente se escribe su apellido y la fecha de publicación, como
se haría en un ensayo. Resulta innecesario informar al lector: Jean Piaget, psicólogo suizo
nacido en Ginebra, afirmó en 1963 que... , a menos que tales detalles sean de suma relevan-
cia para el argumento que se presenta. En lugar de ello, habrá de escribirse: Piaget {1963)
afirmó que... Según la convención, la primera vez que se hace referencia a un articulo es-
crito por más de dos autores, se presenta toda la lista de éstos. En adelante, se cita así: Pia-
get y cols. (1977), en lugar de señalar a todos nuevamente (la abreviatura y cols. significa
"y colaboradores"). Si uno o más estudios leídos no aportan nada al argumento, pero sirven
para apoyar alguna investigación relevante anterior citada en el artículo, basta listar a los
amores en seguida de una frase sintética, como Los resultados hallan respaldo en Piaget
(1963), Hartley (1977) y Cruíkshank (1 983).
El final de la introducción debe allanar el camino a la sección siguiente: el método.
Ello puede hacerse mediante una frase de enlace: Se decidió realizar un experimento para
ver si la presencia de otra persona tiene algún efecto en la conducta altruista de un parti-
cipa me. De manera alternativa, también puede plantearse formalmente la hipótesis de la in-
vestigación. En un informe de laboratorio, tal vez resulte más adecuado utilizar el segundo
ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
~~----------------ln_v_e_st~ig~a_c_ió_n_c_u_a_n_ti_

formato, junto con la hipótesis nula. Sin embargo, pocos psicólogos graduados divulgan
sus investigaciones en tales términos y prefieren dejar implícita la hipótesis. Las ventajas
del método formal son dos: el estudiante puede demostrar al evaluador que sabe lo que hace
y deja en claro qué criterios se aplicaron al efectuar las estadísticas, por ejemplo, si es apro-
piado usar una prueba de una o de dos colas.

El método
La función del método consiste en permitir a los lectores reproduc4' el estudio si lo desean.
Por tanto, es necesario decidir si se han dado o no detalles suficientes. Sin embargo, al mis-
mo tiempo, no debe incluirse información inocua, como el procesador de textos utilizado
para preparar un cuestionario. La sección del método suele diviillrse en los subapartados
"Diseño", "Participantes", "Materiales y equipo" y "Procedimiento".
Diseño. El subapartado "Diseño" contiene, obviamente, los detalles acerca del diseño uti-
lizado en la investigación. Es necesario informar al lector cuáles fueron las variables inde-
pendientes y las dependientes y si se usó un diseño entre sujetos, de sujetos igualados,
intrasujetos o mixto. Sin embargo, en el caso de los diseños correlativos no se requiere
hablar de las VI y de las VD, a menos que se haya manipulado una de ellas, ni de las va-
riables entre o intrasujetos. En esa sección también debe incluirse alguna justificación re-
ferente a ciertos aspectos del diseño. Por ejemplo, si en un experimento sobre la memoria
se introduce una actividad entre la fase de presentación y la de recuerdo para evitar que el
sujeto repase la primera, se explicará por qué. En pocas palabras, la sección "Diseño" sirve
para indicar por qué se pidió a los participantes que hicieran lo que hicieron, mientras que
en "Procedimiento" se pormenoriza lo que se les indicó y lo que realizaron.
Si el investigador efectuó alguna prueba piloto, lo cual recomiendo encarecidamente,
resulta más claro si la menciona en una subsección, o "Estudio piloto", de la sección de di-
seño. En ella se incluirán los detalles usuales de los participantes (véase más adelante) y
una referencia breve a las modificaciones hechas a la luz del estudio piloto. Ello reviste
importancia particular si el estudio se relaciona con la creación de una medida, como un
cuestionario. Es necesario convencer al lector de que se ha intentado, como mínimo, estu-
diar la validez patente de la medida.
El consejo formal sería señalar el nivel alfa que se aplicará a las pruebas estadísticas,
mas en la práctica ello se realiza pocas veces.
Participantes. En el pasado, los participantes se llamaban sujetos. Estamos en un periodo
de transición entre esa postura, la cual parece implicar que las personas son objetos de estu-
dio, y una nueva en que se les considera más semejantes a los investigadores. Por tanto, al-
gunos psicólogos hablan de sujetos y otros de participantes. Debe elegirse un término y
apegarse a él en todo el informe. Los lectores desean conocer la representatividad de la mues-
tra y tener una idea de hasta dónde se generalizan sin riesgos los hallazgos. Es necesario
------------------------~C~ó~m~o~p~r~e~se~n~t~ar_l_a_i_nv_e_s_n~g_ac_i_ón________________-J¡:377

indicar el número de participantes utilizado, la proporción entre hombres y mujeres, el rango


de edad (preferentemente con medias y desviaciones estándar) y la ocupación. Además, se
informará sobre qué base fueron seleccionados: si ésta fue genuinamente aleatoria, debe in-
dicarse cómo se logró. Si algunos de los seleccionados rehusaron participar, ha de señalar-
se cuántos lo hicieron y cuál fue la base de su rechazo. Es importante saber si se tiene una
muestra que podría describirse como autoseleccionada porque la forman quienes no se re-
husaron; quizá la muestra esté sesgada, lo cual tomaría confusos los resultados por la na-
turaleza de la muestra.
Materiales y equipo. De nueva cuenta, hay que incluir sólo los detalles relevantes para
quien trate de reproducir la investigación. Por ello, si los materiales o el equipo empleados
reúnen ciertas características distintivas muy importantes para realizar el estudio, se pro-
porcionarán todos los detalles sobre lo que se utilizó. Por ejemplo, si se mostró a los parti-
cipantes imágenes de rostros durante un lapso muy preciso, vale la pena informar de la
construcción del equipo usado para presentarlos. Tal información posee relevancia porque
el lector quizá desee cuestionar la exactitud de dicho equipo. De manera similar, si el in-
vestigador videograba la conducta en una habitación diseñada ex profeso, describirá la dis-
posición y el equipo respectivos. Si se utilizan ilustraciones, lo mejor consiste en ponerlas
inmediatamente después de la referencia a ellas. Si se colocan en otro lugar, resulta poco
probable que el lector las vea. Sin embargo, si se requiere dar muchos detalles, la informa-
ción se presentará en un apéndice. Si se aplica una técnica estadística estándar para anali-
zar los datos, no es necesario especificar el paquete estadístico utilizado. Sin embargo, si
la técnica no es bien conocida en términos generales o si los paquetes difieren en cuanto a la
forma de manejar los datos, se aconsejaría informar cuál fue el paquete e incluso qué ver-
sión se empleó.
Si no se usaron equipo ni materiales en la investigación, debe omitirse dicho apartado.
Procedimiento. En el procedimiento debe incluirse simplemente lo que se dijo a los par-
ticipantes, cómo se les dijo y qué se les pidió hacer. Toda explicación respecto a por qué
se les solicitó efectuar lo que se les indicó figurará en la sección "Diseño". El lector de-
sea saber cuál historia se les contó, cuánto se les refirió acerca del propósito del estudio y
si fue verbalmente o por escrito, si realizaron pruebas de práctica --si eso era adecuado--
y si se les interrogó tras efectuar la actividad. Se detallarán en orden cronológico las eta-
pas del procedimiento.

Los resul tados


En la sección "Resultados" se incluyen sólo resúmenes estadísticos con apoyos gráficos y
estadísticas inferenciales afmes, en ese orden. Empero, si se tiene más de un conjunto
de resultados, éstos se presentan uno por uno. En el capítulo 9 se indica la mejor manera de
mostrar resúmenes estadísticos y los capítulos correspondientes donde se describe cómo


J78l~ _______________l_n_ve_s_ti~ga_c_io_'n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
exponer las estadísticas inferenciales utilizadas en el estudio. Si se desea incluir los datos
crudos (es decir, los de cada participante, sin analizarlos ni resumirlos), se colocarán en un
apéndice y ha de remitirse a él al lector.
Prefiero las tablas de estadísticas resumidas exactas, como medias y desviaciones es-
tándar, y representaciones gráficas, aun cuando en algunas publicaciones eso está prohibi-
do y se pide a los autores utilizar unas u otras, pero no ambas. Las prefiero porque las
tablas presentan las cifras exactas, mientras que las gráficas dan una impresión más inme-
diata de los resultados.
Se debe informar respecto al tamaño del efecto, cuando lo haya, y dar la versión par-
ticular, por ejemplo, la d de Cohen, pues puede existir más de una medida para el tamaño
del efecto en el mismo tipo de datos. No han de presentarse ecuaciones directamente en el
texto sino en un apéndice o en una nota de pie de página.
Es necesario numerar y rotular cada tabla y figura. Según cierta convención, todo lo que
no es una tabla constituye una figura. Debe señalarse qué unidades se utilizaron en las me-
didas. Por ejemplo, ha de indicarse que la tabla presenta las medias y las desviaciones es-
tándar del número de palabras recordadas. Las tablas y las gráficas serán autosuficientes
en lo posible, en lugar de forzar al lector a que consulte el texto para comprender el signi-
ficado del apoyo gráfico. De la misma manera, se evitarán descripciones como grupo J
si puede indicarse recuerdo inmediato. Sin embargo, si la descripción del grupo resulta de-
masiado complicada, conviene incluir una leyenda o, en el último de los casos, remitir a
la parte del texto donde se halla la explicación respectiva.
No es necesario explicar los resultados en esta sección. En el caso de las estadísticas des-
criptivas, basta una frase como la media y las desviaciones estándar de las palabras recorda-
das por los grupos inmediato y demorado se muestran en la tabla J y en la figura l.
Sugiero que, al presentar estadísticas inferenciales, se brinde información en tres eta-
pas. En primer lugar, debe precisarse qué prueba se utilizó y qué se analizó. Por ejemplo: Se
usó una prueba t entre sujetos para comparar la capacidad de recuerdo de los participan-
tes a quienes se pidió recordar después de JO minutos. En segundo lugar, se indicará con
palabras lo que muestran los resultados. Por ejemplo: Las personas a quienes se pidió que
recordaran inmediatamente recordaron muchas más palabras que aquellas a quienes se
pidió recordar después de JO minutos. Finalmente, han de exponerse las pruebas de la afir-
mación; por ejemplo: (t(IS) = 2.48, p = O.OJ3, prueba de una cola). Se especificará la
versión de la prueba aplicada y, cuando sea apropiado, se mencionarán las variables inde-
pendientes y las dependientes. No basta decir que se realizó una prueba t con los datos.
Si se utilizó un programa estadístico que produjo la probabilidad exacta para el resul-
tado, se indicará ésta. Si, por otra parte, el investigador se apoyó en tablas estadísticas, seña-
lará la probabilidad con toda exactitud. Por tanto. si la probabilidad está entre dos niveles
tabulados. debe presentarse el intervalo de valores posibles; por ej emplo, 0.01 < p < 0.05.
Ello dice más a los lectores que " < O 05. pues ya saben que p es mayor que O Ol .
p:aa

__________________________c_ó_m_o_p~r_e_se_n_t_ar__
la_i_n_ve_s_ti~g_
ac_i_
ón________________~¡-J79

Cuando el investigador realizó análisis complementarios, como comparaciones plani-


1.1
ficadas o post hoc tras practicar un análisis de varianza, debe presentarlos después del aná-
lisis principal con que se relacionan.
También en éste caso, el consejo formal indica que se declare si se decidió aceptar o
rechazar la hipótesis de investigación; esto se hace pocas veces en la práctica, pero es re-
comendable realizarlo mientras se aprenden las técnicas estadísticas.
A menos que se hayan usado técnicas estadísticas poco comunes, no es necesario
explicarlas. Sin embargo, si han de realizarse análisis preliminares para decidir si una

• prueba concreta es apropiada o no, debe informarse sobre los resultados correspondientes;
por ejemplo, si el investigador evaluó la homogeneidad de varianzas antes de aplicar
una prueba t. De manera similar, si transforma los datos, como con una transformación
arcoseno, especificará ese procedimiento. En el capítulo 14 se estudia la transformación de
éste. Asimismo, si se utiliza un procedimiento estadístico en que se dispone de varias deci-
siones, se detallarán las tomadas. Por ejemplo, en el análisis factorial puede elegir cómo se
identificarán los factores.
Según una de las convenciones para informes escritos, el investigador debe dar la im-
presión de ser un científico imparcial que deja a las cifras decidir si su hipótesis es válida.
Así, evitará dañar esa impresión con frases como Por desgracia, los resultados no fueron
significativos. También los resultados no significativos proporcionan información ..
Si el investigador obtuvo un resultado no significativo, recomiendo realizar un análi-
sis de poder. Ello le permitirá calcular el poder estadístico de la prueba, por el tamaño del
efecto obtenido y el de la muestra utilizada. El lector del informe podrá distinguir así la
posibilidad de que se haya cometido un error tipo Il. Si el poder fue de menos de 0.8, su-
giero calcular el tamaño de la muestra que se requeriría para obtener uno de 0.8 con el mis-
mo tamaño del efecto. De esa forma, el resultado se contextúa. Si el tamaño del efecto es
inferior a lo que Cohen (1988) consideraría pequeño y fuese necesaria una muestra muy
grande para obtener un poder de 0.8, el investigador deberá preguntarse si vale la pena re-
plicar el estudio sin modificarlo. Por otra parte, si el tamaño del efecto fue pequeño, media-
no o incluso grande y el poder fue bajo, parecería razonable recomendar la repetición del
estudio con un tamaño adecuado de la muestra.

El análisis y la conclusión
En la parte "Análisis y conclusión" se pretende ubicar los resultados en el contexto de la
investigación referida en "introducción". Además, podrían mencionarse por primera vez
otros trabajos que ayuden a explicar los resultados. También cabe sugerir modificaciones o
mejoras con las cuales la investigación tendría mayor alcance. Debe evitarse exagerar las
críticas hacia ella . Al parecer, algunos estudiantes consideran ésta una oportunidad para
la autohumillación pública y para encontrar fallas donde r :> , a~ . :-


luii¡I.UIIW_,.UIIU _ _ __

~L________________In_v_e_st~ig~a_c_ió_n_c_u_a_n_ ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
ti_

Recomiendo el orden siguiente para la sección: puede comenzarse con un breve resu-
men de los resultados. No deben mencionarse la probabilidad ni el tamaño del efecto sino
sólo qué dirección tomaron los resultados y si fueron estadísticamente significativos o no.
En seguida, han de ubicarse los resultados en el contexto de las investigaciones anteriores.
Si siguen la misma línea que los de éstas, bastará señalar que confirman el trabajo de los
autores citados en "Introducción". Si los contradicen, se tratará de explicar ese hecho. En
esta parte, el psicólogo podría desear criticar su propio estudio, en particular si obtuvo re-
sultados no significativos y el poder estadístico fue bajo. Se evitará el uso de frases poco
convincentes como Si se hubiera usado una muestra más grande, podlian haberse obteni-
do resultados estadísticamente significativos. Como quedó demostrado en el capítulo 13,
esto casi siempre es cierto, por lo cual carece de importancia. Conviene ser más específicos
y recomendar un tamaño de muestra concreto basado en cálculos de poder. Ello podría re-
velar sí vale la pena tratar de obtener el mismo efecto o si se ha de modificar el diseño para
aumentar el tamaño del efecto. Si el científico confia en que sus resultados son el produc-
to de un trabajo bien diseñado y realizado, indicará las implicaciones teóricas de éstos. Fi-
nalmente, deberá recomendar la realización de investigaciones futuras relacionadas con la
suya, pero sin entrar en el ámbito de la fantasía. Ciertamente, puede analizarse toda suerte
de aspectos sobre la memoria, si éste es el tema de la investigación, pero el investigador in-
tentará formular sugerencias apoyadas en sus resultados.
Si el investigador presenta en un solo documento el informe de más de un estudio (por
ejemplo, de una serie de experimentos), lo más usual es redactar una sola introducción con
una sección de método, resultados y análisis para cada estudio. A esas secciones habrá de
seguir un análisis general.

La bibliografía
Quizá la institución a que pertenece el investigador tiene un estilo propio para citar la bi-
bliografía. Sin embargo, el más utilizado en las revistas y en los libros de psicología es el
conocido como método Harv01·d. * Éste muestra disimilitudes ligeras en cuanto a la presen-
tación de referencias de libros, capítulos o artículos. En los tres casos, se indica primero el
nombre o nombres del autor o autores en el orden siguiente: apellido e inicial del o de los nom-
bres del primer autor; después el o los de los demás autores. Se menciona luego el año de
publicación, entre corchetes, asegurándose de que, en el caso de los libros, se especifique
el año de la edición utilizada en la investigación.
En el caso de las revistas científicas, se indica a continuación el nombre del artículo y
el del medio (en cursiva o subrayado), el volumen, la parte (si la hay) y finalmente las pá-
ginas que abarca el artículo.

• Otro método para presentar la bibliografia (el más usado en español) es el seguido en la sección corres-
pondiente de este libro.
_________________________C_
ó_m_o~p_re_s_e_
nt_a_r_la_l_
·n_ve_s_tl~
·g_
ac_io_'n________________~~

Por ejemplo:
Smith, E. (1974). The effect ofhunger upon the perception ofthe size offood. British
Journal of Nutritional Psychology, 17, 3, 27-35.
En el caso de los libros, se indica el título (subrayado o en cursiva), con la primera letra de
cada palabra en mayúscula, seguido de la edición, si ésta no es la primera, el lugar de pu-
blicación y el nombre de la editorial. Por ejemplo:
Brown, A. (1975). Choice Reaction Times Made Simple (2a. ed.). Londres: University
ofNeasden Press.

Si se ha utilizado un libro escrito en colaboración, es decir, donde uno o más capítulos fue-
ron escritos por un autor diferente, se anota el nombre del coordinador o editor (Ed. o Eds. ).
Por ejemplo:
Iones, B. (Ed.) (1990). Children s Understanding ofLinear Algebra. Manchester: Uni-
versity of Stretford Press.

De citarse capítulos de un libro escrito en colaboración, se indica el título del capítulo, se-
guido del nombre del editor o editores, el título del libro (subrayado o en cursiva), el lugar
de publicación y el nombre de la editorial. Por ejemplo:
Kropotkin, P. (1990). Who needs linear algebra, anyway? En B. Iones (Ed.). Children s
Understanding of Linear Algebra. Manchester: University of Stretford Press.

Conviene indicar si el investigador leyó la fuente en su versión original (fuente primaria)


o se basó en la reseña de otro autor (fuente secundaria). Si se apoyó en fuentes secunda-
rias, debe señalarlo mediante la indicación respectiva. Por ejemplo:
Dikkens, C. (1935). Speed-Accuracy Trade-offs. American Iournal ofChoice Reaction
Times, 2, 3, 1-12. Citado por A. Brown (1975). Choice Reaction Times Made Sim-
ple (2a. ed.). Londres: University ofNeasden Press.

Convenciones estándar para las abreviaturas de los títulos de publicaciones figuran en el


manual de estilo de la American Psychological Association (APA).
Las referencias bibliográficas deben ir en orden alfabético, con base en el primer ape-
llido del autor. Observe que he puesto sangría a la segunda línea y a las siguientes en cada
referencia (párrafo francés), lo cual facilita la localización de una referencia concreta.
~L________________In_v_e_st~ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________

Los apéndkes
En un apéndice se presentan datos relacionados con la investigación, los cuales tienen un
grado de detalle que puede afectar la fluidez de la lectura si se incluyen en el-texto princi-
pal. Por tanto, si el investigador creó una medida con varios ítemes, deberá poner en dicho
texto sólo algunos ejemplos y pedir al lector que consulte el apéndice. De manera similar, si
se quiere listar un programa de computadora o describir la parte de un equipo creado espe-
cialmente para el estudio, se colocará tal información en apéndices. Además, como se mencio-
nó, si se desea informar sobre los datos no analizados, éstos aparecerán en un apéndice.
Si el investigador tiene información de varios tipos, es útil .crear un apéndice para cada
uno de ellos, en lugar de aglomerarla toda en uno solo. De esa manera, podría ponerse la
lista de un programa informático en un apéndice y los datos crudos en otro. Para el lec-
tor es útil localizar rápidamente el material, en particular si el informe tiene una tabla de
contenido.

.. El articulo para una revista académica


Cada revista cuenta con su propio estilo, con sus normas para citar la bibliografia y otras
convenciones. Algunas publicaciones tienen detalles de tales reglas en cada ejemplar;
•1
otras, como las de la APA, se presentan en un manual. Una vez que el investigador eligió
la publicación a que enviará su informe, debe leer los detalles correspondientes acerca de las
convenciones y consultar ejemplos de estudios sirniJares al suyo en algún número de la re-
vista. Así sabrá si es preferible utilizar la tercera persona del singular, por ejemplo.
Algunas revistas piden al autor una lista breve de palabras clave que describan el in-
forme. Ello se utiliza en bases de datos como PsychLit y Current Contents para que los
usuarios busquen artículos referentes al área de investigación del autor.
Los artículos para revistas suelen enviarse a una cara y a doble espacio. Las ilustraciones
y las tablas son de alta definición y se mandan por lo general en hojas por separado (en
el texto se indica la parte donde deben colocarse). La mayoría de las publicaciones remite el
escrito a uno o a más jueces, quienes habitualmente permanecen anónimos para el autor.
Éstos evaluarán la calidad del artículo, recomendarán su publicación o su exclusión y, si
procede, sugerirán las modificaciones o adiciones que lo mejorarían; asimismo, pueden
hacer que la publicación del texto dependa de que el autor atienda algunas o todas las su-
gerencias. Desde luego, éste es libre de ignorar el consejo, pero si desea que le publiquen,
necesitará buenos argumentos, en particular si varios jueces propusieron lo mismo.
Cómo presentar la investigación
----------------------------~----------~------------------~
íJ83
Variaciones en la presentación
de otros métodos de investigación
Encuesta o cuesUonario
Utilizaré como ejemplo una encuesta sobre el tabaquismo. Por varias razones, es más difi-
cil elaborar el informe de una encuesta que el de un experimento. En primer sitio, a menos
que el investigador utilice un cuestionario preexistente, estará creando una medida. Por tanto,
debe verificar su validez mediante un estudio piloto e informar al respecto. En segundo lugar,
como no ha manipulado ninguna variable, los términos variable independiente y varia-
ble dependiente se definen con menor claridad. El psicólogo ha de recordar que el análisis de
la relación entre dos variables, donde se hace que una sea independiente y la otra dependien-
te, implica que la primera afecta la segunda; en otras palabras, sugiere la existencia de una
relación causal. En tercer lugar, quizá una encuesta no pruebe hipótesis específica alguna
y ~tnite a describir los datos y explorar las relaciones entre éstos. Como resultado, el ob-
jetivodet-~forme parecería menos evidente. En cuarto sitio, el informe podría parecer aún
menos centrado si en él se realizan varias comparaciones entre las preguntas.
Por lo anterior, en el caso del informe sobre una encuesta, las secciones de método,
resultados y análisis diferirán de las correspondientes a los informes relacionados con otros
tipos de investigación. La sección del método será más larga porque el cuestionario se
modifica frecuentemente tras realizar el estudio piloto. La mejor forma de mantener la flui-
dez del informe es colocando las versiones inicial y final del cuestionario en apéndices se-
parados y pedir al lector que los consulte.
Quizá la sección "Resultados" sea más larga, pues los datos podrían exponerse en dife-
rentes niveles. En primer lugar, podrían divulgarse estadísticas de resumen acompañadas de
gráficas; por ejemplo, una gráfica de barras de las edades de los participantes. En segundo
lugar, se pueden formar tablas de contingencia bidireccional (digamos, relacionando el gé-
nero con la condición de fumador o no fumador) y realizar estadísticas inferenciales a partir
de ellas. A su vez, las estadísticas pueden reanalizarse con base en una tercera variable, como
la condición de fumadores o no fumadores de los padres. Se corre el riesgo de abusar de la
memoria del lector y dificultar la localización de las partes secundarias de la sección.
La mejor manera de exponer el contenido adicional en "Resultados" consiste en divi-
dirlo en subsecciones donde se presenten análisis con algún tema común. Por ejemplo, es
posible incluir dos subsecciones intituladas "Salud" e "Influencias sociales", respectiva-
mente. Quizá la sección "Análisis" sea más larga sólo porque en ella se informa acerca de
más resultados.

Metaanálisis
En el capítulo 22 se detalla cómo presentar los resultados del metaanálisis. En éste, los datos
derivan de las investigaciones de otros profesionales. En cierto sentido, la población la
J84l~ _______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
constituyen todos los artículos referidos al tema del análisis, mientras que la muestra incluye
los artículos comprendidos en la versión final de éste. El psicólogo explicará cómo identi-
ficó su población, con el señalamiento, por ejemplo, de las bases de datos utilizadas. Pos-
teriormente, debe exponer de manera explícita los criterios atendidos para seleccionar la
muestra; es decir, las características de los estudios satisfactorios e insatisfactorios. Además,
pormenorizará sus intentos de incorporar estudios insatisfactorios en la muestra; para ello, por
ejemplo, deducirá estadísticas inferenciales a partir de datos de resumen, usará reglas prác-
ticas para cuantificar ténninos como significativo o escribirá a los autores para tener mayor
información.
Como el objetivo de un informe académico es permitir que el estudio se reproduzca,
conviene presentar, en una tabla incluida en un apéndice, todos los trabajos tomados en
cuenta e identificar los que se utilizaron en el análisis. También se incorporarán tablas con
las estadísticas derivadas de estos últimos, complementadas con el tamaño de la muestra y la
orientación de los resultados; es decir, si éstos apoyan o no cierta hipótesis.
El metaanálisis se encuentra aún en sus primeras fases de desarrollo, por lo cual se es-
pera que el investigador exponga de forma más explícita sus decisiones estadísticas, como
el haber ponderado los estudios con base en el tamaño de la muestra, y la técnica utilizada
para convertir los resultados en una estadística estándar. Además, es común que los auto-
res citen libros sobre el metaanálisis para justificar sus decisiones.

Presentación verbal
Igual que sucede con los otros tipos de presentación, el estilo que el expositor adopte en la
verbal depende de su público. En el caso de uno académico, se aplican muchos principios
del artículo para publicaciones de ese tipo, mientras que para una concurrencia no acadé-
mica se toma más adecuado un modo predominantemente periodístico. , '-' obstante, cabe
recordar que una presentación verbal es un medio temporal: una vez que el e>-, 0sitor ha di-
cho algo, la audiencia recurrirá a su memoria para acceder a la información, a menos que
haya tomado notas suficientes. Por tanto, la presentación tendrá un ritmo que permita a los
oyentes procesar lo que se les indica y no sobrecargar su memoria. Además, éstos no pueden
consultar un diccionario. Por ello, el expositor estará más dispuesto a explicar sus térmi-
nos, incluidas las abreviaturas.
Una limitación clara es el tiempo de que se dispone. El expositor debe investigar si ha
de incluirse un periodo para preguntas y, si es así, de cuánto.

Preparación de la expos;dón
Ciertas personas realizan sin notas sus exposiciones, si bien ésta es una habilidad poco
común. Otras sólo preparan y usan notas. Y algunas más preparan una versión completa de
la exposición, la cual leen ante el público. Le recomiendo que, a menos que esté seguro
__________________________C_ó_m_o~pr~e~se~n~t~a_r~la~i~n_ve~s~tl~·g~ac~i~ón~--------------~~

de poder efectuar la primera de dichas actividades, no haga ninguna. Sugiero que comience
por escribir una versión completa de la exposición para perfeccionar sus argumentos y
presentar una historia coherente. Además, ello permite que los expositores experimentados
sepan si la alocución cabe en el tiempo asignado y que los inexpertos calculen el tiempo de
su presentación.
Posteriormente, sugiero tomar notas de la versión completa de la exposición; servirán
en su oportunidad como ayudas nemotécnicas. Ha de usarse el mínimo de notas y de ase-
gurarse, no obstante, que bastan, para lo cual se releerán después de cierto tiempo. Por basar
la exposición sólo en las notas, el expositor se ve obligado a reelaborar los enunciados cada
vez que presenta el material, dando una imagen de naturalidad. Es necesario espaciar de
modo adecuado las notas, dar sangría a los puntos importantes y colocar las listas de forma tal,
q · ....ada nuevo ítem esté en una línea nueva. Así, el expositor puede encontrar con mayor
rapide~arte que busca y no depende demasiado de las notas para decir lo que debe.
También suelo marcar en mis notas la parte donde va un apoyo gráfico, digamos una trans-
parencia.
Algunos utilizan tarjetas para sus notas; y otros, hojas tamaño carta o A4. Todo ello po-
dría parecer una organización excesiva, pero cuanto mejor preparado esté el expositor, tanto
más natural parecerá su intervención. Una ventaja adicional de preparar la versión comple-
ta de la presentación es que ésta se hallará disponible si alguien necesita copia.
Si se presenta un artículo en un congreso, generalmente se pide una síntesis de la ex-
posición. En el congreso puede repartirse un folleto con los títulos de las síntesis y de las
exposiciones, de manera que los asistentes puedan decidir a cuáles desean asistir; el folleto
también sirve como un registro completo del congreso. Además, para que un artículo se
acepte en un congreso, quizá se pida al autor una versión ampliada de la síntesis, la cual
evaluarán un comité o varios jueces, del mismo modo que un artículo para revista.

Cómo exponer
El expositor desea que el público comprenda lo que dice, pese a las limitaciones de la si-
tuación. Una manera de lograrlo consiste en presentar el mismo material más de una vez,
con diferentes grados de detalle, de forma semejante a un noticiario: primero, los encabe-
zados; en seguida, los pormenores de la información; y para concluir, un resumen de los
puntos principales. Otro método se describe en ocasiones como indicar al público lo que
se le dirá, referírselo y señalarle lo que se le ha comentado.
Una manera de aumentar al máximo la posibilidad de que se comprenda la presenta-
ción consiste en mantener el interés. Líneas arriba recomendé usar notas para conseguir que
la exposición resulte más natural y establecer empatía con el auditorio. Sin embargo, algunos
leen las versiones completas de sus artículos ante el público, lo cual tiene muchas desven-
tajas. Primera, la voz que utilizan al leer difiere de la empleada en una conversación, pues
la primera es menos dinámica. Segunda, quienes leen dedican mucho más tiempo a mirar las
J86l~ _______________l_nv_e~s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
hojas de su escrito. Ello significa que la voz no se proyecta adecuadamente y que el con-
tacto visual con el público disminuye.
Si el investigador piensa leer así su artículo, deberá preguntarse por qué. La única jus-
tificación que se me ocurre es que cada frase escrita debe exponerse literalmente y que
cualquier paráfrasis arruinará el significado. Ello pocas veces ocurre así. Si el expositor
piensa que olvidará algún punto importante, realizará todos los preparativos descritos y ten-
drá a la mano la versión completa como último recurso. Si de cualquier modo ha de leer la
exposición, usará letra grande, suficientemente negra y espaciada para que pueda ver con
mayor frecuencia al público y sin perder el ritmo. Quizá convenga emplear un atril. Sin im-
portar cuán breve sea una exposición, no hay que tratar de memorizarla y reproducirla li-
teralmente, pues tal método también carece de naturalidad.
Mantener el interés del público implica, en parte, centrar su atención en lo que se dice.
Por ello, el expositor estará consciente de su lenguaje no verbal. Es necesario mantener el
contacto visual con el auditorio sin concentrarse en una sola persona, pues ello la inco-
modaría y excluiría a las demás. Sin embargo, el expositor no debe sorprenderse si aun sus
conocidos muestran un rostro más pasivo que el que tendrían en una conversación; el papel
del público es pasivo. El expositor no ha de quedarse parado como estatua, pues parecerá
incómodo e inquietará al público. Mejor utilizará en cierta medida los gestos, pero no al
grado de que éstos se vuelvan distractores; asimismo, evitará jugar con bolígrafos, llaves
o partes de su atuendo. Si está nervioso, recuerde que una hoja de papel amplifica incluso
un temblor mínimo, por lo cual podría suponer una ventaja usar taijetas de notas en las pre-
sentaciones. Asimismo, intentará permanecer en una sola área en lugar de moverse por
todas partes.

Ilustración de la exposición
El expositor tendrá en cuenta que está hablando; por lo mismo, si presenta alguna otra cosa
al público, ésta podría distraerlo y hacer que pierda de vista lo que dice.

Folletos
Si se entrega al público un folleto con texto, antes o después de la exposición, lo más se-
guro es que lo lea. De igual forma, si se le proporcionan imágenes, las verá. En ambos casos,
no se tiene control sobre el momento en que las personas revisarán el folleto. Conviene
pensar en la función de éste. Si es una forma de que la concurrencia evite tomar notas, se
le dirá, antes de iniciar la exposición, que al fmal recibirá un folleto completo. Si se desea
proporcionar una estructura que ayude en el proceso de toma de notas, lo más adecuado
consiste en repartir un folleto que contenga sólo encabezados y subencabezados, con espa-
cios suficientes para tomar notas y no perder tiempo buscando en él. Puede incluirse una
lista de referencias al final del escrito.
__________________________C_ó_m_o~p~r_e_se_n_t_ar__
la_i_nv_e_s_ti~g_ac_i_ón________________~¡:i87

Si el expositor tiene acceso a un proyector de transparencias o de diapositivas y cuen-


ta con instalaciones para presentarlas, será innecesario repartir imágenes. No deberá dar
copias de éstas a fin de que el público las pase de mano en mano, pues propiciaría más
distracciones. Lo mejor es reservarlas para el final de la sesión y dar tiempo suficiente
para hacerlo.

Accesorios audiovisuales
Solía haber una regla para los actores: no trabajar con niños ni con animales, pues son im-
previsibles y pueden echar por tierra la actuación. Se afirmaría lo mismo respecto al uso
de algunas formas de tecnología, como un proyector de transparencias o de diapositivas de
35 mm, un videorreproductor o una computadora. Existen dos reglas generales para todo
ese equipo: el expositor no debe dar por hecho que lo tendrá a su disposición sino que pre-
.. guntará con anticipación; y, aun si dichos aparatos están disponibles, no hará que la presen-
li tación dependa de ellos al grado de que si fallan, ésta se arruine. Es necesario tener planes
i de contingencia y no dejarse abrumar por algún error.
1 A pesar de sus riesgos, Jos accesorios audiovisuales pueden representar una ventaja
i si se usan juiciosamente. Ello se debe a que una imagen, en particular si tiene movimien-
1 to, suele convencer más y comprenderse con mayor facilidad que su equivalente en pala-
t bras, así como a que en una exposición prolongada añaden variedad y ayudan a mantener
la atención del público. Asimismo, por brindar información en más de un medio, se favo-
r rece la retención de los detalles.
Proyectores de transparencias. Los proyectores de transparencias son muy útiles, pues
permiten que el expositor realice un esbozo de su trabajo y presente una lista de temas, ci-
tas largas y gráficas e imágenes. Sin embargo, no conviene usarlos en exceso. No tiene ca-
so efectuar mediante un proyector toda la exposición.
Preparación de las transparencias. Deben dejarse márgenes amplios en los cuatro lados
de las transparencias, pues no todos los proyectores tienen el mismo espacio para colocar-
las. Se aconseja no incluir demasiados detalles y evitar imágenes muy pequeñas o borro-
sas. Si éstas se dibujan sobre la marcha con plumones, elabórese antes un borrador en una
hoja de papel y utilícense marcadores permanentes en el acetato porque los plumones de
agua llegan a correrse, en especial en manos sudorosas. Pueden efectuarse fotocopias di-
rectamente en los acetatos, incluso en color. Sin embargo, si el expositor va a fotocopiar o
imprimir en acetatos, elegirá el tipo correcto de material: algunos de ellos se derriten con
el calor de las impresoras o de las copiadoras. Conviene preparar una transparencia intro-
ductoria para verificar la naturaleza de la proyección.
Presentación de las transparencias. Si es posible, el psicólogo deberá darse tiempo para
colocar la transparencia introductoria y revisar aspectos de la proyección, como que esté
388l~---------------l~nv~e~s~ti~ga~c~ió~n_c~u~a_nt_it_a_ti_va__e_n~p_si~co~l~og~í_a____________________

alineada con la pantalla y enfocada correctamente o que el espejo no oculte parte de la pro-
yección. Esto último puede verificarse sólo desde la perspectiva del público: si el espejo se
interpone entre éste y la proyección, el expositor debe colocar fuera del área tapada la parte
de la imagen que desea que se vea, si ello resulta factible. De presentar varios elementos
en la misma transparencia, una técnica eficaz consiste en tapar la parte que no se utilizará
todavía; de otra manera, la leerán antes de tiempo. Otro método radica en sobreponer dos
o más transparencias (por ejemplo, si se construye una imagen paso a paso). Si se utiliza
tal sistema, a cada una de éstas se colocará cierta marca de referencia que permita alinear-
las todas.
El expositor no debe pararse frente a la pantalla ni dar la espalda al público para indi-
car alguna parte de la transparencia; en cambio, ha de señalar esta misma. Evitará colocar
cierta transparencia y abordar un asunto ajeno a ella; hablará acerca de su contenido, pues
lo contrario revestirá el mismo efecto distractor de un folleto y la audiencia tendrá que
elegir entre concentrarse en lo que se dice o en el contenido de la imagen. Si una transpa-
rencia muestra una gráfica o tabla, particularmente si ésta es complicada, o si se utilizan
convenciones poco usuales, habrá de explicarse el contenido y señalarse partes concretas
de la transparencia mientras se hace. Las gráficas y las tablas constituyen formas de abs-
tracción que, como otros medios de presentar cifras, el lector ha de traducir.
Se intentará mantener en orden las transparencias tras usarlas. Quizá alguien desee re-
ferirse a una de ellas en la sesión de preguntas y respuestas y así se facilitará encontrarla;
tal vez el expositor y quien pregunta recuerden el contenido, pero si la transparencia no se
proyecta de nuevo, el resto del público puede perderse mientras esas dos personas hablan
acerca de ella.
Si hay aspectos de la investigación relativamente importantes para la exposición, pero
el psicólogo ha tenido que resumirlos al grado de que podría preguntársele acerca de los
detalles, le convendría tener preparada una transparencia extra que simplifique su explica-
ción de los pormenores durante la sesión de preguntas. En ocasiones, los científicos indi-
can durante su intervención que en ese momento no pueden tratar a profundidad algunos
temas, pero que volverán a ellos en las preguntas y respuestas.
Diapositivas de 35 mm. Le aconsejo evitar en lo posible el uso de diapositivas de 35 mm,
en particular si ha de comunicarse con otra persona encerrada en un cubículo situado en el
extremo opuesto de la sala para controlar el proyector. Hoy día pueden elaborarse transpa-
rencias en color perfectamente eficaces y los proyectores respectivos son mucho más co-
munes que los de diapositivas. He perdido la cuenta del número de exhibiciones en que tal
dispositivo ha fallado y dejado con ello al expositor sin imágenes para ilustrar la charla o
con una proyección tan desenfocada que sería mejor no tenerla. Otro riesgo con las diapo-
sitivas es que pueden colocarse de diferentes formas en el proyector, incluso de cabeza
o al revés, como la imagen de un espejo.
_________________________c_ó_m_o~p_re_s_
e_nt_a_r_la__
in_ve_s_tl;·g_ac_io_·n________________~~

Esas contrariedades restan tiempo a la exposición mientras se hacen intentos, en gene-


ral vanos, de resolver el problema. Un consejo sobre la orientación consiste en poner una
marca en la misma esquina de las diapositivas como punto de referencia. Sin embargo,
a menos que se recuerde en qué posición debe quedar la señal, podría terminarse con todas
aquéllas colocadas incorrectamente. Igual que con los proyectores de transparencias, cabe
elaborar una diapositiva introductoria utilizable para revisar la proyección antes de empezar
la charla. Con un poco de suerte, el proyector por usar podría ser compatible con algún
carrusel suelto que tuviese la institución donde trabaja el expositor. En este caso, puede
verificarse la orientación de las diapositivas y llevarlas ya colocadas en el carrusel. Por
desgracia, no existe solución para los problemas causados porque alguien más controle la
proyección.
Proyectores para computadora. Se pueden proyectar en una pantalla mediante un equipo
especial imágenes generadas por computadora. Por supuesto, se verificará que el programa
con que se creó el material resulte compatible con el de la computadora que se usará en la
exposición. De haberse utilizado color, se comprobará que la tarjeta de la máquina lo re-
produzca. Este dispositivo, si se aprovecha al máximo, puede ser muy útil. Sin embargo, si
se emplea el proyector equivocado y si se tiene corriente escasa o si en la sala hay demasia-
da iluminación en los lugares menos indicados, la imagen podría resultar tan borrosa que se
antojaría prácticamente inútil. Como sucede con cualquier otro proyector, si la imagen es
demasiado pequeña se tomará inservible. Por ello, se reservará tiempo para verificar con
oportunidad los detalles.

Presentación mural (cartel)


La presentación mural de un cartel es una forma de divulgar investigaciones en foros co-
mo un congreso. Igual que la modalidad verbal, puede constituir una manera de difun-
dir hallazgos preliminares. Posee ventajas y desventajas. En primer lugar, no compite con
otras presentaciones en congresos donde hay sesiones simultáneas; es decir, cuando se tie-
nen dos intervenciones a la misma hora, una persona podría asistir sólo a una. En segundo
sitio, no puede colocarse en un horario poco conveniente que limite a su posible público.
En tercer lugar, no es tan transitoria como la exposición verbal; pueden releerse sus partes
anteriores y, como permanecerá durante todo el congreso, puede volver a consultarse.
Sin embargo, se disputará la atención con otras presentaciones de la misma clase y con
otros aspectos del congreso, como las exhibiciones de libros. Además, quizá se le asigne
un espacio limitado. Por ello, el autor debe captar el interés del público para que éste mire
su presentación y se mantenga atento al leerla.
El formato de la presentación mural resulta más semejante al de la transparencia que
al del informe escrito. Por ello se debe resumir en lo posible y utilizar textos largos sólo
como último recurso. Conviene destacar con claridad los encabezados de las secciones,
J90l~ _______________l_nv_e~s~ti~ga~c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l_og~í~a____________________
utilizar caracteres diferentes para señalar las jerarquías de información y dar los espacios
adecuados; ello ayudará a que los lectores no se pierdan en la exposición. De manera simi-
lar, puede emplearse distinta tipografia, como subrayada, negrilla o cursiva, para atraer la
atención. Sin embargo, igual que con otros medios visuales, se evitará la variedad excesi-
va. No se usará cierta tipografia sólo porque el procesador de palabras puede generarla. El
expositor ha de ser selectivo y contemplar el efecto conjunto. Si no puede recurrir a diferen-
tes tamaños de letra, jerarquizará mediante números romanos o arábigos y letras mayúsculas
o minúsculas. Es mejor usar tablas y gráficas que texto, pero el expositor tratará de ajustarse
a esquemas comunes de representación visual, en vez de pretender crear los suyos: si en
la modalidad verbal puede explicar tales idiosincrasias, la mural se sostendrá por sí misma.
Sin embargo, quizá en ciertas ocasiones el científico esté cerca de su exposición y pueda
contestar preguntas.
De conocerse el tamaño del espacio asignado a la exposición mural, podrá crearse una
versión suya más durable, en lugar de un conjunto de hojas sueltas. Para lograrlo se forra
cada hoja, e incluso toda la presentación, con película plástica transparente o se reproduce
aquélla mediante una impresora de color. Ambas técnicas se hallan disponibles en tiendas
de material artístico o en empresas dedicadas a dar servicio a arquitectos o encuestadores.
También conviene adquirir cilindros para transportar enrollada la presentación. Si no se
dispone de ninguno de tales recw·sos, se recomienda tener una segunda versión por si la
primera se daña al colocarla. Asimismo, el psicólogo podría llevar consigo su propia dota-
ción de tachuelas u otro medio para colocar su exposición si las que se le proporcionen no
bastan. Se averiguará con anticipación cuál es el medio que los organizadores sugieren.
Es buena idea repartir entre los interesados reproducciones de la versión completa del
informe. Sin embargo, lo mejor consiste en ofrecerles el envío de una copia, pues en los con-
gresos suele recibirse todo impreso disponible sin que ello signifique que se leerá. Se debe
tener a la mano una hoja para anotar domicilios y cumplir cualquier compromiso de enviar
el artículo.

Ensayo de la presentación
Sin importar el medio por el cual se presentará el informe de una exposición, es dificil que
el autor permanezca en segundo plano y tenga una visión independiente del contenido. Una
vez preparado éste, se pedirá a una persona menos relacionada con él que lo lea. Única-
mente deberá explicársele la naturaleza del público respectivo, sin dársele más datos. É-sta
constituye otra de las ventajas de preparar una versión completa de una exposición verbal.
En cuanto a la modalidad mural, conviene que la persona la vea antes de leer la versión
completa. La presentación verbal, en particular si el encargado es novato, habrá de reali-
zarse ante una audiencia reducida. En todos los casos, los comentarios de los oyentes o de
los lectores resultarán invaluables para incrementar la calidad del trabajo.
__________________________C_ó_m_o~p_r_es_e_n_ta_r_l_a_i_nv_e_s_ti~ga_c_io_
' n________________~¡-391

Resumen
Hay diversas maneras de presentar un informe de investigación. El científico debe conocer
las convenciones y las limitaciones de la forma elegida y del probable público. Un informe
escrito para publicarse en una revista académica reunirá detalles suficientes para que el lec-
tor identifique el valor de los hechos respectivos y reproduzca los elementos importantes
del trabajo. Por otra parte, una presentación verbal incluirá menos pormenores para favo-
recer la comprensión, en particular si hay una sesión de preguntas y respuestas.

- - - - l l l l tlllllf
Apéndices

~~···
'

1
Estadísticas descriptivas

En este apéndice se exponen las técnicas presentadas en el capítulo 9.



Cálculo de la media (:X)
La ecuación para calcular la media es:

- "x
X=~
11

donde 2: x es la suma de todas las puntuaciones


n es el número de puntuaciones
Esto es, se suman todas las puntuaciones y se dividen entre el número de ellas, con los da-
tos siguientes:
3, 7, 5, 9, 4, 6, 5, 7, 8, 11, 10, 7, 4, 6, 8
- 100
X=-
15
= 6.667

Cálculo de la varianza (s2)


La ecuación para calcular la varianza es:
s2 = _L(x-xY
n-1

394
~-----------------------------------------------------
__________________________E_s_ta_d_ís_ti_ca_s_d_e_sc_n~·p_ti_va_s________________~~

Esto es, se calcula la desviación de cada puntuación a partir de la media y se eleva al cua-
drado. Luego se suman las desviaciones al cuadrado y se divide el resultado entre el núme-
ro de puntuaciones menos l.

Tabla Al. 1. Cálculo de la suma total de las desviaciones a l cuadrado de la media.


Desviación
Recuerdo Desviación al cuadrado
3 -3.667 13.447
7 0.333 0.111
5 -1.667 2.779
9 2.333 5.443
4 -2. 667 7.113
6 -0.667 0.445
5 - 1.667 2.779
7 0.333 0.111
8 1.333 1.777
11 4.333 18.775
10 3.333 11.109
7 0.333 0.111
4 -2.667 7.113
6 -0.667 0.445
8 1.333 1.777
Suma total de 73 .335
desviaciones al cuadrado

2 - 73.335
S - -14-

= 5.238

Cálculo de la desviación estándar (s)

S = ).;2

Esto es, se calcula la raíz cuadrada de la varianza.

S = ~5 .238
= 2.289
J96l~-----------------------A~p_én_d_ic_e_s___________________________

Cálculo de la media y la mediana


a partir de distribuciones de frecuencia
Medjas
Si hemos preguntado a una muestra de 120 personas a qué grupo de edad pertenecen, po-
demos representar los datos respectivos como una tabla simple:

Tabla Al.2. Distribución de frecuencia de las edades de los participantes.

Edad 20·29 30-39 40-49 50-59 60-69


(en años)
Número de personas 15 45 30 20 10

Como ignoramos las edades exactas de los integrantes de los grupos, Jo usual es tomar el va-
lor medio del rango de cada grupo. Por tanto, en el primer grupo hay 15 personas cuya edad
se considerará 20 + 29 ~ 24.5. El total de edades del grupo se calcula multiplicando el punto
2
medio del grupo por el tamaño de éste. Así, la edad total del primer grupo es 24.5 x 15 = 367.5.
Es necesario por ello calcular la edad total de todos los grupos y dividirla entre el tamaño
de la muestra.

Tabla Al.3. Cálculo de las edades totales en un grupo.

Grupo Punto medio Tamaño del grupo Edad total


1 24.5 15 367.5
2 34.5 45 1 552.5
3 44.5 30 1 335.0
4 54.5 20 1 090,0
5 64.5 10 645.0
Gran total 120 4 990.0

Edad total
Medía
Tamaño de la muestra
4990
120
= 41.583 años
Es_ta_d_ís_t_ic_a_s_de_s_c_ri~pt_iv_a_s__________________~~
____________________________

Med;anas
En primer lugar, debe identificarse al grupo que contenga la mediana. Como hay 120 per-
sonas, ésta se halla entre la persona número 60 y la 61. Para encontrar en qué grupo se lo-
caliza, se crea lo que se conoce como frecuencia acumulativa.

Tabla Al.4. Cálculo de frecuencias acumulativas a partir de datos agrupados.

Rango de edades Frecuencia


Grupo (en años) Tamaño del grupo acumulativa

1 20·29 15 15

2 30·39 45 60

3 40-49 30 90

4 50-59 20 11 o

5 60-69 10 120

En este caso, la mediana se halla entre el segundo y el tercer grupos. Puede calcularse obte-
niendo la media de la mayor edad posible del segundo grupo y la menor del tercero:
39 + 40
Mediana=
2
39.5 años
Sin embargo, si la mediana está en un grupo, el cálculo es diferente. En la tabla AI.5 se pre-
sentan los datos para los que la mediana se encuentra en un grupo: el de las personas de 40
a 49 años de edad.

Tabla Al.5. Creación de frecuencias acumulativas a partir de datos agrupados.

Rango de edades Frecuencia


Grupo (en años) Tamaño del grupo acumulativa

1 20-29 14 14
2 30-39 44 58
3 40-49 32 90
4 50-59 20 110
5 60-69 10 120
én~d~k~e~s_____________________________
398lL----------------------~A~p~

La mediana se calcula en este caso con la ecuación siguiente:

donde Lm valor menor del grupo que contiene la mediana


cm amplitud del grupo que contiene la mediana
Fm- 1 = frecuencia acumulativa del grupo inferior al que contiene la mediana
fm frecuencia en el grupo que contiene la mediana
Por tanto, en el presente caso,

40+ !Ox (~xi2o)-ssll


Mediana=
[ [ 32

= 40+(10x( 60~58))
= 40 + (10 X 0.0625)
= 40.625

Creación de una gráfica de pastel


En el capítulo 9 se presentó el ejemplo de un grupo de 50 varones a quienes se preguntó si
fumaban. De ellos, 20 eran fumadores. Podemos expresar las cifras como proporciones. Por
tanto, 20 = 0.4 de la muestra eran fumadores y el 0.6 restante no lo era.
50
Puesto que un círculo tiene 360 grados, podemos calcular el número de grados que re-
presentan los fumadores multiplicando 360 por la proporción de fumadores:

360 x 0.4 = 144 grados

y para los no fumadores

360 x 0.6 = 216 grados


\

• ____________________________
Es_t_ad_í_st_ic_a_s_d_es_c_ri~pt_iv_a_s__________________~~

Lo anterior nos da la gráfica siguiente:


Varones

• Fumadores
D No fumadores
216
grados

Figura Al.1. Grados de una gráfica de pastel necesarios para representar cierta
proporción de una muestra.

Creación de un diagrama de caja


• Los diagramas de caja se basan en percentiles, incluidas la mediana (percentil 50) y los per-
centiles 25 y 75. Por tanto, el primer paso consiste en ordenar por tamaño las puntuaciones.

Tabla Al.6. Recuerdo de 15 participantes según su tamaño.

Orden Recuerdo
1 3
2 4
3 4
4 5
5 5
6 6
7 6
8 7
9 7
10 7
11 8
12 8
13 9
14 10
15 11
400lL_________________________A~p~é_nd~i~ce~s______________________________
La med;ana
La mediana se ubica en la puntuación n; 1
, donde n representa el número de puntuaciones.
Como en este caso se halla en la octava puntuación, la mediana es 7.

Lugar de la bisagra
Las bisagras se localizan en los percentiles 25 y 75. Su ubicación se calcula con la ecua-
ción siguiente:
Ubicación de la mediana + 1
Lugar de la bisagra
2
Si la ubicación de la mediana no es un número entero, hay que ignorar la parte decimal.
Por ejemplo, si la localización de la mediana ha sido de 8.5, en la ecuación anterior se
usará 8.
Lugar de la bisagra = ~ = 4.5

Por consiguiente, la bisagra inferior está entre la puntuación 4 y la 5 de abajo arriba y, por
tanto, es igual a 5. La bisagra superior se encuentra entre la puntuación 4 y la 5 de arriba
abajo y, debido a ello, es igual a 8.

Rango H
El rango H representa la diferencia entre la bisagra inferior y la superior; por consiguien-
te, es 8 - 5 = 3.

Bardas interiores
Las bardas interiores se calculan con la ecuación siguiente:
Barda interior inferior = bisagra inferior- (1.5 x rango H)
Barda interior superior = bisagra superior + ( 1.5 x rango H)

Por tanto,

Barda interior inferior = 5- (1.5 x 3)


= 0.5

Barda interior superior = 8 + (1.5 x 3)


= 12.5
_____________________________E_
st_a_
dl_
·s_
ti_ca_s_d_e_s_
cr~ip~t_iv_a_s__________________~~

Podemos ver que todas las puntuaciones están dentro de las bardas interiores y no tenemos
puntuación alguna que pudiese considerarse extrema. El programa estadístico SPSS, que
hemos utilizado para crear las figuras AI.2 y AI.3, emplea un procedimiento un tanto dife-
rente, pues coloca los bigotes en el valor mayor de la barda interior superior y en el menor
de la barda interior inferior. En este caso, 11 es el valor mayor y 3 el menor.

14

12
Vl
re
"O
re
....
"O 10
o
u
....Q)
Vl 8
....re
.o
re
-¡¡¡
c. 6
Q)
"O
o
....
Q) 4
E
•::J
z
2

o
Figura Al.2. Diagrama de caja del número de palabras recordadas.

Si la puntuación número 15 ha sido 25, valdría la pena calcular las bardas exteriores. Ob-
sérvese que, como el número de puntuaciones permanece igual, todos los valores calcula-
dos para el diagrama de caja también se mantienen sin cambios.

Bardas exterjores
Las bardas exteriores se calculan con la ecuación siguiente:
Barda exterior inferior = bisagra inferior- (3 x rango H)
Barda exterior superior = bisagra superior + (3 x rango H)
Por tanto,
Barda exterior inferior = 5- (3 x 3)
= -4.5 (lo cual no puede existir en este ejemplo)

Barda exterior superior= 8 + (3 x 3)


17
...
.... ,.-

4Q2lL_________________________A~p_én_d_ic_e_s______________________________
Por tanto, una puntuación de 25 (la número 15) estará fuera de la barda exterior y podría
tratarse como un posible extremo. El programa SPSS no muestra las bardas exteriores,
pero destaca los posibles extremos presentándolos en el diagrama de caja.

30

*15
"'"'
'O
"'o
'E
u 20
~
"'~
.o
"'a.
'¡¡j
Q)
'O
....Q)o 10
E
• ::J
z

OL-----------------------~------------------------~

Figura Al. 3. Diagrama de caja del número de palabras recordadas con un posible
extremo señalado.

Índices de sesgo y curtosis


Hay índices para las dos medidas de la forma de una curva de distribución: sesgo (asi-
metría) y curtosis (altura de la distribución). Se cuenta con pruebas z para cada una, las
cuales pueden usarse en muestras menores que 100 a fin de decidir si la distribución es su-
ficientemente no normal para requerir una transformación o si es necesario aplicar una
prueba no paramétrica. En muestras mayores conviene más ver una gráfica de la distribu-
ción, pues quizá las pruebas resulten demasiado sensibles a las desviaciones menores de
una distribución normal. Para ambos índices existen variantes más complejas que se ajustan
mejor a las muestras. Sin embargo, decidí presentar las más simples de cuantas se obtie-
nen por computadora, ya que las considero adecuadas para los criterios que se recomenda-
rían para decidir sobre la no normalidad, si bien son, en sentido estricto, para utilizarse con
la distribución en una población.
----------------------------~E~st=a~d=ís~ti=ca=s~d=e=s=cr~ip~t=iv=a=s------------------~~
Sesgo
Existen varias medidas del sesgo, pero la aparentemente más citada en los programas in-
formáticos es ésta:

Índice de sesgo (IS) =

donde n es el tamaño de la muestra


s es la desviación estándar
Ello implica sumar el cubo de la desviación de la media de cada puntuación y dividir el re-
sultado entre el tamaño de la muestra multiplicado por el cubo de la desviación estándar.
Con desviación simétrica, IS = O; cuando la primera está sesgada negativamente, el se-
gundo resulta negativo, y cuando es positiva éste también lo es.
Es posible obtener una puntuación z del resultado anterior, la cual indicará si la distri-
bución está sesgada de manera significativa:

IS

l
ii
z =

Se recomienda considerar p = 0.01 el nivel alfa; en otras palabras, z tendría que ser de al
menos 2.58 para suponer que la distribución está sesgada de manera significativa.

Curtosis
La medida más común de curtosis tiene dos versiones, una básica y otra ajustada. La pri-
mera es:

Índice de curtosis (IC)


--
n xs•

-.. Observe que constituye casi la misma que el índice de sesgo, excepto porque se eleva no al
cubo, sino a la cuarta potencia. En la segunda versión se resta 3 al primer índice de curtosis.
Eso se debe a que la versión original es igual a 3 cuando la distribución resulta mesocúrtica
(es decir, como la distribución normal, no es marcadamente alta ni plana). Cuando el índi-
ce ajustado produce un valor negativo, ello sugiere una distribución platicúrtica; un valor
positivo la sugiere leptocúrtica.
404lL_________________________A~p~én_d~ic~e~s______________________________
La prueba z de curtosis es:
re
z = (24
'J--;;

donde IC es la versión ajustada del índice de curtosis.


Como sucede con el índice de sesgo, debe considerarse que una z de al menos 2.58 es
estadísticamente significativa.
-

11

Muestreo e intervalos
de confianza para proporciones

En el apéndice se exponen los ejemplos presentados en el capítulo 11.


Todas las siguientes afirmaciones y cálculos se basan en una encuesta donde se utilizó
una muestra aleatoria simple (o probabilística).

Cálculo del intervalo de confianza para una proporción


En el recuento siguiente se supone que la muestra tomada es menor que 5% de la pobla-
ción. Más adelante se presentan refinamientos para situaciones en que ése no es el caso.
Imaginemos que se realizó una encuesta sobre las pautas de votación. En ella se utilizó una
muestra aleatoria de 2 500 empadronados y se encontró que 900 (o 36%) afirmaron que su-
fragarían por un partido de derecha: la Vía Derecha, mientras que 1 050 (42%) señalaron
que lo harían por uno de izquierda: el de los Trabajadores. Deseamos estimar la proporción
de personas de la población de que se obtuvo la muestra que votará por un partido u otro.
Obsérvese que la proporción de una muestra suele representarse con p; su parámetro equi-
valente, la proporción de la población, con n (la letra griega pi). Podemos confiar, en un ni-
vel de 95%, que la proporción de la población (n) que sufragará por la Vía Derecha está en
el rango

p- !.96x ~px(:-p) ap+1.96x ~ px~-p)

--------------------------------------------------------~ 405
406lL________________________A~p_én_d_ic_e_s_____________________________
donde p "' la proporción de la muestra que afirmó que votaría por la Vía Derecha
1 - p = la proporción de la muestra que no dijo que votaría por la Vía Derecha
n = el tamaño de la muestra

~= el error estándar de la distribución de proporciones

La cifra de 1.96 se extrae de las tablas z (apéndice XIV). Ello indica que 2.5% de una po-
blación tendrá 1.96 desviaciones estándar o más por encima de la media de la población y
2.5% tendrá 1.96 o más desviaciones estándar por debajo de la media de la población. Por
tanto, el restante 95% de la población estará en un rango de 1.96 desviaciones estándar de
la media. Podemos confiar así, en un nivel de 95%, que el intervalo de confianza conten-
drá la proporción de la población (n).
En consecuencia, si 900 personas de una muestra de 2 500 afirmaron que votarían por
la Vía Derecha,
900
p
2500
0.36
l -p 0.64
n 2 500
y el intervalo de confianza del número de partidarios de la Vía Derecha en la población es:

re = 0.36-1.96 x ~
a
0.36x 0.64
0.36 + 1.96 X
2500

[023
o.36 ± 1.96 x fi5oo
0.36 ± 1.96 X ~0.000092
0.36 ± 1.96 X 0.0096
0.36 ± 0.019
0.341 a 0.379

Por ende, si la muestra se tomó de una población de 100 000, es probable que el número de
partidarios de la Vía Derecha en la población esté entre
0.341 X 100000 y 0.379 X 100000
es decir, 34 100 y 37 900
- - ·u

__________________ co_n_fl_·a_nz_a~p~a_r_a~p_ro~p_o_rc_io_n_e_s________~~
M_u_es_t_re_o_e_l_·n_te_N_a_l_os_d_e__

Margen de error
Podemos expresar el error estándar utilizado en un intervalo de confianza como un porcen-
taje o margen de error:

Porcentaje de error = 0.019 x 100


1.9%

Obsérvese que el error se expresa como un porcentaje del total de la muestra y no de la sub-
muestra que apoya a un partido político dado.

Tamaño relativo de la muestra y de la población


Si el tamaño de la muestra es menor que 5% de la población, los cálculos anteriores pro-
ducen una estimación razonable del porcentaje de error. No obstante, si dicho tamaño re-
presenta una proporción mayor de la población, se realiza el ajuste siguiente:

Porcentaje de error ajustado= porcentaje de error original x ~1 - ~


donde n = la cantidad de la muestra
N = la cantidad de la población

Por ejemplo, si en la situación mencionada la población fue de 25 000, la muestra repre-


sentaría 10% de la población. Por tanto,

1- 2500
Porcentaje de error ajustado 1.9 X
25000

l. 9 X .J]:Q.l

1.9 X ..JQ.9
).9 X 0.949
1.803%

Ello demuestra que cuanto mayor es la muestra en relación con la población, tanto menor
resulta el porcentaje de error. Esto no sorprende: cuanto mayor es la muestra, pueden espe-
rarse mejores estimaciones sobre los parámetros de la población. La conclusión lógica de
tal tendencia consiste en que no habrá error si se realiza un censo (si la muestra la consti-
tuye la población completa).

1
.1
408l~-------------------------A~p_én_d_ic_e_s______________________________

Estimación del tamaño de la muestra necesario


Cuando no hay datos previos que sirvan como guía
Cuanto más cerca se encuentre de 0.5 la proporción por estimar, tanto mayor será el por-
centaje de error. Si deseamos calcular el tamaño de la muestra (n) que necesitamos para ga-
rantizar un margen de error concreto para una proporción de 0.5, podemos utilizar la ecua-
ción siguiente:

9 604
n = ( error) 2

donde el error es el margen .de error, expresado como porcentaje, que estamos djspuestos a
aceptar.
Por ejemplo, si deseamos un margen de error de 2%,

9604
n = 4
2 401
A mayor margen de error que estemos dispuestos a aceptar, menor tamaño de la muestra
necesitaremos.
Si la proporción de la muestra es menor o mayor que 0.5, el margen de error será me-
nor para el mismo tamaño de la muestra. Por tanto, la ecuación anterior garantizará que el
margen de error no resulte mayor que el requerido para el tamaño de muestra dado.

Cuando hay datos previos que sirven como guía


A partir de los datos anteriores, calculemos el intervalo de confianza para la proporción que
nos interesa. Si éste incluye 0.5, usaremos la ecuación presentada para estimar el tamaño
de la muestra. Si no comprende 0.5, tomaremos el valor del intervalo de confianza más cer-
cano a 0.5 y lo colocaremos en la ecuación siguiente:
38416x p x (1- p )
n =
(error) 2

Debido a lo anterior, si usáramos los datos obtenidos acerca de los votos que obtendrá la
Vía Derecha, el intervalo de confianza estaría entre 0.341 y 0.379. Por tanto, la proporción
(p) más cercana a 0.5 sería 0.379 y la muestra requerida para un margen de error de 2%
sería:
38 4J6 X 0.379 X (1 - 0.379)
n = 4
M_u_
__________________ es_t_
re_o_e_l_n·_te_~
_a_l_
os_d_e__
co_n_fl_
·a_
nz_a~p~a_r_
a ~p_
ro~p_o_
rc_io_n_e_s________~~

38 416 X 0.379 X 0.621


4

9 041.55
4

= 2 261 (redondeado al entero más cercano)

Cuando las submuestras son de interés


Los cálculos anteriores se basan en situaciones donde las proporciones de la muestra total
son de interés. Si nos interesan proporciones de las submuestras, calcularemos el tamaño de
éstas mediante las ecuaciones previas. De esa manera, si nos interesa la proporción de hom-
bres y mujeres de la muestra que votarán por la Vía Derecha y estamos dispuestos a aceptar
un margen de error de 2%, incluiremos 2 500 varones y 2 500 mujeres en la muestra. De
otra manera, si usamos como guía información de investigaciones anteriores, podríamos
emplear la ecuación correspondiente para calcular el número de participantes requerido en
cada submuestra.

Efecto en el margen de error de aumentar el grado de confianza


Si deseamos tener 99% de confianza en que nuestro intervalo de confianza incluya el pará-
metro de la población, utilizaremos las tablas z para calcular cuántas desviaciones estándar
por encima de la media y por debajo comprenderá el 99% de la población. La tabla z del
apéndice XIV nos indica que la cifra es 2.575, pues 0.005 o 0.5% de una población tendrá
una puntuación que está a 2.575 desviaciones estándar o más por encima de la media de la
población, y 0.5% de una población tendrá una puntuación de 2.575 desviaciones estándar
o más por debajo de la media de la población.
Por consiguiente, el intervalo de confianza será:

p-2.575 X ~px( 1 -p) ap+2.575 X ~px( 1 - p)


n n

0.36 X 0.64
IC = 0.36- 2.575 X 2500
a
0.36x0.64
0.36 + 2.575 X
2500

/o23
o.36 ± 2.575 x -v 2500

...
410lL----------------------~A~p=e'n~d~ic~e~s___________________________

0.36 ± 2.575 X ~0.000092


0.36 ± 2.575 X 0.0096
0.36 ± 0.025
0.335 a 0.385
o 33.5% a 38.5%.
Así, por incrementar nuestro grado de confianza de 95% a 99%, el intervalo de confianza
aumentó de 37.9% - 34. 1% = 3.8% a 38.5%- 33.5% = 5%; es decir, el margen de error
creció de 1.9% a 2.5%.
...,,,

111
Comparación de la muestra
con la población

En el apéndice se exponen las técnicas presentadas en el capítulo 12.

Una sola puntuación comparada con la media


de una población (se conoce la DE de ésta)
En esta situación se utiliza una prueba z. La siguiente es la ecuación para tal prueba, don-
de la puntuación de un solo participante se compara con la de la población:
una sola puntuación- media de la población para la medida
z = desviación estándar de la población para la medida

En notación estándar suele formularse como sigue:


x - Ll
z = --·
a
Por ejemplo, si sabemos que alguien obtuvo una puntuación de 120 en una prueba de IQ
donde la media fue de 100 y hubo una desviación estándar de 15, con la ecuación para z,
podemos calcular cuántas desviaciones estándar se encuentra por arriba de la media esa
puntuación :
120- 100
z = 15
1.333

------------------------------------------~
412l~-------------------------A~p_én_d_ic_e_s______________________________

Media de una muestra comparada con la de una población


Cuando se conoce la desviación estándar de la población
Podemos usar una prueba z para calcular la significación de la diferencia existente entre la
media de una muestra y la de la población. Ésta es la ecuación:
media de la muestra - media de la población
z =
desviación estándar de la población)
( ~tamaño de la muestra

En notación estándar se lee así:

De esta manera podemos calcular la probabilidad de que la media de una muestra dada pro-
venga de una población concreta.
Imagine que examinamos los IQ de 20 niños y que la media de IQ es de 90, con una
prueba de media de población de 100 y desviación estándar de 15.
90 - 100

(Jo]
z =

-10
3.354

= -2.98

Cuando se desconoce la desviación estándar de la población


La ecuación para efectuar el cálculo respectivo es en este caso similar a la ecuación para z
cuando comparamos la media de una muestra con la de una población. Aquí se utiliza la
desviación estándar de la muestra en lugar de la correspondiente a la de población:
media de la muestra - media de la población
t = desviación estándar de la muestra )
( ~tamaño de la muestra .
~ 1 11 1

_____________________C_
om
~pa_r_a_
ci_ó_
n _d_
e _la__m_u_
es_t_ra_c_o_n_l_a~p_o_
bl_a_
ci_ó_
n __________~~

En notación estándar se lee como sigue:

Imaginemos que se aplica cierta prueba de matemáticas a 1O participantes; se sabe que és-
ta tiene una media de 6 en la población, cuya desviación estándar se desconoce. La media
de la muestra fue 7 y la desviacion estándar 1.247.

7- 6
(1.247]
t =

lfiO
0.3943
2.536

Para calcular los grados de libertad (gl) de esta versión de la prueba,


. gl = n- 1

donde n es el número de participantes de la muestra. Por tanto,


gl 10 - 1
9

Intervalos de confianza de las medias


El nivel de confianza usual es de 95%. Hay dos ecuaciones para calcular el intervalo de
confianza de una media: una se utiliza cuando el tamaño de la muestra es de por lo menos
30, y la otra, si tal tamaño es menor de 30.

Tamaño de la muestra de por lo menos 30


La versión para un tamaño de muestra de al menos 30 se basa en la prueba z.
La ecuación general de esta versión del intervalo de confianza (IC) de la media es

IC =
.
med1a de la muestra± z x l .{,;
(DE de la muestra J
donde el valor z depende del nivel de confianza que se requiere y n es el tamaño de la
muestra.
414l~-------------------------A~p_én_d_ic_e_s______________________________

Si requerimos un intervalo de confianza de 95%, podemos consultar las tablas z para


ver cuál valor z tiene una probabilidad (p) de dos colas de 0.05 o 5%. Entonces, nuestro
intervalo de confianza se basará en 1 - p = 0.95 o 95%. Según las tablas, z = 1.96; re-
cordemos que, como éstas muestran las probabilidades de una cola, a fm de calcular z para
una probabilidad de dos colas de 0.05 buscaremos la z para una probabilidad de una cola
de 0·05 = 0.025.
2
Si tenemos datos de una muestra de 300 en una pmeba de recuerdo de palabras con
una media de 7 palabras y una desviación estándar de 2,

IC (95%) = 7 ± 1.96x ~
"'J 300
7 ± 1.96 X 0.115

7 ± 0.226

En otras palabras, tenemos 95% de confianza en que la media de recuerdo de palabras de


la población de que se extrajo la muestra esté entre

7 - 0.226 y 7 + 0.226
o 6.774 y 7.226

Tamaño de la muestra menor de 30


La ecuación general de la versión titular del intervalo de confianza (IC) de la media es muy
similar a la anterior:

.¡;;
. de la muestra ± t x ( DE de la muestra )
IC = med1a

donde el valor t depende del nivel de confianza que se necesita y n es el tamaño de la


muestra.
Empero, el valor t varía según los grados de libertad, Jos cuales están ligados al tama-
ño de la muestra (gl = n- 1).
De necesitar un intervalo de confianza de 95%, consultaremos las tablas t para identi-
ficar el valor t que tenga una probabilidad de dos colas (p) de 0.05 (o 5%) para los gl de
que se trata.
_____________________C_
o~m pa_r_a_
ci_ó_
n _d_
e _la__m_u_
e s_t_
ra_c_o_n_l_a~p_o_
bl_a_
ci_ó_
n __________~~

Si a 10 participantes se aplica una prueba de matemáticas, entonces gl = 9. En este ca-


so, las tablas t muestran que el valor t requerido para un nivel de confianza de 95% es
2.262. Si la media de la muestra es 7 y la DE 1.247, entonces:

IC (95%) = 7 ± 2.262 X 1.~


\110

7 ± 2.262 X 0.3943

7 ± 0.892

En otras palabras, tenemos 95% de confianza de que la puntuación media en matemáticas


de la población de que se extrajo la muestra esté entre:
7 - 0.892 y 7 + 0.892
o 6.108 y 7.892

Intervalos de confianza de las medianas


El intervalo de confianza de 95% de la mediana, utilizable para crear la muesca en un dia-
grama de caja con muescas, puede calcularse con la ecuación siguiente:
. . 1.58 x rango H
IC (mediana) = medtana ± _¡;;
donde el rango Hes el intervalo de en medio con 50% de los valores de la muestra (inter-
valo intercuartil)
n es el tamaño de la muestra
Así, en el ejemplo presentado en el capítulo 9 y en el apéndice I, donde una muestra de 15
personas tuvo una mediana de recuerdo de 7 palabras y un rango H de 3,
1.58 X 3
IC (mediana) = 7± -{15

4.74
= 7±
3.873
= 7 ± 1.224

De esa manera, el IC de la mediana está entre 5.776 y 8.224 palabras.


IV
Poder de la prueba z
en un solo grupo

Los ejemplos de este apéndice se relacionan con el material estudiado en el capítulo 13.

Análisis de poder de la prueba z de un solo grupo


Una vez que se ha realizado un estudio puede calcularse el poder de la prueba estadística
efectuada con los datos; es decir, la probabilidad de rechazar una hipótesis nula falsa, evi-
tando así un error tipo II.
El ejemplo presentado en el capítulo 12 se refiere a una muestra de 20 niños internados
en una institución. Se midieron sus IQ mediante la prueba pertinente, con media para lapo-
blación de 100 y DE de 15 para la población. La media de IQ de dichos infantes fue de 90.
Para calcular el poder de una prueba z realizada con esos datos necesitamos saber si la
hipótesis de investigación fue direccional y cuál fue el nivel a establecido.
La hipótesis de investigación es la siguiente:
HA: Los niños internados en la institución tienen un IQ menor que el de la población
en general.
Como ésa es una hipótesis direccional, emplearemos una prueba de una cola. El nivel a se
estableció en 0.05.
Primera etapa: calcular el nivel crítico de la media de IQ que podría haber producido un re-
sultado significativo.

416 L __ _ _ __ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ _ _ _ __ __ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ __ _ _ __ _
--;:::"'111'

Poder de la prueba z en un solo grupo


------------------------------~--------------~~--------------~
¡417

Para ello, necesitamos saber qué valor z podría habemos dado un nivel de significación
de una cola de 0.05. De consultar las tablas z del apéndice XIV, encontraremos que z es
1.645. La versión apropiada de la prueba z es:

xc ~ media de la población
z
(DE de !~oblación)

donde xc (que se calcula más adelante) es la media crítica de la muestra que daría una z de
1.645 y n es el tamaño de la muestra.
La ecuación anterior se usa cuando la predicción consiste en que la media de la mues-
tra será mayor que la de la población. Cuando la predicción estriba, como en el presente
caso, en que la media de la muestra será menor que la de la población, se utiliza la ecua-
ción siguiente:
media de la población ~ xc
z
(DE de !~oblación)

por tanto,

= 100~xc
1.645
( 15 \
lF20)
Mediante operaciones algebraicas, podemos calcular que xc es

15
=> 1.645 X r:::: = 100- XC
-y 20

15
=> 1.645 X C::: - 100
-y 20

1.645 X 3.354 ~ 100


-94.482 = - XC

lo cual es lo mismo que


XC = 94.482
En consecuencia, habríamos obtenido un resultado estadísticamente significativo si la me-
dia de IQ de la muestra hubiese sido 94.482.
41Bl~-----------------------A~pe_·n_d_ic_e_s_____________________________

Segunda etapa: calcular el nivel ~ (la probabilidad de cometer un error tipo II).
Para ello, calcularemos el valor de z que nos daría el nivel ~:

x, - media real de la población


z = DE de la población)
( ¡;;
94.482-90

(Fo)
1.336

El cálculo de la probabilidad de una cola de tal valor z muestra que p es aproximadamen-


te 0.0901. En otras palabras, P= 0.0901 , por lo cual el poder de la prueba (1 - p) fue de al-
rededor de 0.9099. Como ese valor está por encima del 0.8 recomendado por Cohen (1988)
y otros, tenemos una oportunidad satisfactoria de evitar un error tipo II.

Elección del tamaño de la muestra


También es posible elegir el tamaño de la muestra que requeriríamos para alcanzar un nivel
de poder específico. Para ello, necesitarnos conocer la prueba estadística por usar, el nivel ex,
si la hipótesis es direccional o no y el tamaño del efecto.
Imaginemos que deseamos reproducir el estudio anterior para verificar que el resulta-
do es confiable. Querernos saber cuántos participantes usaremos para lograr un poder de
0.8. Como estamos probando la misma hipótesis, utilizaremos una hipótesis de una cola y
el nivel a. será nuevamente de 0.05. D ebemos calcular el tamaño del efecto (d):

media de la población - media de la muestra


d = ------~-----------------
DE de la población
d = 100-90
15
= 0.667

Podemos usar la ecuación siguiente:


'111

_______________________P_od_e_r_d_e_l_a~p_ru_e_b_a_z_e_n_u_n_s_o_lo~g~r_u~po______________~~

donde z~ es el valor z que dará la probabilidad de un error tipo II (en este caso, p = 0.2, lo
cual proporciona un poder de 0.8)
za es el valor z que proporciona el nivel a (en este caso, una probabilidad de una
cola de 0.05)
d es el tamaño del efecto que deseamos detectar
Por tanto,
2
= (0.8415+1.645)
n 0.667

= 13.897

Ello significa que para la persona más cercana, necesitamos una muestra de 14 individuos
para alcanzar un poder de 0.8.
V
Transformación de datos
y pruebas de bondad del ajuste

En el apéndice se exponen las técnicas presentadas en el capítulo 14.

Transformación de datos
Cuando los datos no están distribuidos normalmente o los niveles de una variable indepen-
diente (VI) no tienen una varianza homogénea, no conviene usar una prueba estadística
paramétrica. Sin embargo, en ocasiones pueden transformarse los datos para que la distri-
bución sea más normal o que las varianzas estén más cerca unas de otras. Además, si al exa-
minar.la relación entre dos variables (datos bivariados) parece haber una relación entre
éstas, pero es no lineal, cabe transformar alguna para producir una relación más lineal. Para
transformar los datos se aplica la misma fórmula matemática a cada valor del conjunto. El
lector podría pensar que con esto se manipulan los datos para obtener el resultado que se
quiere. Empero, si con la transformación se busca poner los datos de manera que permita
practicar una prueba paramétrica o lineal, es del todo legítima. Lo ilegítimo estriba en rea-
lizar una transformación, efectuar una prueba estadística con los datos y llevar a cabo des-
pués otra transformación si los resultados no tienen significación estadistica.
Para demostrar que todos usamos transformaciones aun sin darnos cuenta, pensemos en
las medidas que podríamos tomar si estuviésemos interesados en el desempeño de varios
corredores. Podríamos medir el tiempo que les toma recorrer cierta distancia y la que reco-
rrieron en un tiempo determinado e incluso su velocidad, que es la distancia dividida entre
el tiempo. Si convertimos los datos del tiempo en velocidad, habremos realizado una trans-
formación de los datos.

420
11 11

_________________~_r_a_ns_f_or_m_a_c_io_
·n_d_e__d_at_o_s~y~p_r_ue_b_a_s_d_e_b_o_n_d_ad__d_el_a~j_u_st_e______~~

Todas las transformaciones sugeridas pueden llevarse a cabo mediante una calculadora
científica o una computadora.

Datos un;var;ados
Sesgados negativamente. Si la distribución está sesgada negativamente, como la de la
figura AV.l, una posibilidad radica en elevar los puntos de los datos por un valor (.xll), en
tanto a sea mayor que 1; por ejemplo, podríamos elevar al cuadrado todos los puntos de los
datos. De otra forma, podríamos elevar un número a la potencia de cada punto de los da-
tos; por ejemplo, 10X, es decir, elevar 10 a la potencia de cada dato, o eX, lo cual implica
elevar el número e (2.718) a la potencia de cada dato.
20

"'e:ro
o
"'~
c.
~ 10
e
QJ
E

n
•::l

m-miT
z

o
0.5 4.5 8.5 12.5 16.5 20.5 24.5 28.5
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5
Número de palabras recordadas
Figura AV.1. Distribución sesgada negativamente.

Elevamos al cuadrado cada número de palabras recordadas para producir una distribución
más simétrica:
20

"'e:ro r
o .---
~­ r-
QJ
c. r- r-
~ 10
....oQJ
r-
E

liT n
•::l
z

o
16 142 269 396 522 649 776 902
79 206 332 459 586 712 839
Número de palabras recordadas elevado al cuadrado
Figura AV.2. Distribución sesgada negativamente después de ser transformada.
~~-------------------------A~p_é_nd_i_c_es________________________________

Sesgados positivamente. Cuando la distribución está sesgada positivamente, puede probar-


se una variedad amplia de posibles transformaciones: recíprocos, logaritmos, raíces cua-
dradas u otras potencias fraccionarias.

20

V> r-
<O 1-
e:
o
.... -
-
V>
(1)
a. r-
f-
(1)
"O 10
o -
.... f-
E
(1)
- r-
. ::;¡
z
-.-
-
ITlllim
-

o
0.5 4.5 8.5 12.5 16.5 20.5 24.5 28.5
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5
Número de palabras recordadas

Figura AV.3. Distribución sesgada positivamente.

Recíprocos. Pruebe .=!.,-lo..::!... Sin embargo, como no es posible dividir entre cero, uti-
x2 x .¡;
!izaremos una transformación inicial que haga que los puntos de los datos sean diferentes
de cero antes de tomar un recíproco; por ejemplo, sumando 1 a la puntuación de cada per-
sona.
Logaritmos. Pruebe log 10(x) -logaritmo de base 10-- o In (x) -logaritmos naturales o
neperianos- . Si algún punto de los datos es negativo o igual que cero, podemos sumar un
número fijo a cada punto de los datos para que todos sean superiores a cero. De esa mane-
ra, si la puntuación negativa más alta en una serie de datos fue de -4, sume 5 a todas las
puntuaciones y tome el logaritmo del resultado.
Raíces (potencias fraccionarias). Pruebe ·.¡; o particularmente si los valores son inferiores

~ ~ o (.,fx + .,J;;I) . Las raíces cuadradas también pueden mejorar la homogeneidad


a 1O, . x +

de la varianza. Si no funcionan, pruebe la raíz cúbica (es decir, J.{; o xt). Tras probar varias
transformaciones, encontramos que ~palabras recordadas+ 0.5 produjo una distribución más
simétrica.
"111

__________________~_r_an_s_f_or_m_a_c_i_o'n__d_e_d_a_t_o_s_y~p_ru_e_b_a_s_d_e_b_o_n_d_a_d_d_e_l_a~ju_s_te________~~

20

"'e
"' ,-
o
¡:;
(IJ f-
c.
(IJ
-o 10
e(IJ
f- ,-
E

n T 11-m
. ;:¡
z

o
o. 71 1.38 2.04 2. 71 3.38 4.04 4. 71 5.38
1.04 1.71 2.38 3.04 3.71 4.38 5.04

Raíz cuadrada de (palabras recordadas+ 0.5)

Figura AV.4. Distribución sesgada positivamente después de la transformación.

Curtosis. Cuando los datos son proporciones o porcentajes pueden producir una distribución
leptocúrtica (con la sección media alta y angosta) . En ese caso, ensaye 2 x arcoseno (E) (en
las calculadoras, el arcoseno aparece a veces como sin- 1).

Datos bivariados
Al observar la correlación entre dos variables, en la correlación producto momento de Pear-
son se supone que la relación es lineal (que forma una línea recta). Por tanto, quizá debamos
transformar los datos si tienen una pauta no lineal.
Curva hacia arriba. Cuando la curva dt: la línea se inclina hacia arriba, como en la figura
1 -1
siguiente, se transforman los valores del eje vertical (y). Pruebe 'J Y, ln(y ), log1o (y) o -- .
y

100
o
80

60
o
;::.,
40
o
20 o
o
o o
o o o
o 2 4 6 8 10 12
X

Figura AV. S. Diagrama de dispersión curvado hacia arriba.


424l Apéndices

Tomamos el logaritmo de los valores de y y obtuvimos la línea siguiente:


2.0 o
o
1.5 o
o
o
~ 1.0 o
on o
o
_J
0.5 o
o
0.0 o

-0.5
o 2 4 6 8 10 12
X

Figura AV. 6. Efecto de la transformación en un diagrama de dispersión curvado hacia


arriba.
La correlación se transformó de r = 0.868, de la relación no lineal, en r = 0.999.
Curva hacia abajo. Cuando la curva es hacia abajo, transformaremos los valores del eje
horizontal (x). Pruebe¡;, ln(x), log10 (x) o.:.!..
X

Pruebas de bondad del ajuste


Las pruebas de bondad del ajuste se utilizan para comparar la distribución en un conjunto
de datos con distribución teórica. Ésta podría derivarse de una hipótesis nula según la cual
los datos se distribuyen uniformemente en el rango de puntuaciones o se ajustan a una dis-
tribución como la normal. La prueba de una sola muestra de Kolmogorov-Smirnov cabe
cuando los datos son al menos ordinales, mientras que la de bondad del ajuste de x2 se usa
con datos nominales. Sin embargo, la prueba x2 suele emplearse con datos ordinales o in-
cluso con intervalo/razón.

Prueba de una sola muestra de Kolmogorov-Smirnov


En la prueba de una sola muestra de Kolmogorov-Smimov se compara la frecuencia acumu-
lada de los datos con la que podría presentarse si éstos se apegasen a una distribución espe-
cífica. Tomando el ejemplo introducido en el capítulo 9, donde una muestra de 120 personas
indicó su grupo de edad, podemos ver si la distribución de edades se efectúa uniforme-
mente en los rangos de edad. Como hay cinco grupos de edad, cabría esperar que ~ = 0.2
de las personas estén en cada categoría si se hallasen distribuidas de manera uniforme en
las diversas categorías.
-----------------~_ra_n~sf~o~rm~a~c~io~·n_d~e~da~t~o~s~y~p~ru~e~b~as~de~bo~n~d~a~d~d~e~la~j~u~st~e------~~

En cada categoría comparamos la frecuencia acumulada observada con la acumulativa


teórica (F0 - F 1); se desprecia el signo negativo, en caso de haberlo.

Tabla AV.1. Obtención de la estadística Dn en la prueba de una sola muestra de


Kolmogorov-Smirnov.

Frecuencia Frecuencia Proporción


Grupo como acumulativa acumulativa
de edad Frecuencia proporción observada (F0 ) teórica (Ft) F0 - Ft

20-29 15 0.125 0.125 0.2 0.075


30-39 45 0.375 0.5 0.4 0.1
40-49 30 0.25 0.75 0.6 0.15
50-59 20 0.167 0.917 0.8 0.117
60-69 10 0.083 1 1

La estadística de esta prueba es D11 , el mayor valor que F0 F1 puede alcanzar para el ta-
... maño de la muestra n. En este caso,
-

D 120 = 0.15

Cálculo de la significación estadística de D11• En la tabla AXIV.18 del apéndice XIV se pre-
sentan los valores críticos que D 11 debe alcanzar o exceder para ser estadísticamente signi-
ficativa. En una muestra de 35, el nivel crítico de D 11 para p = 0.05 es 1.36 . En este caso,
.[n
6
1.3 = 0.124
f¡20
Debido a ello y a que 0.15 es mayor que 0.124, podemos decir que los datos difieren de
manera significativa de una distribución uniforme.

Prueba de bondad del ajuste de y}


Con datos nominales, cabe usar la prueba de bondad del ajuste de x2 para comparar las fre-
cuencias encontradas en un conjunto de datos con las que se presentarían según la hipótesis
nula. De manera alternativa, se emplea para comparar la distribución de los datos con la
que se predeciría si los datos tuviesen una distribución teórica en particular, como la nor-
mal. Un resultado estadísticamente significativo en la prueba sugiere que los datos no se
ajustan a la hipótesis nula o a la distribución teórica.
4261 Apéndices
L-------------------------~----------------------------------

En el ejemplo del uso de la prueba presentado en el capítulo 14 se estudiaron las pre-


ferencias iniciales de varios niños por ciertas pinturas situadas en una galería de arte. Se
observó a 20 menores que entraron en una sala donde había cinco cuadros y, en el caso de
cada infante, se anotó a qué obra se acercó primero. La hipótesis de investigación fue que
los pequeños se aproximarían primero más a un lienzo que al resto. La hipótesis nula consis-
tió en que el número de participantes que se acercaran primero a cada pintura seria el mismo
25
para todas ellas. Por tanto, de acuerdo con la hipótesis nula, esperaríamos que ~ 5 chi-
5
cos se acercaran primero a cada obra.

Tabla AV.2. Número de niños que se acercaron primero a una pintura concreta y la
cantidad esperada de acuerdo con la hipótesis nula (H0 ).

Pintor Se acercaron primero Esperados por H0

Klee 11 5
Picasso 5 5
Modigliani 3 5
Cézanne 4 5
Rubens 2 5

En la prueba x? se comparan frecuencias reales u observadas (fr) con las esperadas (fe)
-de acuerdo con la hipótesis nula-, para ver si difieren de manera estadísticamente sig-
nificativa, y se utiliza la ecuación siguiente:

Esto es, cada frecuencia esperada se resta a su observada, se eleva al cuadrado el resultado
y se divide entre la frecuencia esperada. El proceso se repite con cada categoría y se suman
todos los resultados. Por ende,

x2 = oI-5) 2 2 2 2
+ (5 - 5) + (3 - 5) + (4 - 5) + (2-5)
2

5 5 5 5 5

= 7.2 +o+ 0.8 + 0.2 + 1.8

= 10
lfl

d_
_________________T_r_a_ns_f_or_m_a_c_io_'n_ d_ e__ at_o_s~y~p_r_ue_b_a_s_d_e_b_o_n_d_a_d_d_e_l~
aJ~·u_st_e________~~

Esta versión de la prueba x_l tiene grados de libertad iguales que el número de categorías
menos l. Por tanto, en este caso, gl = 5 - 1 = 4. Podemos buscar ahora el resultado en la
tabla de distribución de chi cuadrada del apéndice XIV. Con gl = 4, el nivel crítico de x2
para p = 0.05 es 9.49. Como el valor calculado de x2 excede tal valor crítico, concluiría-
mos que los niños s·e acercaron primero a distintas pinturas en una pauta significativamen-
te no aleatoria .

..

-
VI
Búsqueda de diferencias entre dos
niveles de una variable independiente

En el apéndice se exponen las técnicas presentadas en el capítulo 15.

Pruebas paramétricas
La prueba t
Las diferentes versiones de la prueba t dependen de si el diseño es entre o intrasujetos.
Prueba t entre sujetos. En este ejemplo, los investigadores desean evaluar la eficacia de una
técnica terapéutica diseñada para liberar de la aracnofobia a los pacientes, a quienes se di-
vidió en dos grupos: experimental, que recibe la terapia; y control, que no la recibe. Se mide
la ansiedad mediante una lista de verificación de autoinforme.

Tabla AVI. 1. Puntuaciones de ansiedad de los participantes que reciben terapia o de


quienes actúan como controles.
Terapia Control
85 80
65 88
70 86
70 85
65 64
75 82
(Continúa)

428 L------------------------------------------------------

~;:;;;;..,..; _______________ _ _
;;;;..... - - - - --
• Búsqueda de diferencias entre dos niveles de una variable independiente ¡429

Tabla AVI. 1 (Continuación)

83 89
60 81
62 83
70 67
65 65
79 70
76 84
72 88
74 85
69 82
76 79
71 75
68 77
75 80

Tabla AVI.2. Medias, varianzas y DE del nivel de ansiedad del grupo de terapia y del
control.

Terapia Control
Media 71.5 79.5
Varianza 43 58.368
DE 6.557 7.64

La ecuación de la prueba t entre sujetos es:

Ec. AVI.l

donde .X, y .X, son las medias de los dos grupos


n, y n, son los tamaños de las muestras de dichos grupos
s¡ y s~ son las varianzas de esos grupos

((n¡ - l)xs~) +((n, -l)xs~)J es la varianza combinada (las varianzas combinadas de


( (n ,+n, - 2)
ambos grupos)
'
4JOlL_________________________A~p_én_d_ic_e_s______________________________
Cuando los tamaños de la muestra son iguales, la ecuación se simplifica:

=
(s::si)
XI -X2
t Ec. AVI.2

donde n es el tamaño de una muestra.


Por tanto, en el presente caso,
71.5 - 79.5
t =
( 43+~~-368)

= - 3.553

Los gl de esta versión de la prueba t son (2 x n) - 2. Por tanto, en este caso serán (2 x 20)
- 2 = 38; de usar la ecuación AVI.l, serían (n 1 + n2)- 2.
En las versiones anteriores de la prueba t se supone que las varianzas de ambos grupos
son iguales (homogéneas). En el caso contrario, debe aplicarse otra versión de la prueba t.
Prueba t entre sujetos con heterogeneidad de varianza (varianzas independientes: prueba t
de Welch). Cuando las varianzas de las muestras de dos grupos difieren más de tres veces,
si los tamaños de la muestra son iguales (o si las varianzas de las muestras difieren más de
dos veces cuando los tamaños de las muestras no resultan iguales}, debe usarse una versión
de la prueba t en la cual las varianzas se tratan por separado y no se produce una varianza
conjunta estimada:

t = Be. AVI.3

Si los tamaños de las muestras son iguales en ambos grupos, la ecuación produce el mismo
resultado que la AVI.2 (presentada lineas arriba). Sin embargo, tiene su propio método para
calcular los grados de libertad, los cuales debemos conocer para comprobar si el resultado
es estadísticamente significativo. No obstante, para ahorrar tiempo, si no hemos obtenido
los gl con una computadora, es útil verificar si el resultado tiene probabilidades de tor-
narse estadísticamente significativo antes de calcular los gl. Como la nueva versión de los
grados de libertad nunca será mayor que los gl usuales de una prueba t entre sujetos, si el va-
lor t no es estadísticamente significativo con los gl usuales, tampoco lo será con la versión
modificada. De ahí que si el valor t no es estadísticamente significativo con gl = n 1 + n2 - 2,
se antoja innecesario calcular los gl modificados, a menos que se requiera una probabili-
dad más exacta.
• Búsqueda de diferencias entre dos niveles de una variable independiente I4J1
En el otro extremo de la escala, los gl modificados nunca serán inferiores al tamaño de
la muestra más pequeña menos l. Por lo mismo, si el valor t resulta estadisticamente sig-
nificativo cuando gl = n(muestra más pequeña) - 1, de seguro será estadísticamente significativo
con la versión modificada de los gl. Tampoco en este caso se calculan los gl modificados,
a menos que se requiera una probabilidad más exacta.
Si el valor t no es estadísticamente significativo con los gl de n (muestra más pequeña) - 1
pero sí con gl = n 1 + n2 - 2, calcularemos los gl modificados (o ajustados).
La versión más común de la ecuación de los gl ajustados en una prueba t entre sujetos
con varianzas separadas es:

Ec.AVI.4

El resultado se redondea al entero siguiente.


Por ejemplo, imaginemos que el estudio anterior produjo estos resultados:

Tabla AVI. J. Medias, varianzas y DE del nivel de ansiedad del grupo de terapia y del
control (varianza heterogénea).

Terapia Control
Media 71.5 79.5
Varianza 112.053 24.053
DE 10.586 4.904

Observe que la varianza del grupo que recibió terapia es más de tres veces mayor que la
• del grupo control. Por consiguiente, debe aplicarse la prueba t para grupos con varianzas
heterogéneas.
71.5-79.5
t = -;:::::=====
112.053 + 24.053 )
( 20 20

-3.0667

Los grados de libertad mínimos que tal valor t puede tener son n - 1 = 19 (pues el tamaño de
ambas muestras es igual); y los máximos, n 1 + n2 - 2 = 38. Como ese valor de t resultaria
...
4J2lL-------------------------A~p_én_d_ic_e_s______________________________

estadísticamente significativo en p ~ 0.05 con gl = 19, desde luego también será estadísti-
camente significativo para cualesquier gl ajustados. Sin embargo, calculamos a manera de
ejemplo los gl ajustados:

2
112.053 + 24.053)

e~~~53J (24~~53 J
( 20 20
gl ajustados

->--- -- - ' ' - + ->-- - - - "' -


20-1 20 - 1

= 26.798

Es decir, 27, redondeando al entero más próximo.


Prueba t intrasujetos. La prueba t intrasujetos se basa en la diferencia de cada participan-
te en la puntuación de ambas condiciones. En el ejemplo, varios psicólogos del deporte
crearon una técnica que esperan sirva para mejorar el desempeño de los ciclistas de carre-
ras. Los investigadores deciden comparar el desempeño de los deportistas, en términos del
tiempo que les toma recorrer cierta distancia, antes del entrenamiento y tras él.

Tabla AVI.4. Tiempo (expresado en minutos) que los ciclistas emplearon para recorrer
cierta distancia antes y después del entrenamiento con las diferencias
entre ambos tiempos.

Antes del Tras el


Participante entrenamiento entrenamiento Diferencia

1 195 195 o
2 200 190 10
3 180 182 -2
4 170 169 1

(Continúa)
__________
,,,,

Búsqueda de diferencias entre dos niveles de una variable independiente I4J3


Tabla AVI.4. (Continuación)

5 210 205 5
6 220 219 1
7 190 191 -1
8 185 183 2
9 150 148 2
10 160 160 o
11 165 166 -1
Total 17
Media 1.545
DE 3.387

La ecuación para esta versión de la prueba t es

media de las diferencias


t intrasujetos Ec. AVI.5
DE de las diferencias )
( ~ tamaño de la muestra

Por tanto, en este caso,


1.545
=
(3.387J
t

~
1.513

Cálculo del tamaño del efecto al comparar dos grupos experimentales. El tamaño del
efecto en diseños donde se comparan las medias de dos muestras es igual a d y se calcula
de la forma siguiente:

media 1 - medi"2
d
DE

Si uno de los grupos es control, su DE puede usarse en la ecuación anterior. Sin embargo,
si en la investigación se compararon las medias de dos grupos experimentales será mejor
4J.4lL________________________A~p_én_d_ic_e_s_____________________________
emplear una DE que combine la información de ambos (la DE combinada). Recordemos
que la prueba t para un diseño entre sujetos comprende el cálculo de la varianza combina-
da (p. 429) y que la DE es la raíz cuadrada de la varianza. Por tanto,

. d _ (((n, -l)xs~)+((n2 -l)xs~) )


DE com bma a - (n +n - Z) Ec. AVI.6
1 2

Pruebas no paramétricas
Prueba U de Mann-Whjtney
Cuando el diseño tiene una VI con dos niveles y no se satisfacen los requisitos de una prue-
ba t, pero la medida es por lo menos ordinal, puede usarse la prueba U de Mann-Whitney.
Varios investigadores desean comparar las actitudes de dos grupos de estudiantes (los
de física y los de sociología) hacia la cinegética. A cada alumno se pidió que calificara su
grado de acuerdo con la afinnación "la caza de animales salvajes es cruel". Las evaluacio-
nes se dieron en una escala de 5 puntos (desde en completo desacuerdo hasta completamen-
te de acuerdo), en la cual la puntuación más alta denota una actitud anticacerí'a.

Tabla AVI.6. Respuestas de los estudiantes respecto a una afirmación referente a la


cacería.
Sociología Física
5 1
4 2
3 3
3 4
5 5
4 2
2 1
5 3
5 4
4 2
4 1
3 3
3 2
5 3
4 3
4 5
4 4
5 3
5 2
5 1
5 2
Búsqueda de diferencias entre dos niveles de una variable independiente ¡435

Todas las puntuaciones se ordenaron según su magnitud en una sola escala y no por sepa-
rado en cada nivel de la VI.

1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3
F F F F F F F F F F. S F F F F F F S S S S

4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5
F F F S S S S S S S F F S S S S S S S S S

La estadística U se calcula contando cuántos miembros de un grupo se encuentran a la iz-


quierda de cada miembro del otro grupo. Como la predicción consiste en que los estudian-
tes de física den evaluaciones bajas, contamos el número de los de sociología situados a la
izquierda de cada uno de ellos, es decir, contrarios a lo predicho.
¡' . Las cuatro evaluaciones más bajas (de 1) fueron dadas por estudiantes de fisica, de
manera que no los hay de sociología a su izquierda. Por tanto, hasta ahora, U= O. La eva-
luación más baja (2) fue dada por siete estudiantes, seis de física y uno de sociología. Puesto
que éste dio la misma evaluación que los seis de física, se considera que cada uno de éstos
tiene 0.5 de uno de sociología a su izquierda. Así, sumamos (6 x 0.5) = 3 a U. Seis estu-
diantes de física y cuatro de sociología dieron la evaluación siguiente (3). En consecuen-
cia, hay un estudiante de sociología (con una evaluación de 2) a la izquierda de cada uno
de los seis de fisica, por lo cual sumamos (6 x 1) = 6 a U. Además, como cada uno de los
cuatro sociólogos con una evaluación de 3 cuenta como 0.5, cada uno de los seis físicos
tiene (4 x 0.5) = 2 sociólogos a su izquierda; de ahi que sumemos (6 x 2) = 12 a U. El pro-
ceso continúa hasta que se ha contado la posición relativa de cada participante.

Evaluación Aportación a U u
1 o o
2 (6 X 0.5) 3
3 (6 X 2) + (6 X 1) 18
4 (3 X 3.5) + (3 X 4) + (3 X 1) 25.5
5 (2 X 4.5) + (2 X 7) + (2 X 4) + (2 X 1) 33
1 o
Total de U 79.5

Si nuestra predicción fuera direccional e indicase que los sociólogos darían evaluaciones
más altas que los físicos, buscaríamos la probabilidad de este valor U. Sin embargo, si pre-
decimos que los físicos darían las evaluaciones más altas, calcularemos la U de los físicos.
Tras calcular la U de un grupo, se hace lo propio con la otra U mediante la ecuación
siguiente:

.,
436lL________________________~A~p~én~d~ic~e~s______________________________
Por tanto, la U de los fisicos es:
U2 (2Ix21)-79.5
361.5

De no ser direccional la hipótesis, calcularemos U 1 y U2, y la estadística por utilizar será


la menor de ambas; en este caso, será U 1•
Significación estadística de la U de Mann-Whitney. Cuando el tamaño de la muestra del
grupo menor es de 20 participantes o menos, la probabilidad de que el resultado haya ocu-
rrido por azar se presenta en el apéndice XIV. Sin embargo, si el grupo menor tiene más de
20 participantes, con una versión de la prueba z puede calcularse la probabilidad:

z = Ec. AVI.7
n 1 Xn2x(n1 +n2 +1)
12

79.5-(21;21)
z = -;===b=::::f:::=
21X21 x(21+ 21+1)
12
= -3.5469

Corrección para empates. Quizá nuestro programa de computadora ofrezca también otro ,
valor de z, donde se haya tenido en cuenta el número de puntuaciones con el mismo valor
(empatadas). Cuando el tamaño de la muestra es suficientemente grande para requerir el
uso de la prueba z, vale la pena corregir los empates, pues así obtendremos un valor más
exacto de z y, por tanto, de p.
Para corregir los empates necesitamos saber cuántas puntuaciones empataron y cuán-
tas hay en cada empate. En la puntuación 1 hubo cuatro empates, en la 2 siete, etc. Forma-
mos la tabla siguiente:

Puntuación Número de empates (t)

1 4 5
2 7 28
3 10 82.5
4 10 82.5
5 11 110
Corrección total 308
Búsqueda de diferencias entre dos niveles de una variable independiente I4J7
Podemos usar ahora la ecuación para z, corregida para empates, pero a fin de simplificarla
que sea N= n 1 + n2 :

z (corregida
para empates) Ec.AVL8
n1 Xt~
(Nx(N - l )) x
(N 12-N
-
3
.. )
- -correcclon tota1

Por tanto, en este caso,

79.5 - ( 21 ; 21)
z (corregida para empates)
3
21x21 x((42) -42 _ 308)
(42x{42- l)) 12

= - 3.6389

Prueba de rangos con signo de Wilcoxon para pares equiparados


Cuando el diseño es intrasujetos, con una VI de dos niveles, y no se satisfacen los requisi-
tos de una prueba intrasujetos, pero la medida es por lo menos ordinal, puede usarse la
prueba de rangos con signo de Wilcoxon para pares equiparados. En ella se examina el ta-
maño de las diferencias existentes entre ambos niveles de la VI, se clasifican por tamaño
las diferencias y se da a cada una de ellas un signo positivo o negativo, lo cual depende de
si la puntuación en el segundo nivel es mayor o menor que la del primero. Los rangos del
signo que se presenta con menor frecuencia se suman y el resultado forma la estadística T.
Varios investigadores compararon la opinión de las personas acerca de la psicología
como ciencia antes y después de escuchar una charla sobre la naturaleza de tal disciplina.
Las opiniones se dedujeron a partir de la respuesta a la afirmación "La psicología es una
ciencia" . Se utilizó una escala .de evaluación de 5 puntos (desde completamente de acuer-
, do hasta completamente en desacuerdo), en la cual la puntuación más alta denotaba la

·'
creencia de que la psicología es una ciencia.
Cuando hay varias puntuaciones iguales (empatadas), los rangos se calculan contando
cuántos tienen el mismo rango, dándoles el rango que tendrían si no estuvieran empatados
y calculando el rango medio correspondiente a ellos. Por ejemplo, tres personas tuvieron
una diferencia de - 1 en su puntuación entre las dos ocasiones. Por consiguiente, si no es-
tuvieran empatadas, habrían tenido los rangos 1, 2 y 3. Su rango medio es:

1+ 2+3
rango med1o = - -
o

3
= 2

••
4J8l~-------------------------A~p_én_d_ic_e_s______________________________

La diferencia siguiente se trataría como si tuviese un rango de 4 si no estuviera empatada.

Tabla AVI. 7. Puntuaciones de participantes en una prueba de psicología antes y


después de una charla sobre el tema.

Rango
Antes Después Diferencia de diferencia Positivo Negativo
1 4 -3 7.5 7.5
1 4 -3 7.5 7.5
2 2 o
2 4 -2 5 5
3 5 -2 5 5
2 4 -2 5 5 '
3 4 -1 2 2
4 4 o
5 5 o
4 5 -1 2 2
2 3 -1 2 2
3 3 o
Total <n o 36

Utilizamos la menor de las dos T: en este caso, la correspondiente a las diferencias positi-
vas, T= O.

Cálculo de la probabilidad de la prueba de rangos con signo de Wilcoxon. En esta prue- ;


ba se rechazan los casos en que no hay diferencia entre los dos niveles de la VI y el tamaño
de la muestra equivale sólo a quienes mostraron una diferencia. Por tanto, en el ejemplo,
como cuatro personas no cambiaron sus puntuaciones entre una ocasión y otra, se consi-
dera un tamaño de muestra de 12 - 4 = 8. Cuando la muestra es de 25 o menos, se usa la
tabla AXN.S del apéndice XIV. En el presente caso, la muestra es de 8 y por ello debe con-
sultarse dicha tabla. Cuando la muestra es mayor que 25, puede utilizarse cierta prueba z.

T N x(N+l)
4
z = Ec. AVI.9
N x (N +l)x((2x N) + 1)
24
Búsqueda de diferencias entre dos niveles de una var~able independiente ¡439

Aunque no es apropiado usar la prueba z en el ejemplo, utilizaremos el resultado paramos-


trar cómo se emplea.

_ 8x(8 + 1)
0
4
z
8x(8+l)x((2x8)+1)
24

8x9
4
z
rs;9ill
~~
-18
Fl
= -2.521

Puntuaciones empatadas. Para corregir los empates debemos conocer cuántas puntuacio-
nes empataron y de cuántas se compone cada empate. En la puntuación 1 hubo tres empates,
tres en la 2, etc. Formamos la tabla siguiente:

Diferencia
(independientemente
.'
3

del signo) Número de empates (t) Correcc10n = -t -


-
t
2

1 3 12
2 3 12
3 2 3
Corrección total 27

Ahora podemos usar la ecuación para z, corregida para empates:

T- Nx(N +l)
z (corregida para empates) 4 Ec. AVI.lO
Nx(N +l)x(( 2 x N) +l)- Corrección total
• !

24

t1
440lL________________________A~p_én_d_ic_e_s_____________________________
Por tanto, en el presente caso,

O- 8x(8+ 1)
z (corregida para empates) 4
8x(8+1)x((2x8)+1) _
27
24

-18
~51 - 27
-18
4.8989
-3.674

Cálculo del tamaño del efecto a partir de una punt uación


z en las pruebas U de Mann-Whitney o de Wilcoxon
.. Ahora que tenemos tma puntuación z para el resultado podemos convertirla en un tamaño
del efecto (r) mediante la ecuación siguiente:

donde N es el número total de participantes en el estudio.


Por ende, en el ejemplo anterior, para la prueba U de Mann-Whitney "\

- 3.6389
r = ---=---
...}42

= 0.56

que, en términos de Cohen ( 1988), se consideraría un tamaño de efecto grande.


)

Prueba x2
para el análisis de una tabla
de contingencias de dos ent radas
Cuando el diseño es entre sujetos, hay dos variables (dos entradas) y los datos son nomi-
x
nales, puede usarse la prueba 2 para contingencias.
Un conjunto de investigadores desea saber si hay proporciones diferentes de mujeres
y de varones que fuman.
Búsqueda de diferencias entre dos niveles de una variable independiente ¡441
Tabla AV1. 8. Cantidad de hombres y mujeres fumadores y no fumadores.

Tabla de frecuencia observada


Hombre Mujer Totales
Fumador 17 21 38
No fumador 27 23 50
Totales 44 44 88

_La frecuencia esperada (fe) de una celda específica se calcula multiplicando el total de la
fila donde se encuentra la celda por el total de la columna en que se halla y dividiendo el
resultado por el total global. Por tanto, en la celda superior izquierda la .fe es:
38 X 44
J:e =
88
19

' En seguida se muestra la frecuencia de cada celda:

. Tabla AVI. 9. Frecuencias que podrían esperarse si el tabaquismo y el género no


estuviesen correlacionados.

Valores esperados
Hombre Mujer Totales
Fumador 19 19 38
No fumador 25 25 50
Totales 44 44 88

En la prueba x2 se comparan las frecuencias esperadas con las reales (frecuencias observa-
das, j0) mediante la misma ecuación que se utiliza en la prueba x2 de un solo grupo:

x2 = "i.Cfo- J.J'
f.
Esto es, restar cada frecuencia esperada a la observada correspondiente, elevar al cuadrado
el resultado y dividirlo entre la frecuencia esperada. El proceso se repite para cada celda y
se suman todos los resultados.
(17-19) 2 (21-19) 2 (27-25) 2 (23-25) 2
2= + + +
X 19 19 25 25

= 0.2105 + 0.2105 + 0.16 + 0.16


= 0.74 1
442lL------------------------~A~p~é~nd~i~ce~s______________________________

x
Esta versión de la prueba 2 tiene los grados de libertad siguientes: (r - l) x (e- l ), donde
res el número de filas y e el de columnas. Por tanto, en este caso, gl = (2- 1) x (2- 1) = l.
Podemos buscar el resultado en la tabla de distribución de x2 del apéndice XIV. En ella
se muestra que la probabilidad de que tal resultado, con gl = 1, ocurriera por azar es
0.3 < p < 0.5. Según la computadora, la probabilidad exacta es p = 0.3893.
Corrección para continuidad. Yates creó una corrección para la prueba x2 cuando se usa
en una tabla de contingencia de 2 x 2. Como se señaló en el capítulo 15, el razonamiento
de la corrección consiste en que las probabilidades dadas por la distribución de x2 se calcu-
lan con base en que las variables son continuas. Se pensó que, como en una tabla de 2 x
2 las medidas son dicotómicas, debía efectuarse la corrección en esas circunstancias. Sin
embargo, se supone que los totales marginales son fijos.
Eso ocurre muy pocas veces en las investigaciones reales, pero un ejemplo podría ser .
éste: pedir a un participante que clasifique 32 fotografias de personas en dos pilas iguales
según piense que cada imagen presenta a un individuo del norte o del sur de Inglaterra. Por
tanto, los totales marginales de la clasificación serían fijos: 16 en cada uno. Dieciséis foto- ·
grafias serían de personas del norte de Inglaterra y 16 de personas del sur, lo cual fijaría los·
otros totales marginales:

Tabla AVI. 1O. Forma en que un participante clasificó fotografías de personas del norte
y del sur de Inglaterra.

Parte de Inglaterra de donde


proviene la persona retratada

Clasificación Norte Sur


10 6 16
Norte
'
Sur 6 10 16
16 16 32

Si en una tabla de contingencia de 2 x 2 la suposición de totales marginales ftjos es correc-


ta, puede aplicarse la corrección de Yates para x2. Sin embargo, como los programas para
computadora suelen dar la versión corregida de x2 , sin importar si se cumple o no esa res-
tricción, vale la pena conocer la ecuación:

x2 corregida = _¿(V.-1.1- o.s)


f.

donde l.fo - fe! significa despreciar el signo si el resultado es negativo.


Búsqueda de diferencias entre dos niveles de una variable independiente ¡44"3

Por consiguiente, en el caso de la clasificación de fotografias,

(IIo- 81-o.sf ~6 -81- o.sf (16-81-o.sf ~I0- 8 1- o.sf


x2 corregida = 8
+
8
+
8
+ -'---------'-
8
(uY (uy (uy (uY
- - +--+ - - + - -
8 8 8 8
1.125
x
(Para la misma tabla, la 2 no corregida = 2.)
Como es usual con x2 para una tabla de contingencia de 2 x 2, gl = l.

Prueba de probabilidad exacta de Fisher


Cuando tenemos una tabla de contingencia de 2 x 2 y las frecuencias esperadas de cual-
x
quiera de las celdas es menor que 5, la prueba 2 no se considera confiable. Puede usarse
la prueba de probabilidad exacta de Fisher, pero ésta resulta apropiada sólo cuando los ni-
veles de ambas variables tienen totales marginales fijos. (En el capítulo 15 se señaló que si
los datos marginales no son fijos pero las frecuencias esperadas son pequeñas, puede usar-
se otra prueba cuyos detalles se presentan ahí.) Imaginemos que repetimos el experimento
de d_ar a un participante fotografias de personas para que las clasifique de acuerdo con la
región de que piensa que provienen los retratados, pero usando ahora sólo 1O imágenes:

Tabla AVI. 11. Forma en que un participante clasificó 1O fotos de personas del norte y
del sur de Inglaterra.
Parte de Inglaterra de donde
proviene la persona retratada
Clasificación Norte Sur
Norte 4 (A) 1 (B) 5
Sur 1 (C) 4 (D) 5
5 5

Como los totales marginales son fijos y las frecuencias esperadas para cada una de las
celdas de 2.5, para analizar esos datos podemos usar la prueba de probabilidad exacta de
Fisher.
-La ecuación de tal prueba nos da la probabilidad exacta del resultado. Recordemos que
usualmente deseamos conocer la probabilidad de ese resultado y las de las probabilidades
más extremas que concuerdan con la hipótesis (en el capítulo 1O se presenta una explica-
. ción al respecto). En consecuencia, queremos conocer la probabilidad del resultado que se
presenta en la tabla AVI.ll y la del resultado más extremo presentado en la AVI.12 .
444l~------~----------------A~p~én~d~ic~e~s_____________________________

Tabla AVI. 12. Resultado más extremo de los datos presentados en la tabla AVI . 11 .

Clasificación Norte Sur


Norte 5 (A) O (B) 5
Sur O (C) 5 (D) 5
5 5

Observemos que los totales marginales permanecen iguales en la tabla anterior.


La probabilidad de la prueba de probabilidad exacta de Fisher se calcula de la manera
siguiente:

(A+ B)! X (C + D)! X (A+ C)! X (B + D)!


p = N! X A! X B! X C! X D!

donde 4! representa el factorial de 4, que es 4 x 3 x 2 x 1 = 24. (Por cierto, O! = 1.)


Por consiguiente, en el presente caso la probabilidad del resultado de la tabla AVI.ll es

( 4 + 1)! X (1 + 4)! X ( 4 + 1)! X (J + 4)!


p =
1O! X 4! X !! X 4! X l!
120 X 120 X 120 X 120
3628800 X 24 X 1 X 24 X 1
. = 0.099206349

La probabilidad del resultado más extremo de la tabla AVI.l2 es ésta:


p = 0.003968254

Debido a ello, la probabilidad de que los resultados de la tabla de contingencias hayan ocu-
rrido por azar e~: ,
p = 0.099206349 + 0.003968254
= 0.103174603

Para ahorrarnos el cálculo de las probabilidades, en el apéndice XIV se presentan las tablas
respectivas. "
'"

.
VIl
Búsqueda de diferencias
entre más de dos niveles de
una variable independiente

En el apéndice se exponen las técnicas presentadas en el capítulo 16.


La información del presente apéndice le permitirá calcular las estadísticas a mano o
con calculadora, pero no todas las técnicas que se muestran son las convencionales que po-
dría encontrar en la mayoría de los libros de texto. Se incluyen aquí para ayudarle a com-
prender y revisar los datos impresos de los resultados de los programas para computadora.
Las cantidades se dan con cinco decimales, de manera que los resultados sean coherentes
con los de tales programas una vez que se han redondeado hacia arriba o hacia abajo; sin
embargo, normalmente no es necesario alcanzar ese nivel de precisión.

Pruebas paramétricas
ANOVA de una vía entre sujetos
Un conjunto de investigadores comparó la eficacia de dos sistemas nemotécnicos (palabras

-
gancho y el método de ubicación) y una condición control.

--------------------------------------------~~--------~ 445
446l~------------------------A~p~én~d~ic~e~s_____________________________

Tabla AVII.1. Número de palabras recordadas en tres condiciones de memoria con


media y desviaciones estándar.

Estrategia nemotécnica
Control Palabras gancho Ubicación

10 11 10
7 7 8
7 9 11
9 10 9
5 8 12
6 6 10
8 12 7
5 9 11
7 10 8
8 7 10
7.2 8.9 9.6
DE 1.61 933 1.91195 1.57762

Hay tres fuentes de variación que debemos cuantificar: la variación gl~bal de las puntua-
ciones (total), que puede dividirse a su vez en la variación entre los tratamientos (entre gru-
pos) y de las puntuaciones en los grupos (intragrupos).
La suma de cuadrados es la suma de las desviaciones al cuadrado y suele presentarse
de la manera siguiente:
Suma de cuadrados = 2: (x- i) 2

Suma total de cuadrados. Para calcular la suma total de cuadrados, se halla la media glo-
bal de las puntuaciones. Se resta posteriormente la media de cada una de éstas para calcu-
lar cada desviación. Por último, se eleva al cuadrado cada desviación y se suman todas las
desviaciones al cuadrado. '
En este caso, la media global es 8.56667; y la suma de cuadrados total, l 09.36654 (o
109.367, redondeada a tres decimales).
Suma de cuadrados entre grupos. La suma de cuadrados del tratamiento o entre grupos
es la comparación de los resultados de tres tratamientos; en ella se tieRe en cuenta el nú-
mero de puntuaciones observado en cada tratamiento. Se calcula encontrando la desviación
de la media de cada tratamiento respecto a la global. Se eleva al cuadrado cada desviación,
se multiplica por el número de puntuaciones que rindieron esa media del tratamiento y, por
último, se suman todos los resultados.
.~'1

,..
Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡447
Tabla AVII.2. Cálculo de la suma de cuadrados del tratamiento para un ANOVA de una
vía entre sujetos. ti l ·S/ ~-~
c-..!.
Desviación de
la media global
Tratamiento Media (8.56667) (desviación) 2 n x (desviación)2
Control 7.2 1.36667 1.86779 18.6779
Palabras gancho 8.9 0.33333 0.11111 1.1111
Ubicación 9.6 1.03333 1.06777 10.6777
Suma de 30.4667
cuadrados entre
grupos

Suma de cuadrados intragrupos. La suma de cuadrados intragrupos puede calcularse en-


contrando la suma de cuadrados dentro de cada grupo y sumándolas todas. Si sabemos cuál
es la varianza de un conjunto de puntuaciones podemos calcular la suma de sus cuadrados
porque:
Suma de cuadrados
Varianza =
n-l
Recuerde que
Varianza = (DE)2

Tabla AVII.3. Creación de la suma de cuadrados intragrupos para un ANOVA de una vía
entre sujetos.

Tratamiento DE Varianza Varianza x (n - 1)


Control 1.61933 2.62223 23.60007
Palabras gancho 1.91195 3.65555 32.89995
Ubicación 1.57762 2.48888 22.39992
~~~·-
.11.. Suma de 78.89994
.:.:l!< cuadrados
intragrupos
11 La suma de cuadrados (S de C) intragrupos también puede calcularse de la manera siguiente:
S de e total = S de e entre grupos + S de e intragrupos
1' 1~

Ello significa que


111111--

lll il:l S de e intragrupos = S de e total -


S de e entre grupos
lllnl.. = 109.36654- 30.4667
ur::rr = 78.89984 (que es el mismo valor calculado anterior-
mente hasta tres decimales)
....
448lL_________________________A~p_é_nd_i_ce_s______________________________
Tenemos ya las sumas de cuadrados necesarias para crear la tabla resumen del ANOVA:

Tabla AVII.4. Tabla resumen para un ANOVA de una vía entre sujetos.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F p

Entre grupos 2 30.467 15.233 5.213 0.0122


lntragrupos 27 78.9 2.922
Total 29 109.367

En el capítulo 16 se explica cómo calcular los grados de libertad, las medias al cuadrado y
las razones F.
Tamaños desiguales de la muestra (diseños desequilibrados). Cuando el tamaño de la
muestra no es igual en todos los grupos hay dos maneras posibles de calcular la suma de
cuadrados; la otra suma de cuadrados se calcula como se indica en los p~rrafos anteriores.
Medias ponderadas. Con el método presentado anterionnente se produce lo que se cono-
ce como solución de medias ponderadas, donde se multiplica la suma de las desviaciones
al cuadrado de cada media por el tamaño de la muestra del grupo de que se obtuvo dicha
media. Así, a las muestras mayores se da mayor peso. Este método se utili;za en el grueso
de los programas de computadora. ·
Medias no ponderadas. Otro método consiste en multiplicar cada suma de las desviacio-
nes al cuadrado por la media armónica del tamaño de la muestra. La media armónica se
calcula de la forma siguiente:
k

-+-basta-
1 1
( 111 112
1 J
nk

donde k es el número de niveles


n 1 es el tamaño de la muestra del primer grupo
n k es el tamaño de la muestra del último grupo
Por tanto, si en el ejemplo que se presentó con tres niveles los tamaños de las muestras fue-
ron de 8, 10 y 7, la media armónica del tamaño de la muestra sería:
3
n =
h (.!..+_l+.!.)
8 10 7
\ Búsqueda de ~iferencias entre más de dos niveles de una variable independiente ¡-::449

3
(0.125+0.1 +0.14286)

3
0.36786
8.155

Heterogeneidad de la varianza (F' de Welch). Cierta versión del ANOVA entre sujetos (la
fórmula F' de Welch) permite una falta de heterogeneidad de la varianza entre los niveles
de la varl:able independiente.

F'

dond~ w=~
1 S~

nj es el tamaño de la muestra en el nivelj


s~ es la varianza en el nivelj
Xj es la media del nivelj
_ I,(w xx)
x= J J
I,wj
k es el número de niveles en la variable independiente
F' tiene los mismos gl para el tratamiento que la razón F estándar (k - 1), pero un gl de
error modificado en comparación con la razón F estándar:

Aunque los datos de la tabla AVII.l tienen varianza homogénea, en la página siguiente se
presenta un reanálisis acorde con la fórmula de Welch.
45QlL______________________~A~p~én~d~ic=e~s___________________________
Estrategia nemotécnica
Control Palabras gancho Ubicación
7.2 8.9 9.6
DE¡(S¡) 1.61933 1.91195 1.57762
Varianza (~) 2.6222 3.6556 2.4889
3.8135 2.7356 4.0179
27.4572 24.3468 38.5718
¿w1 - 10.567
x = B.5526

Estrategia nemotécnica
Control Palabras gancho Ubicación
X¡ - X - 1.3526 0.3474 1.0474
- - X_)2
(X¡ 1.8295 0.1207 1.0970

6.9768 0.3302 4.4076

n = 1O para cada grupo


k =3
5.8573
F'
l+(ix0.1491)

5.6468
8
glí 3x0.1491
17.8851
En las tablas de la distribución F vemos que con 2 y 18 grados de libertad, la probabilidad
de F' es 0.01 < p < 0.05. (La probabilidad exacta es 0.0 13, muy semejante a la probabili-
dad dada para la razón F original de la tabla AVII.4.)

ANOVA de una vía intrasujetos


Un conjunto de investigadores estudió los efectos de la presencia de terceros en los juicios
acerca del tratamiento de infractores. Se presentó a los participantes la descripción de un
delito y se les pidió que decidieran cuánto tiempo debéría estar en prisión el delincuente.
Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡451

En el experimento hubo tres condiciones: en una, cada participante estaba solo y descono-
cía el juicio de otros; en la segunda, estaba solo, pero podía ver en una pantalla de compu-
tadora lo que otros habían "decidido"; en la tercera, estaba en un grupo y sabía lo que los
demás habían "decidido". Las decisiones que los participantes creían que habían tomado
los demás fueron en realidad preestablecidas por los psicólogos, pero aquéllos lo ignoraban.

Tabla AVII.5. Sentencias que los participantes dieron en cada una de las tres
situaciones a los criminales.

Participante Solo Computadora Grupo Media por participante

1 24 24 24 24
2 18 24 24 22
3 12 15 15 14
4 3 12 12 9

5 24 24 30 26

6 18 18 24 20
7 12 15 18 15
8 15 20 - 20 18.33333
9 12 15 18 15
10 9 15 15 13
Media 14.7 18.2 20 17.63333
DE 6.55 4.52 5.48

Las fuentes de variación de las puntuaciones son la variación total, que puede dividirse en
la debida a los párticipantes (entre sujetos) y en la debida a la combinación de éstos y los
tratamientos (intrasujetos). La variación intrasujetos puede dividirse en variación entre gru-
pos (o de tratamiento) -el efecto de la VI- y en residual (o de error) -lo no atribuible a di-
ferencias entre tratamientos.
De esa manera, la suma total de desviaciones al cuadrado puede dividirse en:

Entre sujetos Intrasujetos

S de C total = 1 S de
~
e de sujetos 1 + 1 S de
"\
e del tratamiento+ S de e residual 1
452lL----------------------~A~p~én~d~ic~e~s_____________________________

Suma total de cuadrados. La suma total de cuadrados se calcula como en el ANO VÁ de


una vía entre sujetos: calculando la media global de las puntuaciones, restando la media
de cada puntuación para calcular cada desviación, elevando al cuadrado cada desviación y
sumando todas las desviaciones al cuadrado.
En este caso, la media global es 17.63333 y la suma total de cuadrados, 984.96673 (o
984.967, redondeada a tres decimales).
Suma de cuadrados entre sujetos. La suma de cuadrados entre sujetos es la suma de las
desviaciones al cuadrado de la media de cada participante de la media global, multiplicada
por el número de tratamientos (k).

Tabla AVII.6. Cálculo de la suma de cuadrados entre sujetos para un ANOVA de una vía
intrasujetos.
Desviación
de la media k x (desviación)2
global (k es el número ·
Participante Media (17.63333) (desviación) 2 de tratamientos)

1 24 6.36667 40.53449 121.60347

2 22 4.36667 19.06781 57.20343

3 14 - 3.63333 13.20109 39.60327

4 9 -8.63333 74.53439 223.60317

5 26 8.36667 70.00117 210.00351

6 20 2.36667 5.60113 16.80339

7 15 - 2.63333 6.93443 20.80329

8 18.33333 0.7 0.49 ·1.47


9 15 -2 .63333 6.93443 20.80329

10 13 -4.63333 21.46775 64.40325


Suma de 776.30007
cuadrados
entre sujetos

Suma de cuadrados intrasujetos. La suma de cuadrados intrasujetos es la suma de las des-


viaciones al cuadrado de la puntuación de cada participante de la media de éste.
Búsqueda de diferencias entre más de dos niveles de una variable independiente í45J
Así, la suma de desviaciones al cuadrado (S de C) del segundo participante es:

S de e(participante 2) (18 - 22) 2 + (24 - 22) 2 + (24 - 22) 2


(--4)2 + 22 + 22
16 + 4 + 4
24

Tabla AVIl. 7. Cálculo de la suma de cuadrados intrasujetos para un ANO VA de una vía
intrasujetos.
Suma de
desviaciones al
cuadrado de
Participante Solo Computadora Grupo Media la propia media
1 24 24 24 24 o
2 18 24 24 22 24
3 12 15 15 14 6
4 3 12 12 9 54
5 24 24 30 26 24
6 18 18 24 20 24
7 12 15 18 15 18
8 15 20 20 18.33333 16.66667
9 12 15 18 15 18
10 9 15 15 13 24
s de e 208.66667
intrasujetos

Suma de cuadrados entre grupos (tratamiento). Como sucede con el ANOVA entre suje-
tos, la suma de cuadrados entre grupos es la suma de cuadrados de las tres medias del tra-
tamiento multiplicadas por el tamaño de la muestra.

Tabla AVII.8. Cálculo de la suma de cuadrados entre grupos para un ANOVA de una vía
intrasujetos.
Desviación
Media de la media
del global
Tratamiento tratamiento (17.63333) (desviación) 2 n x (desviación) 2
Solo 14.7 -2.93333 8.60442 86.0442
Computadora 18.2 0.56667 0.32111 3.2111
Grupo 20 2.36667 5.60113 56.0113
Suma de 145.2666
cuadrados entre
grupos

J
~~~---

454l~------------------------A~pe_'n_d_ic_e_s_____________________________

Suma de cuadrados residual. La suma de cuadrados residual es la suma de cuadrados in-


tragrupos, una vez eliminado el efecto entre sujetos. Los residuos pueden calcularse sustra-
yendo la media global de cada persona de su puntuación en cada condicióJl.
De esa manera, el residuo del segundo participante del tratamiento sólo es 18 - 22 = - 4.
Una vez calculados los residuos, hay que calcular la suma de cuadrados intragrupos de ta-
les residuos, calculando cuánto difiere cada residuo de la media del residuo de ese trata-
miento.

Tabla AVIl . 9. Residuos por participante en cada condición, utilizados para calcular la
suma de cuadrados residual para un ANOVA de una vía intrasujetos.

Participante Solo Computadora Grupo


1 o o o
2 -4 2 2
3 -2 1 1
4 -6 3 3
5 -2 -2 4
6 -2 -2 4
7 -3 o 3
8 -3.33333 1.66667 1.66667
9 -3 o 3
10 -4 2 2
Media del residuo -2.93333 0.566667 2.36667
DE 1.60093 1.68545 1.28091
Varianza 2.56296 2.84074 1.64074 ·S de e residual
S de C de la columna 23.06664 25.56667 14.76667 63.39997
[varianza x (n - 1 )]

Una vez que hemos calculado la suma de cuadrados total y la entre sujetos, podemos calcu-
lar la intrasujetos con la fórmula siguiente:
S de e intrasujetos = S de e total- S de e entre sujetos
Tras calcular la suma de cuadrados del tratamiento, la suma de cuadrado~ residual se calcula
con esta fórmula:
S de e residual = S de e intrasujetos - S de e de los tratamientos
Ahora que hemos obtenido todas las sumas de cuadrados necesarias podemos crear la ta-
bla resumen del ANO VA. En el capítulo 16 se incluyen más detalles sobre el cálculo de los
grados de libertad, las medias de cuadrados y la razón F.
• Búsqueda de diferencias entre más de dos niveles de una variable independiente f"455
Tabla AVIl. 1O. Tabla resumen para un ANOVA de una via intrasujetos.
Suma Media
Fuente gl de cuadrados de cuadrados Razón F p
Entre sujetos 9 776.3 86.256 24.491 0.0001
lntrasujetos 20 208.667 10.433
tratamientos 2 145.267 72.633 20.621 0.0001
residual 18 63.399 3.522
Total 29 984.967

Esfericidad. Los ANOVA intrasujetos tienen una suposición peculiar que los datos han de
cumplir: las yarianzas de las diferencias entre distintos pares de niveles de la VI deben ser
iguales (esfericidad o circularidad). En otras palabras: la varianza de las diferencias entre
las puntuaciones de la condición sujeto solo y con computadora será la misma que la va-
rianza de las diferencias entre las puntuaciones de la condición computadora y cara a cara,
y que la varianza de las diferencias entre las puntuaciones entre la condición sujeto solo y
cara a cara.
Cuando la esfericidad no está presente, un método para compensar tal situación y pro-
ducir una probabilidad más exacta para la prueba consiste en ajustar los grados de libertad
para las razones F.
Los dos ajustes son la épsilon de Greenhouse-Geisser (G-G) y la de Huynh-Feldt (H-
F). El primero resulta conservador (tiene más probabilidades de evitar un error tipo I, pero
también de producir uno tipo 11); y el segundo, más liberal.

Tabla AVII. 11. Cálculo de las varianzas de las diferencias entre las puntuaciones de
las distintas condiciones.
Diferencias
Participante Solo-computadora Solo-grupo Computadora-grupo
1 0.00 0.00 0.00
2 -6.00 -6.00 0.00
3 -3.00 -3 .00 0.00
4 -9.00 - 9.00 0.00
5 0.00 -6.00 -6.00
6 0.00 -6.00 -6.00
-3.00 - 3.00
T

7 -6.00
8 - 5.00 - 5.00 0.00
9 - 3.00 -6.00 - 3.00
10 -6.00 -6.00 0.00

..
,
Varianza 9.17 5.57 6.40
456lL_________________________A~p~én_d~ic~e~s______________________________
Un concepto que suele estar relacionado con la esfericidad en los análisis sobre el tema es
el de la simetría compuesta. Decimos que la hay si las varianzas de las puntuaciones origi-
nales y también las covarianzas son homogéneas (la covarianza representa la medida de
cuán cercana resulta la relación entre dos medidas; en el capítulo 19 se incluyen más deta-
lles al respecto). Por tanto, para que haya simetría compuesta, las varianzas de las condi-
ciones paciente solo, con computadora y en grupo deben ser iguales entre sí, mientras que
las covarianzas de las condiciones solo y computadora, solo y grupo, y computadora y gru-
po han de ser iguales entre sí. Cuando hay simetría compuesta se tiene también esfericidad;
sin embargo, puede tenerse la segunda sin la presencia de la primera.
Una matriz de varianza y covarianza contiene las covarianzas entre cada uno de los ni-
veles de la VI y, en la diagonal de la matriz, las varianzas de cada uno de los niveles. En la
tabla siguiente, el valor 42.9 es la varianza de la condición participante solo; 20.4, la de
la condición con computadora:

Tabla AVII . 12. Matriz de varianza y covarianza de las condiciones en que los
participantes emitieron sus sentencias a los criminales, incluidas las
medias de las columnas.

Solo Computadora Grupo


Solo 42.9 27.06667 33.66667
Computadora 27.06667 20.4 22
Grupo 33.66667 22 30
Media 34.54456 23.15556 28.55556

Para calcular las epsilones necesitamos la información siguiente, que podemos deducir de
la tabla anterior:
Media global = 28.75189 (la media de los nueve valores)
Varianza media = 31.1 (la media de las tres varianzas)
Suma de las medias al cuadrado de las columnas (SCmediaJ = 2 544.92659 (la suma de las
medias al cuadrado de cada columna)
Suma de las varianzas y covarianzas al cuadrado (SC10daJ = 7 856.68645 (la suma de cada
uno de los nueve valores al cuadrado)
Obsérvese que SCmedias y SCtodas son, literalmente, sumas de cuadrados y no de desviacio-
nes al cuadrado, como en cálculos anteriores.
La épsilon de Greenhouse-Geisser (e) se calcula con la ecuación siguiente:

~ k 2 x (varianza media- media global)1


e=
(k- 1) x (sc,od.. - (2 x k x SCmedias ) +(k x media global) 2 )
• Búsqueda de diferencias entre más de dos niveles de una variable independiente f457

(3-1)x( 7 856.68645-(2 X 3 X 2 544.92659) + (3 X 28.75189) 2 )

9 X 5.51362
2 X (7 856.68645-15 269.55955 + 7 440.04061)

49.62258
54.33502
= 0.91327
La épsilon de Huynh-Feldt ( e) se basa en la e de Greenhouse-Geisser:
(nx(k-1)xe)-2
e = --~--~~--~----
(k -1)X (n - 1- ((k - 1) X e))

(10 X (3 -1) X 0.91327) - 2


(3 -1) X (10 - 1- ((3 - 1) X 0.91327))

(10 X 2 X 0.91327) - 2
2 X (9 - (2 X 0.91327))

18.2654-2
2 X (9 -1.82654)

16.2654
14.34692

= 1.13372
Ambas epsilones pueden usarse para ajustar los grados de libertad en un ANOVA intrasu-
jetos mediante la ecuación siguiente:
gl ajustados = (gl anteriores) x épsilon
Sin embargo, cuando la épsilon es mayor que 1 no se realiza ningún ajuste. Por tanto, la e
de Greenhouse-Gefsser es la única necesaria. En el ANO VA de una vía intrasujetos, los gra-
dos de libertad fueron 2 y 18, lo cual significa que, con la ede Greenhouse-Geisser, se con-
vertirán en:
gl ajustados = 2 x 0.913 y 18 x 0.913
= 1.826 y 16.434
que, redondeados a los enteros siguientes, nos dan:
2 y 16

·-
'
458l~------------------------A~p~én_d_ic~e~s----~------------------------
Pruebas no paramétricas
Medida por lo menos ordinal
Diseños entre sujetos: ANO VA de Kruskal-Wallis por rangos. Cuando el diseño de inves-
tigación es entre sujetos con una VI de más de dos niveles y no se cumplen los requisitos
para un ANOVA paramétrico, cabe realizar el análisis mediante el ANOVA de una vía de
Kruskal-Wallis si los datos son al menos ordinales.
Un grupo de investigadores deseaba comparar los grados que varios catedráticos asig-
naron a diversos ensayos escritos por un varón, por una mujer o por un autor de género no
especificado. Veinticuatro catedráticos universitarios recibieron sendos textos para evaluar;
se les dijo que el material correspondía a un estudiante varón o a una estudiante mujer, o
bien, no se les indicó sexo. En realidad, todos recibieron el mismo escrito. Cada ensayo fue
calificado entre C- y A-, lo cual se convirtió después en valores numéricos de 1 a 9.
Se dio un rango a cada grado y los rangos empatados se trataron igual que en la prue-
ba de rangos con signo de Wilcoxon para pares equiparados.

Tabla AVII.13. Grados que los participantes asignaron a un ensayo, según el supuesto
género del autor, con los rangos conferidos a los grados.
"Género" del autor
Mujer Neutro Varón
Grado Rango Grado Rango Grado Rango
2 2 3 7.5 3 7.5
3 7.5 3 7.5 4 15
2 2 4 15 5 20
3 7.5 4 15 6 22.5
4 15 5 20 7 24
4 15 6 22.5 2 2
3 7.5 4 15 3 7.5
5 20 3 7.5 4 15
Total (R) 76.5 110 113.5

La estadística utilizada para la prueba es H, donde:

donde N es el número global de participantes, en este caso, 8 + 8 + 8 = 24,


Búsqueda de diferencias entre más de dos niveles de una variable independiente ~

es la suma de cada uno de los rangos totales al cuadrado, dividida entre el


número de participantes en el grupo. Por tanto,

(76.5) 2 (11 0) 2 (113.5) 2


--+--+---
8 8 8
3 854.3125

En consecuencia,

12
H = (( )x(3854.3125)J-(3x(24+1))
24 X (24 + 1)

((;~o) x 3 854.3125J-75
77.08625 - 75
2.08625 ·

Para una VI con tres niveles y un tamaño de la muestra no mayor que cinco en cualquiera
de los grupos, los valores de probabilidad de H se presentan en el apéndice XIV. En caso
x
contrario, H se distribuye como 2 , con grados de libertad iguales que el número de nive-
les de la VI, menos uno. Por consiguiente, en este caso, podemos consultar la tabla de la
distribución de x2 en el apéndice XIV para gl = 2 y encontraremos que p está entre 0.5 y
0.3 (es decir, 0.3 < p < 0.5). Ello significa que no hay elementos suficientes para rechazar
la hipótesis nula.
Corrección de empates. Cuando algunas puntuaciones son iguales, en una versión de la prue-
ba se ajustan los empates. En el ejemplo hubo cinco lugares donde los grados empataron.

Tabla AVII.14. Cálculo de la corrección de puntuaciones empatadas para el ANOVA de


·• Kruskal-Wallis.
Grado Número de empates (t) Corrección = (t3 - t)
2 3 24
3 8 504
4 7 336
5 3 24
6 2 6
Corrección total 894
~
1
460lL_________________________A~p_én_d_ic_e_s______________________________
H original
H corregida =
( 1- ( corr~~~:total))
2.08625

1-[ 894 ]]
[ (24y -24

2.08625

1
( -( 138~~24 ))
2.08625
1- 0.06478
= 2 .23076
La probabilidad se encuentra en el mismo rango que la de la versión no corregida para em-
pates, y la probabilidad exacta de p = 0.3278. La H corregida para empates constituye la
cifra más exacta.
Diseños intrasujetos: ANO VA de dos vías de Friedman. Cuando el diseño es intrasujetos
y la variable independiente tiene más de dos niveles, pero no se satisfacen los supuestos del
ANOVA paramétrico, si el nivel de medida es al menos ordinal, el ANOVA de dos vías de
Friedman se torna la prueba adecuada.
Un grupo de investigadores desea saber si un conjunto de siete estudiantes evaluaba di-
ferente un curso conforme pasaban más tiempo en él. Se pidió a cada cual evaluar el curso
según una escala de 7 puntos, desde no disfrutable hasta muy disfrutable, en tres ocasio-
nes: después de una semana, después de cinco y luego de 10.

Tabla AVII. 15. Evaluaciones que los estudiantes dieron al curso en tres ocasiones.

Semanas del curso


Part icipante Una Cinco Diez
1 3 4 5
2 4 4 4
3 5 6 6
4 2 3 4
5 6 5 5
6 1 3 5
7 5 6 6
Búsqueda de diferencias entre más de dos niveles de una variable independiente j'461

Para calcular el ANO VA de Friedman, se asignan rangos a las puntuaciones de cada perso-
na. Observe que ello se realiza sólo con cada persona. Sin embargo, los empates se tratan
de la manera usual, como se describe en la prueba de rangos con signo de Wilcoxon para
pares equiparados.

Tabla AVII.16. Rangos por participante en las evaluaciones dadas al curso en un


... ANOVA de dos vías de Friedman .

Semanas del curso


Participante Una Cinco Diez
1 1 2 3
2 2 2 2
3 1 2.5 2.5
4 1 2 3
5 3 1.5 1.5
6 1 2 3
7 1 2.5 2.5
Total (R) 10 14.5 17.5

x
La prueba produce la estadística llamada 2F (conocida también como 2r), donde x

donde N es el tamaño de la muestra (en este caso, 7)


k es el número de niveles de la VI (en este caso, 3)
LR 2
es la suma de los rangos al cuadrado

Por tanto,

(10) 2 + (14.5) 2 + (17.5) 2


2
LR =

= 100 + 210.25 + 306.25


= 616.5
En consecuencia,

12
X2F = (( Jx 616.5)-(3x7x(3+1))
7 X 3 X (3 + 1)
462lL_______________________A~pe_·n_d_ic_es____________________________

= (( ~! )x616.5)-84
= 88.07143 - 84
= 4.07143
Corrección de empates. A diferencia de las correcciones de empates anteriores, la usada
en la prueba de Friedman cuenta las ocasiones en que no hay empate, pero las cuenta co-
mo empate de l. Se cuentan los empates de cada persona.

Tabla AVII.1 7. Cálculo del número de rangos empatados de cada medida en un ANOVA
de dos vías de Friedman.

Semanas del curso Tamaño de los empates


Participante Una Cinco Diez 1 2 3
1 1 2 3 3 o o
2 2 2 2 o o 1

3 1 2.5 2.5 1 1. o
4 1 2 3 3 o o
5 3 1.5 1.5 1 1 o
6 1 2 3 3 o o
7 1 2.5 2. 5 1 1 o
Total 12 3

Elevamos ahora al cubo cada tamaño del empate y sumamos los resultados; así, para los 12
empates que tuvieron uno en cada empate, la suma es

Ésta es la suma para los tres empates que tuvieron dos en cada empate:

(2) 3 + (2)3 + (2) 3 = 8 + 8 + 8 = 24


Y para el único empate que tuvo tres, la suma es la siguiente:

La suma de los empates al cubo es por tanto 12 + 24 + 27 = 63.


~~~~~~~~--,----~~~--' 11 1
1

Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡463

La ecuación para la x2Fcorregida es:


(12 XL R')- (3 X N' X k X (k + 1)
2
)

X F corregida
2
(N x k x (k+ l) )+ (N x k- suma(~~e~pates al cubo)

- Por ello:

(12 X 616.5)-(3 X (7) 2 X 3 X(3 + 1)')


X2F corregida
7 3 63
( 7x3x(3+1)) ( x - )
+ (3 -1)

7 398-(3 x 49x 3x (4)')

(7x3x4))+Cx32-63)

7 398- (3x49x3xl6)

84+( 21;63)

7 398-7 056

84-( ~J
342
63

= 5.42857

Cuando el número qe niveles y el tamaño de la muestra son suficientemente grandes, la dis-


tribución de X2F es como la de X2, con grados de libertad iguales que el número de niveles
de la VI, menos l .
Con un número de niveles mayor que 3, el uso de las tablas de distribución de 2 para x
calcular la probaBilidad produciría una prueba que, en muchos casos, sería tan conservado-
ra que incrementaría la posibilidad de cometer un error tipo II. Sin embargo, para una VI
x
de tres niveles, el uso de la distribución de 2 sería muy liberal en un tamaño de muestra
menor que 10. Para las VI con niveles de 3 o 4, en el apéndice XIV se presentan niveles
críticos más exactos de X~ para tamaños de muestra pequeños.
464lL________________________~A~p~én~d~ic=e~s______________________________
El poder de la prueba de Friedman. El poder de la prueba de Friedman se calcula en
términos de su eficiencia de poder con relación al ANOVA paramétrico de una vía intrasu-
jetos y depende del número de niveles de la VI: a menor número, menor eficiencia. Para
calcular el tamaño de la muestra para la prueba de Friedman, calcularemos el tamaño d~ la
muestra necesaria para el ANOVA paramétrico de una vía intrasujetos, para el número
de niveles de la VI, el nivel alfa y el poder requerido; multiplicaremos después el tama-
ño de la muestra por la cifra respectiva de la tabla siguiente.

Tabla AVII. 18. Cantidad por la que debe multiplicarse el tamaño de la muestra
sugerido por un ANOVA paramétrico para obtener el mismo poder en
la prueba de Friedman.
Número de niveles Se multiplica el tamaño
de la VI de la muestra por
3 1.40
4 1.31
5 1.26
6 1.22
7 1.20
8 1.18
9 1.16
10 1.15

La regla general consiste en multiplicar el tamaño de la muestra por (t.047x k;l)·donde


k es el número de niveles.

Datos nom;nales
Diseños intrasujetos: Q de Cochran. Si la medida tomada resulta dicotómica, por ejem-
plo, sí o no, puede usarse la Q de Cocbran. Sin embargo, si no lo es, cabe recodificar los
datos para volverlos dicotómicos, como se muestra más adelante. Un grupo de investiga-
dores deseaba comparar las elecciones de los estudiantes de psicología social, de métodos de
investigación y de temas de historia para ver si algunos módulos eran más populares que
otros. Se recomienda realizar la prueba con al menos 16 participantes. Los investigadores
preguntaron a 16 participantes cuáles módulos escogieron. Doce seleccionaron psicolo-
gía social; ocho, métodos, y seis, temas de historia. La Q de Cochran requiere variables
dicotómicas; por ello, los datos deben registrarse como variables ficticias, en las cuales 1
indica que el estudiante tomó el curso y Oque no lo hizo (tabla AVll.l9).
_,,,

Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡-465"

Tabla AVII.19. Módulos elegidos por 16 estudiantes y codificados como variables


ficticias.

Participante Psicología social Métodos de investigación Temas de historia


1 1 o o
2 1 1 o
3 o 1 o
4 1 1 1
5 o 1 1
6 1 o o
7 1 1 1
8 o 1 1
9 1 o o
10 1 o o
11 o o o
12 1 o o
13 1 1 o
14 1 o o
15 1 o 1
16 1 1 1

La Q de Cochran puede calcularse mediante un ANOVA de una vía intrasujetos según el


método que se muestra en páginas anteriores del apéndice. Obtendremos así los detalles ne-
cesarios para calcular de la forma siguiente la Q:
Suma de cuadrados del tratamiento
Q = Media de cuadrados intrasujetos

..
Tabla AVII.20. Tabla resumen de un ANOVA de una vía intrasujetos para calcular
la. Q de Cochran .

Suma de Media de
Fuente gl cuadrados cuadrados Prueba F Valor P
Entre sujetos 15 3.917 0.261 1.145 0.362
lntrasujetos 32 8 0.25
tratamientos 2 1.167 0.583 2.561 0.094
residuo 30 6.833 0.228
Total 47 11.917
466l~-------------------------A~p_é_nd_i_ce_s______________________________

-Q = 1.167
0.25
= 4.668
Con un tamaño de muestra por lo menos tan grande como ése, Q se distribuye como conx?
gl =número de niveles de la VI, menos uno. En el ejemplo, gl = 3 - 1 =-2. De consultar las
tablas de distribución de x2 del apéndice XIV, veremos que 0.05 < p < 0.1. De ahí conclui-
mos que no había elementos suficientes para rechazar la hipótesis nula de que el número
de estudiantes que eligiera cada uno de Jos módulos sería el mismo.

111
VIII
Análisis de diseños con más
de una variable independiente

En este apéndice se exponen las técnicas presentadas en el capítulo 17.

ANOVA de dos vias entre sujetos


Un conjunto de investigadores estudió el efecto sobre el recuerdo de cierta estrategia nemo-
técnica y la naturaleza de la lista de palabras recordadas.

Tabla AVIII.1. Número de palabras recordadas por los participantes al recibir una
estrategia nemotécnica y un tipo de lista.
Tipo de lista
Palabra Palabra
Estrategia gancho gancho
nemotécnica Control vinculada Ubicación Control desvinculada Ubicación
10 9 9 4 10 8
10 10 11 6 7 8
11 10 11 7 8 8
11 12 10 7 8 9
13 12 12 8 9 11
Total 55 53 53 32 42 44
Media 11 10.6 10.6 6.4 8.4 8.8
Varianza 1.5 1.8 1.3 2.3 1.3 1.7
DE 1.22474 1.34164 1.14018 1.51658 1.14018 1.30384

------------------------------------------~~--------~467
46:BlL______________________~A~p~én~d~ic~e~s_____________________________
Media global == 9.3

Varianza global = 4.07931

DE global= 2.01973

Suma total de cuadrados


La suma total de cuadrados es la suma de las desviaciones al cuadrado de cada puntuación
de la media global. Puede calcularse también de la forma siguiente:

Suma total de cuadrados = varianza global x (N- 1)

donde N es el tamaño total de la muestra


Por tanto,
Suma total de cuadrados= 4.079 x (30- 1)
= 118.291

Podemos dividir en las partes siguientes la suma total de cuadrados:

Suma de cuadrados para la primera VI (SCA)


Suma de cuadrados para la segunda VI (SCs)
Suma de cuadrados de la interacción entre ambas VI (SCAB)
Suma de cuadrados intragrupos (residual o error, que es el término de error de las otras tres
sumas de cuadrados) (SCerror).

Suma de cuadrados entre grupos para V/ 1


Calcular la media de cada nivel de VI 1 (lista), independientemente de los niveles de VI2
(nemotécnica). Por tanto,
55+ 53+ 53
Media de las listas vinculadas = - - -- -
15

161
15 .

= 10.73333
_______________ A
_n_á_li_sis__
de__
di_se_ñ_o_s_co_n_m
__ in_d~ep~e_n_
ás_d_e_u_n_a_v_a_ria_b_le__ dt_·e_
nt_e_______J~

Tabla AVIII.2. Cálculo de la suma de desviaciones al cuadrado entre grupos para la


primera variable independiente en un ANOVA de dos vías de 2 x 3 entre
sujetos.

Desviación (desviación)2 x número


de la media de puntuaciones que
Lista Media global (9.3) (desviación)2 contribuyen a cada media (15)
Vinculada 10.73333 1.43333 2.05444 30.81667
Desvinculada 7.86667 -1.43333 2.05444 30.81667
S de e entre 61.63334
grupos para Vl 1

Observe que, cuando hay dos valores, cada uno se desvía de su media en la misma medi-
da: uno positivamente y el otro de manera negativa.

Suma de cuadrados entre grupos para V/ 2


La suma de cuadrados entre grupos para VI 2 se calcula con la técnica utilizada para la su-

- ma de c'l!adrados para VI 1.

Tabla AVIII.3. Cálculo de la suma de desviaciones al cuadrado de la segunda variable


independiente en un ANOVA de dos vías de 2 x 3 entre sujetos.

Desviación de (desviación) 2 x número de


la media puntuaciones que contribuyen
Nemotécnica Media global (9.3) (desviación) 2 a cada media (10)
Control 8.7 - 0.6 0.36 3.6
Palabras gancho 9.5 0.2 0.04 0.4
Ubicación 9.7 0.4 0.16 1.6
S de e entre 5.6
grupos para V1 2

Suma de cuadrados de La interacción (SCA 8)
La suma de cuadrados de la interacción (SCAB) se obtiene calculando la suma de desviacio-
nes al cuadrado de las medias relacionadas con la interacción (la suma de cuadrados entre
celdas). En este caso, en la interacción intervienen las seis medias de los diferentes grupos.
Para calcular la suma de cuadrados de la interacción se restan las sumas de cuadrados de los
efectos principales que participan en la interacción de la suma de cuadrados entre celdas:

SCAB = VI 1 por S de C de celdas de VI 2 - (SCA + SC8 )


470'l Apéndices

Tabla AVIII.4. Cálculo de la suma de cuadrados de la celda de Vl 1 por la de Vl 2 en un


ANOVA de dos vías de 2 x 3 entre sujetos.
(desviación)2 x número
Desviación de puntuaciones que
Tipo de de la media contribuyen a cada
lista Nemotécnica Media global (9.3) (desviación) 2 media (5)
Vinculadas Control 11 1.7 2.89 14.45
Palabras gancho 10.6 1.3 1.69 8.45
Ubicación 10.6 1.3 1.69 8.45
Desvinculadas Control 6.4 - 2.9 8.41 42.05
Palabras gancho 8.4 -0.9 0.81 4.05
Ubicación 8.8 -0.5 0.25 1.25
S de C de las 78.70
celdas de Vl 1 por Vl 2

SCAB = 78.7- (61.63334 + 5.6)


= 78.7-67.23334
= 11.46667

Suma de cuadrados intragrupos (residual)


Como hemos visto, la suma de cuadrados intragrupos (residual) se calcula obteniendo la su-
ma de las desviaciones al cuadrado de cada grupo y sumándolas todas. Recuérdese:
Suma de cuadrados (SC) = varianza x (n - 1)
scrcsidual = (J.5 X 4) + (1.8 X 4) + (J.3 X 4) + (2.3 X 4) + (J.3 X 4) + (l.7 X 4)
= 6 + 7.2 + 5.2 + 9.2 + 5.2 .J.. 6.8
=39.6
Como es usual, la suma de cuadrados residual también puede calcularse restando todas las
otras sumas de cuadrados de la suma de cuadrados total (SC10ta1) :

seresidual = sctotal - (SCinteracción + seA + SCs)


= 118.291 - (11.46667 + 61.63334 .J.. 5.6)
= 118.291 - 78.70001
= 39.59099
Ahora que hemos calculado la suma de cuadrados de todos los aspectos del diseño pode-
mos crear la tabla resumen del ANOVA; en el capítulo 17 se indica cómo calcular los gra-
dos de libertad, las medias de cuadrados y los valores F (razones F).
_______________A_n_á_li_
si_s_de__
di_se_ñ_o_s_co_n_m
__ in_d~ep~e_n_d_ie_nt_e______~~
ás_d_e_u_n_a_v_a_ri_ab_le__

Tabla AVIII.S. Tabla resumen de un ANOVA de dos vías de 2 x 3 entre sujetos.

Fuente gl Si.Jma de cuadrados Media de cuadrados Valor F Valor P


Lista 1 61.633 61.633 37.354 0.0001
Nemotécnica 2 5.600 2.800 1.697 0.2045
Lista* nemotécnica 2 11.467 5.733 3.475 0.0473
Residual 24 39.600 1.650
Dependiente: recuerdo

ANOVA de dos vías intrasujetos


Los participantes recomendaron en una de las situaciones siguientes la duración de la senten-
cia que un criminal debía cumplir solo, comunicándose con otros mediante una computadora
y en presencia de otros. Además, debían sentenciar a dos tipos de acusados: sin antecedentes
penales (novatos) y habituales (expertos).
La suma total de cuadrados puede dividirse en dos: la suma de cuadrados entre sujetos
y la suma de cuadrados intrasujetos. Esta última puede dividirse a su vez en:

Suma de cuadrados para VI 1 (acusado) (SeA)


Suma de cuadrados para VI¡ por sujetos (término de error para seA (SeAS)
Suma de cuadrados para VI 2 (situación) (Se8 )
Suma de cuadrados para VI2 por sujetos (término de error para se8 ) (Se8 s)

Suma de cuadrados para la interacción entre VI 1 y V~ (SeAB)


Suma de cuadrados para VI 1 y VI2 por sujetos (término de error para SeAB) (SeABS)

Tabla AVIII.6. Sentencias (expresadas en meses) impuestas a los criminales de acuerdo


con sus antecedentes y con las condiciones en que se tomó la decisión.

Acusado
Novato Cara Experto Cara Media por
Participante Solo computadora a cara Solo computadora a cara participante
1 12 14 16 16 18 20 16
2 14 14 15 14 18 22 16.16667
3 13 13 17 17 17 21 16.33333
4 14 13 17 16 16 19 15.83333
5 13 14 16 17 19 21 16.66667
Media 13.2 13.6 16.2 16.0 17.6 20.6 16.2
Varianza 0.7 0.3 0.7 1.5 1.3 1.3
DE 0.83667 0.54772 0.83667 1.22474 1.14018 1.14018
472lL________________________A~p_én_d_ic_e_s_____________________________
Suma total de cuadrados
Como es usual, la suma total de cuadrados constituye la suma de las desviaciones al cua-
drado de cada puntuación de la media global (16.2), es decir, representa el cálculo de la su-
ma de las desviaciones al cuadrado de cada puntuación de la media global. En este caso, el
valor es 208.8.

Suma de cuadrados entre sujetos


La suma total de cuadrados entre sujetos es la suma de las desviaciones al cuadrado de la
puntuación media de cada participante de la media global, multiplicada por el número de
condiciones que contribuyen a las medias (en este caso, 6).

Tabla AVIII. 7. Cálculo de la suma de cuadrados entre sujetos para un ANOVA de dos
vías de 2 x 3 intrasujetos.

Desviación (desviación) 2 x número


de la media de puntuaciones que
Participante Media global (16.2) (desviación) 2 contribuyen a cada media (6)

1 16 -0.2 0.04 0.24

2 16.16667 -0.03333 0.00111 0.00665

3 16.33333 0.13333 0.01778 0.10668

4 15.83333 -0.36667 0.13445 0.8067

5 16.66667 0.46667 0.21778 1.30668

S de Centre 2.46671
sujetos

Suma de cuadrados de V/ 1 (SC A)


La suma de cuadrados de VI 1 (SCA) se calcula encontrando la media (entre participantes y
en todos los niveles de VI2) para cada nivel de VI 1 (acusado) y calculando la suma de des-
viaciones al cuadrado de las medias de los niveles.
Como conocemos las medias de cada condición y sabemos que cada una de éstas tie-
ne el mismo número de puntuaciones, podemos calcular la medía de cada nivel de VI 1 de
la manera siguiente:
_______________A_n_á_li_si_s_de__
di_se_ñ_o_s_co_n_m
__ in_d_ep~e_n_d_ie_nt_e______~~
ás_d_e_u_n_a_v_a_ri_ab_le__

13.2 + 13.6 + 16.2


Media novatos = - - - -- - - --
3

43
3

= 14.33333

16+ 17.6+20.6
Media expertos =
3

54.2
3

= 18.06667

Tabla AVIII.8. Cálculo de la suma de cuadrados para la primera variable


independiente en un ANOVA de 2 x 3 intrasujetos.

(desviación) 2 x número
Desviación de puntuaciones que
de la media contribuyen a
Acusado Media global (16. 2) (desviación) 2 cada media (15)
Novato 14.33333 - 1.86667 3.48446 52.26685
Experto 18.06667 1.86667 3.48446 52.26685
S de C de V1 1 104.5337

Suma de cuadrados de V/ 1 por sujetos (SC As)


El primer paso para obtener la suma de cuadrados de Vl 1 por sujetos (SCAS) consiste en
calcular las medias de las celdas de los sujetos por Vl 1. De esa manera, la media de la cel-
da del primer participante para los acusados novatos es:

12+14+16 = 14
3

Podemos calcular la suma de cuadrados para los sujetos de las celdas de Vl 1 como se indi-
ca en la tabla AVIII.9.
4J4l Apéndices

Tabla AVIII. 9. Cálculo de la suma de cuadrados de la celda de Vl 1 por sujetos en un


ANOVA de dos vías de 2 x 3 intrasujetos.

(desviación)2 x número
Media Desviación de de puntuaciones que
de la la media contribuyen
Acusado Participante celda global (1 6.2) (desviación)2 a cada media (3)
Novato 1 14 - 2.2 4.84 14.52
2 14.33333 - 1.86667 3.48444 10.45333
3 14.33333 -1.86667 3.48444 10.45333
4 14.66667 -1.53333 2.35111 7.05333
5 14.33333 - 1.86667 3.48444 10.45333
Experto 1 18 1.8 3.24 9.72
2 18 1.8 3.24 9.72
3 18.33333 2.13333 4.55111 13.65333
4 17 0.8 0.64 1.92
5 19 2.8 7.84 23.52
S de C de las celdas 111.46665

Puede calcularse la suma de cuadrados de la celda de VI 1 por sujetos (SeAs) con la fóimu-
la siguiente:

seAS= S de e de la celda de VI] por sujetos- (SeA+ S de e entre sujetos)

Por tanto:

S de e de acusados por sujetos = 111.46665 - (1 04.5337 + 2.46671)


= 111.46665 - 107.00041

= 4.46624

Suma de cuadrados de V/2 (SC 8)


La suma de cuadrados de VI2 (Se8 ) se calcula a partir de la suma de las desviaciones al
cuadrado de las medias de los niveles de la segunda variable independiente, entre partici-
pantes y niveles de la primera VI.
La media del pri~er nivel de VI2 se calcula como sigue:
Análisis de diseños con más de una variable independiente ~

Tabla AVIII.10. Cálculo de la suma de cuadrados de la segunda variable independiente


en un ANOVA de dos vías de 2 x 3 intrasujetos.

Desviación (desviación)2 x número


de la media de puntuaciones que
Condición Media global (16.2) (desviación)2 contribuyen a cada media (10)
Solo 14.6 -1.6 2.56 25.6
Computadora 15.6 - 0.6 0.36 3.6
Grupo · 18.4 2.2 4.84 48.4
S de C de Vl2 77.6

Suma de cuadrados de V/2 por sujetos (SC 8 sJ


De nuevo, calculamos las medias de las celdas de VI2 por celdas de sujetos y la suma de
las desviaciones al cuadrado de las celdas:

Tabla AVIII. 11. Cálculo de la suma de cuadrados de las celdas de Vl 2 para un ANOVA
de dos vías de 2 x 3 intrasujetos.

Desviación (desviación)2 x número


Media de la media de puntuaciones que
de la global contribuyen a cada
Condición Participante celda (16.2) (desviación)2 media de la celda (2)
Solo 1 14 - 2.2 4.84 9.68
2 14 - 2.2 4.84 9.68
3 15 - 1.2 1.44 2.88
4 15 - 1.2 1.44 2.88
5 15 -1 .2 1.44 2.88
Computadora 1 16 - 0.2 0.04 0.08
2 16 -0.2 0.04 0.08
3 15 - 1.2 1.44 2.88
4 14.5 -1.7 2.89 5.78
5 16.5 0.3 0.09 0.18
Grupo 1 18 1.8 3.24 6.48
2 18.5 2.3 5.29 10.58
3 19 2.8 7.84 15.68
4 18 1.8 3.24 6.48
5 18.5 2.3 5.29 10.58
S de e de la celda 86.8
476lL_______________________A~p_
én_d_ic_e_s___________________________

Podemos calcular la suma de cuadrados de~ por sujetos (SCBs) con la fónnula siguiente:

SC8 s =S de e de la celda por sujetos de VI2 - (S de e de VI2 + S de e entre sujetos)

Por ello,

S de e de la condición por sujetos = 86.8 - (77 .6 + 2.46671)


= 86.8 - 80.06671

= 6.73329

Suma de cuadrados de la interacción de V/ 1 por V/2 (SCAaJ


Este valor puede obtenerse calculando primero las medias de las celdas de cada condición,
las cuales se muestran en la tabla AVIII.6.
Posteriormente se calcula la suma de desviaciones al cuadrado de dichas medias:

Tabla AVIII.12. Cálculo de la suma de cuadrados de la celda de V1 1 por Vl 2 en un


ANOVA de dos vías de 2 x 3 intrasujetos.

(desviación) 2 x número
Media Desviación de puntuaciones que
de la de la media contribuyen a cada
Acusado Condición celda global (1 6.2) (desviación) 2 media de la celda (6)
Novato Solo 13.2 -3 9 45
Computadora 13.6 - 2.6 6.76 33.8
Grupo 16.2 o o o
Experto Solo 16.0 -0.2 0.04 0.2
Computadora 17.6 1.4 1.96 9.8
Grupo 20.6 4.4 19.36 96.8
S de C de la celda 185.6
de Vl 1 por Vl 2

La suma de cuadrados de VI 1 por VI2 (SeAB) puede calcularse con la fórmula siguiente:

SeAB =S de e de la celda de VI 1 por VI2 - (SeA+ Se8 )

= 185.6 - (104.5337 + 77.6)


~¡¡

Análisis de diseños con más de una variable independiente !477


= 185.6- 182.1337

= 3.4663

Suma de cuadrados por sujetos de V/ 1 por V/2


La suma de cuadrados por sujetos de VI 1 por V~ se obtiene calculando la suma total de
cuadrados, la cual es la misma que la suma de cuadrados de las celdas de VI 1 por~-
La suma de cuadrados de VI 1 por~ por sujetos (SCABs) se calcula como sigue:

SCABS = sctotal- (SCA + SCB + SCAB + SCAS+ SCss + SCs)

donde A es VI 1
Bes VI2
ABes la interacción entre VI 1 y VI2
AS es la interacción entre VI 1 y los sujetos
BS es la interacción entre VI2 y los sujetos
S son los sujetos

Por tanto,

SCABS = 208.8- (104.5337 + 77.6 + 3.4663 + 4.46624 + 6.73329 + 2.46671)

= 9.53376

Ahora podemos crear la tabla resumen del ANO VA. En el capítulo 17 se explica cómo calcu-
lar los grados de libertad, las medias de cuadrados y las razones F; en el apéndice IX, cómo
efectuar los ajustes de Greenbouse-Geisser (G-G) y Huynh-Feldt (H-F).

Tabla AVIII.13. Tabla de resumen del ANOVA de dos vías de 2 x 3 intrasujetos.

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados F P G-G H-F
Sujeto 4 2.467 0.617
Acusado 1 104.533 104.533 93.612 0.0006 0.0006 0.0006
Acusado por sujeto 4 4.467 1.117
Contexto 2 77.600 38.800 46.099 0.0001 0.0007 0.0001
Contexto por sujeto 8 6.733 0.842
Acusado por contexto 2 3.467 1.733 1.455 0.2892 0.2946 0.2948
Acusado por contexto 8 9.533 1.192
por sujeto
478lL________________________A~p_én_d_ic_e_s_____________________________
ANOVA de dos vias mixto
Un grupo de investigadores comparó la forma en que los varones y las mujeres evaluaron
eliQ de sus progenitores. La variable independiente, género, tiene dos niveles (varón y mu-
jer) y es entre sujetos; la independiente, progenitor, tiene dos niveles y es intrasujetos, pues
cada participante proporciona datos para cada nivel de tal variable.
La suma total de cuadrados puede dividirse en dos: la suma de cuadrados entre e in-
trasujetos. Ésta puede subdividirse en:

La suma de cuadrados de VI 1 (género) (SCA)


La suma de cuadrados de sujetos intragrupos (el término de error de la suma de cuadrados
de VI 1) (SCS[grupos])
La suma de cuadrados intrasujetos puede subdividirse en:
La suma de cuadrados de VI2 (progenitor) (SC8 )
La suma de cuadrados de VI 1 por VI 2 (interacción entre las dos VI, género por progenitor)
(SCAB)
La suma de cuadrados de VI2 por sujetos intragrupos (el término de error para SC 8 y SCAB)
(SCA por S [grupos])

Tabla AVIII. 14. Estimaciones que varones y mujeres efectuaron respecto a los IQ de
sus progenitores.
Progenitor
Género del Medi a del Media del
Participante participante Padre Madre género participante
1 Varón 120 100 110
• 2 Varón 110 90 100
3 Varón 100 105 102.5
4 Varón 105 100 102.5
5 Varón 140 120 130
Media 115 103 109
6 Mujer 11 o 11 o 110
7 Mujer 11 o 105 107.5
8 Mujer 105 11 o 107.5
9 Mujer 120 115 117.5
10 Mujer 100 100 100
Media 109 108 108.5

Media por progenitor 112 105.5


Análisis de diseños con más de una variable independiente lffi
Media global= 108.75
DE global= 10.74526
Varianza global= 115.46053

Suma total de cuadrados (SCtotal)


Como es usual, la suma total de cuadrados (SCtotal) se calcula a partir de la varianza global:

se total = varianza global X (N- 1) -donde N es el número de puntuaciones-


= 115.46053 X 19

= 2193.75007

Suma de cuadrados entre sujetos


La suma de cuadrados entre sujetos se obtiene formando la puntuación media de cada par-
ticipante y calculando la suma de las desviaciones al cuadrado de tales medias:

Tabla AVIII.15. Cálculo de la suma de cuadrados entre sujetos para un ANOVA de dos
vías mixto de 2 x 2.
Puntuación (desviación) 2 x número
media del Desviación de puntuaciones que
IQ de los de la media contribuyen a cada
Participante progenitores global (1 08. 75) (desviación) 2 media (2)
1 11 o 1.25 1.5625 3.125
2 100 - 8.75 76.5625 153.125
3 102.5 -6.25 39.0625 78.125
4 102.5 -6.25 39.0625 78.125
5 130 21 .25 451.5625 903 .125
6 110 1.25 1.5625 3.125
7 107.5 -1.25 1~5625 3.125
8 107.5 - 1.25 1.5625 3.125
9 117.5 8.75 76.5625 153.125
10 100 - 8.75 76.5625 153.125
S de e entre 1 531.25
sujetos
48QlL----------------------~A~p~én~d~ic~e~s_____________________________

Suma de cuadrados de V/ 1 (SCA)


La suma de cuadrados para la VI entre sujetos (género) se obtiene calculando la media del
IQ dada por cada género de participantes, independientemente del progenitor calificado. En
seguida se calcula la suma de las desviaciones al cuadrado de tales medias:

Tabla AVIII.16. Cálculo de la suma de cuadrados para la VI entre sujetos para un


ANOVA de dos vías mixto de 2 x 2.
(desviación)Z x número
Desviación de puntuaciones que
Género del Media estimada de la media contribuyen a cada
participante deliQ global (108.75) (desviación )Z media (10)
Varones 109 0.25 0.0625 0.625
Mujeres 108.5 -0.25 0.0625 0.625
1.25

Suma de cuadrados de los sujetos intragrupos (SCs(grupos))


Este valor se obtiene con la fórmula siguiente:

Ses(grupos) = S de e entre sujetos - SeA


= 1 531.25 - 1.25

= 1530

Suma de cuadrados de V/2 (SC¡J


La suma de cuadrados de VI2 (Se8 ) se calcula de la manera usual para una VI intrasujetos;
se inicia con las medias de IQ de los niveles de la VI (progenitor), independientemente del
género del participante que las proporcionó.

Tabla AVIII.17. Cálculo de la suma de cuadrados de la VI intrasujetos para un ANOVA


de dos vías mixto de 2 x 2.
(desviaciónf x número
Evaluación media Desviación de de puntuaciones que
de los IQ hecha por la media contribuyen a cada
Progenitor los participantes global (1 08. 75) (desviación)Z media (10)
Padre 112 3.25 10.5625 105.625
Madre 105.5 - 3.25 10.5625 105.625
211 .25
_______________An
__á_li_si_s_de__
dr_
·se_ñ_o_s_co_n_ m
__ in_d_ep~e_n_
ás_d_e_u_n_a_v_a_ri_ab_le__ d_
ie_
n_
te______~~

Suma de cuadrados de V/ 1 por V/2 (SCAaJ


El primer paso para obtener la suma de cuadrados de VI 1 por VI2 (SeA8) consiste en calcu-
lar las medias del género por celdas de progenitores. Posteriormente se calcula la suma de
cuadrados de estas medias de las celdas:

Tabla AVIII.18. Cálculo de la suma de cuadrados de las celdas de Vl 1 por Vl 2 en un


ANOVA mixto de dos vías de 2 x 2.

Desviación (desviación) 2 x .número


Género Evaluación de la media de puntuaciones que
de los media de global contribuyen a cada
participantes Progenitor los IQ (108.75) (desviación )2 media (5)
Varón Padre 115 6.25 39.0625 195.3125
Madre 103 - 5.75 33.0625 165.3125
Mujer Padre 109 0.25 0.0625 0.3125
Madre 108 -0.75 0.5625 2.8125
S de C de la celda 363.75
de V1 1 por Vl 2

Ahora podemos obtener la suma de cuadrados de VI 1 por VI2 (SCAB) de la forma siguiente:

SCAB = S de C de las celdas de VI 1 por VI2 - (SeA + SC8 )


= 363.75- (1.25 + 211.25)

= 151.25

Suma de cuadrados de V/ 2 por sujetos intragrupos (SC 8 por S(grupos))


Este valor se calcula de la manera siguiente:

Ses por S(grupos) = Serotal - (SeA+ SCS(grupos) + SCB +seAB)

donde se es la suma de cuadrados


B es VI 2 (progenitor)
S son los sujetos
s (grupos) son los sujetos intragrupos

B por S(grupos) es VI2 por sujetos intragrupos


AB es la interacción entre VI 1 y VI 2 (género por progenitor)
482lL_______________________A~p~én~d~ic~e~s___________________________
O bien, como Ses =SeA + SeS(grupos)

Sea por S(grupos) = setotal - (Ses+ Sea + SeAB)

Por tanto,

Se8 por S(grupos) = 2 193.75007 - ( l 531.25 + 211.25 + 151.25)

= 300.00007

Hemos dividido la suma total de cuadrados en sus partes constitutivas y podemos formar la
tabla resumen del ANO VA. En el capítulo 17 se indica cómo calcular los grados de libertad,
las medias de cuadrados y las razones F, mientras que en el apéndice IX se explica la inter-
pretación de los ajustes G-G y H-F.

Tabla AVIII.19. Tabla resumen de un ANOVA mixto de dos vías de 2 x 2.

Suma de Media de Valor Valor


Fuente gl cuadrados cuadrados F p G·G H·F
Género 1 1.250 1.250 0.007 0.9376
Sujeto (grupo) 8 1 530.000 191.250
Progenitor 1 211.250 211.250 5.633 0.0450 0.0450 0.0450
Progenitor por género 1 151.250 151.250 4.033 0.0795 0.0795 0.0795
Progenitor por sujeto 8 300.000 37.500
(grupo)
IX
Análisis posterior al ANOVA o a xz

En el apéndice se exponen las técnicas presentadas en el capítulo 18.


Siempre que una prueba estadística se usa más de una vez, aumenta la probabilidad de
obtener un resultado estadísticamente significativo, aun con la hipótesis nula de ausencia
de efecto correcta. Es decir, hay mayor peligro de cometer un error tipo J. Puede ajustarse
el nivel a que cierta prueba habría de alcanzar antes de considerar que se ha logrado la sig-
nificación estadística para dar cabida al número de veces que se ha realizado la prueba. Un
método general consiste en el ajuste de Bonferroni.

Ajuste de Bonferroni
Una versión simplificada del ajuste de Bonferroni consiste en dividir el nivel a original en-
tre el número de veces que se repetirá la prueba. De ahí que si se realizaran tres pruebas t y
el nivel a original es de 0.05, el nuevo nivel a contra el que se evaluará cada prueba t será
éste:

0.~ 5 = 0.0167
El método, adecuado para niveles a de 0.05 o menores, es el que se utiliza para calcular los
valores t presentes en las tablas t de Bonferroni, como las incluidas en el apéndice XIV.
La ecuación completa es
1
Nivel a ajustado = 1- (1-a)T
------------------------------------------~----------_J483
'
484lL_________________________A~p_én_d_ic_e_s______________________________
que puede escribirse como

1-Vl-a

donde k es el número de veces que se realizará la prueba.


Por tanto, si la prueba se realiza tres veces,
1
Nivel o: ajustado= 1- (1-0.05)3

.1
= 1-(0.95)3

0.333
= 1- ( 0.95 )

= 1-0.98306

= 0.0169

lo cual es muy cercano a la aproximación que dimos antes (0.0167).

Cont rastes
Cuando se ha realizado un ANO VA, es común que los investigadores deseen comparar tra-
tamientos específicos para ver si resultan estadísticamente distintos entre sí.

Pruebas paramétricas
Cabe usar cierta ecuación estándar en los diseños entre sujetos para calcular un valor t, cu-
ya probabilidad puede probarse. Sin embargo, como se señaló en el capítulo 18, tales con-
trastes son realizables aun si no se lleva a cabo un ANOVA.

Ecuación general de contraste. La versión más general de la ecuación es

Ec. AIX.l

donde ~es la media de uno de los tratamjentos


wj es la ponderación de ~ y depende de la naturaleza del contraste
_________________________A_n_á_li_si_s~p_o_
st_e_ri_o_r_al_A_N_O_V_A_o__a~x~2 --------------~~

MCerror es la media de cuadrados correspondiente al término de error del ANOVA


n1 es el número de puntuaciones que contribuyen a x1
Esto es,

I( w1 x ~) indica multiplicar cada media del contraste por la ponderación correspondiente


y sumar los resultados.

w~
I _!__ indica elevar al cuadrado cada ponderación y dividirla entre el número de participan-

tes del grupo y sumar los resultados.

Contrastes por pares. De comparar sólo dos tratamientos (contraste por par), la ecuación
se simplifica de la manera siguiente:

media 1 -media 2
t= ~==:::!::::e==='== Ec. 18.1
( _.!._ + _!_Jx MCerrar
n1 n2

donde media 1 es la media de una de las condiciones (condición 1)


media2 es la media de la otra co'1dición (condición 2)
n 1 es el tamaño de la muestra del grupo que produjo la media¡
n 2 es el tamaño de la muestra del grupo que produjo la media2
M Cerrar es la media de cuadrados del término de error correspondiente de la razón
F original

La simplificación ocurre porque el contraste requiere que la ponderación de la media 1 sea


igual a 1 y la de la media2 a -1 ; coloque ambas ponderaciones en la ecuación original y ob-
serve qué pasa.
Cuando se realiza un contraste por pares y los dos grupos tienen un número igual de
participantes, la ecuación se simplifica aún más:

media 1 -media 2
t= Ec. 18.2
(~ }Mcerror

donde n es el tamaño de la muestra del grupo que produjo una de las medias.
486lL_________________________A~p~én_d_ic_e_s______________________________
En el capítulo 18 se incluye un ejemplo de contraste por pares. A continuación daremos uno
de contraste no por pares. Utilizaremos el experimento sobre memoria (presentado en los
capítulos 9 y 16) donde se puso a los participantes en una de tres condiciones: condición
control, en la cual no recibieron capacitación; grupo en que se les enseñó a usar palabras
gancho como estrategia nemotécnica; y un grupo en que se les capacitó para emplear un
método de ubicación. Cada grupo contó con lO participantes.

Tabla AIX. 1. Medias y DE del recuerdo de palabras en las tres condiciones de memoria.

Control Palabras gancho Ubicación


Media 7.2 8.9 9.6
DE 1.62 1. 91 1.58

Tabla AIX.2. Tabla resumen del ANOVA de una vía entre grupos sobre datos del recuerdo.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F p

Entre grupos 2 30.467 15.233 5.213 0.0122


lntragrupos 27 78.9 2.922
Total 29 109.367

Si comparásemos ambas técnicas nemotécnicas con la condición control, tendríamos las ci-
fras siguientes:

media 1 (control)= 7.2


media2 (palabras gancho) = 8.9
media3 (ubicación) = 9.6
1o
17( = 172 = 173 =
MCerror = 2.922

Calcularemos en seguida las ponderaciones, con la restricción de que deben sumar cero.
Por tanto, podríamos multiplicar la media 1 por 2, la media2 por - 1 y la media3 por - l. Ello
equivale a contrastar el grupo control con la media de los otros dos grupos; se habría obte-
nido el mismo resultado con ponderaciones de 1, _.!.y _.!._
2 2
------------------------~A~n~á~ll~·sl~·s~p~o~st~e_ri~o_r_a_lA_N_O_V.~~~o~a~x~2--------------~~

Por consiguiente,

ponderación¡ + ponderación2 + ponderación3 = 2 + (-1) + (-1)

=O

La restricción de que la suma de las ponderaciones sea igual a cero (es decir, 2:, w1 =O,
donde w1 es la ponderación de una media concreta) resulta verdadera sólo con los tamaños
de las muestras iguales en los diferentes grupos. Cuando hay tamaños de las muestras desi-
guales, la restricción estriba en que I,(n 1 x w1 )=0, donde n1 es el tamaño de cada muestra.
En el apéndice XVI se indica cómo calcular los coeficientes con los tamaños de las
muestras distintos.
Mediante la ecuación AIX.1 ,

(2 X 7.2 )+( -1 X 8.9)+ (-1 X 9.6)

2.922x[22 + (- 1)2 + (-1)2]


10 10 10

14.4-8.9 - 9.6

4 -1 + -1 J
2.922x ( -+
10 10 10

-4.1
~/2.922 X 0.6
- 4.1
~1.7532
488lL_________________________A~p_én_d_ic_e_s______________________________
-4.1
.JJ.32408

= -3 .096
La forma de medir la significación del resultado depende de si el contraste fue planeado o
no y de si constituyó el único contraste, uno de varios o uno entre muchos. Si se trata de
uno solo, no se requiere otro ajuste. Si es uno de varios ajustes planeados o si hubo unos
cuantos contrastes no planeados, podemos usar la prueba de Bonferroni (basada en el ajus-
te de Bonferroni). Sin embargo, si se trata de uno de muchos ajustes no planeados, emplea-
remos la prueba de Scheffe. Estudiaremos ésta en la sección siguiente.

Otras vers;ones de la prueba de Scheffé


Primer método. En ocasiones, la prueba de Scheffé se ~a como .valor t y en otras como
razón F. Sin embargo, todas las versiones proporcionan la misma protección contra el error
tipo l. En la versión presentada en el capítulo 18 se calcula la razón F que tomaría estadís-
ticamente significativa la razón F del tratamiento original. En el ejemplo de los métodos
nemotécnicos, los grados de libertad correspondientes, necesarios para consultar la tabla F
del apéndice XIV, son 2 y 27. Para lograr una significación estadística en a= 0.05, F ten-
dría que ser al menos 3.35. A fin de calcular el valor critico que t habría de alcanzar, utili-
zamos esta ecuación:

t crítica gltratamiento X F(gltratamiento• g lerror)

= ~2x3.35

= .f6j

= 2.588
Puesto que las tablas F no dan valores negativos, podemos decir que t debe ser igual o ma-
yor que± 2.588 (más menos 2.588). .
Como el valor t obtenido es mayor, en - 3.096, que el valor crítico, concluiríamos que la
condición control produjo menos palabras recordadas que las dos condiciones nemotécnicaS .

• ;l._ _ _
· s~p_o_st_e_ri_o_r_a_lA_N_O_V._A_o__a~x~2--------------~~
_________________________A_n~á_li_sl_

Segundo método. El segundo método se basa muy estrechamente en el anterior. Podemos


elevar al cuadrado el valor t que calculamos en el contraste para obtener una razón F [re-
cuerde que (t27 / = F1.27] y hallaremos una razón F crítica con la fórmula siguiente:

F crítica = gltratamiento X F(gltratamiento, glerror)


2
En este caso, ello significa que la razón F del contraste es (3.096) = 9.585 y la razón F críti-
ca 6.7. De nueva cuenta, el contraste produce un valor mayor que el crítico para la estadística.

Tercer método. En el tercer método, la razón F crítica es simplemente la que se da para el


tratamiento original, que con 2 y 27 grados de libertad para a= 0.05 es igual a 3.35. Sin em-
bargo, como obtuvimos la razón F en forma distinta, ajustaremos la razón F calculada para el
contraste. Los lectores familiarizados con el álgebra podrán ver por qué se realiza el ajuste:
2
( t para el contraste )
F calculada = .
gl del tratamiento

9.585
2

= 4.793

Nuevamente, el valor calculado es mayor que el critico.

Cuarto método. Siguiendo el mismo razonamiento que nos llevó del primer método al se-
gundo (o a la inversa), podemos decir que el tercero tiene una versión relacionada con un
valor t y no con un valor F. Por ende, la t crítica sería la raíz cuadrada de la F crítica del
tratamiento:

t crítica = ·h.35

= 1.83

Debemos obtener ahora la raíz cuadrada de la razón F que calculamos en el tercer método.
Por tanto, ésta es la t calculada:

2
( t original para el contraste )
gl del tratamiento
4901 Apéndices
~------------------------~----------------------------------

que equivale a
t original para el contraste
~gl del tratamiento
3.096
= li
= 2.1 89

El resultado es, de nuevo, mayor que el valor crítico. De los cuatro métodos, el primero y
el segundo parecen los más directos, y como muchas pruebas de contraste se basan en la
misma ecuación de la prueba t, el primero de ellos es consistente con las demás pruebas.

Pruebas de contraste por pares


Como se señaló en el capítulo 18, las ecuaciones para contrastes de t son adecuadas en di-
seños entre sujetos sólo con varianzas homogéneas de los subgrupos. Si la varianza mayor
resulta más pequeña que la menor multiplicada por tres (y si se tienen submuestras del mis-
mo tamaño), consideraríamos suficientemente homogéneas las varianzas. Sin embargo, si
éstas son más dispares, usaremos la prueba t para varianzas independientes (prueba t de
Welch) presentada en el apéndice VI. Los diseños intrasujetos plantean un problema dife-
rente, pues deben tener esfericidad (capítulo 16 y apéndice VII). Por tanto, para asegurar-
nos y ser coherentes con la mayoría de los programas de computadora, se aconseja usar para
el contraste la ecuación de la prueba t estándar intrasujetos.
En el caso de la varianza heterogénea y en el del diseño intrasujetos, al buscar el valor
crítico de t para realizar un contraste, se usan los grados de libertad utilizados en la versión
de la prueba t calculada. En cuanto al diseño intrasujetos, éste será igual al número de par-
ticipantes, menos uno. Por lo que concierne a las varianzas independientes, se empleará la
ecuación para los gl dada en el apéndice VI (la AVI.4).

Newman-Keuls. La prueba de Newman-Keuls sigue un principio similar al de la DHS de


Tukey, presentada en el capítulo 18. En ésta, la t calculada debe alcanzar un valor crítico
basado en el número de medias que participarán en el conjunto (o familia) de contrastes.
A fin de calcular la DHS de Thkey, búsquese el valor q crítico en las tablas de la esta-
dística de rango estudentizado, expuesta en el apéndice XIV, para el número de medias que
participan en el contraste y los gl de error (o los gl para la prueba ten los casos de diseños
intrasujetos y varianza independiente). En la ecuación siguiente, sustitúyase la q por el va-
lor encontrado:

'.
t cnt1ca = .fi
q
_________________________A
_n_á_ll_.sl_·s~p_o_st_e_n_·o_r_a_lA_N_O_V._A__o_a~x~2--------------~~

En la DHS de Tukey, ese valor crítico se utiliza para evaluar todos los valores.,t calculados
en la familia de contrastes.
En la prueba de Newman-Keuls, las medias se ordenan por tamaño y el valor q depen-
de del número de medias que participan en el contraste particular (su rango). Por ejemplo,
ordenaríamos como sigue las medias del experimento nemotécnico:

Control Palabras gancho Ubicación


7.2 8.9 9.6

La comparación entre las medias de ubicación y control abarca tres medias (incluidas las
dos del contraste); por ello, buscaremos la q con tres medias en la tabla de la estadística de
rango estudentizado del apéndice XIV. Éste nos indica que para gl = 24, q = 3.53 y para gl =
30, q = 3.49. En este caso, como los gl que deseamos en realidad se hallan a medio camino
24 30
entre dichos valores ( ; = 27 ), podemos usar una forma simple de interpolación a fin
de calcular el valor q para gl = 27; tomando la media de las dos q:

q= 3.53;3.49 =3 .51

Por tanto,
3.51
t crítica = .fi

3.51
1.4142

= 2.482

Que es la misma que encontraríamos si usáramos la DHS de Tukey.

Para emplear la prueba de Newman-Keuls a fin de comparar la media de control con la de


palabras gancho y la de éstas con la de ubicación, las medias abarcan dos medias en ambos
casos. Por consiguiente, no necesitamos q para hallar el valor crítico de t; podemos utilizar
las tablas t estándar, con gl = 27. En este caso, el valor crítico de tes 2.052.
La DHS de Tukey puede considerarse conservadora y, por tanto, carece de poder en
comparación con la prueba de Newman-Keuls. Ésta puede ser a su vez demasiado liberal
y, en consecuencia, propensa a producir un error tipo 1 si se usa para probar contrastes entre
más de tres medias.
492l~-------------------------A~p_én_d_ic_e_s______________________________

Diferencia totalmente significativa de Tukey. La prueba de diferencia totalmente signifi-


cativa de Tukey (DTS) puede considerarse un compromiso entre la DHS de Tukey y la
prueba de Newman-Keuls. Para calcular su valor crítico, tomaremos la media de la t críti-
ca de la DHS de Tukey y el valor t crítico de Newman-Keuls. Así, para los contrastes en
que participan dos medias (control versus palabras gancho y palabras gancho versus ubica-
ción), la t crítica con el uso de la DTS de Tukey es:
, . 2.482+2.052
t cntlca =
2

= 2.267

Diferencia mínima protegida significativa de Fishet: La diferencia mínima protegida sig-


nificativa de Fisher (DMPS) constituye quizá la prueba más liberal y, por ello, no suele re-
comendarse. Sin embargo, supone una restricción, según la cual no debe realizarse a menos
que la respectiva razón F del ANOVA sea estadísticamente significativa. Tras satisfacer
dicho principio, se busca la t crítica en las tablas t estándar, con los grados de libertad para
el término de error, y cada t calculada se compara con la ecuación usual para los contras-
tes por pares. En el presente caso, la t crítica es por tanto 2.052. Así, la prueba no tiene en
cuenta el número de contrastes; por Jo mismo, a pesar de su restricción inicial, no se acon-
seja utilizarla con más de tres contrastes.

Ortogonalidad
Como se indicó, en cada contraste, cuando los tamaños de la muestra resultan iguales, la
suma de ponderaciones debe ser igual a cero; es decir,

Algunos expertos en estadística sostuvieron en el pasado que las comparaciones deben ser
independientes entre sí porque tratamos de encontrar cuánto contribuye a los contrastes la
suma global de cuadrados. La suma de cuadrados de cada tratamiento puede dividirse en
tantos contrastes independientes como grados de libertad haya para el tratamiento. En el
ejemplo nemotécnico hay 2 gl para el tratamiento y, por tanto, pueden hacerse dos contras-
tes independientes. Si los contrastes resultan independientes, se dice que son ortogonales.
Si son ortogonales (y los tamaños de las muestras iguales), entonces

donde j se refiere a la media para que la ponderación resulte adecuada y a y b son dos con-
trastes diferentes.
• ----------------------~A~n~á~li~si~s~p~os~te~r~io~r~a~l~A~N~O~VA~o~a~x~2--------------~~
Si los tamaños de la muestra no son iguales,

donde nj es el tamaño de la muestra que produjo la media).


Para explicar la ecuación, cuando los tamaños de la muestra son iguales, utilizaremos
un ejemplo. El tratamiento nemotécnico permitirá sólo dos contrastes ortogonales -inde-
pendientes- (como la VI tiene tres niveles, hay dos grados de libertad en la razón F origi-
nal. Así, para que el conjunto de contrastes sea ortogonal, puede haber únicamente dos de
ellos en el conjunto).

Tabla AIX.3. Ponderaciones de un conjunto de contrastes ortogonales cuando los


tamaños de la muestra son iguales.

Tratamiento
Ponderación Control Palabras gancho Ubicación Suma

• wi1 w 11 =O w21 = 1 w31 = -1 o


wi2 w 12 = 2 w22 = - 1 w32 = - 1 o
w 11 x w 12 =O w21 x w22 = -1 w 31 x w32 =1 o

El primer contraste de la tabla se haría comparando la media de las palabras gancho con la
de la ubicación. Obsérvese que no es posible realizar simplemente comparaciones por pa-
res entre todas las medias y mantener las ponderaciones ortogonales.

Pruebas no paramétricas
Datos por lo menos ordinales. Diseños entre sujetos: después de un ANOVA de Kruskal-
Wallis
En el capítulo 16 y en el apéndice VII se presenta un ejemplo donde 24 catedráticos
recibieron un ensayo para evaluar; se les informó que el autor era un varón o una mujer, o
bien, no se les indicó el género. En realidad, se dio el mismo texto a todos. Los partici-
pantes asignaron a los escritos una calificación entre C- y A+, la cual se convirtió en
numérica (entre l y 9). La prueba que explicaremos se usa sólo si el ANOVA de Kruskal-
Wallis inicial es estadísticamente significativo y si se utilizaron al menos cinco personas
en cada grupo. Sin embargo, aunque el resultado no revistió significación e~~. 911plea~

. . . . .....
remos el ejemplo para pormenorizar la técnica. .;. .~....•-..". ·. ~. . . ··•
; · ·;'·~....
494lL_______________________~A~pe~·n~d_ic~e~s_____________________________
En el cálculo de la prueba de Kruskal-Wallis se asigna un rango a cada grado. En el
apéndice VII se mostró que las tres condiciones tenían los rangos totales siguientes, de don-
de se derivaron los rangos medios (de ocho participant07es por gmpo):

Tabla AIX.4. El rango total y el medio de las calificaciones que los participantes
asignaron al ensayo según el supuesto género del autor.

"Género" del autor


Mujer Neutro Varón
Rango total (R) 76. 5 110 113.5
Rango medio (R) 9.5625 13.75 14. 1875

Puede probarse la diferencia entre dos de los rangos medios mediante una ptueba z, en la cual:

donde N es el tamaño total de la muestra


n 1 y n2 los tamaños de las dos sub muestras del contraste.

Por tanto, si comparamos la condición masculina y la femenina del ensayo,

14.1875-9.5625
z=
( 241~ 25) ~ + ~)
X (

4.625

~50x±
- 4.625
- ~12.5
4.625
3.53553

= 1.308
________________________A~n~á~li~si~s~p~os~t~er~io~r~a~l~A~N~O_VA~o~a~x~2--------------~~

Sin embargo, debemos ajustar el nivel a para tener en cuenta el número de condiciones por
contrastar. Éste es el ajuste:

. d a
a aJusta a = k X
(
k -1
)

donde k es el número de niveles de la VI.

En consecuencia, si establecemos a para la familia de tres contrastes en 0.05, entonces, pa-


ra que cada contraste sea estadísticamente significativo, debe tener una probabilidad de

. d 0.05
a aJusta a = x
3 2

= 0.0083

Las probabilidades incluidas en las tablas z son pare. pruebas de una cola. Por ello, si bus-
cáramos una z que produjese una probabilidad de dos colas de 0.05, buscaríamos una z
que arrojara una probabilidad de una cola de 0.025 o %·
En el presente caso, hacemos un
ajuste que tiene en cuenta el número de contrastes por pares que se realizarán. El número
kx(k -1 )
de contrastes por pares efectuables de k niveles de una VI será siempre de .
2
A fin de realizar el ajuste, dividiremos la probabilidad deseada para la familia de contras-
a
tes entre el número de posibles contrastes. En otras palabras, dividiremos 2 entre
kx(k-1)
. Alge-

t ).
2
braicamente, ello se convierte en Por tanto, podemos encontrar el valor z apropiado
k X k -1

que produciría esa probabilidad de dos colas calculando un valor z de una cola en las tablas
z del apéndice XIV. Éstas nos indican que la z crítica es 2.395, mayor que la z calculada.

Corrección de empates. A semejanza de la prueba de Kruskal-Wallis, cuando algunas pun-


tuaciones son iguales, existe una versión más exacta de la prueba en la cual se ajustan los
empates. En el presente ejemplo, en cinco lugares los grados empataron, y las operaciones
hechas en el apéndice VII mostraron que la corrección total fue de 894.

((N t ¡)l-(,0~':(~"-'r' l ~. ~,) H


R-R
z (corregida para empates)= r=====================
1 2

+ +
496l~-------------------------A~p_é_nd_i_ce_s______________________________

14.1875-9.5625

((~J225) _(~))X(.!.+.!.)
J2 23 X 8 8

4.625

~(so- 3.23913) x .¡
4.625
~11.69022

4.625
3.4 1909

= 1.353

Como ese valor es menor que el crítico de z, no podemos concluir que hay una diferencia
en la forma en que los catedráticos evaluaron los ensayos cuando se les indicó que los ha-
bía escrito un hombre y cuando se les dijo que correspondían a una mujer.

Diseños intrasujetos: después de un ANO VA de dos vías de Friedman. En el capítulo 16


y en el apéndice VII se presenta un ejemplo donde un equipo de investigadores deseaba ver
si un grupo de siete estudiantes evaluaban de manera distinta un curso conforme pasaban
más tiempo en él. A cada estudiante se pidió evaluar el curso de acuerdo con una escala de
siete puntos (desde no disfrutable hasta muy disfrutable) en tres ocasiones: después de una
semana, después de cinco y después de 1O.

Tabla AIX.5 . Rangos medios y totales para las evaluaciones asignadas al curso.

Semanas del curso


Una Cinco Diez
Rango total (R) 10 14.5 17.5
Rango medio (R) 1.42857 2.07143 2.5

La prueba de la comparación por pares de los niveles de la variable independiente sigue los
principios del diseño entre sujetos, en cuanto a que debe realizarse sólo si el ANOVA ini-
cial resulta estadísticamente significativo y, mientras el tamaño de la muestra sea de al me-
nos 15, si hay una prueba z cuyo valor puede compararse con el valor z crítico que ajusta

...... A·~o_a~x~2--------------~~
________________________A_n_á_li_si_s~p_os_t_er_io_r_a_l_A_N_O_V~

el nivel a para tomar en cuenta el número de comparaciones que se efectiían. La prueba z

l
se deriva de

R1 - R2
z=
kx(k+l)
nx6

donde m
k es el número de veles de la VI (en este caso, 3)
R1 y R2 son los rangos medios de los dos niveles de la VI que se comparan

(Hay una versión de la prueba, basada en los rangos totales y no en los medios, pero utiliza-
mQs la otra para ser consistentes con el análisis entre sujetos que presentamos antes.)

En el presente caso,

2.5 - 1.42857
z:=
vw
~

1.07143
~0.2857

= 2.005

Siguiendo los principios para calcular el valor z crítico expuestos sobre el diseño entre suje-
m
tos con una VI de tres veles, la z crítica es 2.395, mayor que la z calculada. Así, no podemos
concluir que las opilliones de los estudiantes acerca del curso hayan cambiado entre la primera
y la décima semana.
No parece haber una corrección de empates en la prueba.
1
.._,...

Datos categóricos: particiones en tablas de contingencia


t
Cuando se analiza una tabla de contingencia mayor que una de 2 x 2, pueden realizarse más
análisis mediante una partición para convertirla en varias subtablas de 2 x 2. El ejemplo
que presentamos corresponde a una tabla de 2 x 3. Si se desea efectuar una partición en una
tabla mayor, se encontrarán más detalles en Siegel y Castellan (1988).
Como ejemplo, imaginemos que un grupo de investigadores averiguó las ocupaciones
de 100 personas que interrumpieron sus estudios; 50 de la escuela A y 50 de la B. Encon-
traron la pauta siguiente:
498lL------------------------~A~p~é~nd~i~ce~s~----------------------------
Tabla AIX.6. Ocupaciones de quienes interrumpieron sus estudios en las dos escuelas.

Tiempo completo Medio tiempo Desempleados Total


Escuela A 10 26 14 50
Escuela 8 22 18 10 50
1
Total 32 44 24 100

Los investigadores realizaron una prueba de contingencia de x}, según se describe en el ca-
pítulo 15, y encontraron que l(gl = 2) = 6.621, p = 0.0365. Como ello mostró que las fre-
cuencias de las dos escuelas variaban de manera significativa, decidieron encontrar el
origen de esta significación y efectuaron una partición de la tabla de contingencia.
La pattición implica formar subtablas de 2 x 2. Como cada subtabla tiene un grado de
libertad, pueden elaborarse tantas subtablas como grados de libertad haya en la tabla de con-
tingencia original. Por tanto, en el presente caso, una tabla de 2 x 3 tiene gl = 2; de ahí que
l
puedan practicarse dos particiones. Puede realizarse una prueba en cada partición, pero
se utiliza una ecuación revisada que tiene en cuenta el número original de participantes y
no sólo a aquellos de la partición dada.

Tabla AIX.7. Codificación de las celdas de la tabla AIX.6.

Tiempo completo Medio tiempo Desempleados Total


Escuela A a b e R1
Escuela 8
1
d
1
e f R2
Total c1 c2 c3

La partición inicial Sé realiza en las primeras dos columnas, pero mantenemos los totales
originales de las filas:

Tabla AIX.B. Celdas y totales de la primera partición de los datos de la tabla AIX.6.

Tiempo completo Medio tiempo Total original


Escuela A a b R1
Escuela 8
1
d
1
e R2
Total c1 c2
--------------- -

________________________A_n_á_li_
si_s~p_os_t_
er_io_r_a_l_A_N_O_VA__o_a~x~2--------------~~

De ahí podemos calcular el valor de i mediante la ecuación siguiente:

? _ N2 x((ax e)-(bxd)t
x- (1) - R1 x R2 x c1x c2x ( c1+ c2)

donde N es el tamaño de toda la muestra.

Tabla AIX. 9. Primera partición de la tabla de contingencia original.

Tiempo completo Medio tiempo Total original


Escuela A 10 26 50
Escuela 8
1
22 18 50
1

Total 32 44 100

2
( 1ÜÜ )
2
X (( t
1Ü X 18)- ( 26 X 22)
- -'--------'-'-------------'-'----
X (1 ) - 50x50x32x44x76

2
10 ÜÜÜ X ( -392)
267 520 000

1536 640 000


267 520 000

= 5.744

Con la tabla de la distribución de i


encontramos que el resultado es estadísticamente sig-
nificativo en 0.01 < p < 0.02.
Para la segunqa partición es necesario combinar partes de la primera e introducir la co-
lumna omitida de la tabla de contingencia original:

Tabla AIX.10. Elementos de la segunda partición de los datos de la tabla AIX.6.

Tiempo completo
o medio tiempo Desempleados Total original
Escuela A a+b e R1
Escuela 8 d+e t Rz
c3
1

Total C1 + Cz
SOOlL_________________________A~p_én_d_ic_e_s______________________________

?
Podemos calcular después x-con la ecuación siguiente:

Nx ([f x(a + b)]-[ x(d + e)Jr


x2<1) =--~------~~--~~-
R xR xC x(C +C )
C

1 2 3 1 2

Tabla AIX. 11. Datos de la segunda partición de la tabla AIX.6.

Tiempo completo
o medio tiempo Desempleados Total original
Escuela A
Escuela B
36
40
1
14
10
¡· 50
50
Total 76 24

_ 100x ((10 x36) - (14x40)y


2
X (1)- 50x50x24x76
2
lOO X ( -200)
4560 000
400 000
4560 000
= 0.088

De acuerdo con la tabla de distribución del, lo anterior no es estadísticamente significa-


tivo. Por tanto, concluiremos que la escuela A y la B no difieren en cuanto a la proporción
de quienes interrumpieron sus estudios y encontraron empleo, pero que en la primera par-
tición, la B tuvo mayor proporción de personas que trabajaban tiempo completo.

Pruebas de tendencia
En el capítulo 18 se presenta un ejemplo de participantes que ingerían una, dos o tres uni-
dades de alcohol, tras lo cual se registraban sus tiempos de reacción; hubo ocho participan-
tes por grupo.

Tabla AIX.12. Medias y DE de los tiempos de reacción (expresados en décimas


de segundo) por el número de unidades de alcohol consumidas.

Unidades de alcohol consumidas


Una Dos Tres
Media 151.25 163.38 168.75
DE 14.12 10.53 12.94
• ----------------------~A~n~á~li~si~s~po~s~te~n-·o~r~a~l_A_N~O~VA~o~a~x~2--------------~~

o
-o
190
e
~
on
(j) 180
"'(j)
-o
"'"'
E 170

• QI
~
e: 160
·O

u
"'~ 150
G>
-o
"'a.
o 140
E
G>
F 130
Una Dos Tres
Unidades de alcohol
Figura AIX.1. Tiempos medios de reacción (expresados en décimas de segundo)
por el número de unidades de alcohol consumidas.

La media forma una pauta en que a mayor cantidad de alcohol consumido, mayor tiempo
de reacción. Sin embargo, no forma una línea recta. Si el efecto del tratamiento no es esta-
dísticamente significativo, se toma innecesario un análisis de tendencias. En este caso, el
análisis preliminar revistió significación estadística.

Tabla AIX.13. Tabla resumen del ANOVA entre sujetos acerca del efecto del alcohol
en los tiempos de reacción.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F


Entre grupos 2 1285.75 642.875 4.039
lntragrupos 21 3342.875 159.185 p = 0.0328
Total 23 4628.625

Ecuación general para el análisis de tendencias


Para realizar un análisis de tendencias se crea una suma de cuadrados de la tendencia que
se prueba de acuerdo con la ecuación siguiente:

Ec. AIX.2
5o2l Apéndices

donde X¡ es la media de uno de los tratamientos


Cj es el coeficiente de X¡ y depende de la naturaleza de la tendencia
nj es el número de puntuaciones que contribuyen a X¡.

Cuando las submuestras son del mismo tamaño, la ecuación se simplifica:

_nxi(cJX.Y¡Y
SCtendencia- I(cJ) Ec. AIX.3

donde n es el número de participantes en un grupo.

Cada tendencia tiene su propio conjunto de coeficientes y, como la idea consiste en dividir
la suma de cuadrados del tratamiento en sus componentes, aquéllos serán 01togonales. En
el apéndice XVI se presentan los coeficientes de algunas pruebas de tendencia.
Cada prueba de tendencia tiene 1 gl. Por tanto, ya que la media de cuadrados de la ten-
dencia (MC1endcncia) se calcula con la ecuación siguiente:

Metendencia = SCtendencia
al . =
SCtendencia
o tendenc1a

es igual a la SCtendencia·
Una razón F de la tendencia se calcula con esta fómmla:

Razón F de la tendencia = M~~ndencia


error

y la razón F tiene gl = 1 para MC1endcncia y los gl del ténnino de error original en el ANOVA
para el error. Por tanto, en el presente ejemplo, los grados de libertad son 1 y 21. La pro-
babilidad de la razón F de la tendencia puede encontrarse en las tablas F estándar.
Un análisis de tendencia es, de hecho, ejemplo de una prueba de contraste. Para no
contradecir las convenciones, nos hemos referido a coeficientes al hablar acerca del análi-
sis de tendencias. Éstos desempeñan la misma función que las ponderaciones mencionadas
en la descripción de la prueba de contrastes. En este ejemplo concreto, la prueba de la tenden-
cia lineal entre los niveles de alcohol sería la misma que un contraste por pares entre la con-
dición de una unidad y la de tres, pues el coeficiente de dos unidades es Oen la prueba de
tendencia. Sin embargo, tal prueba producirá una razón F, mientras que el contraste genera
un valor t. Por tanto, recordemos que cuando en una razón F los gl del tratamiento = 1,
t= .JF. En el ejemplo, la razónF de la tendencia lineal fue de 7.695, y en este caso, t = 2.774.
Intente usar la ecuación 18.1 para verificar que los contrastes por pares entre una y tres uni-
dades arrojan el mismo resultado.
.. ________________________A_n_á_li_si_s~p_os_t_er_io_r_a_l_A_N_O_VA__o_a~x~2--------------~~

Ajuste para intervalos desiguales


En el ejemplo anterior, los niveles de la variable independiente (unidades de alcohol) au-
mentan en una cantidad regular (una unidad cada vez). Si las unidades no se incrementan
en una cantidad igual, por ejemplo, si son 1, 3, 7 y 15 unidades, deberán ajustarse los coe-
ficientes. En el apéndice XVI se muestra cómo calcular éstos cuando los intervalos entre ni-
veles son desiguales.
11!'!!!- - - -

X
Correlación y confiabilidad )

En el apéndjce se exponen las técnicas presentadas en el capítulo 19.

Correlación no paramétrica: datos por lo menos ordinales


En el capítulo 19 se presentó el ejemplo de _un grupo de investigadores que deseaba explo-
rar la relación entre el tiempo en que los alumnos habían estudiado psicología y el grado
en que la creían una ciencia. Se preguntó a 11 de éstos por cuánto tiempo la habían cursa-
do y se les pidió que evaluaran, en una escala de cinco puntos (de l = nada a 5 = definiti-
vamente es una ciencia), si la consideraban una ciencia.

Tabla AX. 1. Tiempo que los alumnos han estudiado psicología y opinión de éstos
respecto a si es una ciencia.
Años de estudiar Evaluación de la psicología
Participante psicología como ciencia
1 1 1
2 2 1
3 3 2
4 4 3
S S 4
6 1 3
7 2 3
8 3 2
9 4 S
10 S 5
11 6 S

504
___________________________C_
or_r_
el_a_
ci_
ó_n~y_c_
o_
nf_ia_b_il_
id_a_
d ________________~~

Es posible calcular la rho de Spearman y la tau de Kendall convirtiendo en rangos las puntua-
ciones de una variable. Como resulta común en estas pruebas, a las puntuaciones que tienen
el mismo valor (empates) se da un rango medio (véase la explicación de la prueba de rangos
con signo de Wilcoxon en el apéndice VI).

Tabla AX.2. Años de estudiar psicología y opinión sobre si ésta es una ciencia, más los
rangos.
Rango de la Diferencia entre
Año Evaluación Rango del año evaluación rangos (diferencia)2
1 1 1.5 1.5 o o
2 1 3.5 1.5 2 4
3 2 5.5 3.5 2 4
4 3 7.5 6 1.5 2.25
5 4 9.5 8 1.5 2.25
1 3 1.5 6 - 4.5 20.25
2 3 3.5 6 - 2.5 6.25
3 2 5.5 3.5 2 4

-
4 5 7.5 10 - 2.5 6.25
5 5 9.5 10 -0.5 0.25
6 5 11 10 1 1
Total 50.50

Rho de Spearman
De las dos versiones de la rho de Spearman, una es muy directa, pero no corrige los rangos
empatados. La otra sí lo hace y por ello es más exacta cuando hay empates. A continuación
presentamos el método para calcular la primera versión. La segunda se encuentra calculan-
do la correlación producto momento de Pearson de los rangos de los datos. También puede
hallarse mediante una modificación laboriosa de la versión no corregida. Por tanto, si no
contamos con una computadora, conviene usar la técnica siguiente sólo cuando no hay em-
pates. Sin embargo, para ejemplificar su uso, calculamos la rho no corregida a partir de los
datos de la tabla AX.l. Ésta es la ecuación para calcular la rho cuando no hay empates:

6 x (suma de d )
2

rho = l - ---'---------'-
n3 - n
donde n es el tamaño de la muestra.
Por tanto,
rho = 1- 6 x_so.s
(11Y -11
~L--------------------------A~p_é_n_di_c_es________________________________

h - 1- 303
ro- 1331-11
= 1-0.22955

= 0.77

Comprobación de la significación estadística de la rho de Spearman. En el capítulo 19 se


presentó el valor de rho, corregida para empates de 0.762, para la correlación entre los años
que los alumnos habían estudiado psicología y sus actitudes hacia ella como ciencia.
Con un tamaño de la muestra menor que 100 puede usarse la tabla de probabilidades
de rho del apéndice XIV. Cuando la muestra es mayor, hay una ecuación para convertir la
rbo en un valor t:

t = rho x Ec. AX.l

Podemos revisar la significación estadística del resultado mediante las tablas t estándar con
n - 2 grados de libertad, donde n es el tamaño de la muestra.

De manera alternativa, aunque menos precisa, si tenemos acceso a valores de probabilidad


más exactos de z que de t podemos usar la aproximación z:

z= rhox~(n - !) Ec. AX.2

y buscar la probabilidad respectiva en las tablas z.

Tau de Kendall
Para reanalizar los datos del ejemplo anterior no necesitamos convertir las puntuaciones en
rangos; sin embargo, obtendremos el mismo resultado si usamos rangos o las puntuaciones
originales.
La tau de Kendall puede calcularse de diferentes maneras; algunas de ellas son más rá-
pidas que la que presentaremos a continuación, pero se complican cuando hay empates en
ambas variables. El método que utilizaremos puede aplicarse a todas las situaciones.
Para calcular la tau primero construiremos una tabla con los valores de una variable,
en orden numérico, encabezando las filas respectivas, y los valores de la otra variable, tam-
bién en ese orden, señalando las columnas. El valor de cada par de puntuaciones se presen-
ta en la tabla colocándolo en la celda correspondiente y mostrando el número de pares que
tengan el mismo valor; por ejemplo, los dos alumnos que han estudiado durante tres años
y que dieron una puntuación de dos:
___________________________
C_or_re_l_ac_i_ón~y_c_on_f_ia_b_il_id_a_d________________~~

Tabla AX.3. Datos de la tabla AX.1 organizados en una tabla para el análisis inicial
de la tau de Kendall.

Evaluación dada al curso


Años de estudiar 2 3 4 5
1 1 1
2 1 1
3 2
4 1 1
5 1 1
6 1

Tomamos ahora cada entrada de la tabla, comenzando con la de la celda superior izquier-
da, y observamos cuántas están por debajo y a la derecha de esa celda objetivo; es decir,
cuántas entradas se hallan en tma posición consistente con una correlación positiva:

Tabla AX.4. Datos de la tabla AX.1 organizados en una tabla para realizar un análisis
inicial de la tau de Kendall; en ellos se muestra el área a la derecha
y debajo de la primera celda de la tabla.

Evaluación dada al curso


Años de estudiar 2 3 4 5
1 1 1
2 1 1
3 2
4 1 1
5 1 1
6 1

Sumamos a continuación los números situados en las celdas de abajo y a la derecha de la


celda; en el primer caso, tenemos

1+2 + 1+ 1+ 1+ 1+ 1= 8
508l~-----------------------A~p_én_d_ic_e_s_____________________________

Multiplicamos luego esa suma por el número de la celda objetivo (en este caso, 1). Re-
petimos el proceso con todas las entradas de la tabla y sumamos todos los resultados para
calcular el número de entradas en el orden corregido (S+). Por tanto,

S+ = (l X 8) + (1 X 4) + (1 X 7) + (1 X 4) + (2 X 5) + (1 X 3) + (1 X 1)
= 37

Calculamos a continuación el número de entradas que no están en el orden correcto (Sj.


Para hacerlo, tomamos cada entrada de la tabla y contamos cuántas se hallan por debajo y
a la izquierda de tal entrada objetivo y multiplicamos el resultado por el número de ésta.
Por tanto,

S_ = (1 X 3) + (1 X 2) + (1 X 1) = 6

Podemos calcular ya la tau mediante la ecuación siguiente:


2x((s+ )-(s_))
tau-
- nx(n - 1)
donde n es el tamaño de la muestra.
Por tanto,
2x(37- 6)
tau = 11x 10
62
110
= 0.564

Observaciones empatadas. Igual que en la rho de Spearman, hay un ajuste para los empa-
tes. A fin de obtenerlo, es necesario calcular un
factor de corrección que permita los empates
en cada una de las variables.

Tabla AX.5. Cálculo de los valores de corrección para la tau de Kendall.


Años en el curso Evaluación del curso
Rango Número empatado (t) tx(t-1) Rango Número empatado (t) tx(t-1)
1.5 2 2 1.5 2 2
3.5 2 2 3.5 2 2
5.5 2 2 6 3 6
7.5 2 2 10 3 6
9.5 2 2
Total (corrección para Var0 } 1O Total (corrección para Varb) 16

11
____________________________C_o_rr_e_La_c_ió_n~y_c_o_n_fi_a_bl_.Li_d_ad__________________~~

La ecuación para la tau con corrección de empates es:

2x((s+) - (s_))
tau= -r.======~============~~r.======7===============
~( n x (n -1))- corrección para Vara x ~( n x (n -1)) - corrección para Varb

~(11x10) -1 0 x~(11x10) - 16
62

JO X 9.69536

= 0.639
Probabilidad de tau. A semejanza de la rho de Spearman, hay una aproximación a la dis-
tribución normal de la tau de Kendall. Sin embargo, ésta tiene la ventaja de que su aproxi-
mación es adecuada para muestras menores. Así, con una muestra de 1O o menos puede
usarse la tabla correspondiente del apéndice XIV. Si la muestra es mayor, cabe utilizar la
aproximación z:

3xtau x~nx(n -1)


z = -~¡==2x=;==:
(( 2=x + 5~)
n)= Ec.AX.3

donde n es el tamaño de la muestra.


Podemos encontrar la probabilidad de tal valor de z en las tablas z estándar. En el pre-
sente caso,

z=
3 X 0.639 X Ea
~2 x(22 + 5)
1.917 X 10.48809

Fs4
20.10567
7.34847

= 2.74

Correlación parcial
Como señalamos en el capítulo 19, la correlación parcial es la existente entre dos variables
con la posible influencia de una tercera o más variables en las dos originales extraídas de
51Ql~-------------------------A~p_én_d_ic_e_s______________________________

la relación. Presentamos un ejemplo de la relación entre las aptitudes para matemáticas e


inglés, excluida la edad. Ello nos dio esta correlación parcial:

~'mi .e = 0.723

Correlación parcial de orden mayor


Pueden eliminarse las probabks influencias de más de una variable en la relación entre dos
variables: por ejemplo, si deseamos eliminar las posibles influencias de la edad y del esta-
do socioeconómico (ES) en la relación entre las aptitudes en matemáticas y en inglés.
1íni.e - ( 1ms.e X 'is.e) 1

r,~s.c) x(1- 'i~.c)


~'mi.es =
(l -

donde rmi.e es la correlación parcial entre matemáticas e inglés, excluida la edad


rms.e es la correlación parcial entre matemáticas y ES, excluida la edad
ris.e es la correlación parcial entre inglés y ES, excluida la edad.

Método para calcular la probabilidad de r pareja[


En el apéndice XIV presentamos la ecuación con que se calcula un valor t para encontrar
la probabilidad de un coeficiente r de la correlación producto momento de Pearson (donde la
hipótesis nula consiste en que p = 0). Es posible ampliar la ecuación de manera que inclu-
ya correlaciones parciales, con la misma hipótesis nula:

r x ~ 11 - 2 - orden
t=
~
donde res el coeficiente de correlación o de correlación parcial, n el tamaño de la muestra y
orden el orden de la correlación parcial; si excluimos una variable, tendremos un orden= 1;
si excluimos dos variables, como en el caso anterior donde excluimos edad y ES, orden= 2;
cuando se trata de una correlación normal, no de una parcial, orden= O. En cada caso, los
grados de libertad de la prueba t son gl = (n- 2 - orden).

Diferencia entre dos coeficientes de correlación


Ya en el capítulo 19 explicamos cómo comparar dos coeficientes de correlación para ver si
diferían entre sí de manera significativa. Sin embargo, el ejemplo se restringía a la situación
en que ambos coeficientes provienen de datos de muestras separadas (de grupos indepen-
dientes). Cuando esos coeficientes proceden de la misma muestra, es decir, cuando se trata
de muestras no independientes, se realiza un cálculo más complicado. Tales procedimientos
provienen de un artículo de Steigcr ( 1980) donde se detallan los méritos de ambos métodos.
C_or_re_l_a_ci_ón~y_c_o_nf_ia_b_il_id_a_d________________~~
___________________________

Grupos no independientes
En dos situaciones distintas podemos desear comparar dos correlaciones provenientes de la
misma muestra. Una de ellas es cuando hemos conelacionado una medida con otra, al tiem-
po que hemos correlacionado la primera medida con una tercera. Supongamos que se busca
relacionar el IQ con la aptitud en matemáticas, y el IQ con la aptitud para la música, y que

...- se quiere comparar ambas relaciones para ver si una de las aptitudes está relacionada más
estrechamente con el IQ que la otra.
La segunda situación es cuando tenemos cuatro medidas y deseamos comparar las co-
nelaciones entre pares de ellas. Digamos que se selecciona a un grupo de niños y se pide
a cada uno de ellos que estime cuántas palabras seria capaz de recordar de una lista de 20.
Se da a cada chico una lista de palabras y después se ve cuántas puede recordar. Es posible
correlacionar las dos medidas para averiguar si hay una relación entre la puntuación esti..:
mada y la real. Posterionnente, se capacita a cada niño en diversas estrategias nemotécnicas,
como agrupar las palabras relacionadas. Se puede comparar después ambas correlaciones
para averiguar si cambió la relación entre la puntuación estimada y la real.
En ambas situaciones podemos comparar las correlaciones en tanto el tamaño de la
muestra sea mayor que 20.
Como en los dos casos anteriores utilizamos a los mismos participantes, consideraremos
las otras interrelaciones entre las variables. Ello provoca que los cálculos luzcan aterrado-
res. De hecho, son muy laboriosos y exigen mucho cuidado, pero en realidad nc, resultan
particularmente complicados.

Primera situación
Tabla AX.6. Matriz de correlación para tres variables.
Variable
Variable 2 3
1
... 2 (21
3 r31

Si deseáramos comparar la correlación entre las variables 1 y 2 (r21 ) con la de las variables
1 y 3 (r31), primero encontraríamos lo que se conoce como la determinante de esta matriz,
designada como IRI, donde
5f2lL------------------------~A~p~én~d~ic~e~s______________________________

A continuación, debemos encontrar la media de las dos correlaciones que estamos compa-
rando:
r21 + r31
r = 2

Podemos calcular ahora un valor t que tenga n - 3 grados de libertad, donde n es el tama-
ño de la muestra.

La probabilidad de este valor t puede consultarse en la tabla t del apéndice XIV.

Segunda situación

Tabla AX. 7. Matriz de correlación para cuatro variables.

Variable
Variable 2 3 4
1
2 rz, 1
3 r31 r32 1
4 r4, r42 r43 1

Si deseáramos comparar la correlación entre las variables l y 2 (r21 ) con la correlación en-
tre las variables 3 y 4 (r43 ), primero calcularíamos una expresión basada en la covarianza
de r 21 y r 43, que llamamos 1p 12 .34, donde:

'l-'12.34 = 0.5 x {[(r42 - (r2J x r4¡)) x (r31- (r41 x r43))] +


[(r32- (r42 x r43)) x (r41 - (r21 x rd)J +
[(r42 - (r32 x r43)) x (r31- (r21 x r32))] +
[(r32- (r21 x ,.3¡)) x (r41- (r31 x r43))J}

Posteriormente, calcularemos la media de las dos correlaciones que estamos comparando


(r); ahí,

r21 + r43
r = 2
- -------- --.,

co_r_re_l_
_ _ _ _ _ _ _ _ __ _ __ _ ac_i_ón~y_c_on_f_
ia_b_
il_
id_a_
d _ __ _ _ _ _ _~~

Con esos resultados, calculamos s12 .34 a partir de

$ 12.34 =

Debemos calcular ahora la transfonnación de Fisher (r') para los coeficientes de las corre-
laciones que deseamos comparar. Las llamaremos r'21 y r'43 (en el apéndice XVI se indica
cómo calcular la transformación).
A partir de tales cálculos podemos hallar una puntuación z mediante la ecuación si-
guiente:

La probabilidad de dicho valor z puede consultarse en la tabla z estándar del apéndice XIV.

Ahora ya sabemos por qué se inventaron las computadoras.

Intervalos de confianza de r
En ocasiones, tras calcular un coeficiente de correlación para una muestra deseamos esti-
mar la correlación en la población. Una manera de hacerlo consiste en calcular el interva-
lo de confianza del coeficiente; es decir, el rango de valores en que es probable que esté el
parámetro de la población (p). En el capítulo 19 figura un ejemplo donde la correlación en-
tre la memoria real y la estimada fue de r = 0.8 en una muestra de 30 participantes.
Para calcular el intervalo de confianza (IC) es necesario convertir r en r', calcular el
intervalo de confianza de r' y convertir los límites mostrados nuevamente en valores r.
La ecuación es la siguiente:

1
IC = r' ± z(prob) x ,.-:::
vn-3

donde r' es la transformación de Fisher de r; en este caso, 1.099


z(prob) es el valor z necesario para dar un intervalo de confianza concreto. En el caso
de un nivel de confianza de 95%, calcularemos el valor z que tenga una probabi-
lidad de una cola de p = 0.025, es decir, 1.96 (con una probabilidad de dos colas
dep = 0.05).
514lL_________________________A~p_én_d_ic_e_s______________________________
~ es el error estándar de r'
'1/ll - 3

n es el tamaño de la muestra

Por tanto,

1
IC = 1.099 ± 1.96 X r:::::
v27

= 1.099 ± 0.377

Es decir, p' está entre 0.722 y 1.476.


Es necesario convertir nuevamente los límites en valores r, consultando las tablas de con-
versión de r en r' o utilizando la ecuación para convertir r' en r, la cual se presenta en el
apéndice XVI. Un valor r' de 0.722 dar= 0.62 y uno de 1.476 dar= 0.90. Por ende, el in-·
tervalo de confianza de 95% para p está entre 0.62 y 0.90.

Coeficiente de concordancia de Kendall


El coeficiente de concordancia de Kendall da como resultado una estadística W, la medida
de hasta qué punto un grupo de jueces están de acuerdo cuando se les pide colocar un con-
junto de objetos en cierto orden; por ejemplo, si se les pide ordenar un bloque de fotogra-
fías según lo atractiva que les parezca la persona retratada.
Una vez que hemos obtenido la W mediante la ecuación presentada en el capítulo 19,
es posible calcular la rho de Spearrnan de las correlaciones entre cada uno de los pares de
4 3
jueces (en este caso, ; = 6 pares) de:

(k xw)- 1
rho media = k-1

donde k es el número de jueces.

La técnica expuesta en el capítulo 19 se utiliza en situaciones sin puntuaciones empatadas.


A continuación indicamos cómo calcular la W cuando hay valores empatados. Los datos se
modificaron respecto a los presentados en dicho capítulo para incluir tales puntuaciones.
___________________________Co_r_re_l_ac_i_ón~y_c_on_f_ia_b_il_id_a_
d ________________~~

Tabla AX.B. Valoración de atractivo dada por los jueces para cinco fotografías.

Fotografía
Juez A B e D E
Uno 1 2 3.5 3.5 5
Dos 2 1 4 3 5
Tres 2.5 2.5 1 5 4
Cuatro 1 3 2 4 5
Puntuación total (R) 6.5 8.5 10.5 15.5 19
R media 1.625 2.125 2.625 3.875 4.75

Igual que en otros coeficientes de correlación no paramétricos, debe usarse una corrección
cuando hay empates.

Corrección de empates
La corrección puede hacerse elaborando una tabla de la forma siguiente, donde se anoten
los empates de cada participante:

Tabla AX. 9. Cálculo de la corrección de empates para un coeficiente de concordancia


de Kendall (W).
1111
Participante Valor de la Número de la Corrección
1 o
(juez) puntuación empatada puntuación empatada (t) (t 3 - t)
Uno 3.5 2 6
Tres 2.5 2 6
Corrección total 12

La W con corrección de empates se calcula con la ecuación siguiente:

12 x 2: (R media - R media global)


2

(k x (k2 _1)) -
W= ----,---'------,-r-----'<'-
correcc:ón total
516lL________________________A~pe_'n_d_ic_e_s____________________________
donde la R media global es la media de las R medias de cada entidad juzgada, que es en
este caso 1.625+2.125+2.625+3.875+4.75 = 3
5

L(R media - R media globalt es la suma de las desviaciones al cuadrado de cada R


media de laR media global, que es en este caso :
(1.625 - 3? + (2.125- 3)2 + (2.625- 3)2 + (3.875 - 3)2 + (4.75 - 3)2
= 6.625

k es el número de fotografías juzgadas


n es el número de jueces

Por tanto,

79.5
(5x24) - 3

79.5
= -
117

= 0.6794
(la versión sin corrección para empates sería W = 0.6625)

Confiabilidad
Presentamos a continuación los coeficientes de confiabilidad, cuyo uso apropiado se expli-
ca en el capítulo 19.

Ecuadón de Spearman-Brown de confiabilidad de mitad dividida


El coeficiente de Spearman-Brown de confiabilidad de mitad dividida puede calcularse con
la ecuación siguiente:

2xr12
rkk= l+'i2
__________________________C
_o_r_re_la_c_io_
'n_y~co_n_f_ia_b_
ili_d_ad________________~~

donde rkk es el coeficiente de confiabilidad


r 12 es la correlación entre las puntuaciones de los participantes en las dos mitades
de la prueba
La ecuación puede ampliarse para permitir la intercorrelación de todos los reactivos de la
prueba, convirtiéndose en

kxmedia(r)
1 +((k-l)x media(r ))

donde k es el número de reactivos en la prueba


media(r) es la media de las correlaciones entre los reactivos

Coeficiente alfa de Cronbach


El coeficiente alfa de Cronbach se calcula más fácilmente y produce el mismo resultado
que el de la ecuación anterior:

kk
k x[l-
r =_
k- l
L(sl)l
2

donde s/ es la varianza del reactivo i


s/ es la varianza de las puntuaciones totales
I(sf) significa sumar las varianzas de cada reactivo
Coeficiente de confiabilidad 20 de Kuder-Richardson
Cuando cada ítem tiene respuestas dicotómicas (binarias), como aprobar/reprobar, sí/no, o
de acuerdo/en desacuerdo, el alfa de Cronbach se simplifica aún más hasta convertirse en
el coeficiente de confiabilidad 20 de Kuder-Richardson:

KR20r = _ k x[l_L(pxq)]
kk k- l sl

donde p es la proporción de personas que dan un tipo de respuesta y q = 1 - p (la propor-


ción que da el otro tipo)

L(pxq) significa calcular el producto p x q y sumar cada producto.


518l Apéndices
~----------------------~----------------------------------

Error estándar de medición


Podemos usar la confiabilidad de una medida a fin de producir un intervalo de confianza
para la puntuación de una persona en la medida. Éste se basa en el error estándar de medi-
ción (EEM) de la medida:

EEM=DE1 x~(l ±rkk)

donde DE1 es la desviación estándar de la prueba


rkk es el coeficiente de confiabilidad

El intervalo de confianza de una persona puede calcularse de la manera siguiente:

IC = puntuación :1: Zprob x EEM

donde es el valor z que da el nivel de confianza requerido (digamos, z = 1.96 para una
zprob
confianza de 95%)

Por ejemplo, si una prueba de IQ tiene una DE de 15 con un coeficiente de confiabilidad


de 0.9, el EEM de la prueba seria:

EEM = !Sx~(l-0.9)

= ISx..fOJ

= 15 X 0.3}6

=4.74
Si un joven obtuvo una puntuación de 90 en la prueba, el intervalo de confianza de 95% de
su IQ puede calcularse así:

IC = 90:t !.96x4.74

= 90:!: 9.2904

En otras palabras, quizá el IQ del joven esté entre 80.71 y 99.29.


-
[
--------------------------~C~or~r~el=ac~i~ón~y~c~o~nf~ia=b~il=id=a=d----------------~~
Conf;abilidad entre jueces: kappa de Cohen
Para asegurarnos de que distintos observadores puedan usar consistentemente cierta medi-
da, estimaremos el nivel de acuerdo entre dos de ellos. Como se señaló en el capítulo 19, el
porcentaje de acuerdo no tiene en cuenta la cantidad de éste que puede esperarse por azar. Por
otra parte, una correlación positiva amplia no siempre indica que dos observadores están
de acuerdo, pues la correlación nos señala sólo la dirección en que cada una de las medidas
se mueve con relación a la otra. Una medida que resuelve ambos problemas es la kappa de
Cohen (K) .
En el ejemplo siguiente usamos una escala ordinal, mas la kappa de Cohen se calcula
generalmente con datos nominales.
Dos catedráticos leyeron un conjunto de ensayos, a cada uno de los cuales dieron un
grado según una escala de .cinco puntos, sin saber qué puntuación había dado el otro.

Tabla AX. 1O. Grados conferidos a 75 ensayos por dos catedráticos que trabajaron
independientemente uno de otro.

Primer catedrático
Segundo catedrático 2 3 4 5 Total
·~

1 5 1 6
2 2 13 2 17
3 4 20 2 26
4 1 16 2 19
5 3 4 7
Total 7 18 23 21 6 75

En la diagonal de la matriz vemos los ensayos donde los grados de ambos catedráticos
coincidieron:~ o 77.33%.
75
Calcularemos primero las frecuencias esperadas por azar de cada celda de la matriz en
que los catedráticos coincidieron. Ello se hace de manera similar a la x2 , donde:
. d· lí) _ total de la fila x total de la columna
Frecuenc1a espera a v e - tota1 g1oba1

Por tanto, la frecuencia esperada de los ensayos a que se dio un grado de 1 es:

r = 6x7
Je 75

= 0.56
52Ql~-------------------------A~p_é_nd_i_ce_s______________________________

y las otras frecuencias esperadas para las celdas diagonales son 4.08, 7.973, 5.32 y 0.56.
Ello significa que

suma de los valores diagonales esperados (Suma de fe)= 18.493

La kappa de Cohen se calcula de la forma siguiente:

K= Suma de fa- Suma de fe


N- Sumadefe

donde fo es la suma de las frecuencias observadas de las celdas diagonales (en este caso, 58)
N es el número total de entidades clasificadas por Jos evaluadores (75 ensayos).
Por tanto,

K= 58-18.493
75-18.493

= 0.699

o un acuerdo ligeramente menor que 70%, una vez que se ha considerado el azar.
Robson (1993) informa que kappa en el rango de 0.4 a 0.6 se considerajusto; entre 0.6
y 0.75, bueno; y más de 0.75, excelente.

Error estándar de La estimación


Cuando la validez de una medida se expresa en términos de su correlación con otra (medi-
da de criterio), es posible encontrar un intervalo de confianza de la puntuación de una per-
sona mediante el error estándar de la estimación de una medida, donde

donde DEx es la desviación estándar de la medida de criterio


r es la correlación entre la medida de criterio y la nueva medida

Un intervalo de confianza (IC) puede formarse de

re = puntuación ± Zprob X EEcst

donde zprobes el valor z que da el niv.el de confianza requerido (por ejemplo, z = 1.96
para un grado de confianza de 95%).
Correlación y confiabilidad
----------------------------------~------------------------~
152"1
Si una medida de extraversión correlacionar= 0.8 con una medida de criterio de extraver-
sión, con una desviación estándar de 5, el error estándar de la estimación sería:

EEest = 5x~l - (o.8) 2


=3

Por tanto, si una joven tuvo puntuación de 30 en la medida, el intervalo de confianza de


95% para su puntuación seria éste:

IC = 30 ± 1.96x3

= 30 ± 5.88

Es probable, por lo mismo, que su "verdadera" puntuación esté entre 24.12 y 35 .88.
XI
Regresión

En el apéndice se exponen las técnicas presentadas en el capítulo 20.

Regresión lineal simple


En el capítulo 20 se presentó un ejemplo en que se intentó predecir la aptitud para las ma-
temáticas a partir de la que se tiene para el idioma inglés.

Tabla AXI. 1. Puntuaciones de las pruebas de aptitud para matemáticas e inglés


correspondientes a una muestra de 1O niños.
Participante Aptitud en matemáticas Aptitud en inglés
1 50 50
2 40 48
3 60 48
4 50 47
5 70 65
6 60 64
7 75 75
8 70 72
9 85 75
10 75 80
Media 63 .5 62.4
DE 13.95429 13.05713

522
_______________________________R_e~gr_e_si_ón_______________________J~

Hemos señalado que la ecuación de la regresión lineal corresponde a la de la línea rec-


ta que podría trazarse en los puntos de un diagrama de dispersión tal que la distancia entre
la línea y los puntos sea mínima. Dicha línea se conoce como recta de mejor ajuste y, para
una regresión lineal simple (donde hay una VI y una VD), tiene siempre la forma siguiente:
VD = a + (b x VI)
o bien, cuando la predicción no es perfecta,
VD predicha = a+ (b x VI)
(a y b se describen como coeficientes de regresión. Si trazáramos la recta de mejor ajuste
en una gráfica, a sería el punto en que la recta corta el eje vertical. Dicho punto se cono-
ce como intersección u ordenada al origen y es el valor que la VD tendría si la VI fuera
igual a cero. La pendiente de la línea sería b; es decir, la magnitud en que la VD cambiaría por
cada cambio de una unidad en la VI.)
Para calcular b usamos esta ecuación:

b= (11 x total de [VI x VD]) - (total para VI x total para VD)


(11 x total de [VI1 ) ) - (total para VI)2

donde n es el tamaño de la muestra


total de [VI x VD] significa multiplicar la puntuación de cada persona en la VI por la
correspondiente a ella misma en la VD y sumar los resultados de cada persona.

Tabla AX1.2. Cálculos para hallar la pendiente de una recta de mejor ajuste
de una regresión lineal simple.
Aptitud Aptitud
Participante en matemáticas (AM) en inglés (Al) AM x AI
1 50 50 2500 2500
2 40 48 2304 1920
3 60 48 2304 2880
4 50 47 2209 2350
5 70 65 4225 4550
6 60 64 4096 3840
7 75 75 5625 5625
8 70 72 5184 5040
9 85 75 5625 6375

-
10 75 80 6400 6000
Total 635 624 40472 41080
524l~----------------------~A~p~én~d~ic~e~s_____________________________
Por tanto,
(IQ X 41 080)-(624 X 635)
b =
(lO X 40 472) - (624) 2

410 800-396 240


404 720-389 376

= 0.94890511

(Hemos tenido que calcular todos los decimales para que las respuestas sean compatibles
con las de la computadora.)
Tras calcular b, hallaremos a mediante la ecuación siguiente:

total para VD- (b x total para VI)


a =
11

o bien,
a medía para VD - (b x media para VI)
que suele escribirse así:

a F-bX
Por tanto,

a 63.5 - (0.94890511 x 62.4)

4.28832
De acuerdo con lo anterior,

AM predicha = 4.28832 + (0.94891 x Al)

En consecuencia, si una persona tuvo puntuación de 50 en aptitud para inglés, su aptitud


para matemáticas predicha será:

4.28832 + (0.94891 X 50) = 51.734

Cálculo de la significación estadistica de un análisis de regresión


Para calcular la significación estadística de una regresión, realizamos un ANO VA con los
datos, donde la suma total de cuadrados se divide en la correspondiente a la regresión (la
varianza de la VD que se explica exitosamente por la varianza de las VI) y al residuo (la va-
rianza de la VD que no se explica por la varianza de las VI).
_______________________________R_e~gr_e_si_ón_______________________J~

Suma total de cuadrados. La suma total de cuadrados representa la suma de cuadrados de


la VD. Como es usual, si conocemos la desviación estándar podemos elevarla al cuadrado
para obtener la varianza y multiplicarla por el tamaño de la muestra, menos uno (n - 1):

Suma total de cuadrados = (10- 1) x (13.95429) 2


9 X 194.72221
= 1752.5

Suma de cuadrados de la regresión. La suma de cuadrados de la regresión se calcula res-


tando la media de la VD del valor predicho de la VD de cada persona, elevando al cuadra-
do el resultado y sumando estos valores al cuadrado.

Tabla AXI.3. Cálculo de la suma de cuadrados de la regresión en una regresión lineal


simple.

AM predicha:
Aptitud en media de la AM
matemáticas real (desviación) (desviación )2
Participante (Y) AM predicha ('f) ('f - Y) 6' - ?)2
1 50 51.734 - 11.76642 138.44872
2 40 49.836 - 13.66423 186.71128
3 60 49.836 - 13.66423 186.71128
4 50 48.887 -14.61314 213.54382
5 70 65.967 2.46715 6.08685
6 60 65.018 1.51825 2.30508
7 75 75.456 11.95620 142.95082
8 70 72.609 9.10949 82.98279
9 85 75.456 11.95620 142.95082
10 75 80.201 16.70073 278.91438
Total (S de C 1 381.606
de la regresión)

Suma de cuadrados residual. La suma de cuadrados residual es la suma de las diferencias


al cuadrado entre el valor predicho de la VD y el real de cada persona; también puede calcu-
larse restando la suma de cuadrados de la regresión de la suma total de cuadrados.
5'261 Apéndices

Tabla AXI.4. Cálculo de la suma residual de cuadrados de una regresión lineal simple.

AM: AM
predicha
(residuo); (residuo) 2 ;
Aptitud en AM es decir: es decir:
Y)
A A

Participante matemáticas (Y) predicha (Y) (Y- Y) (Y- 2

1 50 51.734 - 1.73358 3.00529


2 40 49.836 -9.83577 96.74230
3 60 49.836 10.16423 103.31164
4 50 48.887 1.11314 1.23908
5 70 65.967 4.03285 16.26385
6 60 65.018 - 5.01825 25.18281
7 75 75.456 - 0.45620 0.20812
8 70 72.609 -2.60949 6.80943
9 85 75.456 9. 54380 91.08403
10 75 80.201 -5.20073 27.04759
Total (S de C 370.894
de los residuos)

Tenemos ya detalles suficientes a fin de crear el ANOVA de resumen para el análisis de re-
gresión. En el capítulo 20 se indica cómo calcular los grados de libertad, la media de cua-
drados y la razón F.

Tabla AXI.5. Tabla resumen del análisis de varianza de una regresión simple de la
relación entre las aptitudes para matemáticas e inglés.

Fuente gl Suma de cuadrados Media de cuadrados Prueba F

Regresión 1 1 381.606 1 381.606 29.801


Residuo 8 370.894 46.362 p = 0.0006
Total 9 1 752.5

Vinculos adicionales entre la correlación


y la regresión lineal simple
En el capítulo 19 se defme la covarianza entre dos variables y se indica que el coeficiente de
correlación (r) entre dos variables se calcula con la fórmula que inicia la página siguiente.
__________________________________R_
eg~r_e_si_ó_
n ______________________~¡-527

Covarianza
r
DE 1 x DE 2

La covarianza de la aptitud en matemáticas y de la aptitud en inglés es 161.77778.


Además de usar el método descrito en la sección anterior para calcular el coeficiente
de regresión b en una regresión lineal simple, éste puede hallarse también así:

Ca varianza
b=
(DE para VI) 2

lo cual es lo mismo que


Ca varianza
b=
varianza para VI

Por tanto,

b = 161.77778
170.48889

0.948905

En el capítulo 20 explicamos que es posible convertir los coeficientes de regresión en coe-


ficientes de regresión estandarizados (o coeficientes beta) mediante la ecuación siguiente:

f3 = bx DE,.
DE y

donde b es el coeficiente de regresión de una VI


DEx es la. desviación estándar de la misma VI
DEY es la desviación estándar de la VD
Si en una regresión lineal simple convertimos b en un coeficiente beta, obtenemos:
..
Coeficiente beta = 0.94890511 x 13.05713
13.95429

= 0.888

Lo anterior es igual que el coeficiente de correlación (r) de la relación entre las aptitudes
para matemáticas e inglés. Ello se debe a que el coeficiente de regresión estandarizado es el
que hallaríamos si convirtiéramos los valores de la VI en puntuaciones estandarizadas e
hiciéramos lo mismo con la VD y realizáramos luego un análisis de regresión de las dos
variables estandarizadas. Recordemos que la estandarización convierte una distribución en
528l~-----------------------A~pe_'n_d_ic_e_s_____________________________

otra cuya media es cero y su desviación estándar (y su varianza) igual a l. La covarianza


de las variables estandarizadas es igual que su coeficiente de correlación. Además, el co~
ficiente de regresión estandarizado a se convierte en

Coeficiente de regresión estandarizado = media para la VD + beta x media para VI


0 + 0.888 X 0
o
Por tanto, en la regresión simple, ésta es la ecuación de la regresión de las variables estan-
darizadas:

VD estandarizada = r x VI estandarizada

R2 ajustada
La R2 ajustada constituye una estimación de R2 en la población y tiene en cuenta lo mismo el
tamaño de la muestra que el número de variables independientes: a menor muestra, mayor
ajuste. La ecuación de la R2 ajustada es ésta:

. d - 1-r {l -( K)X(Il- 1))


11 - p - 1)
R2 aJusta a -

donde n es el tamaño de la muestra y p el número de las VI en el modelo

Por ende, si en el capítulo 20 R2 fue igual a 0.79, o 0.7896, con cuatro decimales, con dos
VI y 1O participantes,

R2 ajustada 1_({1-0.7896) X {10- 1) )


(10- 2- 1)

1_ ( 0.21~4x9 )

= 0.729

Error estándar de un coeficiente de regresión


El error estándar de un coeficiente de regresión se calcula con la ecuación siguiente:

, d ar d e VI =
E rror están Mediadecuaclradosresiduo
1
~ SdeCdeVI 1 x {t - ~2 ..)
'JI

________________________________R_e~g~re_s_ió_n______________________~~

donde Media de cuadradosresiduo puede calcularse a partir del ANOVA del análisis de re-
gresión
S de C de VI 1 es la suma de desviaciones al cuadrado (de la media) de la VI para la
que se calcula el error estándar
iif.2. es el coeficiente de correlación múltiple al cuadrado donde VI 1 se considera
una variable de criterio y las otras VI actúan como de predicción para ella.
Cuando hay sólo dos VI, dicho valor es el cuadrado del coeficiente de correlación
entre ambas VI (es decir, ,-2).

En el caso de una regresión simple (con una sola VI), la ecuación es la siguiente:

Media de cuadrados residuo


Error estándar =
SdeCdeVI

En el capítulo 20 presentamos el ejemplo de una regresión múltiple donde la aptitud en ma-


temáticas es la VD y la de inglés, la edad, el estado socioeconómico (ES) y el IQ, las VI. En
la tabla AXI.6 se muestran los datos originales registrados en una regresión por etapas; y
en la AXI. 7, el ANO VA de la regresión, en el cual se coloca sólo la aptitud en inglés y el
ES en el modelo.

Tabla AXI.6. Datos registrados en una regresión por etapas en la cual matemáticas
es la VD y las demás variables, las independientes.

Participante Matemáticas Inglés Edad ES IQ

1 50 50 150 5 85
2 40 48 150 1 100
3 60 48 144 4 95
4 50 47 144 3 105
5 70 65 162 4 100
6 60 64 162 2 110
7 75 75 156 3 100
8 70 72 156 2 120
9 85 75 168 1 115
10 75 80 168 1 120
530l~-----------------------A~p~én~d_ic~e~s_____________________________

Tabla AXI. 7. Tabla ANOVA de una regresión múltiple donde matemáticas es la VD,
e inglés y ES, las VI.
Fuente gl Suma de cuadrados Media de cuadrados Prueba F

Regresión 2 1 441.853 720.927 16.245


Residuo 7 310.647 44.378
Total 9 1 752.5

Si la aptitud en inglés se considera ahora la VD y el ES es la VI, R 2 = 0.2233. La suma de


las desviaciones al cuadrado de la aptitud en inglés es 1 534.4. Por ende,

44.378
Error estándar (para inglés) =
' 11534.4 X (1 - 0.2233)

44.378
1 534.4 X 0.7767

44.378
119 1.76848

~0.037237

= 0.193
En seguida se muestra otra parte del análisis de regresión cuando la aptitud en matemáti-
cas es la VD, mientras que la aptitud en inglés y el ES constituyen las VI, incluidos los errores
estándar de los coeficientes de regresión:

Tabla AXI.8. Estadísticas relacionadas con los coeficientes de regresión cuando la


aptitud en matemáticas es la VD, e inglés y ES, las VI.

Error Coeficiente
Variable Coeficiente estándar estándar F por retirar
Intersección -7.68
Inglés 1.055 0.193 0.987 29.899
ES 2.053 1.762 0.21 1.358
__________________________________Re~g~r_e_ ón________________________~j'531
si_

Prueba de la significación estadistica


de un coeficiente de regresión
Es posible formar un valor t para probar la significación estadística de un coeficiente de re-
gresión con esta fórmula:

coeficiente de regresión
t =
(N - P - 1) error estándar del coeficiente de regresión

donde N es el tamaño de la muestra


p es el número de las VI en la regresión
Por tanto, en el caso de la aptitud en inglés,

1.055
0.193

5.4663

La probabilidad de ese valor t puede verificarse contrastándola con los valores críticos pre-
sentados en las tablas t del apéndice XIV. Se usará la probabilidad de dos colas. En este ca-
so, el valor t es estadísticamente significativo en el nivel p < O. 001, por lo cual concluiremos
que la aptitud en inglés representa un predictor significativo de la aptitud en matemáticas.
Recordemos una vez más que F = t2; por ello, F = (5.4663) 2 = 29.88, igual a la razón
F (a un decimal) mostrada en la tabla AXI.8 para el coeficiente de regresión de la aptitud
en inglés. La significación estadística de la razón F podría haberse verificado utilizando gl
de 1 y 7.
En la regresión múltiple, si deseamos probar la significación estadística de los coefi-
cientes de regresión, ajustaremos el nivel alfa para tomar en cuenta el número de pruebas
realizadas, pues en el proceso se requiere realizar más de una prueba. Ello puede hacerse
mediante el ajuste de Bonferroni. En este caso, por tener dos VI, el nivel alfa crítico sería
0 05
· = 0.025.
2

Cálculo de un intervalo de confianza


para un coeficiente de regresión

-
Igual que con otros intervalos de confianza, necesitamos saber cuál sería el valor crítico de t
para los grados de libertad y para el nivel de confianza. Si deseamos tener uno de 95%, la
t crítica representaría el valor t de una probabilidad de dos colas de a.= 0.05 que, con gl = 7,
es igual a 2.365. Para calcular el intervalo de confianza (IC) se utiliza la fórmula siguiente:

IC = coeficiente de regresión ± (t x error estándar del coeficiente de regresión)


5J2l~------------------------A~p_én_d_ic_e_s_____________________________

Por ende, en el caso de la aptitud en inglés,

IC = 1.055 ± (2.365 X 0.193)


= 1.055 ± 0.456

En otras palabras, podemos tener una confianza de 95% de que el valor del coeficiente de
regresión de la población se encuentre entre 0.599 y 1.511.
••

XII
Análisis de reactivos y discriminativo
con las escalas de Likert

En el apéndice se exponen las técnicas presentadas en el capítulo 6.

Realización de un análisis de reactivos


l . Asigne una puntuación a la respuesta por persona a cada afirmación. Recuerde mante-
ner constante el sistema de puntuación, pues aproximadamente la mitad de las pregun-
tas están expresadas en la dirección contraria a la del resto, de tal forma que 1 siempre
signifique una actitud negativa y 5 una positiva.
2. Calcule la puntuación total de cada participante.
3. Calcule una correlación producto momento de Pearson entre cada afirmación y la puntua-
ción total y entre todas las preguntas (capítulo 19). De hecho, cada una de éstas se ~n­
cuentra sólo en una escala ordinal que tiene un número limitado de valores posibles
.•. (5), en cuyo caso parecería más apropiado emplear la rho de Spearman o la tau de Ken-
dall. Sin embargo, tal vez la puntuación total tenga un número de valores posibles suficien-
te para permitir el uso de la r de Pearson. Los datos suelen analizarse mediante pruebas
paramétricas, en parte porque hay un límite para las estadísticas calculables si nos limita-
mos a utilizar pruebas no paramétricas.
4. Calcule el valor crítico de r para una prueba de una cola en a = 0.05 (apéndice XIV).
Utilizamos una prueba de una cola porque elegimos las preguntas con la expectativa de
que se intercorrelacionen de forma positiva. En el capítulo 6 recomendamos usar al me-
nos 68 participantes a fin de dar a la pr:.teba un poder de 0.8 para un tamaño medio del
'
SJ4l~-------------------------A~p_é_nd_i_ce_s______________________________

efecto, que sería en este caso r = 0.3. Si usó 68 participantes, el valor de r, para ser es-
tadísticamente significativo en p = 0.05, sería 0.20 l.
Si decide analizar los datos con la rho de Spearman o la tau de Kendall, debe tener
al menos 75 participantes para obtener el mismo poder. En el primer caso, el valor crí-
tico sería rho = 0.191 para esos participantes. Si usa la tau de Kendall, el valor crítico
de tau sería 0.129 para ellos mismos.
5. Revise la correlación entre cada afirmación y las puntuaciones totales. Se puede decir
que cualquier afirmación que tenga un coeficiente de correlación con el total del mismo
tamaño o mayor que el valor crítico pasó esta etapa del análisis de reactivos y, por el
momento, puede permanecer en la escala.
6. Examine las afirmaciones que no pasaron la etapa del análisis de reactivos para ver si
se correlacionan entre sí (en el mismo nivel crítico que antes). Las que no se correla-
cionen no sólo con el total sino con otras deben desecharse. Revise cómo están expre-
sadas para ver por qué fallaron.
Un conjunto de afirmaciones que no se correlacionen con el total pero sí unas con otras
pueden formar una subescala de la escala de actitud. Examínelas para ver cuáles aspectos de
la actitud que evalúa tienen en común. Si parece haber un tema coherente que las vincule,
considere que forman una subescala.
Si usó una escala de actitud en esta etapa para evaluar actitudes, podría producir pun-
tuaciones totales distintas para las diferentes subescalas.

Análisis del poder discriminatorio


Si en el análisis de reactivos identificamos subescalas, es necesario seguir estos pasos sepa-
radamente con cada subescala:
l. Forme una puntuación total nueva para cada participante.
2. Identifique a los que tengan el 25% más alto de las puntuaciones totales (puntuaciones
altas) y el 25% más bajo (puntuaciones bajas).
3. Para cada pregunta, compare las puntuaciones altas con las bajas (con base en las tota-
les) mediante una prueba t de una cola entre sujetos. También puede realizar una prue-
ba U de Mann-Whitney de una cola, pues representa el equivalente no paramétrico de
la prueba t entre sujetos.
4. Conserve sólo las afirmaciones que muestren una diferencia significativa entre las pun-
tuaciones altas y las bajas. Las otras deben descartarse: no son capaces de discriminar
suficientemente entre las puntuaciones altas y las bajas y, por tanto, resultan superfluas.
...

XIII
Metaanálisis

En el apéndice se exponen las técnicas presentadas en el capítulo 22.

Introducción
En este apéndice realizaremos paso a paso un metaanálisis donde se comparan las puntua-
ciones de depresión de mujeres que sufren dolor pélvico con las de grupos control de las
que no lo padecen. Estos datos se tomaron de McGowan, Clark-Carter y Pitts (en prensa).

Los estudios
Excepto en un caso, los detalles relevantes que aparecen en los artículos se presentan en
forma de medias y desviaciones estándar, no como estadísticas de probabilidad.

Tabla AXII1.1. Medias, desviaciones estándar y tamaños de la muestra presentados


en los artículos que se incluirán en el metaanálisis.
Grupo experimental Grupo control
Estadística
de
Estudio n Media DE n Media DE _Qrobabilidad
1 41 1.26 0.89 41 0.61 0.50 t = 4.08
2 30 46.44 10.52 30 38.40 7.50 -
3 50 64.50 11.30 50 51.90 10.40 -
4 37 61.44 12.24 23 50.50 9.20 -
5 162 54.30 12.65 46 45.50 12.40 -
6 64 61.61 8.83 46 59.11 8.45 -

535
SJ6lL_________________________A~p~é_nd_i_ce_s______________________________
El paso siguiente consiste en crear una sola estadística de probabilidad para cada uno de
los estudios. Por la naturaleza de las estadísticas de resumen que cada estudio ha propor-
cionado, la estadística más apropiada es la prueba t entre sujetos. Como en los diseños entre
sujetos, revisaremos la homogeneidad de la varianza de cada estudio y, si la varianza 1nayor
no equivale a más de tres veces la menor, usaremos la ecuación de la prueba t con varian-
zas conjuntas; de lo contrario, emplearemos la ecuación de la prueba t con varianzas inde-
pendientes (prueba t de Welch). Ambas ecuaciones se presentan en el apéndice VI.
Sin embargo, si el nivel de información de un articulo es tan deficiente que nos impide
disponer de estadísticas descriptivas y nos informa sólo que el resultado es estadísticamente
significativo, lo mejor que podemos hacer es considerar que un resultado no significativo
tiene un valor z de cero (que da una probabilidad de 0.5) y que uno con significación esta-
dística posee un valor z de 1.645 (el nivel crítico de una cola de p = 0.05).
Podemos generar una nueva tabla resumen:

Tabla AXIII.2. Valores t de los estudios del metaanálisis.

Estudio N total t Dirección del efecto


1 82 4.0771 +
2 60 3.4085 +
3 100 5.8015 +
4 60 3.6837 +
5 208 4.1818 +
6 11 o 1.4911 +

Cálculo de una estadistica del tamaño del efecto común


Podemos usar las ecuaciones siguientes para convertir estadísticas comunes en r. En cada caso,
si el resultado original muestra un efecto negativo respecto a la hipótesis (esto es, que el grupo
control tenga una media mayor que el experimental), la r debe considerarse negativa.
Para convertir un valor t en r

Ec. AJ<III.l

Para convertir una razón F en r


1'1, v2
r = 11, v2 + glerror Ec. AXIII.2
M_e t_a_a _n a_'l_is_is______________________~~
________________________________

donde F 1 v2 es una razón F con gl = 1 para el tratamiento


cUna razón F puede usarse sólo cuando la variable independiente tiene dos niveles;
es decir, si gl del tratamiento = l.)

Para convertir una x2 en r


r Ec. AXIII.3

donde la x2 debe tener gl = 1


Para convertir un valor z estándar en r
r = ___¿___ Ec. AXIII.4
JN
donde N es d número total de participantes en el estudio
Para convertir un valor d en r
d
r = Ec. AXIII.5

donde d es el tamaño del efecto, usando la d de Cohen (1988)


p es la proporción de participantes del grupo experimental
Por tanto, si el número total de participantes del estudio fue de 100 y el de los
40
del grupo experimental fue de 40, p =
100
= 0.4.

q es la proporción de participantes en el grupo control


De manera alteiJlativa, cuando las muestras tienen el mismo tamaño, para convertir el valor
den r:

r Ec. AXIII.6

Estamos ahora en posibilidades de calcular el tamaño del efecto para cada estudio. Usare-
mos el estudio 2 como ejemplo:

r
¡;;-
~ '/2:;g¡
..
,
(3.4085) 2
(3 .4085) 2 + ( 60- 2)
5J8l~------------------------A~p_
én_d_ic_e_s_____________________________

1 11.61 79
V 11 .6179 + 58

0.4085

Mediante el mismo procedimiento podemos convertir todos los valores t en r:

Tabla AXIII.3. Tamaños del efecto (r) de los estudios del met aanálisis.

Estudio N r Dirección del efecto


1 82 0.4148 +
2 60 0.4085 +
3 100 0.5056 +
4 60 0.4354 +
5 208 0. 2797 +
6 110 0.1420 +

Cálculo de una estadística de probabilidad común


Las ecuaciones siguientes se utilizan para convertir una estadística inferencia! o un tama-
ño del efecto en un valor z. En cada caso, si el hallazgo original mostró un efecto negativo
respecto a la hipótesis, es decir, si el grupo control tuvo una media mayor que la del expe-
rimental, el valor z debe considerarse negativo.
Para convertir un valor t en z

z = o-J x loge
b
(l + ~)x
g! vll~~
-- 2><gl))
1
Ec. AXIII.7

donde gl = N - 2 para un diseño entre sujetos y N - 1 para uno íntrasujetos.


N es el número total de participantes en el estudio.
loge es el logaritmo natural (aparece como LN en las calculadoras).
_______________________________M_e_t_a_an_á_lt_'sl_·s______________________~ISJ9

Para convertir una razón F en z

1
z = 1glerror X log ( l + ;;¡. "2 ) X ( 1- ) Ec. AXIll.8
~ ' glerror 2 X glerror

-
donde glerror son los grados de libertad del término de error (el divisor) utilizado para calcu-
lar la razón F
F 1,v2 es una razón F con gl = l para el tratamiento
(Una razón F puede usarse sólo si la variable independiente tiene dos niveles; es
decir, si gl del tratamiento= 1.)

Para convertir una x2 en z


z= [x2 Ec. AXIII.9

donde x2 debe tener gl = 1


Para convertir un valor d en z

z= dx.JÑ Ec. AXlli.lO


~tf2 + -1 -
(px q)

donde des el tamaño del efecto, usando la d de Cohen (1988)


p es la proporción de participantes que integran el grupo experimental
Por tanto, si el número total de participantes en el estudio fue de 100 y el del grupo
. 40
expenmental40, p = = 0.4.
100
q es la proporción de participantes en el grupo control
De manera alternativa, cuando las muestras son del mismo tamaño, para convertir un valor
den r,

Ec. AXTII.ll

Para convertir una r en z

z Ec. AXIll.l 2
54Ql~----------------------~A~p~én~d~ic~e~s___________________________
Estamos ahora en posibilidades de calcular una z para cada estudio y de hallar un nivel de
probabilidad combinado. D e nueva cuenta, usaremos el estudio 2 como ejemplo:

1 6179 1
58xlog ( 1+ 1. ) x J (1- )
e 58 2x58

~58 x ioge (1 + 0.2003) X ~(1 - 0.0086)

~58x0.18257 x~0.9914

= ~10.5896 X ~0.9914

= 3.2541 X 0.9957

= 3.2401

Mediante el mismo procedimiento, podemos crear una tabla de valores z para los estudios,
utilizable a fin de producir un nivel de probabilidad combinada.

Tabla AXIII.4. Valores z para los estudios del metaanálisis.

Estudio N z Dirección del efecto


1 82 3.8741 +
2 60 3.2401 +
3 100 5.3652 +
4 60 3.4768 +
5 208 4.0919 +
6 110 1.4801 +

Heterogeneidad
Heterogeneidad del tamaño del efecto
Antes de poder calcular la heterogeneidad del tamaño del efecto y el tamaño combinado
del efecto, convertiremos cada r en una transformación de r de Fisher (r'); si colocamos el
_________________________ _______M_e t_a_a_
n a_'l_ is______________________~j541
i s_

tamaño del efecto del estudio 2, r = 0.4085 en la ecuación que aparece en el apéndice XVI,
se produce r' = 0.4338.
Recordemos que si un estudio tiene dirección de efecto negativa, su r será negativa al
colocarla en la ecuación anterior, y la r' resultante también lo será.
Podemos crear ahora una tabla de r' para todos los estudios:

Tabla AXIII.5. Coeficientes de correlación transformados (r') de Fisher de los estudios


del metaanálisis.

Estudio N r' Dirección del efecto


1 82 0.4414 +
2 60 0.4338 +
3 100 0.5568 +
4 60 0.4666 +
5 208 0.2874 +
6 110 0.1430 +

La información anterior puede usarse para verificar la heterogeneidad de los tamaños de


los efectos, pero calculemos primero la media ponderada r' para los estudios:
2:CCN¡-3)xr;-)
Media ponderada 7 = Ec. AXIII.l3
l:CN¡-3)

donde ~ es el número de participantes en el estudio j


rj es la r' del estudio j
j=lak
k es el número de estudios

(79 0.4414 + 57 X 0.4338 + 97 X 0.5568 +57 X 0.4666 + 205 0.2874 + 107 X 0.1 430)
7 =
X X

(79 +57 + 97 + 57 + 205 + 107)

214.4161
602

0.3562

Si un estudio tiene efecto con dirección negativa, sur' será negativa al colocarla en la ecua-
ción anterior.
542lL________________________A~p~én_d~ic~e~s_____________________________
Podemos calcular ahora con la ecuación siguiente la heterogeneidad del tamaño del efecto:
Ec. AXIII.14

donde ~ es el número de participantes en el estudio j


r'j es la r' del estudio j
j= !ak
k es el número de estudios
k - 1 son los grados de libertad para la x2
7 es la media ponderada de r'
79 X (0.4414- 0.3562f + 57 X (0.4338- 0.3562)2 +
97 X (0.5568 - 0.3562) 2 + 57 X (0.4666- 0.3562)2 +
205 X (0.2874- 0.3562? + 107 X (0.1430- 0.3562f
0.5733 + 0.3437 + 3.9049 + 0.6948 + 0.96998 + 4.8626
11.3494
Recordemos que si un esh1dio tiene efecto de dirección negativa, su r' será negativa al co-
locarla en la ecuación anterior.
De consultar la tabla de la distribución de x2 en el apéndice XIV, observaremos que la
probabilidad de esta x 2 con 5 gl está entre 0.05 y 0.02, donde los tamaños de los efectos de
los estudios son significativamente heterogéneos. Si miramos el cálculo, se nota que el es-
tudio 6 contribuyó más al resultado. Si retiramos ese estudio y rehacemos los cálculos, inclui-
da la producción de una r' media ponderada, veremos que x2 (4) = 5.4356. La probabilidad
de esta nueva x 2 fluctúa entre 0.3 y 0.2. En otras palabras, los cinco estudios restantes no
son significativamente heterogéneos respecto al tamaño del efecto; por ello, no necesita-
mos retirar más estudios del metaanálisis en cuanto al tamaño del efecto.

Heterogeneidad de la probabilidad
Podemos calcular la heterogeneidad de la probabilidad mediante los valores z estándar de
cada estudio. Hallaremos el valor z medio (z) con el procedimiento estándar para el cálculo
de medias; en este análisis incluirnos los seis estudios:

"=_L-"z_k _.1.
-
Ec. AXIII.l5

donde zj es el valor z del estudio j


j=lak
k es el número de estudios
M_et_a_a_na_'l_is_is______________________~l543
________________________________

(3.8741 +3.2401 +5.3652+3.4768+ 4.0919+ 1.4801)


z=
6

3.5880
Si un estudio tiene efecto con dirección negativa, su z será negativa al colocarla en la
ecuación anterior.
Podemos calcular ahora la heterogeneidad de los valores de la probabil idad mediante
la ecuación siguiente:

Ec. AXIII.l 6

donde k - 1 son los grados de libertad para la x2

x25 = (3.8741 - 3.558)2 + (3.240 1 - 3.558)2 +


(5.3652 - 3.558)2 + (3.4768 - 3.558)2 +
(4.09 19 - 3.558)2 + ( 1.4801 - 3.558)2

= 8.0709

Recordemos que si un estudio tiene efecto con dirección negativa, su z será negativa en la
ecuación anterior.
Según la tabla de la distribución de x2 del apéndice XIV, la probabilidad de que x2 con
5 gl sea un suceso por azar está entre 0.2 y 0.1 , por lo cual no es estadísticamente signifi-
cativo. En este caso, concluiremos que los seis estudios no resultan heterogéneos de ma-
nera significativa respecto a sus niveles de probabilidad.

Combinación del tamaño del efecto


Los tamaños del efecto se combinan de acuerdo con la ecuación siguiente:

r' combinada =
2:( / >< r'1 )
11

Ec. AXIII.17
L"i
donde n1 es el número de participantes en el estudio j
j = l ak
k es el número de estudios del metaanális is
r'1 es la z de Fisher para el estudio j

82 x 0.4414+60x0.4338+ IOOx 0.5568+ 60x 0.4666+ 208x0.2874+ 1IOx 0. 1430


r' combinada
8-"2+60+ 100+60+208 +110
544lL_________________________A~p_é_nd_i_ce_s______________________________
221.403
620

0.3571

Si un estudio tiene efecto con dirección negativa, su r' será negativa al colocarla en la ecua-
ción anterior.
Ese valor puede convertirse en uno r mediante la ecuación presentada en el apéndice
XVI para transformar r' en r. Ello produce un tamaño del efecto combinado (r) = 0.3427.
De acuerdo con Cohen (1988), ése es un tamaño medio del efecto. Como los seis es-
tudios fueron heterogéneos respecto al tamaño del efecto, calcularemos también el tamaño
del efecto de los demás estudios una vez que hemos retirado el sexto. Aquí, la r combina-
da = 0.3828, que también es un tamaño medio del efecto.

Combinación de la probabilidad
Podemos combinar la probabilidad utilizando en la ecuación siguiente las puntuaciones z
estándar que se muestran en la tabla AXIII.4:

l:Cn· x z ·)
z combinada= ~ Ec. AXIII.18
-..¡ 2: (11¡)2
donde nj es el número de participantes en el estudio j
j=lak
k es el número de estudios
zj es la puntuación z estándar del estudio j

z combinada =
82 X 3.8741 + 60 X 3.2401 + 100 X 5.3652 + 60 X 3.4768 + 208 X 4.0919 + 110 X 1.4801
~822 + 602 + 1002 + 602 + 2082 + 1J02

317.6572 + 194.4055 + 536.5181 + 208.6087 + 851.1193 + 162.8086


~79 288

2271.135
281.5812

8.0656

Si un estudio tiene efecto con dirección negativa, su z será negativa al colocarla en la ecua-
ción ante1ior.
________________________________ ' l_is_is______________________~¡545
M_e t_a_a _na_

La tabla z del apéndice XIV muestra que este valor z combinado es significativo debajo
del nivel p = 0.0000 l. Podemos concluir que quienes sufren dolor pélvico padecen signifi-
cativamente más depresión que los grupos control participantes en los estudios. De nuevo,
como el estudio 6 produce heterogeneidad respecto al tamaño del efecto, para completar el
panorama recalcularemos la probabilidad combinada de los cinco estudios restantes. El cálculo
produce un valor z de 8.1338, el cual también es significativo en el nivelp < 0.00001.

Intervalo de confianza
Para hallar el intervalo de confianza en el nivel de confianza de 95% colocaremos en la
ecuación siguiente el tamaño del efecto combinado (r'), antes de transfmmarlo en r, y el nú-
mero total de participantes; en el ejemplo calculamos el IC de los seis estudios originales:
1.96
Intervalo de confianza para r' (IC) = r' - -r==== Ec. AXIII.l9
~2,(NJ- 3)

, 1.96
para r +
~ 2,(N; - 3)

donde ~ es el número total de participantes en el estudio j


j=lak
k es el número de estudios del metaanálisis
96
IC parar' = 0.3571 - 1.
~79+57+97+57+205+107

para
1.96
0.3571 +
~79+57+97+57+205 + 107

96
0.3571 - ~ para 0.3571 + 1.
'-!602 f602
0.3571 - 0.0799 para 0.3571 + 0.0799

0.2772 para 0.4370


Es necesario convertir esos valores en r mediante la ecuación para transformar r' en r que
se presenta en el apéndice XVI. El IC se convierte en:

IC para r = 0.2703 para 0.4111


546lL________________________~A~p~én~d~ic=e~s______________________________
El problema del archivero
La N fracaso-éxito representa el número de estudios no publicados y no significativos que
obrarían en los archiveros de los investigadores a fin de que la probabilidad encontrada en
el metaanálisis fuera no significativa. Calculamos dicha N con la ecuación siguiente; de
nueva cuenta, utilizamos como ejemplo la probabilidad de los seis estudios:

N fr , . _ kx(.kx .? - 2.706)
acaso-ex1to - . Ec. AXIII.20
2 706

donde k es el número de estudios del metaanálisis


z es el valor z estándar combinado del metaanálisis
Por tanto,
6 X (6 X 8.0656 2 - 2.706)
N 1racaso-exito =
C; , •

2.706

859.4621
Redondeado al entero siguiente, da

= 860

En consecuencia, habrá al menos 860 estudios no significativos a fin de que el metaanálisis


tampoco lo sea. Para interpretar esa cifra, calcularemos el número crítico de estudios no publi-
cados y no significativos que podríamos esperar razonablemente que estuviesen archivados.

Número critico de estudios para el problema del archivero


Rosenthal ( 1991) presentó la ecuación siguiente para el nivel crítico de estudios no signi-
ficativos:

Número crítico de estudios = (s x k)+ 10 Ec. AXIII.21

donde k es el número de estudios utilizados en el metaanálisis


Por tanto,
Número crítico de estudios (sx6)+10

40

El tema del archivero supone un problema sólo si el número crítico de estudios es igual o
mayor que la N fracaso-éxito. En este caso, como tal número es 40 y esa N 860, el tema no
entrai'ia un problema y podemos tener más confianza respecto al efecto combinado y a las
probabilidades combinadas que calculamos.
____________________________________M_e_t _a _a n_ a_' l_is_is__________________________~~

Es evidente que calcularemos la N fracaso-éxito y el número crítico de estudios sólo


si el metaanálisis presenta un resultado significativo.

Presentación del informe del metaanálisis


1'

Si en el metaanálisis encontramos heterogeneidad del tamaño del efecto, conviene presen-


tar el informe de la versión heterogénea y de la homogénea del metaanálisis con objeto de
que el lector pueda ver todo el panorama. Es posible mejorar el tamaño del efecto y tomar
más significativa la probabilidad si retiramos algún estudio aberrante.

Tabla AXII1.6. Resumen de un metaanálisis de estudios donde se exploró la depresión


de las pacientes con dolor pélvico y la de cont roles.

Grupos Número Número Tamaño Intervalo z p N Número


comparados de total del de combinada combinada fracaso· crítico
estudios de efecto confianza éxito de
participantes combinado estudios
(r} archivados

Dolor
pélvico
vs.
controles

Todos 0.2703
los 6 620 0.3427 para 8.066 <0.0001 860 40
estudios 0.411 1

0.2627
Estudios 5 510 0.3828 para 8.134 <0.0001 607 35
homogéneos 0.4179

111
XIV
Tablas de probabilidad

La mayoría de los programas estadísticos para computadora proporcionan el nivel necesa-


rio de probabilidad para los resultados de la prueba estadística que se real ice, igual que
algunas hojas de cálculo, como Excel. Sin embargo, en ocasiones es necesario verificar la
probabilidad en una tabla. No incluimos un conjunto exhaustivo de tablas sino que, en los
casos en que se precisa de una tabla para un nivel de probabilidad individual, proporciona-
mos los niveles críticos de una estadística para a= 0.05 por ser éste el nivel alfa más usado.
Sin embargo, cuando no se dispone de probabilidades de una cola o éstas son innecesarias,
ofrecemos también valores para a = 0.01. En otras obras especializadas figura una amplia
variedad de tablas; por ejemplo, en Nea ve ( 1978).

Cálculo de la probabilidad de una estadística


para gl que no aparecen en las tablas
Usaremos la prueba t para ejemplificar el tema, pero el principio es válido para otras prue-
bas, entre ellas las no paramétricas donde se muestran probabilidades en lugar de gl para
tamaños de muestra concretos.
Cuando las tablas no incluyan las probabilidades para los grados de libertad exactos
afines a la prueba que hayamos realizado, podemos aplicar la prueba rápida inicial consis-
tente en verificar si el valor t de los gl inmediatos inferiores es estadísticamente significa-
tivo. En ese caso, también lo será con los gl correctos. Por ejemplo, si gl = 45, entonces un

548
_____________________________~_a_
b_la_s_d_e~p_r_
ob_a_b_il_id_a_d__________________~J'5.49

valor t de 1.7 será estadísticamente significativo en a= 0.05 para una prueba de una co-
la, pues el valor t crítico de gl = 40 es 1.684. Por otra parte, si el valor t no es significativo
en el gl inmediato superior, tampoco lo será en el gl exacto. Por tanto, si gl = 45 y el valor
tes 1.6, no será estadísticamente significativo en a= 0.05 en una prueba de una cola por-
que el valor t crítico para gl = 50 es 1.676. Si estos métodos aproximados no nos dicen si
el resultado es estadísticamente significativo o no, usaremos la interpolación lineal.

Interpolación lineal
Cuando dependemos totalmente de las tablas t y los grados de libertad de nuestro estudio
no aparecen en ellas, podemos usar lo que se conoce como interpolación lineal a fin de
cálcular un valor t crítico más exacto para una probabilidad determinada. Por ejemplo,
t = 1.682 con gl = 43. En el cálculo del valor t crítico para gl = 43, con a= 0.05 y una prue-
ba de una cola, utilizaremos la ecuación siguiente:
, . t del gl inmediato superior + (t del gl inmediato gl superior- gl calculado)
t cntlca =
inferior- t del gl inmediato superior) x ( gl superior - gl inferior

En el presente caso,
50-43)
t crítica(4J) 1.676 + {1.684 - 1.676) X ( 50-40

1.682

El valor t calculado es igual que el crítico y, por lo mismo, estadísticamente significativo


en a= 0.05.

Probabilidades de z, la distribución normal estandarizada


Las probabilidades de una cola se encuentran en el cuerpo de la tabla. En la primera colum-
na se muestran los valores z con un decimal; en la siguiente, el segundo decimal. Para leer
la tabla, si desea encontrar la probabilidad de una puntuación z de 1.72, busque en la pri-
mera columna la fila que comience con 1.7; la probabilidad estará ahí. Revise ahora la
primera fila de la columna encabezada por el número 2; la probabilidad estará en ella. Por
tanto, la probabilidad de una cola de z = 1.72 es 0.0427. Si busca la probabilidad de un va-
lor z que no contenga dos decimales, por ejemplo, 2.1 o 2.1 O, la probabilidad aparece en la
primera columna de probabilidades, encabezada por el número O. De esta manera, la pro-
babilidad de una cola de z = 2.1 es 0.0179.
55QlL________________________A~p_én_d_ic_e_s_____________________________
Cálculo de un valor z para una probabWdad concreta
Para calcular el valor= que da una probabilidad de una cola de 0.001, busque en el cuerpo de
la tabla hasta encontrar 0.001. Observe la fila y la columna que contienen la probabilidad;
sus encabezados son 3.0 y 8, respectivamente. Por ello, el valor= es 3.08. En ocasiones, la
probabilidad exacta requerida no aparece en la tabla. Eso se aplica, por ejemplo, a p = 0.05.
En este caso, es necesario observar las probabilidades situadas justo por arriba y por deba-
jo de la que necesitamos: 0.0495 y 0.0505. Como la probabilidad deseada está en medio de
ambas, el valor z estará a la mitad de los valores z respectivos, 1.64 y 1.65; es decir, 1.645.

Probabilidades de dos colas


Si queremos calcular la probabilidad de dos colas de un valor z, multiplicaremos por 2 los
valores que aparecen en el cuerpo de la tabla. Así. la probabilidad de dos colas de == l. 72
es 0.0427 x 2 = 0.0854. Para calcular el valor= de una probabilidad de dos colas concreta,
encontraremos el valor z que dé una probabilidad de una cola igual a la mitad de la proba-
bilidad de dos colas. Por ejemplo, si deseamos encontrar el valor= con una probabilidad
de dos colas de 0.05, buscaremos en el cuerpo de la tabla p = O.~S = 0.025.
Procedemos como se indicó para encontrar el valor z que dé esta probabilidad: z = 1.96.

Búsqueda de valores z negativos


La tabla comprende sólo valores= positivos. Para encontrar uno negativo, recordaremos que,
como la distribución de z es simétrica, ignoraremos el signo negativo y usaremos la tabla co-
mo se describe en los párrafos anteriores. Por ejemplo. la probabilidad de una cola de un
valor= de -1.25 es igual a 0.1056.
r -----------------------------Ti~a_b_la_s_d_e~p_r_o_ba_b_i_lid~a~d------------------~1'551
Tabla AXIV.1. Probabilidades de z, la distribución normal estandarizada.
2o. decimal
z o 2 4 5 6 7 8 9
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.21 77 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1 736 0. 1711 0.1685 0.1660 0.1635 0.1611
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1 292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1 151 0.1131 0.1112 0.1093 0.1075 0 .1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823

-
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 . 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.001 1 0.0011 0.0011 0.0010 0.0010
3.1 ·0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 . 0.00079 0.00076 0.00074 0.00071
3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
3.7 0.0001 1 0.00010 0.00010 0.00010 0 .00009 0.00009 0.00008 0.00008 0.00008 0.00008
3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002

·--
1
5s2l Apéndices

Tabla AXIV.2. Probabilidades de las distribuciones t.


Grados de libertad
Para una prueba t entre sujetos con gl = n 1 + n2 - 2, donde n 1 y n2 son los tamaños de las
dos muestras.
Para una prueba t intrasujetos con gl = 11 - 1, donde n es el tamaño de la muestra.
Para una prueba en que la media de una muestra se compara con la de una población,
gl = 17- l.
a) Grados de libertad de 1 a 20.

Probabilidades de una cola


0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
Probabilidades de dos colas

gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001

0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.656 318.289 636.578

2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.328 31.600

3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.214 12.924

4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610

5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.894 6.869

6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959

7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408

8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041

9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781

10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4. 144 4.587

11 0.260 0.540 0.876 1.363 1.796 2.201 2.718 3.106 4.025 4.437

12 0.259 0.539 0.873 1.356 1.782 2.179 2.681 3.055 3.930 4.318

13 0.259 0.538 0.870 1.350 1.771 2.160 2.650 3.012 3.852 4.221

14 0.258 0.537 0.868 1.345 1.761 2.145 2.624 2.977 3.787 4.140

15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073

16 0.258 0.535 0.865 1.337 1.746 2.120 2.583 2.921 3.686 4.015

17 0.257 0.534 0.863 1.333 1.740 2.110 2.567 2.898 3.646 3.965

18 0.257 0.534 0.862 1.330 1.734 2.101 2.552 2.878 3.610 3.922

19 0.257 0.533 0.861 1.328 1.729 2.093 2.539 2.861 3.579 3.883

20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850
1
, _____________________________Ti_a_b_
la_s_d_e~p_r_o_ba_b_i_lid_a_d__________________~¡-553

Tabla AXIV. 2. Probabilidades .de las distribuciones t.


b) Grados de libertad de 2 1 a 120 e infinito.
Los valores para gl infinito (ce) se presentan para demostrar que cuando el tamaño de una
muestra es suficientemente grande, muy superior a 120, la distribución tes igual a la dis-
tribución z. Por tanto, el valor t crítico para una probabilidad de una cola en a = 0.05 es
1.645, cuando gl = infinito. La probabilidad de una cola de z = 1.645 es 0.05.
Probabilidades de una cola
0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
Probabilidades de dos colas
gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
21 0.257 0.5 32 0.859 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 0.256 0.532 0.858 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 0.256 0.532 0.858 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 0.256 0.531 0.857 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725

..
26 0.256 0.531 0.856 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 0.256 0.531 0.855 1.314 1.703 2.052 2.473 2.771 3.421 3.689
28 0.256 0.530 0.855 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 0.256 0.530 0.854 1.31 1 1.699 2.045 2.462 2.756 3.396 3.660
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646
31 0.256 0.530 0.853 1.309 1.696 2.040 2.453 2,744 3.375 3.633
32 0.255 0.530 0.853 1.309 1.694 2.037 2.449 2.738 3.365 3.622
33 0.255 0.530 0.853 1.308 1.692 2.035 2.445 2.733 3.356 3.611
34 0.255 0. 529 0.852 1.307 1.691 2.032 2.441 2.728 3.348 3.601
35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591
36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574

-
38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551
50 0.255 0.528 0.849 1.299 1.676 2.009 2.403 2.678 3.261 3.496
60 0.254 0.527 0.848 1.296 1.671 2.000 2.390 2.660 3.232 .3.460
70 0.254 0.527 0.847 1.294 1.667 1.994 2.381 2.648 3.211 3.435
80 0.254 0.526 0.846 1.292 1.664 1.990 2.374 2.639 3.195 3.416
90 0.254 0. 526 0.846 1.291 1.662 1.987 2.368 2.632 3.183 3.402
100 0.254 0.526 0.845 1.290 1.660 1.984 2.364 2.626 3.174 3.390
110 0.254 0.526 0.845 1.289 1.659 1.982 2.361 2.621 3.166 3.381
120 0.254 0.526 0.845 1.289 1.658 1.980 2.358 2.617 3.160 3.373

-
00 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.290
554l~-------------------------A~p_én_d_ic_e_s______________________________

Probabilidades de las distribuciones de x2


La forma de la distribución de x2 se vuelve má~ simétrica conforme los gl aumentan.

1-

1 \
1 \
\
\

__....1 -

·~-- --
/- ......... ...
'
\

/"" ....

-
\
\ ' .......
\ / .............
~
, /
-
' ... ...
-- -
1 ....... ... .........
---
o 20 40

y}

- gl= 1
gl = 5
-- gl = 20

Las probabilidades se muestran en la primera fila de la tabla AXIV.3 y se utilizan en hipó-


tesis no direccionales. En los capítulos 14 y 15 se indica cómo calcular las probabilidades
de hipótesis direccionales. En el cuerpo de la tabla se presenta el tamaño mínimo con que
un valor de x2 para unos gl determinados se tomaría estadísticamente significativo en un
nivel de probabilidad determinado. De esa forma, con gl = 1, 2 tendría que ser igual a 3.84 x
o mayor para ser estadísticamente significativa en <X = 0.05.

\
-----------------------------~-a_b_la_s_d_e~p_r_o_ba_b_i_lid_a~d--------------------~1'555
Tabla AXIV.3. Probabilidades de las distribuciones de x2.
Probabilidad
gl o 99 o 9S 090 080 070 oso 030 020 o 10 o 05 o 02 o 01 o 001
1 0.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 10.83
2 0.02 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 7.82 9.21 13.82
0.11 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 16.27
4 0.30 0.71 1.06 1.65 2.19 3.36 4 .88 5.99 7.78 9.49 11 .67 13.28 18.47
S o.ss 1.1S 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 13.39 15.09 20.51
6 0 .87 1.64 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 15.03 16.81 22.46
1.24 2. 17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 16.62 18.48 24.32
8 1.65 2.73 3.49 4.S9 5.S3 7.34 9.52 11 .03 13.36 15.51 18.17 20.09 26.12
9 2.09 3.33 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 19.68 21 .67 27.88
10 2.56 3.94 4.87 6.18 7.27 9.34 11.78 13.44 15.99 18.31 21.16 23 .21 29. 59
11 3.05 4.57 5.58 6.99 8.15 10.34 12.90 14.63 17.28 19.68 22.62 24.73 31.26
12 3.57 5.23 6.30 7.81 9.03 11.34 14.01 15.81 18.55 21 .03 24.05 26.22 32.91
13 4 .11 5.89 7.04 8.63 9.93 12.34 15.12 16.98 19.81 22.36 25.47 27.69 34.53
14 4.66 6.57 7.79 9.47 10.82 13.34 16.22 18.15 21 .06 23.68 26.87 29.14 36.12
15 5.23 7.26 8.55 10.31 11 .72 14.34 17.32 19.31 22.31 25.00 28.26 30.58 37. 70
16 5.81 7.96 9.31 11.15 12.62 15.34 18.42 20.47 23.S4 26.30 29 .63 32.00 39.2S
17 6.41 8.67 10.09 12.00 13.53 16.34 19.51 21.61 24.77 27.59 31.00 33.41 40.79
18 7.01 9.39 10.86 12.86 14.44 17. 34 20.60 22.76 25.99 28.87 32. 35 34.81 42.31
19 7.63 10.12 11 .65 13.72 15.35 18. 34 21.69 23.90 27.20 30.14 33.69 36.19 43.82
20 8.26 10.85 12.44 14.58 16.27 19.34 22.77 2S.04 28.41 31 .41 35.02 37.57 45.31
21 8.90 11.59 13.24 15.44 17.18 20.34 23.86 26.17 29 .62 32.67 36.34 38.93 46.80
22 9.54 12.34 14.04 16.31 18.10 21.34 24.94 27.30 30.81 33.92 37.66 40. 29 48.27
23 10.20 13.09 14.85 17.19 19.02 22.34 26.02 28.43 32.01 35.17 38.97 41.64 49.73
24 10.86 13.85 15.66 18.06 19.94 23. 34 27.10 29.55 33.20 36.42 40.27 42.98 51.18
25 11 . 52 14.61 16.47 18.94 20.87 24.34 28.17 30.68 34.38 37.65 41.57 44.31 52.62
26 12.20 15.38 17.29 19 .82 21 . 79 25. 34 29.2S 31..79 35.56 38.89 42.86 45 .64 54.05
27 12.88 16.15 18.11 20.70 22.72 26.34 30.32 32.91 36.74 40.11 44.14 46.96 55.48
28 13.56 16.93 18 .94 21 . 59 23.65 27. 34 31.39 34.03 37.92 41 . 34 45.42 48.28 56.89
29 14.26 17.71 19.77 22.48 24.58 28.34 32.46 35.14 39.09 42.56 46.69 49 .59 58.30
30 14.95 18.49 . 20.60 23.36 2S.51 29.34 33.53 36.25 40.26 43.77 47.96 50.89 59.70
31 15.66 19.28 21.43 24.26 26.44 30.34 34.60 37.36 41 .42 44.99 49.23 52.19 61 .10
32 16.36 20.07 22 .27 25.15 27.37 31.34 35.66 38.47 42.58 46.19 50.49 53.49 62.49
33 17.07 20.87 23.11 26.04 28.31 32.34 36.73 39.57 43.75 47.40 51.74 54.78 63.87
34 17.79 21.66 23 .95 26.94 29.24 33.34 37.80 40.68 44.90 48.60 53.00 56.06 65.25
3S 18.51 22 .47 24.80 27.84 30. 18 34.34 38.86 41.78 46.06 49.80 54.24 57.34 66.62
36 19.23 23 .27 25.64 28.73 31.12 35.34 39.92 42.88 47.21 S1.00 55.49 58.62 67.98
37 19.96 24.07 26.49 29.64 32.05 36.34 40.98 43.98 48.36 52.19 56.73 59.89 69. 35
38 20.69 24.88 27. 34 30.54 32.99 37.34 42.05 45.08 49. S1 53.38 57.97 61.16 70..70
39 21.43 25.70 28.20 31.44 33.93 38.34 43.11 46.17 50.66 54.57 59.20 62 .43 72.06
40 22.16 26.51 29.05 32.34 34.87 39.34 44.16 47.27 51.81 55.76 60.44 63 .69 73.40
50 29.71 34.76 37.69 41.45 44.31 49.33 54.72 58.1 6 63.17 67.50 72.61 76.15 86.66
60 37.48 43.19 46.46 50.64 53.81 59. 33 65.23 68.97 74.40 79.08 84.58 88.38 99.61
70 45.44 51.74 55.33 59.90 63.35 69.33 75.69 79 .71 8S.S3 90.53 96.39 100.43 112.32
80 53.54 60.39 64.28 69. 21 72.92 79. 33 86.12 90.41 96.58 101 .88 108.07 112.33 124.84
90 61.75 69.13 73.29 78.S6 82.51 89.33 96. 52 101.05 107.57 113.15 119.65 124.12 137.21
100 70.06 77.93 82 .36 87.95 92.13 99.33 106.91 11 1.67 118.50 124.34 131.14 135.81 149.45
110 78.46 86.79 91.47 97.36 101.77 109.33 11 7.27 122.25 129.39 135.48 142. 56 147.41 161 .58

-
120 86 .92 95 .70 100.62 106.81 111 .42 119.33 127.62 132.81 140.23 146.57 153.92 158.95 173 .62
5561 Apéndices

Tabla AXIV.4. Probabilidades de la prueba U de Mann-Whitney.

Si la muestra menor tiene 20 participantes o más, usaremos la ecuación AV1.7 (o la AV1.8


si hay puntuaciones empatadas) de la aproximación z incluida en el apéndice VI.
a) El tamaño de la muestra menor (n 1) = 2 a 7.
Como ejemplo, si los tamaños de la muestra fueran 5 y 8, U deberá ser 8 o menor a fin de
tener significación en a. = 0.05 para una prueba de una cola.
Probabilidades de una cola
0.05 0.025 0.01 0.005 0.05 0.025 0.01 0.005 0.05 0.025 0.01 0.005
Probabilidades de dos colas
n1 n2 0 .10 0.05 0.02 0.01 n1 n2 0.10 0 .05 0.02 0.01 n1 n2 0.1 0 0.05 0.02 0.01
2 5 o 4 4 1 o 6 6 7 5 3 2
6 o 5 2 1 o 7 8 6 4 3
7 o 6 3 2 1 o 8 10 8 6 4
8 o 7 4 3 1 o 9 12 10 7 5
9 o 8 5 4 2 1 10 14 11 8 6
10 o 9 6 4 3 1 11 16 13 9 7
11 1 o 10 7 5 3 2 12 17 14 11 9
12 2 11 8 6 4 2 13 19 16 12 10
13 2 o 12 9 7 5 3 14 21 17 13 11
14 o 13 10 8 5 3 15 23 19 15 12
15 o 14 11 9 6 4 16 25 21 16 13
16 1 o 15 12 10 7 5 17 26 22 18 15
17 3 2 o 16 14 11 7 5 18 28 24 19 16
18 4 2 o 17 15 11 8 6 19 30 25 20 17
19 4 2 o 18 16 12 9 6 20 32 27 22 18
20 4 o
'----------'
19 17 13 9 7
20 18 14 10 8 7 7 11 8 6 4
o 8 13 10 7 6
4 o 4 2 1 o 9 15 12 9 7
5 1 o 6 5 3 2 1 10 17 14 11 9
6 2 1 7 6 5 3 1 11 19 16 12 10
7 2 1 o 8 8 6 4 2 12 21 18 14 12
8 3 2 o 9 9 7 5 3 13 24 20 16 13
9 4 2 1 o 10 11 8 6 4 14 26 22 17 15
10 4 3 1 o 11 12 9 7 5 15 28 24 19 16
11 5 3 1 o 12 13 11 8 6 16 30 26 21 18
12 5 4 2 1 13 15 12 9 7 17 33 28 23 19
13 6 4 2 1 14 16 13 10 7 18 35 30 24 21
14 7 5 2 1 15 18 14 11 8 19 37 32 26 22
15 7 5 3 2 16 19 15 12 9 20 39 34 28 24
16 8 6 3 2 17 20 17 13 10
17 9 6 4 2 18 22 18 14 11
18 9 7 4 2 19 23 19 15 12
19 10 7 4 3 20 25 20 16 13
20 11 8 5 3

(Adaptada, con autorización de Routledge, de H. R. Neave y P. L. Worthington, "Table G", Distribution-Free Tesis,
Routledge, Londres, 1988, p. 375.)
_____________________________t_a_b_
la_s_d_e~p_r_
ob_a_b_il_id_a_d__________________~¡-557

Tabla AXIV.4. Probabilidades de la prueba U de Mann -Whitney.

b) El tamaño de la muestra menor (n 1) = 8 a 20.


Probabilidades de una cola
0.05 0.025 0.01 0.005 0.05 0.025 0.01 0.005 0.05 0.025 0.01 0.005
Probabilidades de dos colas
n, n2 0.10 0.05 0.02 0.01 n 1 n 2 0.10 0.05 0.02 0.01 n1 n2 0.10 0.05 0.02 0.01
8 8 15 13 9 7 11 11 34 30 25 21 14 14 61 55 47 42
9 18 15 11 9 12 38 33 28 24 15 66 59 51 46
10 20 17 13 11 13 42 37 31 27 16 71 64 56 50
11 23 19 15 13 14 46 40 34 30 17 77 69 60 54
12 26 22 17 15 15 50 44 37 33 18 82 74 65 58
13 28 24 20 17 16 54 47 41 36 19 87 78 69 63
14 31 26 22 18 17 57 51 44 39 20 92 83 73 67
15 33 29 24 20 18 61 55 47 42
16 36 31 26 22 19 65 58 50 45
15 15 72 64 56 51
17 39 34 28 24 20 69 62 53 48
16 77 70 61 55
18 41 36 30 26 17 83 75 66 60
19 44 38 32 28 18 88 80 70 64
12 12 42 37 31 27
20 47 41 34 30 19 94 85 75 69
13 47 41 35 31
20 100 90 80 73
14 51 45 38 34
9 9 21 17 14 11 15 55 49 42 37
10 24 20 16 13 16 60 53 46 41 16 16 83 75 66 60
11 27 23 18 16 17 64 57 49 44 17 89 81 71 65
12 30 26 21 18 18 53 47 18 95 86 76 70
68 61
19 101 92 82 74
13 33 28 23 20 19 72 65 56 51
20 107 98 87 79
14 36 31 26 22 20 77 69 60 54
15 39 34 28 24
16 42 37 31 27 17 17 96 87 77 70
13 13 51 45 39 34
17 45 39 33 29 18 102 92 82 75
14 56 50 43 38
18 48 42 36 31 19 109 99 88 81
15 61 54 47 42 20 115 105 93 86
19 51 45 38 33
16 65 59 51 45
20 54 '48 40 36
17 70 63 55 49
18 18 109 99 88 81
18 75 67 59 53
19 116 106 94 87
10 íO 27 23 19 16 19 80 72 63 57
20 123 112 100 92
11 31 26 22 18 20 84 76 67 60
12 34 29 24 21
19 19 123 113 101 93
13 37 33 27 24
20 130 119 107 99
14 41 36 30 26
15 44 39 33 29
16 48 42 36 31 20 20 lm 127 114 105
17 51 45 38 34
18 55 48 41 37
19 58 52 44 39
20 62 55 47 42

(Adaptada, con autorización de Routledge, de H. R. Neave y P. L. Worthington, "Table G", Distribution-Free Tests,

-
Routledge, Londres, 1988, p. 376.)
'
558lL________________________A~p_én_d_ic_e_s_____________________________
Tabla AXIV.5. Probabilidades de T de la prueba de Wilcoxon de rangos con signo para
pares equiparados.

Si la muestra tiene más de 25 participantes, usaremos la ecuación AVI.! O (o la AVI. ll s i


hay puntuaciones empatadas) de la aproximación z incluida en el apéndice VI. Para que sea
estadísticamente s ignificativa, T debe ser igual o menor que el valor que aparece en la
tabla.

Probabilidades de una cola


0.05 0.025 0.01 0.005
Probabilidades de dos colas
n 0.1 0.05 0.02 0.01
5 o
6 2 o
7 3 2 o
8 5 3 1 o
9 8 5 3 1
10 10 8 5 3
11 13 10 7 5
12 17 13 9 7
13 21 17 12 9
14 25 21 15 12
15 30 25 19 15
16 35 29 23 19
17 41 34 27 23
18 47 40 32 27
19 53 46 37 32
20 60 52 43 37
21 67 58 49 42
22 75 65 55 48
23 83 73 62 54
24 91 81 69 61
25 100 89 76 68

(Adaptada, con autorización de Routledge. de H. ll ·ea, e)' P. L. Wonhington. "Tablc o··. Dislribution-Free Tesis.
Routlcdge. Londres. 1988. p. 373.)
____________________________1~a~b~la~s~d~e~p~ro~b~a~bt~·li~d~ad~----------------~~

Tabla AXIV.6. Probabilidades de la prueba de probabilidad exacta de Fisher.


a) n =Sa 12.
Para leer las tablas, identifique el total de fila o columna menor; este valor será S 1. Halle
luego el total siguiente de fila o columna menor; éste constituirá S2 . Y x representará el nú-
mero de la celda en que se intersecan S 1 y S2.

1 2 1 o 2

~ n
1 o
2
1 8 8
8 10
De esta manera, si un resultado está de acuerdo con una hipótesis direccional, cuando la
muestra tiene tamaño (n) de 10, S 1 = 2, S2 = 2 y x = 2, su probabil idad es p = 0.022.
Hemos incluido sólo probabilidades hasta O. J. Para obtener otras mayores, consúltese
Dixon y Massey (1983) o Siegel y Castellan (1988).

n s, S¡ x Una cola Dos colas n s, S¡ X Una cola Dos colas n s, S¡ x Una cola Dos colas
S 2 2 2 0.100 0.1 00 10 1 1 1 0.100 0.100 12 1 1 1 0.083 0.083
6 2 2 2 0.067 0.067 2 2 2 0.022 0.022 2 2 2 0.01S 0.01S
3 3 o o.oso 0.100 2 2 0.067 0.067 2 3 2 0.04S 0.04S
3 o. oso 0.100 3 3 3 0.008 0.008 2 4 2 0.091 0.091
7 2 2 2 0.048 0.048 3 4 3 0.033 0.033 3 3 o.oos o.oos
3 3 3 0.029 0.029 3 S o 0.083 0.167 3 4 3 0.018 0.018
8 2 2 2 0.036 0.036 3 0.083 0.1 67 3 S 3 0.04S 0.045
3 3 3 0.018 0.018 4 4 o 0.071 0.0:'6 3 6 o 0.091 0.182
3 4 o 0.071 0.143 4 0.005 o.oos 3 0.091 0.182
3 0.071 0.143 4 S o 0.024 0.048 4 4 3 0.067 0.067
4 4 o 0.014 0.029 4 0.024 0.048 4 0.002 0.002
4 0.014 0.029 5 S o 0.004 0.008 4 5 o 0.071 0.081
9 2 2 2 0.028 0.028 S 0.004 0.008 4 0.010 0.010
2 3 2 0.083 0.083 11 1 1 1 0.091 0.091 4 6 o 0.030 0.061
3 3 3 0.012 0 .012 2 2 2 0.018 0.018 4 0.030 0.061
3 4 3 0.048 0.048 2 2 0.055 0.055 5 5 o 0.027 0.028
4 4 o 0.040 0.048 3 3 0.006 0.006 4 0.045 o.on
.... 4 0.008 0.008 3 4 0.024 0.024 S 0.001 0.001
3 S 3 0.061 0.061 5 6 o 0.008 0.015
4 4 3 0.088 0.088 0.008 0 .015
4 0.003 0 .003 6 6 o 0.001 0.002
4 5 o 0.045 0.061 0.040 0.080
4 0.015 0.015 0.040 0.080
S S o 0.013 0.015 6 0.001 0.002
4 0.067 0.080
5 0.002 0.002

(Adaptada. con autorización de McGraw- Hill Companies. de W. J. Dixon y F. J. Masscy. Jr.. lmroductionto Statisrical
4a. ed .• McGra\\-Hi11. Nueva York. 1983.)
Atw~l"Sis,
56Ql Apéndices

Tabla AXIV. 6. Probabilidades de la prueba de probabilidad exacta de Fisher.

b) n = 13 a 15.
n s, Sz X Una cola Dos cola.s n s, Sz X Una cola Dos colas n s, Sz X Una cola Dos colas
1
13 1 1 1 0.077 0.077 14 1 1 1 0.071 0.071 15 1 1 1 0.067 0.067
2 2 2 0.013 0.013 2 2 2 0.011 0.011 2 2 2 0.010 0.010
2 3 2 0.038 0.038 2 3 2 0.033 0.033 2 3 2 0.029 0.029
2 4 2 o.on o.on 2 4 2 0.066 0.066 2 4 2 O.OS7 O.OS7
3 3 3 0.003 0.003 3 3 2 0.093 0.093 2 S 2 0.09S 0.095
3 4 3 0.014 0.014 3 0.003 0.003 3 3 2 0.081 0.081
3 S 3 0.035 0.03S 3 4 3 0.011 0.011 3 0.002 0.002
3 6 3 0.070 0.070 3 5 3 0.027 0.027 3 4 3 0.009 0.009
4 4 3 0.052 0.052 3 6 3 0.055 0.055 3 5 3 0.022 0.022
4 0.001 0.001 3 7 o 0.096 0.192 3 6 3 0.044 0.044
4 5 o 0.098 0.105 3 0.096 0.192 3 7 3 0.077 0.077
4 0.007 0.007 4 4 3 0.041 0.041 4 4 3 0.033 0.033
4 6 o 0.049 0.070 4 0.001 0.001 4 0.001 0.001
4 0.021 0.021 4 S 3 0.095 0.09S 4 5 3 0.077 0.077
5 5 o 0.044 0.075 4 0.005 0.005 4 0.004 0.004
4 0.032 0.032 4 6 o 0.070 0.08S 4 6 o 0.092 0.103
5 0.001 0.001 4 0.015 0.015 4 0.011 0.011
S 6 o 0.016 0.021 4 7 o 0.03S 0.070 4 7 o O.OS1 0.077
4 0.086 0.103 4 0.03S 0.070 4 0.026 0.026
5 0.005 0.005 5 5 o 0.063 0.086 5 5 o 0.084 0.101
6 6 o 0.004 0.005 4 0.023 0.023 4 0.017 0.017
1 0.078 0.103 5 0.0005 0.0005 5 0.0003 0.0003
5 0.02S 0 .029 S 6 o 0.028 0.031 S 6 o 0.042 0.089
6 0.001 0 .001 4 0.063 0.091 4 0.047 0.089
S 0.003 0.003 5 0.002 0.002
5 7 o 0.010 0.021 S 7 o 0.019 0.026
S 0.010 0.021 4 0.100 0.119
6 6 o 0.009 0.010 5 0.007 0.007
S 0.016 0.026 6 6 o 0.017 0.028
6 0.0003 0.0003 5 0.011 0.011
6 7 o 0.002 0.005 6 0.0002 0.0002
1 0.051 0.103 6 7 o 0.006 0.007
5 0.051 0.103 1 0.084 0.119
6 0.002 0.005 5 0.035 0.041
7 7 o <0.0001 <0.0001 6 0.001 0.001
1 0.015 0.029 7 7 o 0.001 0.001
6 0.015 0.029 1 0.032 0.041
7 <0.0001 <0.0001 5 0.100 0.132
6 0.009 0.010
7 0.0002 0.0002

(Adaptada, oon autorización de McGraw-Hill Companies, de W. J. Dixon y F. J. Massey, Jr., l11troduction ro Statistical
A11alysis, 4a. ed., McGraw-Hill, Nueva York, 1983.)
____________________________To_a_
bl_a_
s _de~p_
ro_b_a_
bi_li_
da_d__________________~~

Probabilidades de las distribuciones F


La distribución F depende de los grados de libertad del numerador y los del divisor (en el
ANOVA, aquéllos son por lo general la media de cuadrados del tratamiento; y éstos, la me-
dia de cuadrados del error). Cuanto mayores sean los gl del numerador, la distribución
estará sesgada menos positivamente.

"'-·

r-- 1\
1\
1 1

·~ 1 1
e:
<lJ
:::J
u
~
LJ...

'
-
: ,:''-., 1
1 ,, 1

\1
1

1'

~.
o
1

5 10

F
- gl = 1, 50
-- gl = 5, 50
-- gl = 20, 50

Para leer las tablas, los gl del numerador se muestran en la primera fila y los del divisor en
la columna inicial. Por tanto, si los gl del tratamiento son iguales a 2 y los del error a 20, la
razón F tendrá que ser 3.49 o mayor para resultar estadísticamente significativa en a= 0.05.

11
5621 Apéndices

Tabla AXIV. 7. Probabilidades de la distribución F.


a) a = O.OS,gl 1 = lal4.
gl,
gl2 2 4 6 7 8 9 10 12 14
1 161.45 199.50 215.71 224.58 230.16 233.99 236.n 238.88 240.54 241.88 243.90 245.36
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.42
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.71
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.87
5 6.61 5.79 5.41 5.19 5.05 '1.95 '1.88 '1.82 'l.n '1.7'1 4.68 4.64
6 5.99 5.14 4.76 4.53 '1.39 4.28 4.21 4.15 4.10 '1.06 4.00 3.96
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.53
8 5.32 'IA6 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.24
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.03
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.86
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.74
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2. 75 2.69 2.64
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.55
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.48
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.42
16 4.'19 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.'12 2.37
17 4.'15 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.'15 2.38 2.33
18 4.41 3.55 3.16 2.93 2.n 2.66 2.58 2.51 2.46 2.'11 2.34 2.29
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.26
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.22
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.20
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2. 17
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.15
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.13
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.11
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08
28 4.20 3.34 2.95 2.71 2.56 2.45 2.3b 2.29 2.24 2.19 2.12 2.06
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.05
30 4.17 3.32 2.92 2.69 2.53 2.42 2. 33 2.27 2.21 2.16 2.09 2.04
35 4.12 3.27 2.87 2.64 2.49 2.37 2.29 2.22 2.16 2.11 2.04 1.99
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.95
45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05 1.97 1.92
50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.95 1.89
55 4.02 3.16 2.77 2.54 2.38 2.27 2.18 2.11 2.06 2.01 1.93 1.88
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.86
65 3.99 3.14 2.75 2.51 2.36 2.24 2.15 2.08 2.03 1.98 1.90 1.85
70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97 1.89 1.84
75 3.97 3.12 2.73 2.49 2.34 2.22 2.13 2.06 2.01 1.96 1.88 1.83
80 3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06 2.00 1.95 1.88 1.82
85 3.95 3.10 2 .71 2.48 2.32 2.21 2.12 2.05 1.99 1.94 1.87 1.81
90 3.95 3.10 2.71 2.47 2.32 2.20 2.11 2.04 1.99 1.94 1.86 1.80
95 3.94 3.09 2.70 2.47 2.31 2.20 2.11 2.04 1.98 1.93 1.86 1.80
100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.85 1.79
110 3.93 3.08 2.69 2.45 2.30 2.18 2.09 2.02 1.97 1.92 1.84 1.78
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.83 1.78
...1 Tablas de probabilidad
----------------------------------~------------------------~
~

Tabla AXIV. 7. Probabilidades de la distribución F.

b) a.= 0.05, gl 1 = 16 a lOO.


gl ,
gl2 16 18 20 22 24 30 35 40 50 60 80 100
1 246.47 247.32 248.02 248.58 249.05 250.10 250.69 251.14 251.77 252.20 252.72 253.04
2 19.43 19.44 19.45 19.45 19.45 19.46 19.47 19.47 19.48 19.48 19.48 19.49

...
8.69 8.67 8.66 8.65 8.64 8.62 8.60 8.59 8.58 8.57 8.56 8.5S
4 5.84 5.82 5.80 5.79 5.77 5.7S 5.73 5.72 5.70 5.69 5.67 5.66
5 4.60 4.58 4.56 4.54 4.53 4.50 4.48 4.46 4.44 4.43 4.41 4.41
6 3.92 3.90 3.87 3.86 3.84 3.81 3.79 3.77 3.75 3.74 3.72 3.71
7 3.49 3.47 3.44 3.43 3.41 3.38 3.36 3.34 3.32 3.30 3.29 3.27
8 3.20 3.17 3.15 3.13 3.12 3.08 3.06 3.04 3.02 3.01 2.99 2.97
9 2.99 2.96 2.94 2.92 2.90 2.86 2.84 2.83 2.80 2.79 2.77 2.76
10 2.83 2.80 2.77 2.75 2.74 2.70 2.68 2.66 2.64 2.62 2.60 2.59
11 2.70 2.67 2.65 2.63 2.61 2.57 2.55 2.53 2.51 2.49 2.47 2.46
12 2.60 2.57 2.54 2.52 2.51 2.47 2.44 2.43 2.40 2.38 2.36 2.35
13 2.51 2.48 2.46 2.44 2.42 2.38 2.36 2.34 2.31 2.30 2.27 2.26
14 2.44 2.41 2.39 2.37 2.35 2. 31 2.28 2.27 2.24 2.22 2.20 2.19
15 2.38 2.35 2.33 2.31 2.29 2.25 2.22 2.20 2.18 2.16 2.14 2.12
16 2.33 2.30 2.28 2.25 2.24 2.19 2.17 2.15 2.12 2.11 2.08 2.07
17 2.29 2.26 2.23 2.21 2.19 2.15 2.12 2.10 2.08 2.06 2.03 2.02
18 2.25 2.22 2.19 2.17 2.15 2.1 1 2.08 2.06 2.04 2.02 1.99 1.98
""· 19 2.21 2.18 2.16 2.13 2.11 2.07 2.05 2.03 2.00 1.98 1.96 1.94
20 2.18 2.15 2. 12 2.10 2.08 2.04 2.01 1.99 1.97 1.95 1.92 1.91
21 2.16 2.12 2.10 2.07 2.0S 2.01 1.98 1.96 1.94 1.92 1.89 1.88
22 2.13 2.10 2.07 2.05 2.03 1.98 1.96 1.94 1.91 1.89 1.86 1.85
23 2.11 2.08 2.05 2.02 2.01 1.96 1.93 1.91 1.88 1.86 1.84 1.82
24 2.09 2.05 2.03 2.00 1.98 1.94 1.91 1.89 1.86 1.84 1.82 1.80
25 2.07 2.04 2.01 1.98 1.96 1.92 1.89 1.87 1.84 1.82 1.80 1.78
26 2.05 2.02 1.99 1.97 1.95 1.90 1.87 1.85 1.82 1.80 1.78 1.76
27 2.04 2.00 1.97 1.95 1.93 1.88 1.86 1.84 1.81 1.79 1.76 1.74
28 2.02 1.99 1.96 1.93 1.91 1.87 1.84 1.82 1.79 1.77 1.74 1.73
29 2.01 1.97 1.94 1.92 1.90 1.85 1.83 1.81 1.77 1.75 1.73 1.71
30 1.99 1.96 1.93 1.91 1.89 1.84 1.81 1.79 1.76 1.74 1.71 1.70
35 1.94 1.91 1.88 1.85 1.83 1.79 1.76 1.74 1.70 1.68 1.65 1.63
40 1.90 1.87 1.84 1.81 1.79 1.74 1.72 1.69 1.66 1.64 1.61 1.59
45 1.87 1.84 1.81 1.78 1.76 1.71 1.68 1.66 1.63 1.60 1.57 1.55
50 1.85 1.81 1.78 1.76 1.74 1.69 1.66 1.63 1.60 1.58 1.54 1.52
~ SS 1.83 1.79 1.76 1.74 1.72 1.67 1.64 1.61 1.S8 1.55 1.S2 1.50
60 1.82 1.78 1. 75 1.72 1.70 1.65 1.62 1.59 1.56 1.53 1.50 1.48
65 1.80 1.76 1.73 1.71 1.69 1.63 1.60 1.58 1.54 1.52 1.49 1.46
70 1.79 1.7S 1.72 1.70 1.67 1.62 1.59 1.57 1.S3 1.SO 1.47 1.45
75 1.78 1.74 1.71 1.69 1.66 1.61 1.58 1.55 1.52 1.49 1.46 1.44
80 1.77 1.73 1.70 1.68 1.65 1.60 1.57 1.54 1.51 1.48 1.45 1.43
85 1.76 1.73 1.70 1.67 1.65 1.59 1.56 1.54 1.50 1.47 1.44 1.42
90 1.76 1.72 1.69 1.66 1.64 1.59 1.55 1.53 1.49 1.46 1.43 1.41
95 1.75 1.71 1.68 1.66 1.63 1.58 1.55 1.52 1.48 1.46 1.42 1.40
100 1.75 1.71 1.68 1.65 1.63 1.57 1.54 1.52 1.48 1.45 1.41 1.39
110 1.74 1.70 1.67 1.64 1.62 1.S6 1.53 1.50 1.47 1.44 1.40 1.38
120 1.73 1.69 1.66 1.63 1.61 1.55 1.52 1.50 1.46 1.43 1.39 1.37

~.
564l Apéndices

Tabla AXIV. 7. Probabilidades de la distribución F.

e) a = 0.01 , gl 1 = 1 a 24.

gl2 4 7 8 9 10 12 24
1 4052. 18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980. 95 6022.40 6055.93 6106.68 6234. 27
2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99 .39 99.40 99.42 99.46
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.05 26.60
4 21.20 18.00 16.69 15.98 15. 52 15.21 14.98 14.80 14.66 14.55 14.37 13.93
S 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10. 16 10.05 9.89 9.47
6 13.75 10.92 9.78 9. 15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.31
7 12.25 9.55 8.45 7.85 7.46 7. 19 6.99 6.84 6.72 6.62 6.47 6.07
8 11 .26 8.65 7.59 7.01 6.63 6. 37 6.1 8 6.03 5.91 5.81 5.67 5.28
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.1 1 4.73
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.33
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4. 74 4 .63 4.54 4.40 4.02
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4. 16 3.78
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4. 30 4 .19 4.10 3.96 3.59
14 8 .86 6.51 5. 56 5.04 4.69 4.46 4.28 4.14 4 .03 3.94 3.80 3.43
15 8.68 6.36 5.42 4.89 4.56 4.32 4. 14 4.00 3.89 3.80 3.67 3.29
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3. 18
17 8.40 6. 11 5. 19 4.67 4.34 4. 10 3.93 3.79 3.68 3.59 3.46 3.08
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.00
19 8.18 5.93 5.01 4.50 4. 17 3.94 3.77 3.63 3.52 3.43 3.30 2.92
20 8.10 5.85 4.94 4.43 4. 10 3.87 3.70 3. 56 3.46 3.37 3.23 2.86
21 8.02 5.78 4.87 4. 37 4 .04 3.81 3.64 3.51 3.40 3.31 3.17 2.80
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.75
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3. 30 3. 21 3.07 2.70
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.66
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.62
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.58
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3. 15 3.06 2.93 2.55
28 7.64 5.45 4.57 4.07 3. 75 3.53 3.36 3.23 3.12 3.03 2.90 2.52
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.49
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3. 17 3.07 2.98 2.84 2.47
35 7.42 5.27 4.40 3.91 3.59 3.37 3.20 3.07 2.96 2.88 2.74 2.36
40 7.31 5.18 4.31 3.83 3. 51 3. 29 3.12 2.99 2.89 2.80 2.66 2.29
45 7.23 5. 11 4.25 3.77 3.45 3.23 3.07 2.94 2.83 2.74 2.61 2.23
so 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.56 2.18
55 7.12 5.01 4. 16 3.68 3. 37 3. 15 2.98 2.85 2.75 2.66 2.53 2.15
60 7.08 4.98 4. 13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.12
65 7.04 4.95 4. 10 3.62 3.31 3.09 2.93 2.80 2.69 2.61 2.47 2.09
70 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59 2.45 2.07
75 6.99 4.90 4.05 3.58 3.27 3.05 2.89 2.76 2.65 2.57 2.43 2.05
80 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.42 2.03
85 6.94 4.86 4.02 3.55 3.24 3.02 2.86 2.73 2.62 2.54 2.40 2.02
90 6.93 4.85 4.01 3.53 3.23 3.01 2.84 2.72 2.6 1 2.52 2.39 2.00
95 6.91 4.84 3.99 3.52 3.22 3.00 2.83 2.70 2.60 2.51 2.38 1.99
100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.37 1.98
110 6.87 4.80 3.96 3.49 3.19 2.97 2.81 2.68 2.57 2.49 2.35 1.96
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 1.95
_____________________________Ti_a_b_la_s_d_e~p_r_o_ba_b_il_id_a_d__________________ --J¡-565
Tabla AXIV.B. Probabilidades de H del ANOVA de Kruskal-Wallis.

k (número de niveles)= 3 a 5.
En el caso de las muestras que no aparecen en la tabla, usaremos los valores de probabili-
dad de la distribución de x2 con gl =k - l.

... k. 3
Tamaños de Probabilidad
k• 3
Tamaños de Probabilidad Tamaños de
k=4
Probabilidad Tamaños de
k=5
Probabilidad
la muestra 0.05 0.01 la mue-;tra 0.05 0.01 la mue-;tra 0.05 0.01 la muestra 0.05 0.01
2 2 2 5 5 3 5.705 7.578 2 2 1 1 2 2 1 1 1
3 2 1 5 5 4 5.666 7.823 2 2 2 1 5.679 2 2 2 1 1 6.750
3 2 2 4.714 5 5 5 5.780 8.000 2 2 2 2 6.167 6.667 2 2 2 2 1 7.133 7.533
3 3 1 5.143 6 1 1 3 1 1 1 2 2 2 2 2 7.418 8.291
3 3 2 5.361 6 2 1 4.822 3 2 1 1 3 1 1 1 1
3 3 3 5.600 7.200 6 2 2 5.345 6.655 3 2 2 1 5.833 3 2 1 1 1 6.583
4 2 1 6 3 1 4.855 6.873 3 2 2 2 6.333 7.133 3 2 2 1 1 6.800 7.600
4 2 2 5.333 6 3 2 5.348 6.970 3 3 1 1 6. 333 3 2 2 2 1 7.309 8.127
4 3 1 5.208 6 3 3 5.615 7.410 3 3 2 1 6.244 7.200 3 2 2 2 2 7.682 8.682
4 3 2 5.444 6.444 6 4 1 4.947 7.106 3 3 2 2 6.527 7.636 3 3 1 1 1 7.111
4 3 3 5.791 6.745 6 4 2 5.340 7.340 3 3 3 1 6.600 7.400 3 3 2 1 1 7.200 8.073
4 4 1 4.967 6.667 6 4 3 5.610 7.500 3 3 3 2 6.n7 8.015 3 3 2 2 1 7.591 8.576
4 4 2 5.455 7.036 6 4 4 5.681 7.795 3 3 3 3 7.000 8.538 3 3 2 2 2 7.910 9.115
4 4 3 5.598 7.144 6 5 1 4.990 7.182 4 1 1 1 3 3 3 1 1 7.576 8.424
4 4 4 5.692 7.654 6 5 2 5.338 7.376 4 2 1 1 5.833 3 3 3 2 1 7.769 9.051
5 2 1 5.000 6 S 3 5.602 7.590 4 2 2 1 6.133 7.000 3 3 3 2 2 8.044 9.505
5 2 2 5.160 6.533 6 5 4 5.661 7.936 4 2 2 2 6.545 7.391 3 3 3 3 1 8.000 9.451
5 3 1 4.960 6 5 5 5.729 8.028 4 3 1 1 6.178 7.067 3 3 3 3 2 8.200 9.876
S 3 2 S.2S1 6.909 6 6 1 4.945 7.121 4 3 2 1 6.309 7.455 3 3 3 3 3 8. 333 1o. 200
5 3 3 5.648 7.079 6 6 2 5.410 7.467 4 3 2 2 6.621 7.871
5 4 1 4.985 6.955 6 6 3 5.625 7.725 4 3 3 1 6.545 7.758
5 4 2 5.273 7.20S 6 6 4 5.724 8.000 4 3 3 2 6.795 8.333
5 4 3 5.656 7.445 6 6 5 5.765 8.124 4 3 3 3 6.984 8.659
5 4 4 5.657 7.760 6 6 6 5.801 8.222 4 4 1 1 5.945 7.909
5 5 1 5.127 7.309 7 7 7 5.819 8.378 4 4 2 1 6.386 7.909
5 5 2 5.338 7.338 8 8 8 5.805 8.465 4 4 2 2 6.731 8.346
4 4 3 1 6.635 8.231
4 4 3 2 6.874 8.621
4 4 3 3 7.038 8.876
4 4 4 1 6.725 8.588
4 4 4 2 6.957 8.871
4 4 4 3 7.142 9.075
4 4 4 4 7.235 9.287

(Adaptada, con autorización de Routledge, de 11. R. Neavc, " Table 4.2", Statistics Tables for Mathematicians, Engi-
neers, Economists and 1he Behavioural and Management Sciences, Routledge, Londres, 1978, p. 49.)
566lL_________________________A~p_én_d_ic_e_s______________________________
Tabla AXIV. 9. Probabilidades de x2F (estadística no paramétrica de Friedman para
ANOVA intrasujetos).

La tabla proporciona la probabilidad de un valor de x2F con el número de niveles de la va-


riable independiente (k), donde k es 3 y el tamaño de la muestra (n) por debajo de 1O o k
es 4 y n está por debajo de 5. Con ese número tan reducido de niveles y participantes, x2F
no siempre tiene un valor con las probabilidades estándar de 0.1 , 0.05, etc. Ofrecemos una
variedad de probabilidades de manera que podamos calcular la correspondiente a una x2F
si el nivel a se establece en 0.1, 0.05 o 0.0 l. Señalamos con un asterisco (*) la x2F estadís-
ticamente signHícativa en a= 0.05, y con dos(**) la que lo es en a = 0.01.
Por ejemplo, si en un estudio con cuatro participantes (n = 4) y tres niveles (k = 3),
x2F = 6.5, entonces p = 0.042 y, por tanto, x2F será estadísticamente significativa con
a = 0.05

k ~3 k S 3 k~4

n x2F p n 2
XF p n x2F p
3 4.667
6
0.194
0.028 . 8 4.75
5.25
0.12
0.079
.
2 5.4
6
0.167
0.042 .
6.25 0.047
4 4.5 0.125 3 5.8 0.148
6.75 0.038
6 0.069
. 7 0.03
6.6 0.075

- .
6.5 0.042 7 0.054
8 0.0046
7.75
9
0.018
0.0099 .. 7.4 0.033

-
8.2 0.017
S 4.8 0.124
9 4.667 0. 107 9 0.0017
5.2
6.4
0.093
0.039 . 5.556 0.069
6 0.105
.
4
6 0.057
7.6
8.4
0.024
0.0085 .. 6.222
6.889
0.048
0.031
6.3
6.6
0.094
0.077
6.9 0.068
6 4.33 0.142 8 0.019
7.2 0.054
5.33 o.on 8.222 0.016
.. .
.
7.5 0.052
6.33 0.052 8.667 0.01
7.8 0.036
7 0.029
8.1 0.033
8.33
9
0.012
0.0081 .. 8.4
8.7
0.019
0.014

..
7 4.571 0.112 9.3 0.012
5.429 0.085 9.6 0.0069
6
7.143
0.052
0.027 .
7.714 0.021

-
8 0.016
8.857 0.0084
_____________________________Ti_a_b_la_s_d_e~p_r_ob_a_b_il_id_a_d__________________ __j¡-567
Tabla AXIV. 1O. Correcciones de contrastes de Bonferroni.

a) Índice de error por familia, a= 0.05, probabilidades de dos colas (o a= 0.025, proba-
bilidades de una cola), gl de error= 1 a 20.
Número de contrastes

gl de error 2 3 4 5 6 7 8 9 10 12 15

25.452 38.189 50.922 63.656 76.392 89.123 101.859 114.590 127.321 152.793 190.996

2 6.205 7.649 8.860 9. 925 10.886 11.769 12.590 13.360 14.089 15.444 11.2n

3 4.1n 4.857 5.392 5.841 6.232 6.580 6.895 7.185 7.453 7.940 8.575

4 3.495 3.961 4.315 4. 604 4.851 5.068 5.261 5.437 5.598 5.885 6.254

S 3.163 3.534 3.810 4.032 4.219 4.382 4.526 4.655 4.773 4.983 5.247

6 2.969 3.287 3.521 3.707 3.863 3.997 4.115 4.221 4.317 4.486 4.698

7 2.841 3.128 3.335 3.499 3.636 3. 753 3.855 3.947 4.029 4.174 4.355

8 2.752 3.016 3.206 3.355 3.479 3.584 3.677 3.759 3.833 3.962 4.122

9 2.685 2.933 3.111 3.250 3.364 3.462 3.547 3.622 3.690 3.808 3.954

10 2.634 2.870 3.038 3.169 3.277 3.368 3.448 3.518 3.581 3.691 3.827

11 2.593 2.820 2.981 3.106 3.208 3.295 3.370 3.437 3.497 3.600 3.728

12 2.560 2.779 2.934 3.055 3.153 3.236 3.308 3.371 3.428 3.527 3.649

13 2.533 2.746 2.896 3.012 3.107 3.187 3.256 3.318 3.372 3.467 3.584

14 2.510 2.718 2.864 2.977 3.069 3.146 3.214 3.273 3.326 3.417 3.530

15 2.490 2.694 2.837 2.947 3.036 3.112 3.177 3.235 3.286 3.375 3.484

16 2.473 2.673 2.813 2.921 3.008 3.082 3.146 3.202 3.252 3.339 3.444

17 2.458 2.655 2.793 2.898 2.984 3.056 3.119 3.173 3.222 3.307 3.410

18 2.445 2.639 2.775 2.878 2.963 3.034 3.095 3.149 3.197 3.279 3.380

19 2.433 2.625 2.759 2.861 2.944 3.014 3.074 3.127 3.174 3.255 3.354

20 2.423 2.613 2. 744 2.845 2. 927 2. 996 3.055 3.107 3. 153 3.233 3.331

..
568l___ Apéndices

Tabla AXIV.10. Correcciones de contrastes de Bonferroni.


b) Índice de error por familia, a= 0.05, pruebas de dos colas (o a= 0.025, pruebas de una
cola), gl de error = 21 a 120.
Número de contrastes
gl de error 2 4 5 6 7 8 9 10 12 15
21 2.414 2.601 2.732 2.831 2.912 2.980 3.038 3.090 3.135 3.214 3.310
22 2.405 2.591 2.720 2.819 2.899 2.965 3.023 3.074 3.119 3.196 3.291
23 2.398 2.582 2.710 2.807 2.886 2.952 3.009 3.059 3.104 3.181 3.274
24 2.391 2.574 2.700 2.797 2.875 2.941 2.997 3.046 3.091 3.166 3.258
25 2.385 2.566 2.692 2.787 2.865 2.930 2.986 3.035 3.078 3.153 3.244
26 2.379 2.559 2.684 2.779 2.856 2.920 2.975 3.024 3.067 3.141 3.231
27 2.373 2.552 2.676 2.771 2.847 2.911 2.966 3.014 3.057 3.130 3.219
28 2.368 2.546 2.669 2.763 2.839 2.902 2.957 3.004 3.047 3.120 3.208
29 2.364 2.541 2.663 2.756 2.832 2.894 2.949 2.996 3.038 3.1 10 3.198
30 2.360 2.536 2.657 2.750 2.825 2.887 2.941 2.988 3.030 3.102 3.189
31 2.356 2.531 2.652 2.744 2.818 2.880 2.934 2.981 3.022 3.094 3.180
32 2.352 2.526 2.647 2.738 2.812 2.874 2.927 2.974 3.015 3.086 3.172
33 2.348 2.522 2.642 2.733 2.807 2.868 2.921 2.967 3.008 3.079 3.164
34 2.345 2.518 2.638 2.728 2.802 2.863 2.915 2.961 3.002 3.072 3.157
35 2.342 2.515 2.633 2.724 2.797 2.857 2.910 2.955 2.996 3.066 3. 150
36 2.339 2.511 2.629 2.719 2.792 2.853 2.905 2.950 2.990 3.060 3.144
37 2.336 2.508 2.626 2.715 2.788 2.848 2.900 2.945 2.985 3.054 3.138
38 2.334 2.505 2.622 2.712 2.783 2.844 2.895 2.940 2.980 3.049 3.132
39 2.331 2.502 2.619 2.708 2.780 2.839 2.891 2.936 2.976 3.044 3.127
40 2.329 2.499 2.616 2.704 2.776 2.836 2.887 2.931 2.971 3.039 3.122
45 2.319 2.487 2.602 2.690 2.760 2.819 2.869 2.913 2.952 3.019 3.1 00
50 2.311 2.477 2.591 2.678 2.747 2.805 2.855 2.898 2.937 3.003 3.083
55 2.304 2.469 2.583 2.668 2.737 2.794 2.844 2.887 2.925 2.990 3.069
60 2.299 2.463 2.575 2.660 2.729 2.785 2.834 2.877 2.915 2.979 3.057
65 2.295 2.458 2.569 2.654 2.721 2.778 2.826 2.869 2.906 2.970 3.048
70 2.291 2.453 2.564 2.648 2.715 2.771 2.820 2.862 2.899 2.962 3.039
75 2.287 2.449 2.559 2.643 2.710 2.766 2.814 2.855 2.892 2.956 3.032
80 2.284 2.445 2.555 2.639 2.705 2.761 2.809 2.850 2.887 2.950 3.026
85 2.282 2.442 2.552 2.635 2.701 2.757 2.804 2.846 2.882 2.945 3.020
90 2.280 2.440 2.549 2.632 2.698 2.753 2.800 2.841 2.8i8 2.940 3.016
95 2.277 2.437 2.546 2.629 2.695 2.750 2.797 2.838 2.874 2.936 3.011
100 2.276 2.435 2.544 2.626 2.692 2.747 2.793 2.834 2.871 2.933 3.007
105 2.274 2.433 2.541 2.623 2.689 2.744 2.791 2.831 2.868 2.929 3.004
110 2.272 2.431 2.539 2.621 2.687 2.741 2.788 2.829 2.865 2.926 3.001
115 2.271 2.430 2.538 2.619 2.685 2.739 2.786 2.826 2.862 2.924 2.998
120 2.270 2.428 2.536 2.617 2.683 2.737 2.783 2.824 2.860 2.921 2.995
- ____________________________To_a_bl_a_s_de~p_ro_b_a_

Tabla AXIV. 1O.


da_d__________________~~
bi_li_

Correcciones de contrastes de Bonferroni.

e) Índice de error por familia, a = 0. 1, pruebas de dos colas (o a. = 0.05, pruebas de una
cola), gl de error= 1 a 30.
Número de contrastes
gl de error 2 3 4 5 6 7 8 9 10 12 15
12.706 19.081 25.452 31.821 38.189 44.557 50.922 57.290 63.656 76.392 95.489
2 4.303 5.339 6.205 6.965 7.649 8.277 8.860 9.408 9.925 10.886 12.186
3 3.182 3.740 4.177 4.541 4.857 5.138 5.392 5.625 5.841 6.232 6.741
4 2.776 3.186 3.495 3.747 3.961 4.148 4.315 4.466 4.604 4.851 5.167
5 2.571 2.912 3.163 3.365 3.534 3.681 3.810 3.926 4.032 4.219 4.456
6 2.447 2.749 2.969 3.143 3.287 3.412 3.521 3.619 3.707 3.863 4.058
7 2.365 2.642 2.841 2.998 3.128 3.238 3.335 3.422 3.499 3.636 3.806
8 2.306 2.566 2.752 2.896 3.016 3.117 3.206 3.285 3.355 3.479 3.632
9 2.262 2.510 2.685 2.821 2.933 3.028 3.111 3.184 3.250 3.364 3.505

-
10 2.228 2.466 2.634 2.764 2.870 2.960 3.038 3.107 3.169 3.277 3.409
11 2.201 2.431 2.593 2.718 2.820 2.906 2.981 3.047 3.106 3.208 3.334
J

12 2.179 2.403 2.560 2.681 2.779 2.863 2.934 2.998 3.055 3.153 3.273
13 2.160 2.380 2.533 2.650 2.746 2.827 2.896 2.957 3.012 3.107 3.223
14 2. 145 2.360 2.510 2.624 2.718 2. 796 2.864 2.924 2.977 3.069 3.181
15 2.131 2.343 2.490 2.602 2.694 2. 770 2.837 2.895 2. 947 3.036 3.146
16 2.120 2.328 2.473 2.583 2.673 2.748 2.813 2.870 2.921 3.008 3. 115
17 2.110 2.316 2.458 2.567 2.655 2.729 2.793 2.848 2.898 2.984 3.088
18 2.101 2.304 2.445 2.552 2.639 2.712 2.775 2.829 2.878 2.963 3.065
19 2.093 2.294 2.433 2.539 2.625 2.697 2.759 2.813 2.861 2. 944 3.045
20 2.086 2.285 2.423 2.528 2.613 2.683 2.744 2.798 2.845 2.927 3.026
21 2.080 2.278 2.414 2.518 2.601 2.671 2.732 2.784 2.831 2.912 3.010
22 2.074 2.270 2.405 2.508 2.591 2.661 2.720 2.772 2.819 2.899 2.995
23 2.069 2.264 2.398 2.500 2.582 2.651 2.710 2.761 2.807 2.886 2.982
24 2.064 2.258 2.391 2.492 2.574 2.642 2.700 2.751 2.797 2.875 2.970
25 2.060 2.252 2.385 2.485 2.566 2.634 2.692 2.742 2.787 2.865 2.959
26 2.056 2.247 2.379 2.479 2.559 2.626 2.684 2.734 2.779 2.856 2.949
27 2.052 2.243 2.373 2.473 2.552 2.619 2.676 2.726 2.771 2.847 2.939
28 2.048 2.238 2.368 2.467 2.546 2.613 2.669 2.719 2.763 2.839 2.930
29 2.045 2.234 2.364 2.462 2.541 2.607 2.663 2.713 2.756 2.832 2.922
30 2.042 2.231 2.360 2.457 2.536 2.601 2.657 2.706 2.750 2.825 2.915

.,._,.
1
5701 Apéndices

Tabla AXIV.1O. Correcciones de contrastes de Bonferroni.


d) Índice de error por familia, a = 0.1 , pruebas de dos colas (o a = 0.05, pruebas de una
cola), gl de error = 31 a 120.
Número de contrastes
gl de error 2 3 4 5 6 7 8 9 1O 12 15

31 2.040 2.227 2.356 2.453 2.531 2.596 2.652 2.701 2.744 2.818 2.908

32 2.037 2.224 2.352 2.449 2.526 2.591 2.647 2.695 2.738 2.812 2.902

33 2.035 2.221 2.348 2.445 2.522 2.587 2.642 2.690 2.733 2.807 2.896

34 2.032 2.218 2.345 2.441 2.518 2.583 2.638 2.686 2.728 2.802 2.890

35 2.030 2.215 2.342 2.438 2.515 2.579 2.633 2.681 2.724 2.797 2.88S

36 2.028 2.213 2.339 2.434 2.511 2.57S 2.629 2.677 2.719 2.792 2.879

37 2.026 2.210 2.336 2.431 2.508 2.571 2.626 2.673 2.715 2.788 2.875

38 2.024 2.208 2.334 2.429 2.505 2.568 2.622 2.670 2.712 2.783 2.870

39 2.023 2.206 2.331 2.426 2.502 2.565 2.619 2.666 2.708 2.780 2.866

40 2.021 2.204 2.329 2.423 2.499 2.562 2.616 2.663 2.704 2.776 2.862

45 2.014 2.195 2.319 2.412 2.487 2.549 2.602 2.648 2.690 2.760 2.845

50 2.009 2. 188 2.311 2.403 2.477 2.S39 2.591 2.637 2.678 2.747 2.831

SS 2.004 2.183 2.304 2.396 2.469 2.S30 2.S83 2.628 2.668 2.737 2.820

60 2.000 2.178 2.299 2.390 2.463 2.S24 2.S7S 2.620 2.660 2.729 2.811

6S 1.997 2.174 2.295 2.385 2.458 2.518 2.569 2.614 2.654 2.721 2.803

70 1.994 2.171 2.291 2.381 2.453 2.S13 2.564 2.608 2.648 2.715 2.796

75 1. 992 2.168 2.287 2.377 2.449 2.S08 2.SS9 2.604 2.643 2.710 2.791

80 1. 990 2.16S 2.284 2.374 2.445 2.505 2.55S 2.600 2.639 2.70S 2. 786

8S 1.988 2.163 2.282 2.371 2.442 2.S01 2.552 2.S96 2.635 2.701 2.781

90 1. 987 2.161 2.280 2.368 2.440 2.499 2.549 2.593 2.632 2.698 2. 777

95 1.985 2.159 2.277 2.366 2.437 2.496 2.546 2.590 2.629 2.695 2.774

100 1.984 2.1 58 2.276 2.364 2.435 2.494 2.S44 2.S87 2.626 2.692 2.771

105 1.983 2.1S6 2.274 2.362 2.433 2.492 2.S41 2.585 2.623 2.689 2.768

110 1.982 2.1 SS 2.272 2.361 2.431 2.490 2.539 2.583 2.621 2.687 2.766

115 1.981 2.154 2.271 2.359 2.430 2.488 2.S38 2.581 2.619 2.685 2.763

120 1.980 2.153 2.270 2.358 2.428 2.486 2.536 2.579 2.617 2.683 2.761
_____________________________T<_a_
b_la_s_d_e~p_r_ob_a_b_il_id_a_d__________________~f'571

Tabla AXIV. 11 . Prueba t de contrastes de Dunnett.

a) a = 0.05, pruebas de dos colas.

Número de medias (incluidas las de control)

-
gl de error 3 4 5 6 7 8 9 10 11 12 13 16 21

5 3.03 3.29 3.48 3.62 3.73 3.82 3.90 3.97 4.03 4.09 4.14 4.26 4.42

6 2.86 3.10 3.26 3.39 3.49 3.57 3.64 3.71 3.76 3.81 3.86 3.97 4.11

7 2.75 2.97 3.12 3.24 3.33 3.41 3.47 3.53 3.58 3.63 3.67 3.78 3.91

8 2.67 2.88 3.02 3.13 3.22 3.29 3.35 3.41 3.46 3.50 3.54 3.64 3.76

9 2.61 2.81 2. 95 3.05 3.14 3.20 3.26 3.32 3.36 3.40 3.44 3.5.3 3.65

10 2.57 2.76 2.89 2.99 3.07 3.14 3.19 3.24 3.29 3.33 3.36 3.45 3.57

11 2.53 2.72 2.84 2.94 3.02 3.08 3.14 3.19 3.23 3.27 3.30 3.39 3.50

12 2.50 2.68 2.81 2. 90 2. 98 3.04 3.09 3.14 3.18 3.22 3.25 3.34 3.45

13 2.48 2.65 2.78 2.87 2.94 3.00 3.06 3.10 3.14 3.18 3.21 3.29 3.40

14 2.46 2.63 2.75 2.84 2.91 2.97 3.02 3.07 3.11 3.14 3.18 3.26 3.36

15 2.44 2.61 2. 73 2.82 2.89 2.95 3.00 3.04 3.08 3.12 3.15 3.23 3.33

16 2.42 2.59 2.71 2.80 2.87 2.92 2.97 3.02 3.06 3.09 3.12 3.20 3.30

17 2.41 2.58 2.69 2.78 2.85 2.90 2.95 3.00 3.03 3.07 3.10 3.18 3.27

18 2.40 2.56 2.68 2.76 2.83 2.89 2.9A 2.98 3.01 3.05 3.08 3.16 3.25

19 2.39 2.55 2.66 2.75 2.81 2.87 2.92 2.96 3.00 3.03 3.06 3.14 3.23

20 2.38 2.54 2.65 2.73 2.80 2.86 2.90 2.95 2.98 3.02 3.05 3.12 3.22

24 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90 2.94 2.97 3.00 3.07 3.16

30 2.32 2.47 2.58 2.66 2.72 2.77 2.82 2.86 2.89 2.92 2.95 3.02 3.1 1

40 2.29 2.44 2.54 2.62 2.68 2. 73 2. 77 2.81 2.85 2.87 2.90 2. 97 3.06

60 2.27 2.41 2.51 2.58 2.64 2.69 2.73 2.77 2.80 2.83 2.86 2.92 3.00

120 2.24 2.38 2.47 2.55 2.60 2.65 2.69 2.73 2.76 2.79 2.81 2.87 2.95

(Adaptada, con autorización de Tbe lntemationa1 Biometrics Socicty, de C. W. Dunnctt, "Ncw tab1es for mu1tiple coro·
parisons with a control. Table Ir'. Biometrics. \ 'OI. 20, 1964, pp. 482-491.)
5721 Apéndices

Tabla AXIV.1 1. Valores críticos de la t de Dunnett.

b) a = 0.05, pruebas de una cola.

Número de medias (incluidas las de control)


gl de error 3 4 5 6 7 8 9 10
5 2.44 2.68 2.85 2.98 3.08 3.16 3.24 3.30
6 2.34 2.56 2.71 2.83 2.92 3.00 3.07 3.12
7 2.27 2.48 2.62 2.73 2.82 2.89 2.95 3.01
8 2.22 2.42 2.55 2.66 2.74 2.81 2.87 2.92
9 2.18 2.37 2.50 2.60 2.68 2.75 2.81 2.86
10 2.15 2.34 2.47 2.56 2.64 2.70 2.76 2.81
11 2.13 2.31 2.44 2.53 2.60 2.67 2.72 2.77
12 2.11 2.29 2.41 2.50 2.58 2.64 2.69 2.74
13 2.09 2.27 2.39 2.48 2.55 2.61 2.66 2.71
14 2.08 2.25 2.37 2.46 2.53 2.59 2.64 2.69
15 2.07 2.24 2.36 2.44 2.51 2.57 2.62 2.67
16 2.06 2.23 2.34 2.43 2.50 2.56 2.61 2.65
17 2.05 2.22 2.33 2.42 2.49 2.54 2.59 2.64
18 2.04 2.21 2.32 2.41 2.48 2.53 2.58 2.62
19 2.03 2.20 2.31 2.40 2.47 2.52 2.57 2.61
20 2.03 2.19 2.30 2.39 2.46 2.51 2.56 2.60
24 2.01 2.17 2.28 2.36 2.43 2.48 2.53 2.57
30 l. 99 2.15 2.25 2.33 2.40 2.45 2.50 2.54
40 1.97 2.13 2.23 2.31 2.37 2.42 2.47 2.51
60 1.95 2.1 0 2.21 2.28 2.35 2.39 2.44 2.48
120 1.93 2.08 2.18 2.26 2.32 2.37 2.41 2.45
-----------------------------Ti~a~b~la~s~d~e~p_r_ob_a_b_il_id~a_d__________________~¡-573

Tabla AXIV.12. Distribución de la estadística q de rango estudentizado.

a) Índice de error por familia a.= 0.05, pruebas de dos colas.

Número de medias por contrastar


gl de error 3 4 5 6 7 8 9 10 11 12 15

26.98 32.82 37.08 40.41 43.12 45.40 47.36 49.07 50.59 51 .96 55.36
2 8.33 9.80 10.88 11.74 12.44 13.03 13.54 13.99 14.39 14.75 15.65
5.91 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.52

4 5.04 5.76 6.29 6.71 7.05 7.35 7.60 7.83 8.03 8.21 8.66

5 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.72
6 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65 6.79 7.14
7 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 6.43 6.76
8 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.48
9 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87 5.98 6.28
10 3.88 4.33 4.65 4.91 5.12 5.30 5. 46 5.60 5.72 5.83 6.11
11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.98
12 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51 5.61 5.88
13 3.73 4.1 5 4.45 4.69 4.88 5.05 5.1 9 5.32 5.43 5.53 5. 79
14 3.70 4.11 4.41 4.64 4.83 4.99 5. 13 5.25 5.36 5.46 5.71
15 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.65
16 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.59
17 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.54
18 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.1 7 5.27 5.50
19 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.46

20 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.43

24 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.32
30 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 5.00 5.21
40 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 4.90 5.11

60 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 5. 00
120 3.36 3.68 3.92 4.10 4. 24 4.36 4.47 4.56 4.64 4.71 4.90

(Adaptada, con autorización de los autores y de Edward Amold (eds.] Ltd., de E. S. Pearson y H. O. Hartley, Biometri-
ka Tables for Statisticians, 3a. ed. , Charles Griffin & Co. Ltd, Londres, 1970.)
574l Apéndices

Tabla AXIV. 11 Distribución de la estadística q de rango estudentizado.


b) Índice de error por familia a= 0.01, pruebas de dos colas.

Número de medias por contrastar

gl de error 3 4 5 6 7 8 9 10 11 12 15

135.00 164.30 185.60 202.20 215.80 227.20 237.00 245.60 253.20 260.00 277.00

2 19.02 22.29 24.72 26.63 28.20 29.53 30.68 31.69 32.59 33.40 35.43

3 10.62 12.17 13.33 14.24 15.00 15.64 16.20 16.69 17.13 17.53 18.52

4 8.12 9.17 9.96 10.58 11.10 11 .55 11.93 12.27 12.57 12.84 13.53

5 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 10.48 10.70 11.24

6 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 9.48 9.95

7 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 8.55 8.71 9.12

8 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03 8.18 8.55

9 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49 7.65 7.78 8.13

10 5.27 5. 77 6.14 6.43 6.67 6.87 7.05 7.21 7.36 7.49 7.81

11 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 7.25 7.56

12 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6. 94 7.06 7.36

13 4.96 5.40 5.73 5.98 6.19 6.37 6. 53 6.67 6. 79 6.90 7.19

14 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 6.66 6.77 7.05

15 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55 6.66. 6.93

16 4.79 5. 19 5.49 5.72 5.92 6.08 6.22 6.35 6.46 6.56 6.82

17 4.74 5. 14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 6.48 6.73

18 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6. 31 6.41 6.65

19 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25 6.34 6.58

20 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 6.28 6.52

24 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5. 92 6.02 6. 11 6.33

30 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85 5.93 6.14

40 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69 5.76 5.96

60 4.28 4.59 4.82 4. 99 5.13 5.25 5.36 5.45 5.53 5.60 5.78

120 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30' 5.37 5.44 5.61

(Adaptada, con autorización de los autores y de Edward Arnold [eds.] Ltd., de E. S. Pearson y H. O. Hartley, Biometri-
ka Tables for Statisticians, 3a. ed., Charles Griffin & Co. Ltd., Londres, 1970.)
Tablas de probabilidad 1575
Tabla AXIV.13. Probabilidades de la distribución de r (coeficiente de correlación
producto momento de Pearson).
La probabilidad de un valor r también puede calcularse convirtiendo r en un valor t y usan-
do las tablas t (de la AXIV2).
Convertimos r en t con la ecuación siguiente:

rx ~n-2
F-?
donde n es el número de pares de puntuaciones en la correlación.
a) gl = 1 a 20.
Probabilidades de una cola
0.4 0.3 0.2 0. 1 0.05 0.025 0.01 0.005 0.001 0.0005
Probabilidades de dos colas
gl = n- 2 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
0.3090 0.5878 0.8090 0.9511 0.9877 0.9969 0.9995 0.9999 1.0000 1.0000
2 0.2000 0.4000 0.6000 0.8000 0.9000 0.9500 0.9800 0.9900 0.9980 0.9990
3 0.1577 0.3197 0.4919 0.6870 0.8054 0.8783 0.9343 0.9587 0.9859 0.9911
4 0.1341 0.2735 0.4257 0.6084 0.7293 0.8114 0.8822 0.9172 0.9633 o. 9741
5 0.1186 0.2427 0.3803 0.5509 0.6694 0.7545 0.8329 0.8745 0.9350 0.9509
6 0.1075 0.2204 0.3468 0.5067 0.6215 0.7067 0.7887 0.8343 0.9049 0.9249
7 0.0990 0.2032 0.3208 0.4716 0.5822 0.6664 0.7498 0.7977 0.8751 0.8983
8 0.0922 0.1895 0.2998 0.4428 0.5494 0.6319 0.7155 0.7646 0.8467 0.8721
9 0.0867 0.1783 0.2825 0.4187 0.5214 0.6021 0.6851 0.7348 0.8199 0.8470
10 0.0820 0.1688 0.2678 0.3981 0.4973 0.5760 0.6581 0.7079 0.7950 0.8233
11 0.0780 0.1607 0.2552 0.3802 0.4762 0.5529 0.6339 0.6835 0.7717 0.8010
12 0.0746 0.1536
1
0.2443 0.3646 0.4575 0.5324 0.6120 0.6614 0.7501 0.7800
13 0.0715 0.1474 0.2346 0.3507 0.4409 0.5140 0.5923 0.6411 0.7301 0.7604
14 0.0688 0.1419 0.2260 0.3383 0.4259 0.4973 0.5742 0.6226 0.7114 0.7419
15 0.0664 0.1370 0.2183 0.3271 0.4124 0.4821 0.5577 0.6055 0.6940 0.7247
16 0.0643 0.1326 0.2113 0.3170 0.4000 0.4683 0.5425 0.5897 0.6777 0.7084
17 0.0623 0.1285 0.2049 0.3077 0.3887 0.4555 0.5285 0.5751 0.6624 0.6932
18 0.0605 0.1248 0.1991 0.2992 0.3783 0.4438 0.5155 0.5614 0.6481 0.6788
19 0.0588 0.1214 0.1938 0. 2914 0.3687 0.4329 0.5034 0.5487 0.6346 0.6652
20 0.0573 0.1 183 0.1888 0.2841 0.3598 0.4227 0.4921 0.5368 0.6219 0.6524

..
5761 Apéndices

Tabla AXIV.13. Probabilidades de la distribución de r (coeficiente de correlación


producto momento de Pearson).

b) gi = 21 a 120.
Probabilidades de una cola
0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
Probabilidades de dos colas
gl = n - 2 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
21 0.0559 0.1154 0.1843 0.2774 0.3515 0.4132 0.4815 0.5256 0.6099 0.6402
22 0.0546 0.1127 0.1800 0.2711 0.3438 0.4044 0.4716 0.5151 0.5986 0.6287
23 0.0534 0.1102 0.1760 0.2653 0.3365 0.3961 0.4622 0.5052 0.5879 0.6178
24 0.0522 0.1078 0.1723 0.2598 0.3297 0.3882 0.4534 0.4958 0.5776 0.6074
25 0.0511 0.1056 0.1688 0.2546 0.3233 0.3809 0.4451 0.4869 0.5679 0.5974
26 0.0501 0.1036 0.1655 0.2497 0.3172 0.3739 0.4372 0.4785 0.5587 0. 5880
27 0.0492 0.1016 0.1 624 0.2451 0.3115 0.3673 0.4297 0.4705 0.5499 0. 5789
28 0.0483 0.0997 0.1594 0.2407 0.3061 0.3610 0.4226 0.4629 0.5415 0. 5703
29 0.0474 0.0980 0.1567 0.2366 0.3009 0.3550 0.4158 0.4556 0.5334 0.5621
30 0.0466 0.0963 0.1540 0.2327 0.2960 0.3494 0.4093 0.4487 0.5257 0.5541
31 0.0458 0.0947 0.1515 0.2289 0.2913 0.3440 0.4032 0.4421 0.5184 0.5465
32 0.0451 0.0932 0.1491 0.2254 0.2869 0.3388 0.3972 0.4357 0.5113 0.5392
33 0.0444 0.0918 0.1468 0.2220 0.2826 0.3338 0.3916 0.4296 0.5045 0.5322
34 0.0437 0.0904 0.1446 0.2187 0.2785 0.3291 0.3862 0.4238 0.4979 0.5254
35 0.0431 0.0891 0.1425 0.2156 0.2746 0.3246 0.3810 0.4182 0.4916 0.5189
36 0.0425 0.0878 0.1405 0.2126 0.2709 0.3202 0.3760 0.4128 0.4856 0.5126
37 0.0419 0.0866 0.1386 0.2097 0.2673 0.3160 0.3712 0.4076 0.4797 0.5066
38 0.0414 0.0855 0.1368 0.2070 0.2638 0.3120 0.3665 0.4026 0.4741 0.5007
39 0.0408 0.0844 0.1350 0.2043 0.2605 0.3081 0.3621 0.3978 0.4686 0.4950
40 0.0403 0.0833 0.1333 0.2018 0.2573 0.3044 0.3578 0.3932 0.4634 0.4896
50 0.0360 0.0744 0.1192 0.1806 0.2306 0.2732 0.3218 0.3542 0.4188 0.4432
60 0.0328 0.0679 0.1088 0.1650 0.2108 0.2500 0.2948 0.3248 0.3850 0.4079
70 0.0304 0.0628 0.1007 0.1528 0.1954 0.2319 0.2737 0.3017 0.3583 0.3798
80 0.0284 0.0588 0.0942 0. 1430 0.1829 0.2172 0.2565 0.2830 0.3364 0.3568
90 0.0268 0.0554 0.0888 0.1 348 0.1726 0.2050 0.2422 0.2673 0.3181 0.3375
100 0.0254 0.0525 0.0842 0.1279 0.1638 0.1946 0.2301 0.2540 0.3025 0.3211
110 0.0242 0.0501 0.0803 0.1220 0.1562 0.1857 0.2196 0.2425 0.2890 0.3068 -
120 0.0232 0.0479 0.0769 0.1 168 0.1496 0. 1779 0.2104 0.2324 0.2771 0.2943
--~------------------------Ti_a_bl_a_s_de~p_ro_b_a_
bi_li_da_d__________________~~

Tabla AXIV.14. Valores críticos de la rho de Spearman.

Cuando el tamaño de la muestra es mayor que 100, usamos la ecuación 10.1 de la aproxi-
mación t o la AX.2 de la aproximación z del apéndice X.
a) n = 4 a 40.

....
Probabilidades de una cola
0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
Probabilidades de dos cotas
n 0.50 0.20 0 .10 0.05 O.Q2 0.01 0.005 0.002 0.001
4 0.600 1.0CO 1.000
S 0.500 0.800 0.900 1.000 1.000
6 0.371 0.657 0.829 0.886 0.943 1.000 1.000
7 0.321 0.571 0.714 0.786 0.893 0.929 0.964 1.000 1.000
8 0.310 0.524 0.643 0.738 0.833 0.881 0.905 0.952 0.976
9 0.267 0.483 0.600 0.700 0.783 0.833 0.867 0.917 0.933
10 0.248 0.455 0.564 0.648 0.745 0.794 0.830 0.879 0.903
11 0.236 0.427 0.536 0.618 0.709 0.755 0.800 0.845 0.873
12 0.224 0.406 0.503 0.587 0.671 0.727 0.776 0.825 0.860
13 0.209 0.385 0.484 0.560 0.648 0.703 0.747 0.802 0.835
14 0.200 0.367 0.464 0.538 0.622 0.675 0.723 0.776 0.811
15 0.189 0. 354 0.443 0.521 0.604 0.654 0.700 0.754 0.786
16 0.182 0.341 0.429 0.503 0.582 0.635 0.679 0.732 0.765
17 0.176 0.328 0.414 0.485 0.566 0.615 0.662 0.713 0.748
18 0.170 0.317 0.401 0.472 0.550 0.600 0.643 0.695 0.728
19 0.165 0.309 0.391 0.460 0.535 0.584 0.628 0.677 0.712
20 0.161 0.299 0.380 0.447 0.520 0.570 0.612 0.662 0.696
21 0.156 0.292 0.370 0.435 0.508 0.556 0.599 0.648 0.681
22 0.152 0.284 0.361 0.425 0.496 0.544 0.586 0.634 0.667
23 0.148 0.278 0. 353 0.415 0.486 0.532 0.573 0.622 0.654
24 0.144 0.271 0.344 0.406 0.476 0.521 0.562 0.610 0.642
25 0.142 0.265 0.337 0.398 0.466 0.511 0.551 0.598 0.630
26 0.138 0.259 0.331 0.390 0.457 0.501 0.541 0.587 0.619
27 0.136 0.255 0.324 0.382 0.448 0.491 0.531 0.577 0.608
28 0.133 0.250 0.317 0.375 0.440 0.483 0.522 0.567 0.598
29 0.130 0.245 0.312 0.368 0.433 0.475 0.513 0.558 0.589
30 0.128 0.240 0.306 0.362 0.425 0.467 0.504 0.549 0.580
31 0.126 0.236 0.301 0.356 0.418 0.459 0.496 0.541 0 .571
32 0.124 0. 232 0.296 0.350 0.412 0.452 0.489 0.533 0.563
...... 33 0.121 0.229 0.291 0.345 0.405 0.446 0.482 0.525 0.554
34 0.120 0.225 0.287 0.340 0.399 0.439 0.475 0.517 0.547
35 0.1 18 0.222 0.283 0.335 0.394 0.433 0.468 0.510 0.539
36 0.116 0.219 0.279 0.330 0.388 0.427 0.462 0.504 0.533
37 0.114 0.216 0.275 0.325 0.383 0.421 0.456 0.497 0.526
38 0.113 0.212 0 .271 0.321 0. 378 0.415 0.450 0.491 0.519
39 0 .11 1 0.210 0.267 0.317 0.373 0.410 0.444 0.485 0.513
40 0.110 0.207 0.264 0.313 0.368 0.405 0.439 0.479 0.507

(Adaptada de J. H. Zar, "Significance testing of the Spearman rank correlation coefficicnt", la tabla l deJouriUll of the
American Statistical Association, vol. 76, 1972, pp. 578-580. Reimpresa con autorización de Journal ofthe American
Statistical Association, copyright 1972 por la American Statislical Association. Todos los derechos reservados.)
578l Apéndices

Tabla AXIV.14. Valores críticos de la rho de Spearman.


b) n =41 a 100.
Probabilidades de una cola
0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
Probabilidades de dos colas
n 0.50 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001
41 0.108 0.204 0.261 0.309 0.364 0.400 0.433 0.473 0.501
42 0.107 0.202 0.257 0.305 0.359 0.395 0.428 0.468 0.495
43 0.105 0.199 0.254 0.301 0.355 0.391 0.423 0.463 0.490
44 0.104 0.197 0.251 0.298 0.351 0.386 0.419 0.458 0.484
45 0.103 0.194 0.248 0.294 0.347 0.382 0.414 0.453 0.479
46 0.102 0.192 0.246 0.291 0.343 0.378 0.410 0.448 0.474
47 0.101 0.190 0.243 0.288 0.340 0.374 0.405 0.443 0.469
48 0.100 0.188 0. 240 0.285 0.336 0.370 0.401 0.439 0.465
49 0.098 0.186 0.238 0.282 0.333 0.366 0.397 0.434 0.460
50 0.097 0.184 0.235 0.279 0.329 0.363 0.393 0.430 0.456
52 0.095 0.180 0.231 0.274 0.323 0.356 0.386 0.422 0.447
54 0.094 0.177 0.226 0.268 0.317 0.349 0.379 0.414 0.439
56 0.092 0.174 0.222 0.264 0. 311 0.343 0.372 0.407 0.432
58 0.090 0.171 0.218 0.259 0.306 0.337 0.366 0.400 0.424
60 0.089 0.168 0.214 0.255 0.300 0.331 0.360 0.394 0.418
62 0.087 0. 165 0.211 0.250 0.296 0.326 0.354 0.388 0.411
64 0.086 0.162 0.207 0.246 0.291 0.321 0.348 0.382 0.405
66 0.084 0.160 0.204 0.243 0.287 0.316 0.343 0.376 0.399
68 0.083 0.157 0.201 0.239 0.282 0.311 0.338 0.370 0.393
70 0.082 0.155 0.198 0.235 0.278 0.307 0.333 0.365 0.388
72 0.081 0.153 0.195 0.232 0.274 0.303 0.329 0.360 0.382
74 0.080 0.151 0.193 0.229 0.271 0.299 0.324 0.355 0.377
76 0.078 0.149 0.190 0.226 0.267 0.295 0.320 0.351 0.372
78 0.077 0.147 0.188 0.223 0.264 0.291 0.316 0.346 0.368
80 0.076 0.145 0.185 0.220 0.260 0.287 0.312 0.342 0.363
82 0.075 0.143 0.183 0.217 0.257 0.284 0.308 0.338 0.359
84 0.074 0.141 0.181 0.215 0.254 0.280 0.305 0.334 0.355
86 0.074 0.139 0.179 0.212 0.251 0.277 0.301 0.330 0.351
88 0.073 0.138 0.176 0.210 0.248 0.274 0.298 0.327 0.347
90 0.072 0.136 0.174 0.207 0.245 0.271 0.294 0.323 0.343
92 0.071 0.135 0.173 0.205 0.243 0.268 0.291 0.319 0.339
94 0.070 0.133 0.171 0.203 0.240 0.265 0.288 0.316 0.336
96 0.070 0.132 0.169 0.201 0.238 0.262 0.285 0.313 0.332
98 0.069 0.130 0.167 0.199 0.235 0.260 0.282 0.310 0.329
100 0.068 0.129 o. 165 0.197 0.233 0.257 0.279 0.307 0.326

(Adaptada de J. H. Zar, "Sign ificance testing ofthc Speannan rank correlation coefficient", la tabla 1 de Jow·nal ofthe
American Statistical Association, vol. 76, 1972, pp. 578-580. Reimpresa con autorización de Joumal of the American
Statisrical Association. copyright 1972 por la American Statistical Association. Todos los derechos reservados.)
·+ Tablas de probabilidad 1579
Tabla AXIV.15. Valores críticos de la tau de Kendall.

Si la muestra es mayor que 1O, usamos la ecuación AX.3 de la aproximación z del apén-
dice X.

Valores críticos de a: probabilidades de una cola

,.,.., n 0.1 0.05 0.025 0.01 0.005 0.001

4 1.0000 1.0000

5 0.8000 0.8000 1.0000 1.0000

6 0.6000 0.7333 0.8667 0.8667 1.0000

7 0.5238 0.6190 0.7143 0.8095 0.9048 1.0000

8 0.4286 0.5714 0.6429 0.7143 0.7857 0.8571


9 0.3889 0.5000 0.5556 0.6667 0.7222 0.8333

10 0.3778 0.4667 0.5111 0.6000 0.6444 0.7778

Valores críticos de a: probabilidades de dos colas

n 0.1 0.05 0.025 0.01 0.005 0.001

·• 4 1.0000
0.8000 1.0000 1.0000

6 0.7333 0.8667 0.8667 1.0000 1.0000

7 0.6190 0.7143 0.8095 0.9048 0.9048 1.0000

8 0.5714 0.6429 0.7143 0.7857 0.8571 0.9286

9 0.5000 0.5556 0.6111 0.7222 0.7778 0.8333

10 0.4667 0.5111 0.6000 0.6444 0.6889 0.7778

(Adaptadas, con autorización del autor y de Edward Arnold [eds.] Ltd. , de M. G. Kendall, Rank Correlation Methods,
4a. ed., Charles Gri ffin & Co. Ltd., Londres, 1970.)

Tabla AXIV. 16. Probabilidades de la tau de Kendall como correlación parcial "xy·z·

En la tabla se aprecian las probabilidades de tau para tamaños de muestra de hasta 50.
Maghsoodloo y Palios (1985) observaron que, con tamaños superiores a ése, puede usarse
cierta aproximación normal a fin de calcular la probabilidad del coeficiente de correlación
parcial de Kendall:

donde n es el tamaño de la muestra.


,,.,.
'
5801 Apéndices

Tabla AXIV. 16. Probabilidades de la tau de Kendall como correlación parcial 'xv·z·

Prueba de dos colas

0.2 0.1 0.05 0.02 0.01 0.002

Prueba de una cola

n 0.1 0.05 0.025 0.01 0.005 0.001

4 0.707 0.707 1.000

5 0.535 0.667 0.802 0.817 1.000

6 0.473 0.600 0.667 0.764 0.866 1.000

7 0.421 0.527 0.617 0.712 0.761 0.901

8 0.382 0.484 0.565 0.648 0.713 0.807

9 0.347 0.443 0.515 0.602 0.660 0.757

10 0.325 0.413 0.480 0.562 0.614 0.718

11 0.305 0.387 0.453 0.530 0.581 0.677

12 0.288 0.465 0.430 0.505 0.548 0.643

13 0.273 0.347 0.410 0.481 0.527 0.616

14 0.260 0.331 0.391 0.458 0.503 0.590

15 0.251 0.319 0.377 0.442 0.485 0.570

16 0.240 0.305 0.361 0.423 0.466 0.549

17 0.231 0.294 0.348 0.410 0.450 0.532

18 0.222 0.284 0.336 0.395 0.434 0.514

19 0.215 0.275 0.326 0.382 0.421 0.498

20 0.210 0.268 0.318 0.374 0.412 0.488

25 0.185 0.236 0.279 0.329 0.363 0.430

30 0.167 0.213 0.253 0.298 0.329 0.390

35 0.153 0.196 0.232 0.274 0.303 0.361

40 0.142 0.182 0.216 0.255 0.282 0.335

45 0.133 0.171 0.203 0.240 0.265 0.316

50 0.126 0.161 0.192 0.225 0.250 0.298

(Adaptada, con au torización de Gordon and Breach Publishers, de las tablas U y V de S. Maghsoodloo, "Estimates of
the quantities ofKcndall 's partial rank corrclation coefficient", Joumal ofStatistical Computing and Simula/ion, vol. 4,
1975, pp. 155-164; y de las tablas I y II de S. Maghsoodloo y L. L. Palios, "Asymptotic behaviour ofKendall's partial
rank correlation cocfficicnt and additional quantilc estimates", Joumal ofStatistical Compuling and Simulation, vol. 13,
1981, pp. 41-48.)
------------------------~t~ab~la=s~d~e~p~ro~b~ab~il~id~a~d----------------~~
Tabla AXIV.17. Coeficiente de concordancia de Kendall (W).

k (número de reactivos por ordenar)= 3 a 7, n (número de jueces) = 3 a 20

k =3
n Probabilidad

... 8
0.05
0.3758
0.01
0.5219
9 0.3333 0.4685
10 0.3000 0.4255
12 0.2497 0.3594
14 0.2138 0.3110
15 0.1996 0.2911
16 0.1871 0.2738
18 0.1662 0.2448
20 0.1496 0.2213

k=4 k= 5 k= 6 k=7
Probabilidad Probabilldad Probabilidad Probabilidad

n 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01

3 - - o. 7156 0.8400 0.6597 0.7797 0.6242 O. 7365

4 0.6188 0.7675 0.5525 0.6831 0.5118 0.6293 0.4844 0.5915

5 0.5008 0.6440 0.4492 0.5712 0.4169 0.5243 0.3946 0.4911

6 0.4206 0.5528 0.3781 0.4892 0.3514 0.4483 0.3325 0.4192

8 0.3178 0.4294 0.2870 0.3792 0.2670 0.3467 0.2528 0.3236


10 0.2556 0.3506 0.2312 0.3091 0.2153 0.2823 0.2039 0.2632

15 0.1715 0.2398 0.1555 0.21 12 0.1449 0.1926 0.1373 0.1793

20 0.1290 0.1821 0.1171 0.1603 0.1092 0.1460 0.1035 0.1359

(Adaptada, con autorización del autor y de Edward Amold [eds.] Ltd., de M. G. Kendall , Rank Correlation Methods,
4a. ed., Charles Griffin & Co. Ltd. , Londres, 1970.)
582l~---------------------A~p_én_d_ic_es__________________________

Tabla AXIV.18. Estadística de Kolmogorov-Smirnov (Dn).


Para revestir significación estadística, D 11 debe ser igual o mayor que el valor crítico que
aparece en la tabla. Por ejemplo, con un tamaño de muestra de 20, para resultar estadísti-
camente s ignificativa en a= 0.05, D11 será de al menos 0.294.

Probabilidad
n 0.20 0.15 0.10 0.05 0.01
1 0.900 0.925 0.950 0.975 0.995
2 0.684 0.726 0.776 0.842 0.929
3 0.565 0.597 0.642 0.708 0.828
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669
6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.368 0.410 0.490
11 0.307 0.326 0.352 0.391 0.468
12 0.295 0.313 0.338 0.375 0.450
13 0.284 0.302 0.325 0.361 0.433
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404
16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 0.318 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356
25 0.210 0.220 0.240 0.270 0.320
30 0.190 0.200 0.220 0.240 0.290
35 0.180 0.190 0.210 0.230 0.270
Más de 35 1.07 1.14 1.22 1.36 1.63
.[n .[n l;, ,In Fn
XV
Tablas de poder

Introducción
Hemos intentado simplificar el proceso del cálculo de poder sin sobrecargar el libro con
tablas de poder. Para ello, cedimos en algunos aspectos. En primer lugar, presentamos
sólo tablas para a= 0.05. En segundo, para pruebas como x 2 , ANOVA y regresión múlti-
ple, incorporamos tablas para un conjunto limitado de grados de libertad. En tercero, en el
caso del ANO VA, usamos -r¡ 2 como medida del tamaño del efecto. Además, es necesario
explicar brevemente cómo emplear tales tablas en diseños intrasujetos, en diseños entre su-
jetos con tamañ~s de muestras desiguales y para ANOVA entre sujetos con más de una VI,
así como para calcular el poder para tamaños de la muestra y gl cuando no se encuentren en
las tablas. Un asterisco(*) indica que el poder de la prueba es de más de 0.995.

....
1
Tamaño de la muestra ajustado para las tablas de poder
cuando se usan tamaños de muestras desiguales
Pruebas t entre sujetos. Cuando usamos muestras de tamaño desigual en una prueba t entre
sujetos, el poder se reduce con relación al que tendría en un diseño de muestras iguales. Para
interpretar las tablas de poder es necesario calcular un tamaño de muestra ajustado nh, usando
la media armónica de ambos tamaños de muestra.

=
"
n

583
584lL_________________________A~p~én_d~ic~e~s______________________________
donde nh es la media armónica
n 1 es el tamaño de una muestra
n2 es el tamaño de la otra
Por tanto, si n 1 = 10 y n 2 = 30,
2xl0x30
10+ 30

15

En este caso, el poder de la prueba será el mismo que el de un diseño con 15 personas en
cada grupo, aun cuando tengamos aquí un total de 40 participantes.

ANOVA entre sujetos. En el ANOVA entre sujetos utilizamos la media aritmética. Por tanto,
si tuviésemos tres grupos con 15, 20 y 30 participantes, respectivamente, el tamaño de la
muestra por grupo deberá tratarse como sigue:

15+20+30
n = = 2 1.67 o 21, redondeado al entero inferior siguiente
3

Interpolación
La técnica de la interpolación lineal descrita en el apéndice XIV para las tablas de proba-
bilidad permite calcular valores de poder y tamaños de muestra aproximados si no figuran
en las tablas del presente apéndice. Cohen (1988) proporciona una variedad mucho más
amplia de valores tabulados.

Cálculo de poder de un tamaño de muestra intermedio. En el cálculo de poder de un ta-


maño de muestra intermedio utilizamos la ecuación siguiente:

poder =
n real- n inferior
poder inferior + (poder superior - poder inferior) x ( n supenor
. ·- n m
. fienor
.
J
donde los poderes y "tamaños de muestra superiores e inferiores son los que se muestran en
las tablas.

Imaginemos que realizamos una prueba t de una cola entre sujetos con a= 0.05, con unta-
maño de muestra de 22 personas por grupo, y que hemos calculado un tamaño del efecto
(d) de 0.5.

poder = 0.46 + (0.54- 0.46) x

= 0.492
l22-20J
- -
25-20
______________________________r._a_b_la_
s _d_
e~p_o_de_r____________________~~

Cálculo de poder de un tamaño del efecto (TE) intermedio. Para calcular el poder de un
tamaño del efecto intermedio, utilizaremos la ecuación siguiente:

poder = poder inferior + (poder Superior- poder inferior) X ( TE rea~- inferio~


TE )
TE supenor- TE 1nfenor

Si realizamos una prueba t de una cola entre sujetos con datos que tienen un tamaño del
efecto de 0.56, con una muestra de 20 participantes por grupo y con a = 0.05, entonces:

0 56 0
poder= 0.46 +(0.58-0.46)x ( · - ·:)
0.6-0.:>

0.532
Cálculo del tamaño de la muestra para un nivel de poder intermedio. En el cálculo del
tamaño de la muestra para un nivel de poder intermedio, utilizaremos esta ecuación:

. ( . ;_e . ) ( poder real - poder inferior )


n = n infienor + n supenor - n llllenor x d . d "nfi .
po er supenor - po er 1 enor

Si deseáramos obtener un poder de 0.8 en una prueba t de una vía y una cola entre sujetos
con un tamaño del efecto de 0.4, necesitaríamos el siguiente número de participantes por
grupo:

n 70 + (80 - 70) x ( 0·80 - 0·76 ~


0.81 - 0.76 )
78
De no haber sido un número entero el resultado, tendríamos que redondearlo al entero
siguiente.

Tamaño del efecto en una prueba t intrasujetos


En el capítulo 15 señalamos que el tamaño del efecto para un diseño intrasujetos con dos
niveles de la VI se calcula de dos maneras: una de ellas produce d y permite hacer compa-
raciones con los diseños entre sujetos, mientras que la otra produce d' y permite calcular el
poder estadístico. En el ejemplo presentado vimos que d = 0.07 y d' = 0.456. La discrepan-
cia obedece a que d' está influida por el grado de correlación entre las puntuaciones de los
participantes de los dos niveles de la VI. En el ejemplo, la correlación fue muy alta en r =
0.9883. Podemos usar la ecuación siguiente para convertir den d':

d' = d
,/2x(1-r)
586lL________________________A~p_én_d_ic~e~s_____________________________
Por tanto,
0.07
d' =
~2x{I-0.9883)
0.458 (lo cual, redondeado a dos decimales, coincide con la
cifra presentada anteriormente)

Explicación de las tablas para el ANOVA y la regresión múltiple


Hemos basado las tablas de poder para el ANO VA en rt 2 como tamaño del efecto, y para la
regresión múltiple hemos usado R2 . En ambos casos, ello significa que las tablas difieren
de las que Cohen (1988) presenta. Sin embargo, incluimos valores tabulados para lo que él
considera tamaños del efecto pequeños, medianos y grandes.

Tamaño del efecto 'Yl2 R2


Pequeño 0.01 0.0196
Mediano 0.059 0.13
Grande 0.138 0.26

ANOVA multifactorial entre sujetos


Cálculo de poder. Cuando un ANOVA entre sujetos tiene más de una VI, es necesario
ajustar el tamaño de la muestra, para lo cual se consultan las tablas de poder. Así se calcu-
la el tamaño de la muestra ajustado (n' ):
, gl de error
n =
gl del tratamiento+ 1

E l ejemplo incluido en el capítulo 17 tiene la VI tipo de estrategia nemotécnica, con tres


niveles, y la VI tipo de lista, con dos. Por tanto, había tres efectos posibles: dos principales y
la interacción entre ambos. El efecto principal del tipo de estrategia nemotécnica tuvo gl = 2;
el de tipo de lista, gl = l; y la interacción, gl = 2. El término de error es el mismo para cada
una de las razones F y tuvo gl = 24. Por ello, en el caso de la estrategia nemotécnica (y la
interacción),

n' = ~+1
2+ 1

9
------------------------------Ti~a~b~la~s~d~e~p~od~e~r--------------------~~
Para el tipo de lista, n' es igual a 13.
Los tamaños (t') 2) de los tres efectos fueron 0.57 para el tipo de lista, 0.05 para el tipo
de estrategia nemotécnica y 0.11 para la interacción. En la tabla AXV.Sa se aprecia que el
poder de la prueba con r¡ 2 = 0.57, gl del tratamiento= 1 y n' = 13 es de más de 0.95. Según la
tabla AXV.Sb, el poder de la prueba con r¡ 2 = 0.05, gl del tratamiento = 2 y n' = 9 fue igual
a 0.16 y para r¡ 2 = 0.11, gl del tratamiento= 2 y n' = 9 fue ligeramente superior a 0.29.

- Como el efecto principal del tipo de estrategia nemotécnica no fue estadísticamente


significativo, vale la pena calcular el tamaño de la muestra que se requeriría para obtener
un poder de 0.8. En la sección siguiente se detalla cómo hacerlo.
Elección del tamaño de la muestra. Utilizaremos el ejemplo de la sección anterior, donde el
tamaño del efecto (r¡ 2) buscado es 0.05, los gl del tratamiento = 2 y el diseño un ANOVA de
2 x 3. En la tabla AXV.5b se observa que n' estaría entre 60 y 70 para obtener un poder
de 0.8. Mediante la interpolación lineal, la cifra es igual a 62. El tamaño total de la mues-
tra requerida se calcula con la ecuación siguiente:
Tamaño total de la muestra= (gl del tratamiento+ 1) x (n'- 1) + número de condiciones
En el presente caso, como hay 3 x 2 condiciones,
Tamaño total de la muestra 3 X (62 - 1) + 6
189
Para obtener un diseño equilibrado, el número de participantes de cada condición será éste:

tamaño total de la muestra


número de condiciones

que en el presente caso será

~- 31.5
6

En otras palabras, se necesitarán 32 personas en cada condición a fin de dar un poder de


0.8 para probar el efecto principal del tipo de estrategia nemotécnica.
Si los tamaños del efecto que buscamos para los distintos tratamientos son diferentes, se
realizará el análisis anterior usando el tratamiento con el menor tamaño del efecto esperado.

Poder del ANOVA intrasujetos


El poder del ANO VA intrasujetos está influido por varios factores. Mejora según el grado en
que las puntuaciones de los participantes se correlacionan entre los pares de niveles de la VI.
Sin embargo, se reduce por la falta de esfericidad. Para simplificar el proceso, recomenda-
mos consultar las tablas de la misma forma que para el ANO VA entre sujetos, pero conside-
rando el tamaño de la muestra sugerido como si fuera el global. Para ilustrar el procedimiento
~~--------------------------A~p~é~n~d~~·c~es~------------------------------
usaremos el ejemplo donde los participantes proponen una sentencia para un delincuente en
tres condiciones. El análisis se realiza mediante un ANOVA de una vía con tres niveles en la
VI. Si los investigadores desearan detectar un tamaño del efecto grande (r¡ 2 = 0.138) según
la definición de Cohen (1988), usando un poder de 0.8, encontrarían en la tabla AXV.Sb que
el tamaño de muestra recomendado está entre 20 y 25, lo cual da un poder entre 0.78 y 0.87.
Mediante la interpolación lineal, ello mostraría que el tamaño global de la muestra requeri-
da sería de 21 .1. Por tanto, los investigadores precisan de una muestra de 22 personas.

Tabla AXV. 1. Tablas de poder para la prueba z de un solo grupo.


a) Pruebas de una cola.
Tamaño del efecto (d)
n 01 02 03 04 OS 06 07 08 09 10 11 12 13 14
4 0.07 0.11 0.15 0.20 0.26 0.33 0.40 0.48 0.56 0.64 0.71 0.77 0.83 0.88
5 0.08 0.12 0.17 0.23 0.30 0.38 0.47 0.56 0.64 0.72 0.79 0.85 0.90 0.93
6 0.08 0.12 0.18 0.25 0.34 0.43 0. 53 0.62 0. 71 0.79 0.85 0.90 0.94 0.96
7 0.08 0.13 0.20 0.28 0.37 0.48 0.58 0.68 0.77 0.84 0.90 0.94 0.96 0.98
0.99

.. ...
8 0.09 0.1 4 0.21 0.30 0.41 0.52 0.63 0.73 0.82 0.88 0.93 0.96 0.98
9 0.09 0.15 0.23 0.33 0.44 0.56 0.68 0.77 0.85 0.91 0.95 0.97 0.99 0.99
10 0.09 0.1 6 0.24 0.35 0.47 0.60 0.72 0.81 0.89 0.94 0.97 0.98 0.99

.. ..
0.16 0.26 0.38 0.51 0.63 0.75 0.84 0.91 0.95 0.98 0.99
..
11 0.09
12 0.10 0.17 0.27 0.40 0.53 0.67 0.78 0.87 0.93 0.97 0.98 0.99
0.99
.. .. ..
13 0.10 0.18 0.29 0.42 0.56 0.70 0.81 0.89 0.95 0.98

...
14 0.10 0.18 0.30 0.44 0.59 0.73 0.84 0.91 0.96 0.98 0.99

.. ... .. ..
15 0. 10 0.19 0.31 0.46 0.61 0.75 0.86 0.93 0.97 0.99
16 0.11 0.20 0.33 0.48 0.64 0.77 0.88 0.94 0.97 0.99

... .. ..
17 0.1 1 0.21 0.34 0.50 0.66 0.80 0.89 0.95 0.98 0.99
0.82 0.91 0.96 0.99
. .
18 0.1 1 0.21 0.35 0.52 0.68

.. ... ... .. .. .. ..
19 0.11 0.22 0.37 0.54 0.70 0.83 0.92 0.9?- 0.99
20 0.12 0.23 0.38 0.56 0.72 0.85 0.93 0.97 0.99
0.26 0.44 0.64 0.80 0.91 0.97 0.99

... ..
25 0.13

... ...
0.14 0.29 0.50 0.71 0.86 0.95 0.99
. .. .. ..
30

.
35 0.15 0.32 0.55 0.76 0.91 0.97 0.99

...
0.81 0.94 0.98
.. .. .. .. .. .. ... ...
40 0.16 0.35 0.60
45 0.17 0.38 0.64 0.85 0.96 0.99
so
.. ..
0.17 0.41 0.68 0.88 0.97

... .. ... ... ..


0.19 0.46 0.75 0.93 0.99

...
60

... ...
0.51 0.81 0.96 0.99
.. .. .. ..
70 0.21
0.23 0.56 0.85 0.97

... .. ...
80

.. .. .. .. ..
0.24 0.60 0.89 0.98
.. .. ...
90
100 0.26 0.64 0.91 0.99
..
...
0.29 0.71 0.95
.. ... .. ... ..
120
0.76 0.97
.. ... .
...
140 0.32

... ...
0.81 0.98
.. .. . ... ...
160 0.35

.. .. .. ..
180 0.38 0.85 0.99
.. .. .. ...
0.41 0.88
. .
200
0.97
.. .. ..
300 0.53
400 0.64
..
0.99
.. .. ... ... .. ... . ..
... ... ... ..
0.72
.. .. ..
500

... .. .. .. ... ..
600 0.79
700 0.84
800
900
0.88
0.91 .. . .. .. . . . . . . . . ..
1000 0.94
Tablas de poder
------------------------------------~----------------------~
f589
Tabla AXV. 1. Tablas de poder para la prueba z de un solo grupo.
b) Pruebas de dos colas.
Tamaño del efecto (d)

n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4

-
4 0.05 0.06 0.09 0.12 0.17 0.22 0.29 0.36 0.44 0.52 0.59 0.67 0.74 0.80
5 0.05 0.07 0.10 0.14 0.20 0.27 0.35 0.43 0.52 0.61 0.69 0.77 0.83 0.88
6 0.05 0.07 0.11 0.16 0.23 0.31 0.40 0.50 0.60 0.69 0.77 0.84 0.89 0.93
7 0.05 0.08 0.12 0.18 0.26 0.35 0.46 0.56 0.66 0.75 0.83 0.89 0.93 0.96
8 0.05 0.08 0.13 0.20 0.29 0.40 0.51 0.62 0.72 0.81 0.88 0.92 0.96 0.98
9 0.05 0.09 0.14 0.22 0.32 0.44 0.56 0.67 o. 77 0.85 o. 91 o. 95 0.97 0.99
10 0.05 0.09 0.16 0.24 0.35 0.48 0.60 0.72 0.81 0.89 0.94 0.97 0.98 0.99
11 0.05 0.10 0. 17 0.26 0.38 0.51 0.64 0.76 0.85 o. 91 o.95 o. 98 o.99
12 0.05 0.10 0.18 0.28 0.41 0.55 0.68 0.79 0.88 0.93 0.97 0.99 0.99
13 0.05 0.11 0.19 0.30 0.44 0.58 0.71 0.82 0.90 0.95 0.98 0.99
14 0.06 0.11 0.20 0.32 0.46 0.61 o. 75 0.85 0.92 0.96 0.98 0.99
15 0.06 0.12 0.21 0.34 0.49 0.64 o. 77 0.87 0.94 0.97 0.99
16 0.06 0.12 0.22 0.36 O. 52 0.67 0.80 0.89 0.95 0.98 0.99
17 0.06 0.13 0.23 0.38 0.54 0.70 0.82 0.91 0.96 0.98 0.99
18 0.06 0.13 0.25 0.40 0.56 0.72 0.84 0.92 0.97 0.99
19 0.06 0.14 0.26 0.41 0.59 0.74 0.86 0.94 0.98 0.99
20 0.07 o. 14 0.27 0.43 0.61 0.77 0.88 0.95 0.98 0.99
25 0.07 0.17 0.32 0.52 0.71 0.85 0.94 0.98 0.99
30 0.08 0.19 0.38 0.59 0.78 0.91 0.97 0.99
35 0.09 0.22 0.43 0.66 0.84 0.94 0.99
40 o.09 o.24 o.48 o.n 0.89 0.97 0.99
45 0.10 0.27 0.52 0.77 0.92 0.98
50 0.11 0.29 0.56 0.81 0.94 0.99
60 0.12 0.34 0.64 0.87 0.97
70 0.13 0.39 0.71 0.92 0.99
80 0.14 0.43 O. 77 O. 95 O. 99
90 0.16 0.48 0.81 0.97
100 0.17 0.52 0.85 0.98
120 0.19 0.59 0.91 0.99
140 0.22 0.66 0.94
160 0.24 0.72 0.97
180 0.27 0.77 0.98
200 0.29 0.81 o. 99
300 0.41 0.93
400 0.52 o. 98
500 0.61 0.99
600 0.69
700 0.75
800 0.81
900 0.85

-
1000 0.89
59Ql Apéndices

Tabla AXV.2. Poder de una prueba t entre sujetos.


a) Pruebas de una cola (n es el número de personas por grupo).
Tamaño del efecto (d)

n 0.1 0.2 0.3 0.4 0.5 0.6 o.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4

8 0.07 0.10 0.13 0.18 0.23 0.29 0.36 0.44 0.52 0.59 0.67 0.73 0.79 0.84
9 0.07 0.10 0.14 0.19 0.25 0.32 0.40 0.48 0.56 0.64 0.72 0.78 0.84 0.88
10 0.07 0.11 0.15 0. 21 0.27 0.35 0.43 0.52 0.61 0.69 0.76 0.82 0.87 0.91
11 0.08 0.11 0.16 0.22 0.29 0.38 0.47 0.56 0.65 0.73 0.80 0.86 0.90 0.93
12 0.08 0.12 0.17 0.23 0.31 0.40 0.50 0.59 0.68 0.76 0.83 0.88 0.92 0.95
13 0.08 0.12 0.18 0.25 0.33 0.43 0.53 0.63 0.72 0.80 0.86 0.90 0.94 0.96
14 0.08 0.13 0.19 0.26 0.35 0.45 0.56 0.66 0.75 0.82 0.88 0.92 0.95 0.97
15 0.08 0.13 0.19 0.27 0.37 0.48 0.58 0.69 0.77 0.85 0.90 0.94 0.96 0.98
16 0.08 0.13 0.20 0.29 0.39 0.50 0.61 0.71 0.80 0.87 0.92 0.95 0.97 0.98
17 0.09 0.14 0.21 0.30 0.41 0.52 0.63 0.74 0.82 0.88 0.93 0.96 0.98 0.99
18 0.09 0.14 0.22 0.31 0.42 0.54 0.66 0.76 0.84 0.90 0.94 0.97 0.98 0.99
19 0.09 0.15 0.23 0.33 0.44 0.56 0.68 0.78 0.86 0.91 0.95 0.97 0.99
.
0.99
20 0.09 0.15 0.23 0.34 0.46 0.58 0.70 0.80 0.87 0.93 0.96 0.98 0.99
. .
25 0.10 0.17 0.27 0.40 0.54 0.67 0.79 0.87 0.93 0.97 0.98
.
0.99
. .
30 0.10 0.19 0.31 0.45 0.60 0.74 0.85 0.92 0.96 0.98
. .
0.99
. .
. . .
... ...
35 0.11 0.20 0.34 0.50 0.66 0.80 0.89 0.95 0.98 0.99
40
45
0.11
0.12
0.22
0.24
0.37
0.41
0.55
0.59
0.72
0.76
0.84
0.88
0.93
0.95
0.97
0.98
0.99
0.99
.
.. . ..
50
60
0.12
0.13
0.26
0.29
0.44
0.49
0.63
0.70
0.80
0.86
0.91
0.95
0.97
0.98
. .
..
0.99
.. .. .. . .
. .
70
80
0. 14
0.1~
0.32
0.35
0.55
0.60
0.76
0.81
0.90
0.93
0.97
0.98 .. .. ..
0.99
. . .
. . .
. .
. .
90 0.16 0. 38 0.64 0.85 0.95 0.99
. . . . .. . . .
100 0.17 0.41 0.68 0.88 0.97
. . . .
0.99
. . . .
110 0.18 0.43 0.72 0.90 0.98
. . . . . . . . .
. . . . . .. .
.. ..
120 0.19 0.46 0.75 0.93 0.99

. . . .
... .. ...
130 0.20 0.48 0.78 0.94 0.99

. . . . .
... ...
140 0.21 0.51 0.80 0.95 0.99
150 0.22 0.53 0.83 0.96
. . . . .
. . . . .
... .. ...
160 0.23 0.56 0.85 0.97
.
170 0.23 0.58 0.87 0.98
. . . . .
. . . .
. .
. .
...
180 0.24 0.60 0.88 0.98
190 0.25 0.62 0.90 0.99
. . . . . . . . .
200 0.26 0.64 0.91
.
0.99
. . . . . . . . .
300 0.34 0.79
. .
0.98
. . . . . .. .. .. . .
400 0.41 0.88
. . . . . . . .
500 0.47 0.94
. . . . . . . . . . . .
600 0.53 0.97
. . . . . . . . . . . .
700 0.59 0.98
. . . . . . . . . . . .
800 0.64
.
0.99
. . . . . . . . . . .
900
1000
0.68
0.72 . . . . . . . . . . . . .
r ________________________________
Ta_b_la_s_d_e~po_d_e_r____________________ --Jf'591
Tabla AXV.2. Poder de una prueba t entre sujetos.
b) Pruebas de dos colas (n es el número de personas por grupo).
Tamaño del efecto (d)

n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
8 0.05 0.05 0.07 0.10 0.14 0.18 0.23 0.30 0.37 0.44 0.52 0.60 0.67 0.74
9 0.05 0.05 0.08 0.1 1 0.15 0.20 0.27 0.34 0.42 0.50 0.58 0.66 0.73 0.80
10 0.05 0.06 0.08 0.12 0.17 0.23 0.30 0.38 0.47 0.55 0.64 0.72 0.78 0.84
11 0.05 0.06 0.09 0.13 0.19 0.25 0.33 0.42 0.51 0.60 0.69 0.76 0.83 0.88
12 0.05 0.06 0.10 0.14 0.20 0.28 0.36 0.46 0.55 0.64 0.73 0.80 0.86 0.91
13 0.05 0.07 0.10 0.15 0.22 0.30 0.39 0.49 0.59 0.68 0.77 0.84 0.89 0.93
14 0.05 0.07 0.11 0.16 0.24 0.32 0.42 0.52 0.63 0.72 0.80 0.86 0.91 0.94
15 0.05 0.07 0.12 0.17 0.25 0.34 0.45 0.56 0.66 0.75 0.83 0.89 0.93 0.96
16 0.05 0.08 0.12 0.18 0.27 0.37 0.48 0.59 0.69 0.78 0.85 0.91 0.94 0.97
17 0.05 0.08 0.13 0.20 0.28 0.39 0.50 0.62 0.72 0.81 0.87 0.92 0.96 0.98
18 0.05 0.08 0.13 0.21 0.30 0.41 0.53 0.64 0.75 0.83 0.89 0.94 0.96 0.98
19 0.05 0.08 0.14 0.22 0.31 0.43 0.55 0.67 0.77 0.85 0.91 0.95 0.97 0.99
20
25
0.05
0.05
0.09 0.14
0.10 0.17
0.23
0.28
0.33
0.40
0.45
0.54
0.57
0.68
0.69
0.79
0.79
0.88
0.87
0.93
0.92
0.97
0.96
0.98
. ..0.98
0.99
0.99

...
30 0.06 0.11 0.20 0.33 0.47 0.63 0.76 0.86 0.93 0.97 0.99
. . .
0.99
35 0.06 0.13 0.23 0.37 0.54 0.70 0.82 0.91 0.96 0.98
.
0.99
. .
40 0.06 0.14 0.26 0.42 0.60 0.75 0.87 0.94 0.98
.
0.99
. . . .
45 0.07 0.15 0.29 0.46 0.65 0.80 0.91 0.96 0.99
. . . . .
50
60
0.07
0.08
0.16 0.31
0.19 0.37
0.51
0.58
0.70
0.78
0.84
0.90
0.93
0.97
... ..
0.98

.
0.99
0.99
. .
. ... .
.
..
70 0.08 0.21 0.42 0.65 0.84 0.94 0.98
. . . .
80
90
0.09
0.10
0.24 0.47
0.26 0.52
0.71
0.76
0.88
0.92
0.96
0.98 .0.99
. .
. . . .
. .
. .
. .
.
.
.
.. ... ... ... ... . . . .
100 0.10 0.29 0.56 0.80 0.94 0.99
110 0.11 0.31 0.60 0.84 0.96 0.99
. . . .
120 0.12 0.34 0.64 0.87 0.97
. . . .
130
140
0.12
0.13
0.36 0.67
0.38 0.71
0.89
0.92
0.98
0.99 . . . . .
. . . . .
.
.
.
. . .
. .
150 0.14 0.41 0.74 0.93 0.99
. . . . . . . . .
160 0.14 0.43 . 0.76 0.95 0.99
. . . . . . . . .
. .
... . . . . . . .
170 0.15 0.45 0.79 0.96

. . . . . . .
... ...
180 0.15 0.47 0.81 0.97
190 0.16 0.49 0.83 0.97
. . . . .. .. .
200 0.17 0.51 0.85
.
0.98
. . . .
300 0.23 0.69 0.96
. . . . . . . . . . .
. .. ..
400 0.29 0.81 0.99
. . . . . . . . . .
500
600
0.35
0.41
0.88
0.93 .. .
.
.
.
. . .
.. .. .. ... . .
. . . . .
700
800
0.46
0.52
0.96
0.98 .. .
.
.
. . . . . .
. .
.
. . .
. . .
900
1000
0.56
0.61
0.99
0.99 . . . . . . . . . . . .
.....
5921 Apéndices

Tabla AXV.3. Poder de una prueba t intrasujetos o de una prueba t de un solo grupo.
a) Pruebas de una cola.
Tamaño del efecto (d)

n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
5 0.06 0.08 0.11 0.14 0.18 0.24 0.30 0.37 0.46 0.54 0.62 0.69 0.76 0.81
6 0.07 0.09 0.13 0.17 0.23 0.30 0.39 0.48 0.57 0.66 0.74 0.80 0.85 0.89
7 0.07 0.10 0.15 0.21 0.28 0.37 0.47 0.57 0.66 0.75 0.81 0.87 0.91 0.94
8 0.08 0.11 0.17 0.24 0.32 0.42 0.53 0.64 0.73 0.81 0.87 0.91 0.94 0.96
9 0.08 0.12 0.18 0.26 0.36 0.48 0.59 0.70 0.79 0.86 0.91 0.94 0.96 0.98
10 0.08 0.13 0.20 0.29 0.40 0.52 0.64 0.75 0.83 0.89 0.93 0.96 0.98 0.99
11 0.08 0.14 0.22 0.32 0.44 0.57 0.69 0.79 0.87 0.92 0.95 0.97 0.98 0.99
12 0.09 0.15 0.23 0.34 0.48 0.61 0.73 0.82 0.89 0.94 0.97 0.98 0.99 0.99
13 0.09 0.15 0.25 0.37 0.49 0.65 0.76 0.85 0.92 0.95 0.98 0.99 0.99
14 0.09 0.16 0.26 0.39 0.54 0.68 0.79 0.88 0.93 0.96 0.98 0.99
15 0.10 0.17 0.28 0.42 0.57 0.71 0.82 0.90 0.95 0.97 0.99 0.99
16 0.10 0.18 0.29 0.44 0.60 0.74 0.84 0.92 0.96 0.98 0.99
17 0.10 0.19 0.31 0.46 0.62 0.76 0.86 0.93 0.97 0.98 0.99
18 0.10 0.19 0.32 0.48 0.65 0.78 0.88 0.94 0.97 0.99
19 0.11 0.20 0.34 0.50 0.67 0.81 0.90 0.95 0.98 0.99
20 0.11 0.21 0.35 0.52 0.69 0.82 0.91 0.96 0.98 0.99
25 0.12 0.24 0.42 0.61 0.78 0.90 0.96 0.98 0.99
30 0.13 0.28 0.48 0.69 0.85 0.94 0.98 0.99
35 0.14 0.31 0.53 0.75 0.89 0.96 0.99
40 0.15 0.34 0.58 0.80 0.93 0.98
45 0.16 0.37 0.63 0.84 0.95 0.99
50 0.17 0.40 0.67 0.87 0.97 0.99
60 0.19 0.45 0.74 0.92 0.98
70 0.20 0.50 0.80 0.95 0.99
80 0.22 0.55 0.84 0.97
90 0.24 0.59 0.88 0.98
100 0.26 0.63 0.91 0.99
110 0.27 0.67 0.93 0.99
120 0.29 0.70 0.95
130 0.30 0.73 0.96
140 0.32 0.76 0.97
150 0.33 0.79 0.98
160 0.35 0.81 o. 98
170 0.36 0.83 0.99
180 0.38 0.85 0.99
190 0.39 0.86 0.99
200 0.41 0.88 o. 99
300 0.53 0.96
400 0.64 0.99
500 0.72
600 0.79
700 0.84
800 0.88
900 0.91
1000 0.94
.... ____________________________Ti_ab_la_s_d_e~p_oo_e_r___________________J~

Tabla AXV.3. Poder de una prueba t intrasujetos o de una prueba t de un solo grupo.
b) Pruebas de dos colas.
Tamaño jel efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 o. 7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
6 0.05 0.05 0.06 0.09 0.12 0.16 0.22 0.28 0.36 0.45 0.55 0.64 0.72 0.79
7 0.05 0.05 0.07 0.11 0.15 0.21 0.29 0.38 0.47 0.58 0.67 0.75 0.82 0.87
8 0.05 0.06 0.09 0.13 0.19 0.26 0.36 0.46 0.57 0.67 0.76 0.83 0.88 0.92
9 0.05 0.06 0.10 0.15 0.22 0.31 0.42 0.54 0.65 0.75 0.83 0.88 0.93 0.95
10 0.05 0.07 0.11 0.17 0.26 0.36 0.48 0.60 0.71 0.80 0.87 0.92 0.95 0.97
11 0.05 0.07 0.12 0.19 0.29 0.41 0.54 0.66 0.77 0.85 0.91 0.94 0.97 0.98
12 0.05 0.08 0.13 0.22 0.32 0.45 0.59 0.71 0.81 0.88 0.93 0.96 0.98 0.99
13 0.05 0.09 0.15 0.24 0.36 0.49 0.63 0.75 0.85 0.91 0.95 0.97 0.99 0.99
14 0.05 0.09 0.16 0.26 0.39 0. 53 0.67 0.79 0.88 0.93 0.96 0.98 0.99
15 0.05 0.10 0.17 0.28 0.42 0.57 0.71 0.82 0.90 0.95 0.97 0.99 0.99
16 o.o5 ·o,10 0.18 0.30 0.45 0.60 0.74 0.85 0.92 0.96 0.98 0.99
17 0.05 0.11 0.20 0.32 0.48 0.64 0.77 0.87 0.93 0.97 0.99 0.99
18 0.06 0.11 0.21 0.34 0.50 0.67 0.80 0.89 0.95 0.98 0.99
19 0.06 0.12 0.22 . 0.36 0.53 0.69 0.82 0.91 0.96 0.98 0.99

-
20 0.06 0.12 0.23 0.38 0.56 0.72 0.84 0.92 0.97 0.99 0.99
25 0.07 0.15 0.29 0.47 0.67 0.82 0.92 0.97 0.99
30 0.07 0.18 0.35 0.56 0.75 0.89 0.96 0.99
35 0.08 0.20 0.40 0.63 0.82 0.93 0.98 0.99
40 0.09 0.23 0.45 0.69 0.87 0.96 0.99
45 0.09 0.25 0.50 0.75 0.91 0.97 0.99
50 0.10 0.28 0.54 o. 79 o.93 o.98
60 0.11 0.33 0.63 0.86 0.97 0.99
70 0.13 0.37 0.70 0.91 0.98
80 0.14 0.42 0.75 0.94 0.99
90 0.15 0.46 0.80 0.96
100 0.16 0.51 0.84 0.98
110 0.18 0.55 0.88 0.99
120 0.19 0.58 0.90 0.99
130 0.20 0.62 0.92 0.99
140 0.21 0.65 o. 94
150 0.23 0.68 o. 95
160 0.24 o. 71 o. 96
170 0.25 o. 74 o. 97
180 0.26 o. 76 o. 98
190 0.28 0.78 0.98
200 0.29 0.80 o. 99
300 0.41 o. 93
400 0.51 o. 98
500 0.61 o. 99
600 0.69
700 0.75
800 0.81
900 0.85
1000 0.88
594lL--------------------~A~p~é_nd_ic~e~
s _________________________

Tabla AXV.4. Poder de una prueba xz.


a) gl = l.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 0.27 0.43 0.61 0.76 0.88 0.95 0.98
0.99
22
24
<0.20
<0.20
<0.20
<0.20
0.29
0.31
0.46
0.50
0.65
0.69
0.80
0.84
0.91
0.93
0.96
0.97 ..
26 <0.20 <0.20 0.33 0.53 0.72 0.86 0.95 0.98 *
28 <0.20 <0.20 0.35 0.56 0.75 0.89 0.96 0.99 •
30 <0.20 <0.20 0.38 0.59 0.78 0.91 0.97 0.99 *
35 <0.20 0.22 0.42 0.66 0.84 0.94 0.98 • •
40 <0.20 0.25 0.47 0.71 0.89 0.97 * * *
45 <0.20 0.27 0.52 0.76 0.92 0.98 * • *
50 <0.20 0.30 0.56 0.81 0.94 0.99 * • •
55 <0.20 0.32 0.60 0.84 0.96 • * • •
60 <0.20 0.34 0.64 0.87 0.97 • • • *
65 <0.20 0.36 0.68 0.90 0.98 • • • *
70 <0.20 0.39 0.71 0.92 0.99 • • * *
75
80
<0.20
<0.20
0.41
0.43
0.74
0.76
0.93
0.95
0.99
*



• .
* •
*
85 <0.20 0.45 0.79 0.96 * • • • *
90 <0.20 0.47 0.81 0.97 * • * * *
95 <0.20 0.49 0.83 0.97 • • * * •
100 <0.20 0.51 0.85 0.98 * * * * •
110 <0.20 0.55 0.88 0.99 * • * • •
120 <0.20 0.59 0.91 0.99 • * * * *
130 0.21 0.62 0.93 • • • • * *
140 0.22 0.66 0.94 • • • * * •
150 0.23 0.69 0.96 • • • • * *
160 0.25 0.71 0.97 • • • * * *
170 0.26 0.74 0.97 • • • * * *
180 0.27 0.76 0.98 • • * * * *
190 0.28 0.79 0.98 * * • * • *
200
250
0.30
0.35
0.81
0.89
0.99

*



*

*
* . ..•
*
*
300
350
0.41
0.46
0.93
0.96
*


*
*
*


*
* .• .
400
450
0.51
0.56
0.98
0.99

* .
• •
*



*


*
*
500 0.61 * * * * • * * •
600 0.69 * • • * • * * *
700
800
0.75
0.81 .
• •

*
*

*

*
*
* .
• •
.

900 0.85 • • • • • * *
1000 0.89 * * * * • * • *
------------------------~To~ab~la=s~d~e~p~od=e~r----------------~~
Tabla AXV.4. Poder de una prueba x2 •
b) gl = 2.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 07 0.8 09
20 <0.20 <0.20 0.21 0.34 0.50 0.67 0.81 0.90 0.96
22 <0.20 <0.20 0.23 0.37 0.54 0.71 0.85 0.93 0.97
24 <0.20 <0.20 0.24 0.40 0.58 0.75 0.88 0.95 0.98
26 <0.20 <0.20 0.26 0.43 0.62 0.79 0.90 0.96 0.99
<0.20 <0.20 0.66 0.82 0.92 0.97 0.99
28
30 <0.20 <0.20
0.28
0.29
0.46
0.48 0.69 0.85 0.94 0.98 ..
35 <0.20 <0.20 0.34 0.55 0.76 0.90 0.97 0.99 ..
40 <0.20 <0.20 0.38 0.61 0.82 0.93 0.99 . ..
45 <0.20 0.21 0.42 0.67 0.86 0.96 0.99 . •
• . •
50
55
<0.20
<0.20
0.23
0.25
0.46
0.50
0.72
0.76
0.90
0.92
0.98
0.99 . .. ..
<0.20 0.27 0.94 0.99 • . •
60
<0.20 0.28
0.54 0.80
0.83 0.96 .. • . ..
65
70 <0.20 0.30
0.57
0. 61 0.86 0.97 .. .. . ..
75 <0.20 0.32 0.64 0.88 0.98 .. . • ..
..
80
85
<0.20
<0.20
0.34
0.36
0.67
0.70
0.90
0.92
0.99
0.99 . •
. .
* •
..
..
90 <0.20 0.38 0.72 0.93 0.99 • • •
95 <0.20 0.40 0.75 0.95 .. • .. • •
0.41 .. . . •
100 <0.20 0.77 0.96
.. .
110
120
<0.20
<0.20
0.45
0.48
0.81
0.85
0.97
0.98
..
• ... .
.
..

.
130 <0.20 0.52 0.88 0.99 • • • •
..
140
150
<0.20
<0.20
0.55
0.58
0.90
0.92
0.99
. •

.• ..
.
.

..
..
..
160 <0.20 0.61 0.93 • • • •
. .. • . * ..
170
180
0.20
0.21
0.64
0.67
0.95
0.96 . . .. . .. ..
190 0.22 0.69 0.97 . • • • • •
.. • • • .. •
200
250
0.23
0.28
0.72
0.82
0.98
0.99 • • .. • .. ..
300 0.32 0.88 • .. • • • .
• .* . • .. •
350 0.37 0.93
0.96 .. • • • .* .. •
400 0.41
• • • • . .. ..
450
500
0.46
0.50
0.98
0.99 • . . .. • • •
• • • • .. ..
600 0.58
.. ..* .. .. *
700
800
0.66
0.72
.



..
.•

• . ..
..
.. ...

900 0.77 • • • •
1000 0.82 • . • • • .. .. .
5961 Apéndices

Tabla AXV.4. Poder de una prueba x2.


e) gl = 3.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 o6 0.7 0.8 09
20 <0.20 <0.20 <0.20 0.29 0.44 0.60 0.75 0.87 0.94
22 <0.20 <0.20 <0.20 0.32 0.48 0.65 0.80 0.90 0.96
24 <0.20 <0.20 0.21 0.35 0.52 0.69 0.83 0.92 0.98
26 <0.20 <0.20 0.22 0.37 0.55 0.73 0.86 0.94 0.99
28 <0.20 <0.20 0.23 0.40 0.59 0.77 0.89 0.96 0.99
30 <0.20 <0.20 0.25 0.42 0.62 0.80 0.91 0.97 *
35 <0.20 <0.20 0.29 0.49 0.70 0.86 0.95 0.99 *
40 <0.20 <0.20 0.32 0.55 0.76 0.91 0.98 * *
45 <0.20 <0.20 0.36 0.60 0.82 0.94 0.99 * *
50 <0.20 0.20 0.40 0.65 0.86 0.96 * * *
55 <0.20 0.21 0.44 0.70 0.89 0.98 * • •
60 <0.20 0.22 0.47 0.74 0.92 0.99
.
* * *
65 <0.20 0.24 0.51 0.78 0.94 0.99 * * *
70 <0.20 0.26 0.54 0.81 0.95 * * *
75 <0.20 0.27 0.57 0.84 0.97 * * *
.
*
80 <0.20 0.29 0.60 0.87 0.98
.
* * * *
85 <0.20 0.31 0.63 0.89 0.99 * * *
90 <0.20 0.32 0.66 0.91 0.99 * * *
95 <0.20 0.34 0.69 0.92 0.99 • •
100 <0.20 0.36 0.71 0.93 • ..
*
• •
*
*
110 <0.20 0.39 0.76 0.96 • • •
120 <0.20 0.42 0.80 0.97 • ..* *
• • •
..
130
140
<0.20
<0.20
0.46
0.49
0.83
0.86
0.99
0.99

..
* .. *
* .
• *
*
150
160
<0.20
<0.20
0.52
0.55
0.88
0.91
*

.
* *
*
* .• *
*
170 <0.20 0.58 0.92 * * * • *
180 <0.20 0.60 0.94 * * * *

.•
* *
190 <0.20 0.63 0.95 * * • • *
200 0.20 0.65 0.96 * * * * *
250
300
0.23
0.27
0.76
0.84
0.99
*

.•
*
*
*
* ..
* *
*
*
*
350
400
0.32
0.36
0.90
0.93
* * *
.
* *
*

.•
* * * * *
450 0.40 0.96 * * * * * •
500 0.44 0.98 •
.
* * * * *
• •
600 0.52 0.98
.. *
..
*
..
* * *
700 0.59
.. .. * *

.. ..
* *
800 0.65 • * • • * •
900
1000
:Q.71
'0.76
*
*
*
*
·•
. .
* *
*
*

1100 0.81 • * • * * * * *
------------------------~Ti~ab~la~s~d~e~po~d~e~r----------------~~
Tabla AXV.4. Poder de una prueba x2.
d) gi = 4.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 0.26 0.40 0.55 0.71 0.83 0.91
22 <0.20 <0.20 <0.20 0.29 0.43 0.60 0.75 0.87 0.94
24 <0.20 <0.20 <0.20 0.31 0.47 0.64 0.80 0.90 0.96
26 <0.20 <0.20 0.20 0.33 0.50 0.69 0.83 0.92 0.97
28 <0.20 <0.20 0.21 0.36 0.54 0.72 0.86 0.94 0.99
30 <0.20 <0.20 0.23 0.38 0.57 0.76 0.88 0.96 0.99
35 <0.20 <0.20 0.26 0.44 0.65 0.82 0.93 0.98 *
40 <0.20 <0.20 0.29 0.50 0.72 0.88 0.96 0.99 *
45 <0.20 <0.20 0.33 0.55 0.77 0.91 0.98 * •
50 <0.20 <0.20 0.36 0.61 0.82 0.94 0.99 * *
55 <0.20 <0.20 0.39 0.65 0.86 0.96 * • *
60 <0.20 0.20 0.42 0.70 0.89 0.98 * • •
65 <0.20 0.22 0.46 0.74 0.91 0.99 • • •
70 <0.20 0.23 0.49 0.77 0.93 0.99 • * *
75 <0.20 0.25 0.52 0.80 0.95 * • * •
80 <0.20 0.26 0.55 0.83 0.96 • * •
.. .• .
*
85 <0.20 0.28 0.58 0.86 0.98 * • •
90 <0.20 0.29 0.61 0.88 0.98 *
95 <0.20 0.31 0.64 0.89 0.99 • • •
100 <0.20 0.32 0.67 0.91 0.99 * • * •
110 <0.20 0.35 0.71 0.94 * * * • *
120 <0.20 0.38 0.76 0.96 * • * • *
130 <0.20 0.41 0.79 0.97 • • • • •
140
150
<0.20
<0.20
0.44
0.47
0.82
0.85
0.98
0.99





.


* .*

160 <0.20 0.50 0.88 0.99 * * * *


170 <0.20 0.53 0.90 * * * • • *
180 <0.20 0.55 0.91 * • • • * •
190 <0.20 0.58 0.93 • * • • • *
200 <0.20 0.61 0.94
.
* * * * * *
250 0.21 0.72 0.98 • * • • • *
300 0.25 0.80 0.98 • • *

..
* *
350 0.28 0.87 • • • • •
.
* *
400 0.32 0.91 • • • • • •
450 0.36 0.94 • • * • •
0.40 0.96 • • •
.
500 * * * *
600 0.47 0.99 • • • • • •
..
*
700 0.54 • • • • •
.•
* *
800 0.61 • * * • • •
900 0.67 • • •
.
* * *
1000 0.72 * * * • * * * *
1100 0.76 • * • * * * *
1200 0.80 * • • * * • • *
598l~-----------------------A~pe_·n_d_ic_e_s___________________________

Tabla AXV.4. Poder de una prueba 2. x


e) gl = 5.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 0.24 0.36 0.51 0.67 0.80 0.89
22 <0.20 <0.20 <0.20 0.26 0.40 0.56 0.72 0.84 0.92
24 <0.20 <0.20 <0.20 0.28 0.43 0.60 0.76 0.88 0.94
26 <0.20 <0.20 <0.20 0.30 0.47 0.64 0.80 0.90 0.96
<0.20 <0.20 <0.20 0.50 0.83 0.93 0.97

...
28 0.33 0.68
30 <0.20 <0.20 0.20 0.35 0.53 0.72 0.86 0.94 0.98
<0.20 <0.20
..
35 0.23 0.40 0.61 0.79 0.91 0.97
<0.20 <0.20
..
40 0.26 0.46 0.68 0.85 0.95 0.99

..
45 <0.20 <0.20 0.29 0.51 0.74 0.89 0.97

..
50 <0.20 <0.20 0.33 0.56 0.79 0.93 0.98
<0.20
.•• .
55 <0.20 0.36 0.61 0.83 0.95 0.99

...
60 <0.20 <0.20 0.39 0.66 0.87 0.96
.
..
65 <0.20 <0.20 0.42 0.70 0.90 0.98
<0.20 0.21 0.45 0.73 0.92 0.98
..
70
75 <0.20
<0.20
0.22
0.24
0.48
0.51
0.77
0.80
0.94
0.95
0.99
..• ..
.. .•• ..
80
<0.20 0.25 0.54 0.83 0.96

...
85
<0.20 0.26 0.57 0.85 0.97
.. ..
90
95 <0.20 0.28 0.60 0.87 0.98
<0.20 0.29 0.62 0.89 0.98 •
.. .. ..•
100
<0.20 0.32 0.67 0.92 0.99 •

...
110
<0.20 0.35 0.72 0.94 • •
..
120
<0.20 0.76 0.96 •
.•• ..
130 0.38
<0.20 0.97 •

...
140 0.40 0.79
<0.20 •
..• .
150 0.43 0.82 0.98
<0.20 •
.. .•
160 0.46 0.85 0.99
<0.20 • •

...
170 0.49 0.87 0.99
<0.20 • •
.. .• ..• .•
180 0.51 0.89

...
190 <0.20 0.54 0.91 • •
<0.20
.. .. .•
200 0.56 0.93
250 <0.20 0.68 0.97

.• ..
.. ..
300 0.22 0.77 0.99
350 0.26 0.84 •
• ..

.• .•
.. ..
400 0.29 0.89
• •

..• .. ..•
450 0.33 0.93

..

..
• •
..•
...
500 0.36 0.95

..
600 0.43 0.98
700 0.50 0.99
..• .. . .. ..• ...
.. ..
0.56
.
800

..• .
900 0.62
.. ... .. ...
0.68
..
1000
1100 0.73
1200
1300
0.77
0.84 . • .• . .•
------------------~------~Ti~ab~l~as~d~e~p~o~de~r------------------~~
Tabla AXV.4. Poder de una prueba xz.
j) gl = 6.
Tamaño del efect o (w)
n 0.1 0.2 0.3 0.4 0 .5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 0.22 0.34 0.48 0.63 0.77 0.87
22 <0.20 <0.20 <0.20 0.24 0.37 0.52 0.68 0.81 0.91
24 <0.20 <0.20 <0.20 0.26 0.40 0.57 0.73 0.85 0.93
26 <0.20 <0.20 <0.20 0.28 0.43 0.61 0.77 0.88 0.95
28 <0.20 <0.20 <0.20 0.30 0.47 0 .65 0.80 0.91 0.96

..
30 <0.20 <0.20 <0.20 0.32 0.50 0.68 0.83 0.93 0.98
35 <0.20 <0.20 0.22 0.38 0.57 0 .76 0.89 0.96 0.99

.. ..•
40 <0.20 <0.20 0.25 0.43 0.64 0 .82 0.93 0.98
45 <0.20 <0.20 0.27 0.48 0.70 0 .87 0.96 0.99
50 <0.20 <0.20 0.30 0.53 0 .76 0.91 0.98
55 <0.20 <0.20 0.33 0 .58 0.80 0 .94
..
0.99
.. .•
..
60 <0.20 <0.20 0.36 0.62 0 .84 0 .96 0.99
<0.20 <0.20

..
65 0.39 0.66 0.87 0 .97

...
70 <0.20

.
0.20 0.42 0.70 0.90 0 .98
<0.20

... ..
75 0.21 0.45 0.74 0.92 0 .99

... ..
80 <0.20 0.22 0.48 0.77 0.94 0.99

..
85 <0.20 0.23 0.51 0.80 0.95

. .
90 <0.20 0.25 0.53 0.82 0.96

...
95 <0.20 0.26 0.56 0.85 0.97

.. .•
100 <0.20 0.27 0.59 0.87 0.98
• •
..
110 <0.20 0.30 0.64 0.90 0.99
• •
.. ..
120 <0.20 0.32 0.68 0.93
• • •
.•
130 <0.20 0.35 0.72 0.95
140
150
<0.20
<0.20
0.38
0.40
0.76
0.79
0.96
0.97
..



. ..
160 <0.20 0.43 0.82 0.98 •
..
• • .• ..
. .•
170 <0.20 0.45 0.85 0.99
180 <0.20 0.48 0.87 0.99
• . • •

..• ..• ..• ..• ..


190 <0.20 0.50 0.89

.•
200 <0.20 0.53 0.91 *

. .. .. .. ... ...
250 <0.20 0.64 0.96
300 0.21 0.74 0.99

... .•• ... ... ..


350 0.24 0.81

.. ..
400 0.27 0.87 *

... ..
450 0.30 0.91

... .. . ..• ..
500 0.34 0.94
600 0.40 0.97

... .. .. .•• ..
700 0.47 0.99

.. ..
800 0.53
900 •
.. .. .. .• ..
0.59

.. .•• ..
1000 0.64

. . . .
1100 0.69
1200 0.74
1300 0.81 •
600l~------------------------A~p_én_d_ic_e_s______________________________

Tabla AXV.4. Poder de una prueba ·x,2.


g) gl = 7.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 0.20 0.32 0.45 0.60 0.75 0.85
22 <0.20 <0.20 <0.20 0.22 0.35 0.50 0.66 0.79 0.89
24 <0.20 <0.20 <0.20 0.24 0.38 0.54 0.70 0.83 0.92
26 <0.20 <0.20 <0.20 0.26 0.41 0.58 0.74 0.87 0.94
28 <0.20 <0.20 <0.20 0.28 0.44 0.62 0.78 0.89 0.96
30 <0.20 <0.20 <0.20 0.30 0.47 0.66 0.81 0.92 0.97

...
35 <0.20 <0.20 0.20 0.35 0.55 0.74 0.88 0.96 0.99
40 <0.20 <0.20 0.23 0.40 0.62 0.80 0.92 0.98

... ..
45 <0.20 <0.20 0.26 0.45 0.68 0.85 0.95 0.99
50 <0.20 <0.20 0.28 0.50 0.73 0.89 0.97

.. ..
55 <0.20 <0.20 0.31 0.55 0.78 0.92 0.99
60
65
<0.20
<0.20
<0.20
<0.20
0.34
0.37
0.59
0.64
0.82
0.86
0.95
0.97
0.99
..
70
75
<0.20
<0.20
<0.20
<0.20
0.40
0.43
0.68
0.71
0.88
0.91
0.98
0.99 .. ... ...
80 <0.20 0.20 0.45 0.75 0.93 0.99
..
... .. ... .
..
85 <0.20 0.22 0.48 0.78 0.94 0.99
90 <0.20 0.23 0.51 0.80 0.96

.. ..
95 <0.20 0.24 0.53 0.83 0.97
100 <0.20 0.25 0.56 0.85 0.98
.. ..
.. ..
110 <0.20 0.28 0.61 0.89 0.99
120 <0.20 0.30 0.66 0.92
0.94
0.99
.. ... .
.. .
130 <0.20 0.33 0.70

... ..•
<0.20

.. ...
140 0.35 0.74 0.96

...
150 <0.20 0.38 0.77 0.97
160 <0.20 0.40 0.80 0.98
..
... .. ... ..
170 <0.20 0.43 0.83 0.99

..
180 <0.20 0.45 0.85 0.99
. .. ...
190 <0.20 0.48 0.88 0.99

.. ... .. ..
200 <0.20 0.50 0.89

.. .•
250 <0.20 0.62 0.96

. .
... ... .
300 <0.20 0.71 0.99

.. ... ..
350 0.22 0.79

... .
400 0.25 0.85
450
500
0.28
0.32
0.89
0.93
.. .. . .. .. ..•
600 0.38 0.97
... .. ...
... ... ... .. ..
700 0.44 0.99

.. ... . ..
800 0.50

.. ... ..
900 0.56
1000 0.62
.. ... . .. ... ...
1100 0.67

.. . ..
1200 0.71
1300
1400
0.79
0.82 . . .•
________________________________
Ta_b_la_s_d_e~po_d_e_r____________________~¡-&01

Tabla AXV.4. Poder de una prueba x2 .


h) gl = 8.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 <0.20 0.30 0.43 0.58 0.72 0.84
22 <0.20 <0.20 <0.20 0.21 0.33 0.47 0.63 0.77 0.87
24 <0.20 <0.20 <0.20 0.23 0.36 0.51 0.67 0.81 0.91
26 <0.20 <0.20 <0.20 0.25 0.39 0.55 0.72 0.85 0.93
28 <0.20 <0.20 <0.20 0.27 0.42 0.59 0.76 0.88 0.95
30 <0.20 <0.20 <0.20 0.29 0.45 0.63 0.79 0.90 0.96
35 <0.20 <0.20 <0.20 0.33 0.52 0.71 0.86 0.95 0.98

...
40 <0.20 <0.20 0.22 0.38 0.59 0.78 0.91 0.97 0.99
45 <0.20 <0.20 0.24 0.43 0.65 0.84 0.94 0.99
50 <0.20 <0.20 0.27 0.47 0.71 0.88 0.96 0.99
..
...
55 <0.20 <0.20 0.30 0.52 0.76 0.91 0.98
60
65
<0.20
<0.20
<0.20
<0.20
0. 32
0.35
0.56
0.61
0.80
0.84
0.94
0.96
0.99
0.99 ..
70
75
<0.20
<0.20
<0.20
<0.20
0.37
0.40
0.65
0.68
0.87
0.89
0.97
0.98 ..
0.99

.. ..
80 <0.20 <0.20 0.43 0.72 0.92 0.99
.. .
... ..
85 <0.20 0.20 0.45 0.75 0.93 0.99 *
90 <0.20 0.22 0.48 0.78 0.95 0.99
..
95
100
<0.20
<0.20
0.23
0.24
0.51
0. 53
0.81
0.83
0.96
0.97 ..
0.99
. . ..
110
120
<0.20
<0.20
0.26
0.29
0.58
0.63
0.87
0.90
0.98
0.99 . * * ..
... ...
130 <0.20 0.31 0.67 0.93 0.99 * * *

... ..
140 <0.20 0.33 0.71 0.95 * * *
150
160
<0.20
<0.20
0.36
0.38
0.75
0.78
0.96
0.97
..
*
.. .. ..
170 <0.20 0.40 0.81 0.98
.. .. .
... .
180 <0.20 0.43 0.84 0.99
190
200
<0.20 0.45
0.47
0.86
0.88
0.99

..
0.99 .. *
*

...
.. ... .
<O. Í O

...
250 <0.20 0.59 0.95 * *
300 <0.20 0.68 0.98
..
... ... ... ..
350 0.21 0.77 0.99 * *

.. .. ...
400 0.24 0.83
450 0.27 0.88

.. .
.. ... .. ..
500 0.30 0.92
600 0.36 0.96
. . .. .. *

... .
700 0.42 0.98 *

...
800 0.47 0.99
900
1000
0. 53
0.59 .
* *
. *
*
. .. *
. ..
*
*

... ..
1100 0.64 * * * *
1200
1300
0.68
0.77
*

.
* ..
*

..
* *

.
*
. .. ..
*

1400 0.80

,~
6o2l Apéndices

Tabla AXV.4. Poder de una prueba y}.


i)gl=IO.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0. 20 <0.20 <0.20 <0.20 0.27 0.39 0.53 0.68 0.80
22 <0. 20 <0.20 <0.20 <0.20 0.30 0.43 0.58 0.73 0.84
24 <0.20 <0.20 <0.20 0.21 0.32 0.47 0.63 0.77 0.88
26 <0.20 <0.20 <0.20 0.23 0.35 0.51 0.67 0.81 0.91
28 <0.20 <0.20 <0.20 0.24 0.38 0.55 0.71 0.84 0.93
30 <0.20 <0.20 <0.20 0.26 0.41 0.58 0.75 0.87 0.95
35 <0.20 <0.20 <0.20 0.30 0.48 0.67 0.82 0.93 0.98
40
45
<0.20
<0.20
<0.20
<0.20
<0.20
0.22
0.35
0.39
0.54
0.61
0.74
0.80
0.88
0.92
0.96
0.98 ..
0.99

50
55
<0.20
<0.20
<0.20
<0.20
0.24
0.27
0.44
0.48
0.66
0.71
0.85
0.88
0.95
0.97
0.99
.. ..
60 <0.20 <0.20 0.29 0.52 0.76 0.91 0.99
.. ...
...
65 <0.20 <0.20 0.32 0.56 0.80 0.94 0.99
70 <0.20 <0.20 0.34 0.60 0.83 0.96
..
...
75 <0.20 <0.20 0.37 0.64 0.86 0.97
80
85
<0.20
<0.20
<0.20
<0.20
0.39
0.42
0.68
0.71
0.89
0.91
0.98
0.99 .. ...
90
95
<0.20
<0.20
<0.20
0.21
0.44
0.47
0.74
0.77
0.93
0.94
0.99
.. .. .. ...
... ..
100 <0.20 0.22 0.49 0.79 0.96
110
120
<0.20
<0.20
0.24
0.26
0.54
0.58
0.84
0.87
0.98
0.99
.. ·•
.. ..
... ... ..
130 <0.20 0.28 0.63 0.90 0.99
140 <0.20 0.30 0.67 0.93
.. ...
.. ...
150 <0.20 0.32 0.70 0.95
160 <0.20 0.35 0.74 0.96
.. ... ...
170 <0.20 0.37 0.77 0.97
180 <0.20 0.39 0.80 0.98
.. . ..
... ..
190 <0.20 0.41 0.82 0.99
200
250
<0.20
<0.20
0.44
0.54
0.85
0.93
0.99
.. ... .. .. ...
300 <0.20 0.64 0.97
.. .. ... .. .. ..
...
350 <0.20 0.72 0.99
400 0.22 0.79
.. .. ..
... .. ..
450 0.24 0.85
500 0.27 0.89
.. .. .. ..
... ...
600 0.32 0.95
700
800
0.38
0.44
0.98

..
0.99
... .. .. .. ..
... ... ... ... ...
900 0.49
1000 0.54
.
.. . ...
...
1100 0.59
1200 0.64
.. .. ... .. ...
... ..
1300 0.72
1400
1500
0.76
0.79
. . .. .. . . .. .
1700 0.82
____________________________T<_ __
ab_la_s_d_e~~de_r__________________~~

Tabla AXV.S. Poder de una razón F en el análisis de varianza.


a) gl del tratamiento = 1 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto ('112)
n 0.01 0.05 0.059 0.1 o 0.138 0.15 0.20 0.25 0.30 0.35

·-
3 0.06 0.08 0.08 0.11 0.13 0.13 0.17 0.20 0.24 0.29
4 0.06 0.09 0.09 0.13 0.16 0.17 0.23 0.28 0.35 0.42
5 0.06 0.10 0.11 0.15 0.20 0.22 0.29 0.37 0.45 0.54
6 0.06 0.11 0.12 0.18 0.24 0.26 0.35 0.45 0.54 0.64
7 0.06 0.12 0.14 0.21 0.28 0.31 0.41 0.52 0.62 0.72
8 0.06 0.13 0.15 0.24 0.32 0.35 0.47 0.58 0.69 0.79
9 0.06 0.15 0.17 0.27 0.36 0.39 0.52 0.64 0.75 0.84
10 0.06 0.16 0.18 0.30 0.40 0.44 0.57 0.69 0.80 0.88
11 0.07 0.17 0.20 0.32 0.44 0.47 0.62 0.74 0.84 0.91
12 0.07 0.19 0.22 0.35 0.47 0.51 0.66 0.78 0.87 0.93
13 0.07 0.20 0.23 0.38 0.51 0.55 0.70 0.81 0.90 0.95
14 0.07 0.21 0.25 0.40 0.54 0.58 0.73 0.84 0.92 0.96
15 0.07 0.23 0.26 0.43 0.57 0.61 0.76 0.87 0.94 0.97
16 0.08 0.24 0.28 0.46 0.60 0.64 0.79 0.89 0.95 0.98
17 0.08 0.26 0.30 0.48 0.63 0.67 0.82 0.91 0.96 0.99
18 0.08 0.27 0.31 0.50 0.66 0.70 0.84 0.92 0.97 0.99

..•
19 0.08 0.28 0.33 0.53 0.68 0.72 0.86 0.94 0.98
..
0.99
20 0.09 0.30 0.34 0.55 0.70 0.75 0.88 0.95 0.98
25 0.10 0.36 0.42 0.65 0.80 0.84 0.94 0.98
30
35
0.11
0.12
0.42
0.48
0.49
0.55
0.73
0.79
0.87
0.92
0.90
0.94
0.97
0.99
0.99
• .. .•
40
45
0.14
0.15
0.54
0.59
0.61
0.66
0.85
0.89
0.95
0.97
0.96
0.98
0.99
..• .

... .•
50
60
0.16
0.19
0.63
0.71
0.71
0.79
0.92
0.96
0.98
0.99
0.99
.. .•• .. ...
70 0.22 0.78 0.85 0.98 •
. .•
.• ...
80 0.24 0.83 0.89 0.99 • •
90
100
0.27
0.30
0.87
0.90
0.92
0.95
0.99
. •
. .•• •


.•
....
120
140
0.35
0.40
0.95
0.97
0.97
0.99
..•

.• .. •
.. .. .• ..
160
180
0.44
0.49
0.98
0.99
.•
0.99
.• .. ..• . .. .• .. ..• .•
200 0.53
.. .•• .. . .. .
... ..• ..
300 0.70
400 0.82
.. .• .• .. ..•
.. .. ..•
500 0.89
600 0.94
.. ..• .. ..
.. ... ... ...
700 0.97
800
900
0.98
0.99
. . ..• .• .. ..
1000 0.99 •

••
6o4l Apéndices

Tabla AXV. 5. Poder de una razón F en el análisis de varianza.


b) gl del tratamiento = 2 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto (r¡2)
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.08 0.08 0. 11 0.13 0.14 0.17 0.21 0.26 0.32
4 0.06 0.09 0.09 0.13 0.17 0.18 0.24 0.31 0.39 0.47
5 0.06 0.10 0.11 0.16 0.22 0.23 0.32 0.41 0.51 0.61
6 0.06 0.11 0.13 0.19 0.26 0.29 0.39 0.50 0.61 0.72
7 0.06 0.13 0.14 0.23 0.31 0.34 0.46 0.58 0.70 0.80
8 0.06 0.14 0.16 0.26 0.36 0.39 0.53 0.66 0.77 0.86
9 0.06 0.16 0.18 0.29 0.40 0.44 0.59 0.72 0.83 0.91
10 0.07 0.17 0.20 0.32 0.45 0.49 0.64 0.77 0.87 0.94
11 0.07 0.19 0.22 0.36 0.49 0.53 0.69 0.82 0.91 0.96
12 0.07 0.20 0.23 0.39 0.53 0.58 0.74 0.85 0.93 0.97
13 0.07 0.22 0.25 0.42 0.57 0.62 0.77 0.89 0.95 0.98
14 0.08 0.23 0.27 0.45 0.61 0.65 0.81 0.91 0.96 0.99
15
16
0.08
0.08
0.25
0.26
0.29
0.31
0.48
0.51
0.64
0.68
0.69
0.72
0.84
0.86
0.93
0.95
0.97
0.98 .
0.99

17
18
0.08
0.09
0.28
0.30
0.33
0.35
0.54
0.57
0.71
0.73
0.75
0.78
0.89
0.90
0.96
0.97
0.99
0.99 .
*

19 0.09 0.31 0.36 0.59 0.76 0.80 0.92 0.98 0.99 *


20 0.09 0.33 0.38 0.62 0.78 0.82 0.93 0.98 • •
25
30
0.10
0.12
0.40
0.48
0.47
0.55
0.72
0.81
0.87
0.93
0.90
0.95
0.98
.
0.99
*
. *
*
. ..
*

35 0.13 0.54 0.62 0.87 0.96 0.98 *


40
45
0.15
0.16
0.60
0.66
0.69
0.74
0.91
0.94
0.98
0.99
0.99
0.99 .• .• ..• •
*
50
60
0.18
0.21
0.71
0.79
0.79
0.86
0.96
0.98
0.99
.
*

.

.

. •

..
* * * *
70
80
0.24
0.27
0.85
0.90
0.91
0.94
0.99
..• ..•

. ..• .• *
.
90
100
0.30
0.33
0.93
0.95
0.97
0.98 . .. ..• .. ..• ..•
120
140
0.39
0.44
0.98
..
0.99 ..
0.99
..• .•

.. ... .. ... ..
160
180
0.50
0.55
.. .. ..• ..• . .. .. ..
200
300
0.60
0.78
.. .. . . ..• .• . ..
400
500
0.89
0.95 .. ..• • .. ..• .• ..• ..
600
700
0.98
0.99 ..
*
. . ..
*
.. . .• .• .•
800 • •
___________________________r._ab_la_s_d_e~p_od_e_r__________________~~

Tabla AXV. 5. Poder de una razón F en el análisis de varianza.


e) gl del tratamiento = 3 (n es el número de personas en cada condición para un diseño
entre sujetos).

,_
Tamaño del efecto (1')2)
n o 01 o 05 o 059 o 1o o 138 o 15 o 20 o 25 o 30 o 35
3 0.06 0.08 0.08 0.11 0.14 0.15 0.19 0.24 0.30 0.36
4 0.06 0.09 0.10 0.14 0.18 0.20 0.27 0.35 0.44 0.54
5 0.06 0.10 0.12 0.17 0.24 0.26 0.36 0.46 0.57 0.68
6 0.06 0.12 0.13 0.21 0.29 0.32 0.44 0.57 0.69 0.79
7 0.06 0.13 0.15 0.25 0.35 0.38 0.52 0.65 0.77 0.87
8 0.06 0.15 0.17 0.29 0.40 0.44 0.59 0.73 0.84 0.92
9 0.07 0.17 0.19 0.33 0.46 0.50 0.66 0.79 0.89 0.95
10 0.07 0.19 0.22 0.36 0.51 0.55 0.71 0.84 0.93 0.97
11 0.07 0.20 0.24 0.40 0.55 0.60 0.76 0.88 0.95 0.98
12 0.07 0.22 0.26 0.44 0.60 0.65 0.81 0.91 0.97 0.99
13
14
0.08
0.08
0.24
0.26
0.28
0.30
0.47
0.51
0.64
0.68
0.69
0.73
0.84
0.87
0.93
0.95
0.98
0.99
0.99
..
..
15 0.08 0.27 0.32 0.54 0.71 0.76 0.90 0.97 0.99
16
17
0.08
0.09
0.29
0.31
0.34
0.37
0.57
0.60
0.75
0.78
0.79
0.82
0.92
0.94
0.98
0.98
0.99
.
18 0.09 0.33 0.39 0.63 0.80 0.84 0.95 0.99 * •
19 0.09 0.35 0.41 0.66 0.83 0.87 0.96 0.99 *
.. *
.
..
20 0.10 0.37 0.43 0.69 0.85 0.88 0.97 0.99
25
30
0.11
0.13
0.45
0.53
0.53
0.62
0.80
0.87
0.93
0.97
0.95
0.98
0.99
. .. .•
35
40
0.14
0.16
0.61
0.67
0.69
0.76
0.92
0.95
0.98
0.99
.. ..
0.99
.• ..• . *

..•
45
50
0.18
0.19
0.73
0.78
0.81
0.85
0.97
0.98
. . *
*
. ..•
*
..
60
70
0.23
0.26
0.86
0.91
0.92
0.95
.•

* .• ..• . *
*
80 0.30 0.94 0.97
..
*
.* * *

..
*

... . ..•
90 0.33 0.97 0.99 * * *
100
120
0.37
0.43
0.98
..
0.99 . ..
0.99
.*
..
*
*
. .. .•
140 0.50
.. ..• ..
*
.. ... ..• .
...
160 0.56 * *
180
zao
0.61
0.66 . . . *
*

.•
300
400
0.85
0.94 .. .• .• ..• .*
.* *
* *

.
*
500 0.98
. *
. *

.• .. .* *

. . .•
• *

..
600 0.99 * *
700 * * * • * *

,
6o6l Apéndices

Tabla AXV.5. Poder de una razón F en el análisis de varianza.


d) gl del tratamiento = 4 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto (1')2)
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.08 0.09 0.11 0.14 0.16 0.20 0.26 0.33 0.41
4 0.06 0.09 0.10 0.1 5 0.20 0.22 0.30 0.39 0.50 0.60
5 0.06 0.11 0. 12 0.19 0.26 0.29 0.40 0.52 0.64 0.75
6 0.06 0.13 0.14 0.23 0.32 0.36 0.49 0.63 0.75 0.85
7 0.06 0.14 0.16 0.27 0.39 0.42 0.58 0.72 0.83 0.91
8 0.07 0.16 0.19 0.32 0.45 0.49 0.65 0.79 0.89 0.95
9 0.07 0.18 0.21 0.36 0.51 0.55 0.72 0.85 0.93 0.97
10 0.07 0.20 0.23 0.40 0.56 0.61 0.78 0.89 0.96 0.99
11 0.07 0.22 0.26 0.45 0.61 0.66 0.82 0.92 0.97 0.99
12
13
0.08
0.08
0.24
0.26
0.28
0.31
0.49
0.53
0.66
0.70
0.71
0.75
0.86
0.89
0.95
0.96
0.98
0.99 ..•
14
15
0.08
0.08
0.28
0.30
0.33
0.36
0.56
0.60
0.74
0.78
0.79
0.82
0.92
0.94
0.98
0.98
0.99

.• .
16 0.09 0.32 0.38 0.63 0.81 0.85 0.95 0.99 *
17
18
0.09
0.09
0.34
0.36
0.41
0.43
0.66
0.69
0.83
0.86
0.87
0.89
0.96
0.97
0.99

. •
• . • *

.
*
19 0.10 0.38 0.45 0.72 0.88 0.91 0.98
20
25
0.10
0.12
0.40
0.50
0.48
0.58
0.75
0.85
0.90
0.96
0.93
0.97
0.99
.. ..• .•• ..•
30
35
0.13
0.15
0.59
0.67
0.68
0.75
0.92
0.95
0.98
0.99
..
0.99

.• • .. • •
40
45
0.17
0.19
0.73
0.79
0.81
0.86
0.98
0.99
.. •
*
.. .. ..
* *
.
... ..• ... .. ...
50 0.21 0.84 0.90 0.99 •
60 0.25 0.90 0.95 •
..• .
~

70 0.29 0.95 0.98 •


80 0.33 0.97 0.99
. .. .. ..• .•

... .
90 0.37 0.98 0.99 • *
100
120
0.40
0.48
0.99
.. ..
*



.. . .• ..•
140
160
0.55
0.61 .. .. ... ..

.

.• .• . ..
180
200
0.67
0.72 .. .. .. .•
*

.• ..• ..• ..• ..•


300
400
0.90
0.97 .. .. ..• •
500
600
0.99
• . . *
. .• .• .• .• .*
- ___________________________Ti_ab_la_s_d_e~p_ r __________________~~
oo_e_

Tabla AXV. S. Poder de una razón F en el análisis de varianza.


e) gl del tratamiento = 5 (n es el número de personas en cada condición para un diseño
entre suj etos).
Tamaño del efecto ('112)
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.08 0.09 0.12 0.15 0.17 0.22 0.29 0.37 0.46
4 0.06 0.10 0.11 0.16 0.22 0.24 0.33 0.43 0.55 0.66
5 0.06 0.11 0.13 0.20 0.29 0.31 0.44 0.57 0.69 0.80
6 0.06 0.13 0.15 0.25 0.36 0.39 0.54 0.68 0.80 0.89
7 0.06 0.15 0.18 0.30 0.42 0.46 0.63 0.77 0.88 0.95
8 0.07 0.17 0.20 0.35 0.49 0.54 0.71 0.84 0.93 0.97
9 0.07 0.19 0.23 0.39 0.55 0.60 0.77 0.89 0.96 0.99
10
11
0.07
0.08
0.22
0.24
0.25
0.28
0.44
0.49
0.61
0.66
0.66
0.71
0.83
0.87
0.93
0.95
0.98
0.99
0.99
.
12
13
0.08
0.08
0.26
0.28
0.31
0.34
0.53
0.57
0.71
0.75
0.76
0.80
0.90
0.93
0.97
0.98
0.99
. .•
14
15
0.08
0.09
0.31
0.33
0.36
0 .39
0.61
0.65
0.79
0.83
0.84
0.86
0.95
0.96
0.99
0.99 .• ..•
...
16 0.09 0.35 0.42 0.68 0.85 0.89 0.97 • •
17
18
0.09
0.10
0.37
0.40
0.44
0.47
0.72
0.75
0.88
0.90
0.91
0.93
0.98
0.99

• .•
19 0.10 0.42 0.49 0.77 0.92 0.94 0.99 • •
20
25
0.10
0.12
0.44
0.55
0.52
0.63
0.80
0.89
0.93
0.98
0.95
0.99
0.99


• . •
.


30
35
0.14
0.16
0.64
0.72
0.73
0.80
0.95
0.97
0.99



.. .• •
• ..• •
40
45
0.18
0.20
0.79
0.84
0.86
0.90
0.99
0.99 .•
.



• . ..•
50
60
0.22
0.27
0.88
0.94
0.93
0.97




..• .




..

• .
70
80
0.31
0.36
0.97
0.98 ..
0.99 •



.. .•


.. .•
90
100
0.40
0.44 ..
0.99
.. .

..

.. •

• ..•
120
140
0.52
0.60
..• . .• . .. .



. .•


..•
160
180
0.67
0.72
.. ..• .• .• .. • • •
200
300
0.78
0.93
.. ..•



.• .• . .•

.

400
500
0.98


• • .• .• •
• .• •
6081 Apéndices

Tabla AXV.5. Poder de una razón F en el análisis de varianza.


j) gl del tratamiento = 6 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto (112)
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.08 0.09 0.13 0.16 0.18 0.24 0.32 0.40 0.50
4 0.06 0.10 0.11 0.17 0.23 0.26 0.36 0.47 0.59 0.71
5 0.06 0.12 0.13 0.22 0.31 0.34 0.48 0.62 0.74 0.85
6 0.06 0.14 0.16 0.27 0.39 0.42 0.58 0.73 0.85 0.93
7 0.06 0.16 0.19 0.32 0.46 0.50 0.68 0.82 0.91 0.97
8 0.07 0.18 0.21 0.37 0.53 0.58 0.76 0.88 0.95 0.99

10
9 0.07
0.07
0.21
0.23
0.24
0.27
0.43
0.48
0.60
0.66
0.65
0.71
0.82
0.87
0.92
0.95
0.98
0.99 .
0.99

11
12
0.08
0.08
0.26
0.28
0.30
0. 33
0.53
0.57
0.71
0.76
0.76
0.80
0.90
0.93
0.97
0.98
0.99
* .•
13 0.08 0.31 0.36 0.62 0.80 0.84 0.95 0.99 * *
14
15
0.09
0.09
0.33
0.36
0.39
0.42
0.66
0.70
0.83
0.86
0.87
0.90
0.97
0.98
0.99
. •
*

*
..
16 0.09 0.38 0.45 0.73 0.89 0.92 0.98 * •
17
18
0 ..10
0.10
0.41
0.43
0.48
0.51
0.76
0.79
0.91
0.93
0.94
0.95
0.99
0.99 .• *

.
* *
..
19
20
0.11
0.11
0.45
0.48
0.53
0. 56
0.82
0.84
0.94
0.95
0.96
0.97
*
*
*
.. .
*
.
25
30
0.13
0.15
0.59
0.69
0.68
0.77
0.92
0.97
0.99
• .
0.99
..
*
. * *
.
... . .
35 0.17 0.76 0.84 0.99 * * * •
40 0.19 0.83 0.90 0.99 * * *
45
50
0.22
0.24
0.88
0.91
0.93
0.96
*
.. •
.
* .• ..• *
.. ..•
60
70
0.29
0.34
0.96
0.98
0.98
0.99 .. .
* .• *

.. ..• ..• ..•
80
90
0.38
0.43 .
0.99
..
*
. *
*
.
.. . .. .•
100 0.48 * * * * • * •
120
140
0.56
0.64
*
* .• * .• .

*
.. .

160
180
0.71
0.77 ..
* *

.. .• ..
*

..• •
* *

.

.
*
200 0.82 * * *
300
400
0.95
0.99
.

* .• .• •
.
* .• ..• .• ..• •
.
*
500 * • • • *
r Tablas de poder l6o9
Tabla AXV.5. Poder de una razón F en el análisis de varianza.
Ul g) gl del tratamiento = 7 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto (r¡ 2 )
n 0.01 0.05 0.059 0.10 0.138 0.1.5 0.20 0.25 0.30 0.35
3 0.06 0.09 0.09 0.13 0.17 0.19 0.26 0.34 0.44 0.54
4 0.06 0.10 0.12 0.18 0.25 0.27 0.39 0.51 0.64 0.76
5 0.06 0.12 0.14 0.23 0.33 0.37 0.51 0.66 0.79 0.88
6 0.06 0. 15 0. 17 0.29 0.41 0.46 0.63 0.77 0.88 0.95
7 0.07 0. 17 0.20 0.35 0.49 0.54 0.72 0.85 0.94 0.98
8 0.07 0.19 0.23 0.40 0.57 0.62 0.80 0.91 0.97 0.99
9 0.07 0.22 0.26 0.46 0.64 0.69 0.85 0.95 0.99
10 0.08 0.25 0.29 0.51 0.70 0.75 0.90 0.97 0.99
11 0.08 0.27 0.32 0.56 0.75 0.80 0.93 0.98
12 0.08 0.30 0.36 0.6 1 0.80 0.84 0.95 0.99
13 0.09 0.33 0.39 0.66 0.84 0.88 0.97 0.99
14 0.09 0.35 0.42 0.70 0.87 0.90 0.98
15 0.09 0.38 0.45 0.74 0.90 0.93 0.99
16 0.1 0 0.41 0.48 0.77 0.92 0.94 0.99
17 0. 10 0.43 0. 51 0.80 0.94 0.96 0.99
18 0.11 0.46 0.54 0.83 0.95 0.97
19 0.1 1 0.49 0.57 0.85 0.96 0.98
20 0.1 1 0.51 0.60 0.87 0.97 0.98
25 0.1 3 0.63 0.72 0.95 0.99
30 0.1 6 0.73 0.81 0.98
35 0.1 8 0.80 0.88 0.99
40 0.20 0.86 0.92
45 0.23 0.91 0.95
50 0.26 0.94 0.97
60 0.31 0.97 0.99
70 0.36 0.99
80 0.41
90 0.46
100 0. 51
120 0.60
140 0.68
160 0.75
180 0.81
200 0.85
300 0.97
400 0.99
500
6101 Apéndices

Tabla AXV. S. Poder de una razón F en el análisis de varianza.


h) gl del tratamiento = 8 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto (r¡2)
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.09 0.10 0.14 0.18 0.20 0.28 0.37 0.47 0.58
4 0.06 0.11 0.12 0.19 0.27 0.29 0.42 0.55 0.68 0.79
5 0.06 0.13 0.15 0.25 0.35 0.39 0.55 0.70 0.82 0.91
6 0.06 0.15 0.18 0.31 0.44 0.49 0.66 0.81 0.91 0.97
7 0.07 0.18 0.21 0.37 0.53 0.58 0.76 0.88 0.96 0.99
8 0.07 0.20 0.24 0.43 0.60 0.66 0.83 0.93 0.98
9 0.07 0.23 0.28 0.49 0.67 0.73 0.88 0.96 0.99
10 0.08 0.26 0.31 0.55 0.74 0.78 0.92 0.98
11 0.08 0.29 0.34 0.60 0.79 0.83 0.95 0.99 •
12 0.08 0.32 0.38 0.65 0.83 0.87 0.97 0.99
13 0.09 0.35 0.41 0.69 0.87 0.90 0.98 •
14 0.09 0.38 0.45 0.74 0.90 0.93 0.99 • •
15 0.10 0.41 0.48 0.77 0.92 0.95 0.99 •
16 0.10 0.43 0.51 0.81 0.94 0.96 • •
17 0.10 0.46 0.55 0.83 0.95 0.97 •
18 0.11 0.49 0.58 0.86 0.97 0.98 •
19 0.11 0.52 0.61 0.88 0.97 0.99 *
20 0. 12 0.54 0.63 0.90 0.98 0.99
25 0.14 0.66 0.75 0.96 * * *
30 0.16 0.76 0.84 0.99 *
35 0.19 0.84 0.90 * • *
40 0.22 0.89 0.94 * *
45 0.24 0.93 0.97 *
50 0.27 0.95 0.98 • *
60 0.33 0.98 0.99
70 0.38 0.99 *
80 0.44 • *
90 0.49 • •
100 0.54 • • •
120 0.64 • * • •
140 0.72 • *
160 0.78 * • • *
180 0.84 * * • *
200 0.88 • • *
300 0.98 • • *
400 * * *
"'' Tablas de poder ["611

Tábla AXV. 5. Poder de una razón F en el análisis de varianza.


i) gl del tratamiento = 1O (n es el número de personas en cada condición para un diseño
entre sujetos) . .
Tamaño del efecto (r¡2)

-
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.09 0.10 0.15 0.20 0.22 0.31 0.42 0.53 0.65
4 0.06 0.11 0.13 0.21 0.30 0.33 0.47 0.61 0.75 0.86
5 0.06 0.14 0.16 0.27 0.40 0.44 0.61 0.76 0.88 0.95
6 0.07 0.17 0.19 0.34 0.50 0.54 0.73 0.87 0.95 0.98
7 0.07 0.19 0.23 0.41 0.59 0.64 0.82 0.93 0.98
8 0.07 0.22 0.27 0.48 0.67 0.72 0.88 0.96 0.99
9 0.08 0.26 0.31 0.55 0.74 0.79 0.93 0.98
10 0.08 0.29 0.35 0.61 0.80 0.84 0.96 0.99
11 0.08 0.32 0.39 0.66 0.85 0.88 0.97
12 0.09 0.35 0.42 0.71 0.88 0.92 0.98
13 0.09 0.39 0.46 0.76 0.91 0.94 0.99
14 0.10 0.42 0.50 0.80 0.94 0.96
15 0.10 0.45 0.54 0.83 0.95 0.97
16 0.11 0.48 0.57 0.86 0.97 0.98
17 0.11 0.52 0.61 0.89 0.98 0.99 *
18 0.12 0.55 0.64 0.91 0.98 0.99 * *
19 0.12 0.57 0.67 0.92 0.99 0.99
20 0.13 0.60 0.70 0.94 0.99 *
25 0.15 0.73 0.81 0.98 * *
30 0.18 0.82 0.89 0.99 *
35 0.21 0.89 0.94 *
40 0.24 0.93 0.97 *
45 0.27 0.96 0.98
50 0.30 0.98 0.99
60 0.36 0.99 *
70 0.43 *
80 0.49
90 0.55
100 0.60
120 0.70
140 0.78 *
160 0.84 *
180 0.89
200 0.92
300 0.99
400
6121 Apéndices

Tabla AXV.6. Poder de un coeficiente de correlación r producto momento de Pearson.


a) Pruebas de una cola.
Tamaño del efecto (r)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.99
4 0.06 0.08 0.10 0.13 0.16 0.20 0.26 0.35 0.50 0.64 0.88

.
5 0.06 0.08 0.11 0.15 0.20 0.26 0.36 0.49 0.70 0.85 0.99
0.06 0.09 0.13 0.18 0.24 0.33 0.46 0.62 0.83 0.95
~10.07 0.10 0.14 0.21 0.29 0.40 0.55 0.73 0.91 0.98
1

8 0.07 0.11 0.16 0.24 0.34 0.47 o 63 0.80 0.96 0.99 1


9 0.07 0.12 0.18 0.27 0.38 0.53 0.70 0.86 0.98
10 0.08 0.13 0.20 0.30 0.43 0.58 0.75 0.90 0.99
11 0.08 0.13 0.21 0.32 0.47 0.63 0.80 0.93
12 0.08 0.14 0.23 0.35 0.50 0.68 0.84 0.96
13 0.09 0.15 0.25 0.38 0.54 0.72 0.87 0.97
14 0.09 0.16 0.26 0.40 0.57 0.75 0.90 0.98
15 0.09 0.17 0.28 0.43 0.61 0.78 0.92 0.99
16 0.09 0.17 0.29 0.45 0.64 0.81 0.94 0.99
17 0.10 0.18 0.31 0.48 0.66 0.84 0.95 0.99
18 0.10 0.19 0.33 0.50 0.69 0.86 0.96
19 0.10 0.20 0.34 0.52 0.72 0.88 0.97
20 0.10 0.20 0.35 0.54 0.74 0.89 0.98
25 0.12 0.24 0.42 0.64 0.83 0.95 0.99
30 0.13 0.27 0.49 0.71 0.89 0.98
35 0.14 0.31 0.54 0.78 0.93 0.99
40 0.15 0.34 0.60 0.83 0.96
45 0.16 0.37 0.64 0.87 0.97
50 0.17 0.40 0.69 0.90 0.98
60 0.19 0.45 0.76 0.94 0.99 •
70 0.20 0.51 0.81 0.97
80 0.22 0.55 0.86 0.98
90 0.24 0.60 0.89 0.99
100 0.25 0.64 0.92 0.99
110 0.27 0.68 0.94
120 0.29 0.71 0.96
130 0.30 0.74 0.97
140 0.32 0.77 0.98
150 0.33 0.79 0.98
160 0.35 0.82 0.99
170 0.36 0.84 0.99
180 0.38 0.85 0.99
190 0.39 0.87
200 0.41 0.89
300 0.53 0.97
400 0.64 0.99
500 0.72
600 1 0.79
700 1 0.84
800 1 0.88
900 1 0.91
1000 0.94
.. 1
1
1

'
____________________________Th_b_la_s_d_e~p_o_de_r__________________~~

Tabla AXV.6. Poder de un coeficiente de correlación r producto momento de Pearson.


b) Pruebas de dos colas.
Tamaño del efecto (r)
n 0.1 0.2 0.3 0.4 0.5 0.6 o.7 0.8 0.9 0.95 0.99

..
4 0.05 0.05 0.05 0.07 0.09 0.12 0.16 0.22 0.36 0.50 0.79
5 0.05 0.05 0.05 0.08 0.11 0.16 0.23 0.35 0.56 0.75 0.97
..
.•
~
6 0.05 0.05 0.07 0.10 0.14 0.21 0.32 0.48 0.73 0.89
~ 7 0.05 0.05 0.08 0.12 0.18 0.27 0.40 0.59 0.84 0.96

.. ..
8 0. 05 0.06 0.09 0. 14 0.22 0.33 0.49 0.69 0.91 0.98
9 0.05 0.06 0.10 0. 17 0.26 0.39 0.56 0.77 0.95 0.99

. ..
10 0.05 0.07 0.12 0.19 0.30 0.44 0.63 0.83 0.98
11 0.05 0.07 0.13 0.21 0.33 0.50 0.69 0.88 0.99

. ..
12 0.05 0.08 0.14 0.24 0.37 0.55 0.74 0.91 0.99
13 0.05 0.08 0.15 0.26 0.41 0.59 0.79 0.94 * *
.
..
14 0.05 0.09 0.17 0.28 0.44 0.63 0.82 0.96

... ...
15 0.05 0.10 0.18 0.30 0.47 0.67 . 0.86 0.97 * *
16 0.05 0.10 0.19 0.33 0.51 0.71 0.88 0.98

...
17 0.05 0.11 0.20 0.35 0.54 0.74 0.90 0.99
18 0.05 0.1 1 0.22 0.37 0.57 0.77 0.92 0.99
.. .. ..
..
19 0.05 0.12 0.23 0.39 0.59 0.79 0.94 0.99 *

. ...
20 0.06 0.12 0.24 0.41 0.62 0.82 0.95

. ... .. ...
25 0.06 0.15 0.30 0.51 0.73 0.90 0.98

..
30 0.07 0.1 8 0.36 0.60 0.82 0.95 0.99

.. ... .
35 0.08 0.20 0.41 0.67 0.88 0.98

... ..
40 0.09 0.23 0.47 0.73 0.92 0.99 *
45 0.09 0.26 0.52 0.79 0.95 0.99
.. .. ..
.. ..
50 0.10 0.28 0.56 0.83 0.97

..
*

... . ..
60 0.11 0.33 0.65 0.89 0.99

... .. .. .
70 0.13 0.38 0.72 0.94 0.99

. .
80 0.14 0.43 0.78 0.96

..
90 0.15 0.47 0.82 0.98 *
100 0.16 0.51 0.86
..
0.99
.
..
.

.. .. .. ..
*

...
..
110 0.18 0.55 0.89 0.99 * * * *

.. . .. ... ..
120 0.19 0.59 0.92

.. . ..
130 0.20 0.63 0.94

... ..
140 0.21 0.66 0.95 *

... .. .. .. ...
150 0.23 0.69 0.96

. ...
160 0.24 0.72 0.97 *
170 0.25 0.75 0.98
.. .. ... .
..
.. .. . . .
180 0.27 0.77 0.98
190 0.79 0.99

...
0.28 *

..
*

. .
200 0.29 0.81 0.99

... . .
*
300 0.41 0.94 * * * * * *

.. ..
400 0.52 0.98

... .. ... . . ... ... ..


500 0.61 0.99 * * * * * * *

.• . ..
600 0.69
700 0.75
. . ..
*

.. . .
. .. . . . .
800 0.81
900 0.85 *
. *
.
*

...
1000 0.89 •
,
6141 Apéndices

Tabla AXV.7. Tablas de poder para regresión múltiple.


a) Una o dos variables predictoras.
Una variable predictora
Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
10 0.06 0.07 0.10 0.15 0.19 0.22 0.29 0.37 0.38 0.45
15 0.06 0.07 0.13 0.22 0.29 0.33 0.44 0.55 0.57 0.66
20 0.06 0.08 0.16 0.30 0.38 0.44 0.57 0.69 0.72 0.80
30 0.07 0.11 0.23 0.43 0.54 0.61 0.76 0.87 0.89 0.94
40 0.09 0.13 0.30 0.55 0.67 0.75 0.88 0.95 0.96 0.98
50 0.10 0.16 0.36 0.65 0.77 0.84 0.94 0.98 0.99
60 0.11 0.19 0.42 0.73 0.85 0.90 0.97 0.99
80 0.14 0.24 0.54 0.85 0.93 0.96 0.99
100 0.16 0.29 0.63 0.92 0.97 0.99
120 0.19 0.34 0.71 0.96 0.99
150 0.23 0.41 0.81 0.98
200 0.30 0.52 0.90
250 0.36 0.62 0.95
500 0.62 0.89
750 0.79 0.97
1000 0.89 0.99

Dos variables predictoras


Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
10 0.06 0.06 0.08 0.11 0.14 0.15 0.19 0.25 0.26 0.30
15 0.06 0.07 0.10 0.16 0.20 0.23 0.32 0.41 0.43 0.51
20 0.06 0.07 0.12 0.21 0.28 0.32 0.44 0.56 0.58 0.67
30 0.07 0.09 0.17 0.32 0.42 0.49 0.64 0.77 0.80 0.87
40 0.07 0.11 0.22 0.43 0.55 0.63 0.79 0.89 0.91 0.96
50 0.08 0.12 0.27 0.53 0.66 0.74 0.88 0.95 0.96 0.99
60
80
0.09
0.11
0.14
0.18
0.33
0.43
0.62
0.75
0.75
0.87
0.82
0.92
0.93

..
0.98
0.98

..
• .
0.99

.
..•
100 0.13 0.22 0.52 0.85 0.94 0.97

. . ..
... .•
120 0.15 0.26 0.60 0.91 0.97 0.99
150 0.18 0.32 0.71 0.96 0.99
.. ..• ..• ..
... ..•
200 0.23 0.42 0.84 0.99
250
500
0.28
0.51
0.51
0.82 ..
0.91

..• . ..
750
1000
0.70
0.82
0.95
0.99 . . .• .• .• .• .
- _____________________________Ti_a_bl_as_d_e~po_d_e_r__________________~~

Tabla AXV.7. Tablas de poder para regresión múltiple.


b) Tres o cuatro variables predictoras.
Tres variables predictoras
Tamaño del efecto (R2 )
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
10 0.06 0.06 0.08 0.10 0.11 0.12 0.15 0.18 0.19 0.22
15 0.06 0.06 0.09 0.13 0.16 0.19 0.25 0.32 0.34 0.41
20 0.06 0.07 0.10 0. 17 0.22 0.26 0.36 0.46 0.49 0.57
30 0.06 0.08 0.14 0.27 0.35 0.41 0.56 0.69 0.72 0.81
40 0.07 0.09 0.19 0.36 0.48 0.55 0.71 0.84 0.86 0.93
50 0.07 0.11 0.23 0.46 0.59 0.67 0.83 0.92 0.94 0.97
60 0.08 0.12 0.27 0.54 0.68 0.76 0.90 0.97 0.97
.. ..
0.99

...
80 0.10 0.15 0.37 0.69 0.82 0.88 0.97 0.99
100
120
0.11
0.13
0.19
0.22
0.45
0.53
0.80
0.87
0.91
0.95
0.95
0.98 ..
0.99
.. ..
150
200
0.15
0.19
0.27
0.36
0.64
0.78
0.94
0.98
.. ..
0.98

...
0.99
.. ... .. ...
.. .. .. ..
-
250 0.24 0.44 0.87
500 0.45 0.76
.. ... ... ...
.. .. .. ..
750 0.63 0.92
1000
1250
0.77
0.86
0.97
0.99 .
Cuatro variables predictoras
Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
15 0.06 0.06 0.08 0.11 0.14 0.16 0.20 0.26 0.28 0.33
20 0.06 0.07 0.09 0.15 0.19 0.22 0.30 0.39 0.41 0.50
30 0.06 0.07 0.13 0.23 0.30 0.36 0.49 0.63 0.65 0.75
40 0.07 0.09 0.16 0.32 0.42 0.49 0.65 0.79 0.82 0.89
50 0.07 0.10 0.20 0.40 0.53 0.61 0.78 0.89 0.91 0.96
60 0.08 0.11 0.24 0.49 0.62 0.71 0.86 0.95 0.96
..
0.98

...
80 0.09 0.14 0.32 0.63 0.78 0.85 0.95 0.99 0.99
100
120
0.10
0.11
0.17
0.20
0.40
0.48
0.75
0.83
0.87
0.93
0.93
0.97 ..
0.99
..• ..
150
200
0.13
0.17
0.24
0.32
0.59
0.73
0.92
0.98 ..
0.98
..
0.99
.. .. ... ..
.. ... .. .. .. ..
250 0.21 0.40 0.84 0.99
500
750.
0.40
0.58
0.72
0.89 ..
0.99

.. .. .. .. ... ..
1000
1250
0.72
0.83
0.96
0.99 . .
6161 Apéndices

Tabla AXV. 7. Tablas de poder para regresión múltiple.


e) Seis u ocho variables predictoras.
Seis variables predictoras
Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
15 0.06 0.06 0.07 0.09 0.11 0.12 0.15 0.19 0.19 0.23
20 0.06 0.06 0.08 0.12 0.15 0.17 0.22 0.29 0.31 0.37
30 0.06 0.07 0.11 0.18 0.24 0.28 0.39 0.52 0.54 0.64
40 0.06 0.08 0.13 0.25 0.34 0.40 0.55 0.70 0.73 0.82
50 0.07 0.09 0.16 0.33 0.44 0.52 0.69 0.83 0.85 0.92
60 0.07 0.10 0.20 0.40 0.54 0.62 0.79 0.91 0.92 0.97
80 0.08 0.12 0.27 0.55 0.70 0.78 0.92 0.98 0.98
100 0.09 0.14 0.34 0.67 0.81 0.88 0.97
120 0.10 0.16 0.41 0.77 0.89 0.94 0.99
150 0.11 0.20 0.51 0.87 0.96 0.98
200 0.14 0.27 0.66 0.96 0.99
250
500
750
0.17
0.34
0.51
0.33
0.64
0.84
0.77
0.98
0.99
' .
1000 0.65 0.94
1250 0.76 0.98
1500 0.85 0.99

Ocho variables predictoras


Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
15 0.06 0.06 0.07 0.09 0.09 0.10 0.12 0.14 0.1 5 0. 17
20 0.06 0.06 0.08 0.10 0.12 0.14 0.18 0.23 0.24 0.29
30 0.06 0.07 0.09 0.15 0.20 0.23 0.32 0.43 0.45 'Ü.55
40 0.06 0.07 0.12 0.21 0.28 0.34 0.48 0.62 0.65 0.75
50 0.06 0.08 0.14 0.28 0.38 0.44 0.61 0.76 0.79 0.88
60 0.07 0.09 0.17 0.35 0.47 0.55 0.73 0.86 0.88 0.94
80 0.07 0.10 0.23 0.48 0.63 0.72 0.88 0.96 0.97
100 0.08 0.12 0.29 0.60 0.76 0.84 0.95
120 0.09 0.14 0.36 0.71 0.85 0.91
150 0.10 0.17 0.45 0.82 0.93 0.97
200 0.13 0.23 0.60 0.93
250 0.15 0.29 0.72 0.98
500 0.30 0.59 0.97
750 0.46 0.80
1000 0.60 0.91
1250 0.71 0.97
1500 0.80 0.99
.. ____________________________Ti~ab~la~s_d_e~p_o_de_r__________________~~

Tabla AXV. 7. Tablas de poder para regresión múltiple.


d) Diez o doce variables predictoras.
Diez variables predictoras
Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30

·- 20
30
40
0.05
0.05
0.06
0.06
0.06
0.07
0.07
0.08
0.10
0.09
0.13
0.18
0.10
0.16
0.24
0.11
0.19
0.29
0.14
0.26
0.41
0.18
0.35
0.55
0.18
0.37
0.57
0.22
0.45
0.68
50 0.06 0.07 0.13 0.24 0.33 0.39 0.55 0.70 0.73 0.83
60 0.06 0.08 0.15 0.30 0.41 0.49 0.67 0.81 0.84 0.91
80 0.07 0.10 0.20 0.43 0.57 0.66 0.84 0.94

..
0.95
..
0.98

..
100 0.08 0.11 0.26 0.55 0.71 0.79 0.93 0.98 0.99
120 0.08 0.13 0.32 0.66 0.81 0.88 0.97
..
... ... ...
150 0.10 0.16 0.41 0.78 0.91 0.95 0.99

..
... ..
200 0.12 0.21 0.55 0.91 0.98 0.99
250 0.14 0.26 0.67 0.97
.. ..
..
... .. .
-
500 0.27 0.54 0.96
750
1000
0.41
0.55
0.76
0.89
. .. .. .. •
.. ..

...
1250
1500
0.67
0.77
0.95
0.98 .. .. . .. . . . .
1750 0.84 0.99 •

Doce variables predictoras


Tamaño del efecto (R2)
11 0.01 0.0196 0.05 0.10. 0.13 0.15 0.20 0.25 0.26 0.30
20 0.05 0.06 0.07 0.09 0.09 0.10 0.12 0.14 0.15 0.17
30 0.05 0.06 0.08 0.11 0.14 0.16 0.22 0.29 0.30 0.37
40 0.06 0.07 0.10 0.16 0.21 0.25 0.36 0.48 0.51 0.61
so 0.06 0.07 0.12 0.21 0.29 0.34 0.49 0.64 0.67 0.78
60 0.06 0.08 0.13 0.27 0.37 0.44 0.61 0.77 0.79 0.88
80
100
0.07
0.07
0.09
0.10
0.18
0.23
0.39
0.51
0. 53
0.66
0.61
0.75
0.80
0.91
0.92
0.97
0.93

..
0.98
0.97
..
...
120 0.08 0.12 0.29 0.61 0.77 0.85 0.96 0.99
150 0.09 0.14 0.37 0.74 0.88 0.94
..
0.99
..• .
... ..
200 0.11 0.19 0.51 0.89 0.97 0.99
250
500
0.13
0.25
0.24
0.50
0.63

..
0.95 ..
0.96

...
0.99

... ... ...


750
1000
0.38
0.51
0.72
0.86
.. .. . .. ..•
..
1250
1500
0.63
0.73
0.94
0.97
. .. .. ..

.
• ..• .. .
1750 0.81 0.99
XVI
Tablas diversas

Tabla AXVI. 1. Números aleatorios.

Para usar las tablas es necesario decidir un número inicial eligiendo una fila y una colum-
na; por ejemplo, la 7 y la 1O, en ese orden. Se seleccionan a continuación los números de
la magnitud adecuada. Por tanto, si éstos se hallan entre O y 99, ios primeros tres serían 66,
74 y 13. Considérese 03 como si fuera 3.
Columna
Fila 1 2 3 4 5 6 7 8 9 10 11 1213 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 11
1 2 4 1 3 o 3 6 3 7 8 o 3 S 7 2 3 5 3 6 5 7 4 2 8 7 S 8 1 5 o
2 4 3 1 3 8 2 7 7 6 1 4 8 2 4 4 5 7 3 5 8 6 3 5 5 2 o 7 4 5 4
3 7 1 6 4 7 3 5 6 7 2 2 1 3 o 2 4 6 5 4 4 o o 8 2 5 2 8 o 8 6
4 6 2 o 5 3 o 3 o 5 4 8 6 5 8 6 1 6 7 8 3 5 o 1 8 6 4 8 1 o 4
5 1 3 8 3 7 1 2 5 5 6 3 4 o 4 5 5 1 o 2 4 8 3 5 7 6 6 2 3 6 3
6 8 4 S 2 4 7 2 4 7 5 4 5 o 2 3 6 6 4 4 2 7 5 3 2 o 8 1 2 5 o
7 1 7 o o 5 6 3 4 5 6 6 7 4 1 3 4 6 4 8 5 1 6 o 8 3 o o 8 7 7
8 1 8 o 3 1 2 8 6 6 o 6 1 6 4 6 1 3 8 6 1 5 3 4 1 6 2 o 4 5 5
9 1 4 8 6 2 4 2 2 4 o 7 7 7 6 1 8 7 o 1 o 4 1 1 2 o 7 1 1 o 3
10 6 2 o 3 5 2 2 7 o 3 8 8 7 3 8 6 5 2 7 3 1 8 3 2 7 2 1 2 2 o
11 8 1 6 1 7 2 1 o o o 2 4 8 o o 7 1 3 o 1 2 7 2 1 3 4 8 5 4 5
12 o 1 7 o 7 5 8 2 3 o 3 7 5 1 4 6 6 8 1 3 5 4 7 5 1 5 7 S 4 8
13 1 5 5 o 6 o 8 5 2 4 7 2 5 7 2 4 6 1 6 8 7 o 2 o 2 8 4 4 4 7
14 2 4 2 1 1 1 2 7 8 4 1 2 2 5 7 7 2 6 1 5 5 7 6 5 2 7 1 4 5 6
1S 5 3 8 4 5 4 1 o 4 o 1 6 1 4 3 o 4 o 2 1 7 S o 1 5 7 S S 2 S
16 o 7 1 7 3 5 2 o 7 3 7 2 2 6 8 7 4 7 1 2 4 2 o 2 o 4 2 4 6 1
17 7 8 o 7 4 4 4 5 o 7 2 1 7 1 1 1 7 2 2 2 3 4 7 4 3 4 7 5 o 6
18 2 6 6 7 4 3 6 1 6 2 2 5 3 4 o 7 3 3 o 7 5 4 2 4 4 5 4 7 o 7
19 4 3 5 o 6 6 8 5 8 4 o 8 6 7 o 4 o 3 7 1 5 8 3 8 1 2 6 4 6 8
20 1 2 5 3 2 o o 2 1 o 1 5 2 8 7 7 2 5 7 6 8 3 1 5 3 o 8 8 o 3
21 o 4 4 5 5 1 o 3 3 4 2 o 6 7 6 7 3 1 2 3 5 6 8 5 8 2 o S 6 2
22 2 7 8 7 o o 5 6 1 6 8 3 8 3 6 2 8 7 5 3 2 5 5 6 6 o 4 7 4 1
23 4 o 8 3 o o 5 4 3 6 6 4 1 8 6 2 7 4 3 3 2 1 4 1 6 o 4 8 1 7
24 4 2 6 1 2 4 2 o 2 5 2 6 7 7 6 3 7 3 4 4 6 2 7 8 1 2 8 o 2 6
2S 1 2 8 2 2 6 6 8 4 o 2 1 6 6 2 2 4 2 o 8 6 8 o 8 o 1 4 6 6 6
26 4 3 3 3 2 8 6 o o 3 2 o o 3 8 4 4 4 o 4 6 o o 7 7 3 8 3 7 6
27 6 2 7 6 1 1 4 5 2 2 5 8 6 o 1 6 5 6 o S 3 2 6 2 6 6 3 8 2 6
28 o 4 6 3 o 2 6 2 4 4 8 8 6 5 o 6 o 6 3 o 4 4 8 o 5 4 o 8 o o

618
-
r ________________________________Tó_
ab_l_a_
s_d_iv_e_~_a_
s __________ ~

Columna
Fila 1 2 3 4 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 16 17 28 29 30
29 1 8 4 7 7 8 6 o o 3 7 8 1 4 5 4 3 3 o 7 8 o o 8 6 o 6 1 4 2
30 7 2 8 8 6 o 3 4 7 4 7 8 7 6 6 5 6 4 5 7 8 4 4 6 1 2 6 3 1 6
31 1 3 1 o 8 4 8 4 5 8 7 4 5 6 5 8 7 5 1 2 2 5 6 8 3 7 7 1 6 2
32 o 5 4 5 6 1 o 8 4 o 3 7 2 5 3 3 5 3 o 2 7 4 7 4 o 3 7 5 2 4
33 6 1 1 1 o 8 8 3 6 5 7 2 1 6 8 4 1 2 6 5 6 2 4 4 3 2 4 6 1 2
34 1 4 6 5 4 6 2 3 4 7 8 2 4 6 7 4 2 6 6 8 6 4 1 1 o 8 6 o 3 5
35 2 2 1 8 5 1 6 1 3 8 8 8 3 7 4 8 5 2 2 5 3 1 3 6 o 3 6 2 o 4
)6 o 4 4 5 7 8 7 4 o o 6 5 2 1 7 2 o 4 o 7 8 7 3 7 4 2 6 7 3 8
37 5 7 8 4 2 5 8 6 3 o 5 1 7 1 1 8 8 6 6 4 7 o 5 1 6 5 7 1 7 8
38 5 o 6 7 4 o 4 6 2 ) 6 5 7 3 8 o 2 4 3 4 o 4 5 1 1 5 2 o o 2
39 o 2 3 o 3 4 4 8 4 2 8 1 3 7 8 4 7 1 8 7 5 1 3 6 o 8 5 5 4 1
~ 5 3 o 1 4 1 7 6 4 1 8 8 4 2 3 4 8 7 2 8 o 2 1 3 8 4 2 1 o o
41 o 6 7 1 5 6 3 3 1 8 o 6 1 1 6 7 5 o 7 5 3 3 3 3 1 2 8 5 2
.,
4
42 6 1 8 6 1 5 6 7 2 5 3 6 4 3 o 2 4 4 5 8 2 3 5 8 2 1 2 3 o 3
43 o 4 1 8 7 6 2 7 3 5 6 8 1 1 5 6 4 4 3 7 3 o 1 7 7 3 8 5 7
44 o 1 1 7 6 7 5 2 1 7 3 6 8 3 o o 5 3 4 4 6 3 2 6 5 4 3 2 6 2
45 2 2 o 4 7 1 5 6 7 4 7 5 1 8 6 7 3 5 2 o o 7 1 7 3 o 6 8 6 6
46 8 2 7 5 2 5 2 6 4 1 5 4 o o 3 4 4 4 8 5 2 4 1 2 1 8 5 3 4 2
47 2 o 4 1 4 8 4 5 3 8 6 2 7 3 2 2 3 8 1 2 3 7 1 1 2 6 5 o 2 4
48 2 o 7 8 3 5 o 6 8 2 4 4 5 8 o 6 5 8 8 o 7 2 8 8 1 6 2 3 o 3
49 o 7 5 5 7 7 8 o 1 3 2 8 o 8 o 3 6 6 5 5 3 3 4 8 2 8 4 o 1 1
50 1 7 4 7 3 6 8 3 o 5 6 2 8 6 8 1 4 3 7 o 5 2 2 6 8 1 8 2 5 5
51 7 1 3 3 4 2 1 8 o 5 4 3 2 2 3 3 7 6 1 o 8 3 1 1 5 o 8 8 o 6
52 5 4 7 6 6 6 4 o 2 4 4 2 2 o 6 8 1 1 6 3 4 2 o 2 1 7 6 o 4 2
53 7 4 6 o 7 4 5 o 1 6 7 1 1 o 1 3 2 4 1 2 2 6 6 4 3

-
8 8 3 8 8
54 3 o 7 2 3 8 6 4 6 4 1 8 o 6 4 3 o 6 2 6 5 4 3 7 2 2 5 o 1 4
55 o 1 o 2 o 7 1 6 5 3 2 o 1 4 4 5 8 5 7 o 4 8 4 7 5 5 6 4 8 7
56 8 3 6 4 7 2 8 6 1 8 5 7 6 8 o 2 6 7 6 7 5 7 6 2 7 7 o 3 4 7
57 2 8 7 o 4 6 3 8 8 3 2 5 2 5 3 6 3 2 7 7 2 8 8 3 6 1 3 2 8 8
58 6 5 o 4 6 o 7 4 8 6 6 3 2 1 7 1 o 2 o 1 o 7 6 8 7 4 2 1 3 6
59 3 7 2 3 4 3 3 6 5 5 o 8 1 2 1 5 3 5 2 2 3 3 7 3 7 4 2 8 5 2
60 8 5 6 7 3 5 3 4 3 4 6 3 o 6 2 3 1 o 8 3 1 6 2 2 o 2 o 3 o 4
61 7 1 8 4 7 6 o 8 1 1 1 5 2 6 6 7 7 8 4 1 o 1 8 3 1 5 2 1 7 o
62 o 5 4 3 3 3 4 7 1 6 7 5 2 8 7 1 8 3 1 o 2 1 6 6 5 7 7 5 5 7
63 5 2 5 o 3 1 8 5 6 5 5 7 1 3 7 6 4 5 o 8 5 8 6 8 8 8 o o 2 8
6<1 4 2 2 2 o 1 3 o 3 6 1 o o 7 5 8 2 6 1 1 4 8 1 1 1 2 4 4 4 4
65 5 5 2 3 8 3 o 1 6 6 5 8 8 o 5 4 5 7 6 1 3 3 7 2 6 6 4 6 6 8
66 6 3 1 8 3 1 7 2 2 3 7 5 8 7 1 4a 36 2 6 1 1 5 3 8 4 5 2 3
67 7 2 2 7 2 4 7 2 7 5 7 8 4 5 5 o 2 6 6 6 8 6 5 8 1 7 6 5 o 4
68 3 1 1 6 3 4 7 1 1 5 o 5 6 6 o 5 3 a o 6 5 6 5 5 4 2 2 8 6 3
69 1 2 3 5 6 o 1 6 1 3 3 8 7 6 6 6 7 5 o 2 o 5 o 4 1 7 6 4 8 8
70 7 o 2 3 6 3 4 7 4 2 4 8 1 4 o 8 7 8 5 2 1 o 7 7 7 o 4 1 7 3
71 1 3 2 1 8 1 5 6 6 2 5 5 4 3 1 o 8 3 o 7 4 2 7 5 5 2 8 o 5 2
n 5 6 1 6 2 2 7 o o 3 8 1 3 3 1 o o 2 4 1 2 6 7 4 8 3 4 3 7 5
73 6 o 5 1 1 3 6 1 7 o 5 7 3 3 8 6 6 1 a 6 4 3 6 1 7 8 1 2 o 2
H 8 7 6 o o 8 5 4 o 3 2 6 7 5 1 6 4 5 8 8 1 2 4 8 4 2 4 1 8 1
75 1 3 7 2 2 o 1 3 2 7 5 1 8 5 3 6 6 1 7 3 4 6 4 2 6 4 4 8 2 1
76 8 6 7 3 8 1 3 7 o 4 8 7 3 3 8 7 3 o 5 o 8 6 3 4 6 6 2 3 o 2
77 o 4 6 8 1 2 8 6 2 8 o 1 8 3 3 8 5 8 6 4 2 1 5 2 8 5 1 4 7 3
78 6 8 8 7 4 3 5 8 4 2 8 4 4 6 2 4 7 o 2 o 5 4 4 7 2 o o o 1 o
79 6 3 4 5 4 4 6 3 8 8 o o 5 6 8 7 6 o o 7 o 3 3 5 6 5 5 7 8 1
80 3 o 1 3 2 2 8 1 o 6 1 5 7 8 8 3 1 6 o 8 7 4 5 2 1 8 5 4 4 3
81 7 1 4 6 4 1 3 2 o o 7 4 2 o 5 2 8 6 4 2 5 6 6 3 o 2 6 4 5 7
82 8 3 8 4 8 3 6 o 5 8 1 5 5 3 8 3 8 4 8 4 o 5 1 3 o 8 5 4 4 6
83 6 3 6 7 2 5 1 3 6 7 8 7 5 8 6 6 5 6 6 2 o 8 8 7 8 7 5 5 7 5
84 6 8 5 5 2 3 4 1 5 6 5 3 3 6 8 1 o 2 6 5 3 8 5 5 3 6 8 7 o 8
85 2 7 3 4 4 o 2 6 5 4 4 4 1 5 8 3 6 2 4 6 2 2 2 5 4 8 1 1 1 o
86 1 8 7 1 3 4 1 7 5 5 o 2 8 2 8 6 8 4 o 7 2 2 6 2 1 7 2 2 5 6
87 3 o 8 1 1 5 1 1 5 8 6 7 1 1 7 5 3 3 8 4 1 6 8 7 6 8 3 4 8 7
88 2 5 5 4 4 2 1 8 o 2 1 6 4 4 2 7 7 1 2 5 2 o 3 2 5 o 4 o 1 6
89 7 3 7 4 4 5 2 1 2 1 2 1 8 2 7 o 7 5 2 6 8 4 5 4 1 3 4 6 3 6
90 o 5 o o 1 7 3 6 7 2 8 3 7 8 7 4 3 o 2 4 5 1 5 3 o 7 5 1 5 6
91 1 6 4 2 7 2 6 1 7 8 6 3 4 o 6 6 o 4 3 8 4 2 6 5 5 o 2 5 o 4
92 7 4 6 4 5 7 3 5 4 7 o o 3 7 1 o 1 8 1 4 o 2 5 o 1 4 o 4 2 1
93 8 6 6 1 7 1 3 8 o 7 5 1 3 4 5 1 3 8 3 6 6 4 o 6 5 8 2 6 5 1
94 3 3 7 7 2 4 8 3 1 1 2 6 7 7 7 7 1 1 5 2 4 3 3 1 7 4 3 5 1 4
95 5 8 6 8 3 3 o 5 o 6 3 8 5 5 o 8 5 3 4 8 8 4 4 2 1 6 8 2 4 1
96 1 3 3 1 8 7 8 8 3 3 o 6 8 6 5 3 4 7 2 8 6 4 1 6 3 4 2 6 1 7
97 7 7 6 2 4 4 3 1 7 5 1 1 5 4 1 6 o 3 8 o 6 3 4 5 8 3 8 o 7 4
98 3 6 4 5 1 7 6 1 6 1 5 3 8 4 7 6 3 5 3 5 5 o 8 2 1 8 6 o 3 4
99 o 8 3 5 6 1 4 1 8 7 2 6 2 3 5 2 4 o a 3 7 5 6 6 8 8 o 4 8 3
100 4 3 6 4 4 8 1 8 o 8 2 5 2 2 3 4 4 6 a 3 4 8 4 o 5 2 2 1 1 3
620lL------------------------~A~p~én~d~ic=e=s______________________________

Coeficientes para pruebas de tendencia


En la tabla AXVI.2 sólo se presentan los coeficientes(!¡) apropiados para pmebas de ten-
dencia cuando los tamaños de la muestra en cada niYel de la variable independiente son
iguales y los de la independiente difieren en cantidades regulares: un ejemplo consistiría en
SI la VI es el tiempo. en segundos. antes de que se pida a los panicipantes recordar una lis-
ta de palabras. con tiempcs de 5. 1O. 15 ) 20 segundos. Adcmáo;. "o lo presentamos coefi-
cientes para tendencias lineales, cuadráticas y cúbicas (cuando son aplicables). Véanse en
Myers y Well ( 1991) los coeficientes de otras tendencias y los detalles sobre cómo calcu-
lar los coeficientes de tendencias diferentes de las lineales.

Cálculo de coeficientes lineales


Con interi'CI!os y tamaiios de muestra iguales. Presentamos a continuación las dos ecua-
ciones necesarias para un coeficiente lineal, si los intcnalos entre los niveles de la VI y los
tamai'los de la muestra son iguales:

Ec. AXVI.l
y

2:(c) = O Ec.AXVL2
donde a es un ,·alor algebraico (una constante) que nos sir\'e para calcular cada cj
j es el nivel de la VI
cj es el coeficiente de laj media

Por ello. si tenemos tres niveles en la VI,

C¡ - a+ 1
c2 = a+2
e, = a+3
.)

En ta l caso, a partir de la ecuación AXVL2,

3a + 6 = O
Por tanto,

a= - 2
lo cual significa que C¡ = -2 + 1 =
c.,= - 2 1-2 =o
e,=
_, 2+ 3= 1
______________________________l_a_b_la_s_d_iv_e_rs_a_s____________________~~

Con intermlos _r tamaiios de muestra desiguale.\. Si se tienen intervalos y tamaños de


muestra desiguales. la ecuación AXVI.I se transfonna en:

cj = a+ ·'S Ec. AXVI.3

-
donde X es el \·alor del nivelj-ésimo de la VI
y la ecuactón AX\'I.2 se toma en

Ec. AXVI.4

donde'~; es el tamaño de la muestra en el nivelj-ésimo de la VI


Imaginemos que calcularemos los coeficientes para una tendencia lineal si tenemos tres ni-
veles en.la VI, muestras de lO, 15 y 25 pmticipantes y 5, 12 y 20 como niveles de la VI
(años dedicados a aprender una habilidad). Por tanto, a partir de la ecuación AXVI.3,

't a-+5
e~ - a+ 12

- y de la AXVI.4
c 3 = a -r 20

1O x (a+ 5) + 15 x (a~ 12) -r 25 x (a + 20) = O

l:.n consecuencia,
SO x a+ 730 =O

lo cual significa que:


73
a--
5

y a partir de la ecuación AXVU·


4X
e1
5
D
('2 ~

27
c3 -
5

Para simpliticar los cálculos de la prueba de tendencia lineal. podemos multiplicar cada
coetkiente por 5 para com ertirlos en números enteros.
62:ZlL________________________~A~p~én~d~ic~e~s______________________________
Con intervalos desiguales y tamaños de muestra iguales. De haber intervalos desiguales
y tamaños de muestra iguales, podemos usar las ecuaciones AXVI.3 y AXVI.2. Por tanto,
si en el ejemplo anterior esos tamaños hubiesen sido iguales, tendríamos que, a partir de la
primera de dichas ecuaciones:
e 1 =a+ 5
e2 = a + 12
e3 =a + 20
y de la segunda:

3 x a + 37 = O
en cuyo caso:
-37
a= -
3
Por ende, a partir de la ecuación AX.VI.3:
. -22
3
-1
e = -
2 3
23
e = -
3 3

Como en el ejemplo anterior, podemos simplificar los coeficientes multiplicándolos por 3.

Con intervalos iguales y tamaños de muestra desiguales. En caso de tener intervalos igua-
les y tamaños de muestra desiguales, necesitamos las ecuaciones AXVI.l y AXVI.4. De ahí,
e 1 = a+ 1
c2 = a+ 2
c3 = a + 3

y si las muestras hubiesen tenido 10, 15 y 25 participantes, respectivamente,

10 x (a + 1) + 15 x (a + 2) + 25 x (a+ 3) = O
lo cual significa que:
50 x a+ 115 =O

· Por consiguiente,
-115 -23
a= so 0
lO
_______________________________
Ta_b_la_s_d_iv_e_~_a_s____________________~~

En tal caso:

-13
el =w
-3
c2 = 10
7
c3 = 10
Podemos multiplicar cada coeficiente por 1O para simplificar los cálculos de la prueba de
tendencia.

Cálculo de las ponderaciones para contrastes


por pares con tamaños de muestra des;guales
Podemos usar el procedimiento referido para calcular los coeficientes de una tendencia lineal
cuando los tamaños de muestra son desiguales y los intervalos iguales. Sin embargo, bus-
camos sólo dos coeficientes. Por ejemplo, si tenemos una VI con tres niveles, con muestras
de 5, 10 y 25, y deseamos contrastar dos condiciones, usaremos adaptaciones de las ecua-
ciones AXVI.l y AXVI.4, pero con w en lugar de cF Por tanto:
1
w1 = a + 1
w2 = a +2
(en un contraste por pares es necesario usar siempre 1 y 2 en estas ecuaciones, indepen-
dientemente de los niveles de la VI que se contrastan)
y
Ec.AXVI.5

Debido a ello, si estuviésemos contrastando la primera y tercera muestras,


5 x (a+ 1) + 25 x (a+ 2) =O
lo cual significa que:

30 x a + 55= O
y
-55 - 11
a= -o-
30 6

lo que implica que:


W¡ = -- 5
6
1
w2 = -
6
624lL_________________________A~p~é_nd~i~ce~s______________________________
Para simplificar los cálculos del contraste podemos multiplicar las ponderaciones por 6 pa-
ra obtener -5 y l.

Tabla AXVI.2. Coeficientes para pruebas de tendencia.


Número de niveles Nivel de la VI
de !a VI Tipo de tendencia 2 3 4 5 6 7 8 9 1O cJ
2: (
3 lineal --1 o 1 2
cuadrática 1 -2 1 6
4 lineal 3 -1 1 3 20
cuadrática 1 -1 1 1 4
cúbica -1 3 -3 1 20
5 lineal 2 -1 o 1 2 10
cuadrática 2 - 1 -2 1 2 14
cúbica 1 2 o -2 1 10

6 lineal -5 -3 1 1 3 5 70
cuadrática 5 -1 -4 -4 1 5 84
cúbica -5 7 4 4 7 5 180
7 lineal 3 -2 -1 o 1 2 3 28
cuadrática 5 o -3 -4 3 o 5 84
cúbica 1 1 1 o 1 1 1 6
8 lineal -7 5 - 3 -1 1 3 5 7 168
cuadrática 7 1 -3 -5 5 -3 1 7 168
cúbica -7 5 7 3 3 -7 -5 7 264
9 lineal -4 - 3 -2 1 o 1 2 3 4 o 60
cuadrática 28 7 - 8 17 20 - 17 - 8 7 28 2772
cúbica 14 7 13 9 o -9-13 -7 14 990
10 lineal -9 -7 -5 -3 1 1 3 5 7 9 330
cuadrática 6 2 -1 3 -4 -4 - 3 - 1 2 6 132
cúbica -42 14 35 31 12 12 - 31 35 14 42 8580

Conversión de r en r' (transformación de Fisher)


En la tabla AX\'1.3 se presenta la conversión de un rango de valores de 1: Sin embargo,
cuando necesitemos convertir un valor que no apare7ca en la tabla podemos usar la ecua-
ción siguiente:
r' = ú.5 x log, ( -1+r)
i -r
Tablas diversas

Ello significa calcular el valor de ( ~ ~:), calcular el logaritmo de la base e del resultado (el
logaritmo natural que suele aparecer como LN o ln en las calculadoras) y multiplicar el re-
sultado por 0.5.
Por ejemplo, sir= 0.7, entonces:

1 07
r' = 0.5 x lo ( + · )
ge 1-0.7

= 0.5 x log, 1.7)


(0.3
= 0.5 x loge5.6667
= 0.5 X l. 7346
= 0.8673

Conversión de r' en r

e(2xr')_
1
r
e
(2 x r') + 1

donde e = 2.71828 (aproximadamente).


Por ejemplo, sir' = 0.8673, entonces:

e(2x08673) _
1
r
(2 X 0.8673)
e +1

e(i7346) _
1
e(i7346) +
1

5.6667 -1
5.6667+1

4.6667
6.6667

= 0.7
6261 Apéndices

Tabla AXV1.3. Transformación de Fisher.

r' r r' r r' r r' r'

0.000 0.000 0.200 0.203 0.400 0.424 0.600 0.693 0.800 1.099
0.005 0.005 0.205 0.208 0.405 0.430 0.605 0.701 0.805 1.113
0.010 0.010 0.210 0.213 0.410 0.436 0.610 0.709 0.810 1.127
0.015 0.015 0.215 0.218 0.415 0.442 0.615 0.717 0.815 1.142
0.020 O.D20 0.220 0.224 0.420 0.448 0.620 0.725 0.820 1.157
0.025 0.025 0.225 0.229 0.425 0.454 0.625 0.733 0.825 1.172
0.030 0.030 0.230 0.234 0.430 0.460 0.630 0.741 0.830 1.188
0.035 0.035 0.235 . 0.239 0.435 0.466 0.635 0.750 0.835 1.204
0.040 0.040 0.240 0.245 0.440 0.472 0.640 0.758 0.840 1.221
0.045 0.045 0.245 0.250 0.445 0.478 0.645 0.767 0.845 1.238
0.050 0.050 0.250 0.255 0.450 0.485 0.650 0.775 0.850 1.256
0.055 0.055 0.255 0.261 0.455 0.491 0.655 0.784 0.855 1.274
0.060 0.060 0.260 0.266 0.460 0.497 0.660 0.793 0.860 1.293
0.065 0.065 0.265 0.271 0.465 0.504 0.665 0.802 0.865 1.313
0.070 0.070 0.270 0.277 0.470 0.510 0.670 0.811 0.870 1.333
0.075 0.075 0.275 0.282 0.475 0.517 0.675 0.820 0.875 1.354
0.080 0.080 0.280 0.288 0.480 0.523 0.680 0.829 0.880 1.376
0.085 0.085 0.285 0.293 0.485 0.530 0.685 0.838 0.885 1.398
0.090 0.090 0.290 0.299 0.490 0.536 0.690 0.848 0.890 1.422
0.095 0.095 0.295 0.304 0.495 0.543 0.695 0.858 0.895 1.447
0.100 0.100 0.300 0.310 0.500 0.549 0.700 0.867 0.900 1.472
0.105 0.105 0.305 0.315 0.505 0.556 0.705 0.877 0.905 1.499
0.110 0.110 0.310 0.321 0.510 0.563 Q.710 0.887 0.910 1.528
0.115 0.116 0.315 0.326 0.515 0.570 0.115 0.897 0.915 1.557
0.120 0.121 0.320 0.332 0.520 0.576 0.720 0.908 0.920 1.589
0.125 0.126 0.325 0.337 0.525 0.583 0.725 0.918 0.925 1.623
0.130 0.131 0.330 0.343 0.530 0.590 0.730 0.929 0.930 1.658
0. 135 0.136 0.335 0.348 0.535 0.597 0.735 0.940 0.935 1.697
0.140 0.141 0.340 0.354 0.540 0.604 0.740 0.950 0.940 1.738
0.145 0.146 0.345 0.360 0.545 0.611 0.745 0.962 0.945 1.783
0.150 0.151 0.350 0.365 o.5:;o 0.618 0.750 0.973 0.950 1.832
0.155 0.156 0.355 0.371 0.555 0.626 0.755 0.984 0.955 1.886
0.160 0.161 0.360 0.377 0.560 0.633 0.760 0. 996 0.960 1.946
0.165 0.167 0.365 0.383 0.565 0.640 0.765 1.008 0.965 2.014
0.170 0.172 0.370 0.388 0. 570 0.648 0.770 1.020 0.970 2.092
0.175 0.177 0.375 0.394 0. 575 0.655 0.775 1.033 0.975 2.185
0.180 0.182 0.380 0.400 0.580 0.662 0.780 1.045 0.980 2.298
0.185 0.187 0.385 0.406 0.585 0.670 0.785 1.058 0.985 2.443
0.190 0.192 0.390 0.412 0.590 0.678 0.790 1.071 0.990 2.647
0.195 0.198 0.395 0.418 0.595 0.685 0.795 1.085 0.995 2.994
0.999 3.800

-

Bibliografía

Abelson, R. P., Statistics as Principled Argument, Lawrence Erlbaum Associates, Hillsdale, Nueva
Jersey, 1995.
Agresti, A., Categorical Data Analysis, Wiley, Nueva York, 1990.
_ , An Introduction to Categorical Data Analysis, Wiley, Nueva York, 1996.
American Psychological Association, "Ethical principies of psy<..:hologists and code of conduct",
American Psychologist, núm. 47, PI?· 1597-1611, 1992.
Atkinson, R. C. y R. M. Shiffiin, "The control of short-term memory", en Scientific American, núm. 225,
pp. 82-90, 1971.
Bales, R. F., "A set of categories for analysis of small group interaction", American Sociological Re-
view, núm. i5, pp. 257-263, 1950.
Boden, M. A., Artificial Intelligence and Natural Man, 2a. ed. revisada, The MIT Press, Londres,
1987.
Bonge, D. R., W. J. Scbuldt y Y. Y. Harper, "Tbe experimenter-as-fixed-effect fallacy", The Journal
of Psychology, núm. 126 (5), pp. 477-486, 1992.
British Psycbological Society, Code of Conduct, Ethical Principies & Guidelines, The British Psy-
chological Society, Leicester, 1993.
Clark-Carter, D., "The account taken of statistical power in research published in the British Jour-
nal ofPsychology", British Journal ofPsychology, núm. 88, pp. 71 -83, 1997.
Cleveland, W. S., The Elements ofGraphing Data, Wadsworth, Monterey, California, 1985.
Cochran, W. G. y G. M. Cox, Experimental Designs, 2a. ed., Wiley, Londres, 1957.
Cohen, J., "The satistical power of abnormal-social psycho1ogical research: a review", Journal of
Abnormal and Social Psychology, núm. 65, pp. 145-153, 1962.
__, Satistical Power Analysis for the Behavioral Sciences, 2a. ed., Lawrence Erlbaum Associates,
Hillsdale, Nueva Jersey, 1988.

-
Danziger, K., Constructing the Subject, Cambridge University Press, Cambridge, 1990.

-----------------------------~~-----~16:U
~L_ __ __ _ _ _ _ _ _ __ __ _ _ __ _ _ _ _ _ _ _ og~r_a_fí_a_______________________________
B_ib_li_

Dixon, W. J. y F. J. Massey Jr., lntroduction to Statistical Analysis, 4a. ed., McGraw-Hill, Londres,
1983.
Ericsson, K. A. y H. A. Simon, "Verbal reports as data", Psychological Review, núm. 87, pp. 215-
251 , 1980.
Estes, W. K., "Mathematical models in psychology", en G. Keren y C. Lewis (eds.), A Handbookfor
Data Analysis in the Behavioral Sciences: Methodologicallssues, Lawrence Erlbaum Associa-
tes, Hillsdale, Nueva Jersey, 1993.
Eysenck, H. J. y L. Kamin, lntelligence: The Battle for Mind, Macmillan, Londres, 198 1.
Gregg, V. H., Introduction 10 Human Memory, Routledge, Londres, !986.
Hammersley, M. y P. Atkinson, Etlmography: Principies in Praclice, Tavistock Publications, Lon-
dres, 1983.
Harré, R., "The ethogcnic approach: theory and practice", en L. Berkowitz (ed.), Advances in Expe-
rimental Social Psychology, Academic Press, Londres, 1977. ·
Hewstone, M., W. Stroebe y G. M. Stcphcnsoo (eds.), Introduction lo Social Psychology, 2a. ed.,
Blackwell, Oxford, 1996.
Howell, D. C., Statistical Methodsfor Psychology, 4a. ed., Duxbury, Boston, 1997.
Huberty, C. J., Applied Discriminan! Analysis, Wiley, Nueva York, 1994.
Humphreys, G. y J. M. Riddoch, To See but notto Be Seen: A Case Study of Visual Agnosia, Law-
rence Erlbaum Associates, Hove, Reino Unido, 1987.
Kelly, G., The Psychology of Personal Constructs, Norton, Nueva York, 1955.
Kerlinger, F. N ., Foundations of Behavioral Research, 2a. ed., Holt, Rinehart & Winston, Londres,
1973.
Kline, P., The Handbook of Psychological Testing, Routledgc, Londres, 1993.
Luria, A. R., The Mind ofa Mnemonist, Penguin, Harmondsworth, 1975a.
_ , The Man with a Shattered World, Pcnguín. Harmondswonh, 1975b.
Maghsoodloo, S. y L. L. Palios, "Asymptotic behaviour ofKendall's partía! rank corrclatioo coeffi-
cient and additional quantile estimates", Joumal ofStafistical Computing and Simulation, vol. 13,
pp. 41 -48, 1981.
Manstead, A. S. R. y C. McCulloch, "Scx-role stereotyping in british te1evision advertisements", British
Journal of Psychology, núm. 20, pp. 171-180, 1981.
Marsh, P., E. Rosser y R. Harré, The Rules of Disorder, Routledge, Londres, 1978.
McGowan, L., D. C1ark-Carter y M. Pitts, "Chronic pe1vic pain: a meta-ana1ytic review", Psycho-
logy and health (en prensa).
Meddis, R., Statistics Using Ranks: A Unified Approach, Blackwell, Oxford, 1984.
M ilgram, S., Obedience to Authority. Tavistock Publications, Londres, 1974.
Miller, G. A., "Trends and debates in cognitive psychology", en A. M. Aitkenhead y J. M. Slack
(eds.), lssues in Cognitive Modelling. Lawrence Erlbaum Associates, Hove, Reino Unido, 1985.
Myers, J. L. y A. D. Well, Research Design and Statistical Analysis, HarperCollins, Nueva York,
1991.
Neave, H. R., Statistics Tables: For Mathematicians. Engheers, Economists and the Behavioral and
Management Sciences, Unwin Hyman, Londres, 1978.
_ , y P. L. Worthington, Distribution-Free Tests, Routledge, Londres, 1988.
Newell, A. y H. A. Simon, Human Problem Solving, Prenticc-Hall, Englewood C1iffs, Nueva Jersey,
1972.
___________________________________B_ib_li_o~g_ra_f_ía________________________~~

Nisbett, R. E. y T. D. Wilson, "Telling more than we can know: verbal reports on mental processes",
Psychological Review, núm. 84, pp. 231-259, 1977.
Ome, M . T., "On tbe social psychology ofthe psychological experiment: with particular reference to
demand cbaracteristics and their implications", American Psychologist, núm. 17 ( 11 ), pp. 776-
783, 1962.
Osgood, C. E., G. J. Suci y P. H. Tannenbaum, The Measurement of Mean.ing, University of lllinois
Press, Urbana, Illinois, 1957.
Pedbazur, E. J. y L. P. Schmelkin, Measuremen.t, Design. an.d An.alysis: An. Integrated Approach,
Lawrence Erlbaum Associates, Hillsdale, Nueva Jersey, 1991.
Pfungst, 0., Clever Hans: The Horse ofMr. Von Osten (traducido por C. L. Rahn), Holt, Rinebart &
Winston, Nueva York, 1911, 1965.
Pitts, M. y H. Jackson, "AJDS and the press: an analysis of tbe coverage of AIDS by Zimbabwe
oewspapers", AIDS Care, núm. 1 (l), 77-83, 1989.
Popper, K. R., The Logic of Scientific Discovery, 5a. reimpresión revisada, Hutcbinson, Londres,
1972.
_ , Conjectures and Refutations: The Growth of Scientific Knowledge, 5a. ed., Routledge, Londres,
1974.
Potter, J. y M . Wetberell, Discourse and Social Psychology, Sage, Londres, 1987.
Putnam, H., 'The 'corroboration' oftheories", en T. Honderich y M. Bumyeat (eds.), Philosophy as
it is, Penguin, Harmondsworth, 1979.
Robson, C., Real World Research: A Resource for Social Scientists and Practitioner-Researchers,
Blackwell, Oxford, 1993.
Rogers, C. R., Client-Centred Therapy, Constable, Londres, 1951.
_ , On Becoming a Person: A Therapist ~ View of Psychotheraphy, Constable, Londres, 1961.
Rosenthal, R., Meta-analytic Proceduresfor Social Research, Sage, Londres, 1991.
Rosnow, R. L. y R. Rosenthal, "Statistical procedures and the justification of knowledge in psycho-
logical science", American Psychologist, núm. 44 (1 0), pp. 1276- 1284, 1989.
Schlenker, B. R., "On the ethogenic approacb : etiquette and revolution", en L. Berkowitz (ed.), Ad-
vances in Experimental Social Psychology, Academic Press, Londres, 1977.
Sears, D. 0., "College sophomores in the laboratory: influences of a narrow data base on psycho-
logy's view ofhuman nature", Journal ofPersonality and Social Psychology, núm. 51, pp. 513-
530, 1986.
Schumacker, R. E. y R. G. Lomax, A Beginner ~ Guide to Structural Equation Modelling, Lawrence
ErlbaumAssociates, Mahwah, Nueva Jersey, 1996.
Sedlmeier, P. y G. Gigerenzer, "Do studies ofstatistical power have an effect on the power ofstudies?",
Psychological Bulletin, pp. 309-316, 1989.
Shaughnessy, J. J. y E. B. Zechmeister, Research Methods in Psychology, 3a. ed., McGraw-Hill, Lon-
dres, 1994.
Siegel, S. y N. J. Castellan, Nonparametric Statisticsfor the Behavioral Sciences, 2a. ed., McGraw-
Hill, Nueva York, 1988.
Soyland, A. J., Psychology as Metaph01; Sage, Londres, 1994.
Steiger, J. H., "Tests for comparing elements of a correlation matrix", Psychological Bulletin, núm.
87 (2), pp. 245-251' 1980.
Stenner, P. y H. Marshall, "A Q methodological study of rebelliousness", European Journal of So-
cial Psychology, núm. 25, pp. 621 -636, 1995.
~L__________________________ · b_li_og~r_a_fí_a_______________________________
Bl_

Stephenson, W., The Study of Behavior: Q-Technique and its Methodology, University of Chicago
Press, Chicago, 1953.
Stevens, J., Applied Multivariate Statistics jor the Social Sciences, 3a. ed., Lawrence Erlbaum Asso-
ciates, Mahwah, Nueva Jersey, 1996.
Sudman, S., Applied Sampling, Academic Press, Londres, 1976.
Suedfeld, P., Restricted Environmental Stimulation: Research and Clínica/ Applications, Wiley, Nueva
York, 1980.
Tabacbnick, B. G. y L. S. Fidell, Using Multivariate Statistics, 3a. ed., HarperCollins, Nueva York,
1996.
Valentine, E. R., Conceptual Issues in Psychology, 2a. ed., Routledge, Londres, 1992.
Winer, B. J., D. R. Brown y K. M . Michels, Statistical Principies in Experimental Design, 3a. ed., Mc-
Graw-H i11, Londres, 199 J.
Winter, D. A., Personal Construct Psychology in Clínica! Practice: Theory, Research and Applications,
Routledge, Londres, 1992.
Wright, P., "Writing and reading technical information", en J. Nicholson y B. Foss (eds.), Psycho-
logy Survey No. 4, British Psycbological Society, Leicester, 1983.
Zimmerman, D. W. y B. D. Zumbo, "The relative power ofparametric and non-parametric statistics",
en G. Keren y C. Lewis (eds.), A Handbook for Data Analysis in the Behavioral Sciences:
Methodological Issues, Lawrence Erlbaum Associates, Hillsdale, Nueva Jersey, 1993.
Índice onomástico

Abelson, R. P., 180 Eysenck, H . J. , 11


Agresti, A., 352, 355
Atkinson, P. , 1O Fidell, L. S., 341, 351, 361
Atkinson, R. C. , 4
Gigerenzer, G., 186
Gregg, V. H. , 4
Bales, R. F. , 7, 105-106
Boden, M. A., 5 Hammersley, M., 1O
Bonge, D. R. , 37 Harper, Y. Y., 37
Brown, D. R., 71 , 271 Harré, R., 10, 11
Hewstone, M ., 7
Castellan, N. J. , 284, 497, 559 Howell, D . C. , 242, 271 , 294, 31 O, 314, 316, 348
Clark-Carter, D., 186; 363 , 535 Huberty, C. J., 354, 355
C1eve1and, W. S., 138 Humphreys, G. , 9
Cochran, W. G., 71
Cohen, J., 186, 187, 189, 190, 201 , 204, 208, Jackson, H., 8
213,218, 221 , 224, 246, 296, 307,341 ,
371 , 378, 379,418 , 440,537, 539,544, Kamin, L. , 11
584, 586, 588 Kelly, G. , 97
Cox, G. M., 71 Ker1inger, F. N., 94
Kline, P. , 326, 327
Danziger, K. , 48
Dixon, W. J., 559 Lomax, R. G. , 361
Duncan, D., 40-41 Luria, A. R., 9

Ericsson, K . A., 25 Maghsood1oo, S., 579


Estes, W. K., 4 Manstead, A. S. R. , 8, 106

------------------------------------------------------~ 631
~L_______________________í~n~d~~·c~e~o~n~o~m~á~st~ic~o_____________________________

Marsh, P., 11 Schuldt, W. J., 37


Marshall, H., 95 Schumacker, R. E., 361
Massey, F. J., 559 Sears, D. 0., 36
McCulloch, C., 8, 106 Sedlmeier, P., 186
McGowan, L., 363, 535 Shaughnessy, J. J., 13
Meddis, R., 271 Shiffrin, R. M., 4
Michels, K. M., 71, 271 Siegel, S., 284, 497, 559
Milgram, S., 17,27 Simon, H. A., 4, 25
Miller, G. A., 4 Soyland, A. J., 11
Myers, J. L., 52, 71, 271, 276, 290, 620 Steiger, J. H., 51 O
Stenner, P., 95
Neave, H. R., 271, 548 Stephenson, G., 94
Newell, A., 4 Stephenson, G. M., 7
Nisbett, R. E., 25 Stevens, J., 341,345,351
Stroebe, W., 7
Ome, M. T., 27 Suci, G. J., 96, 97
Osgood, C. E., 96, 97 Sudman, S., 158, 161, 167
Suedfeld, P., 38
Palios, L. L., 579
Pedhazur, E. J., 327 Tabachnick, B. G., 341, 351, 361
Pfung.st, 0., 15 Tannenbaum, P. H., 96, 97
Pitts, M., 8, 363, 535
Platón, 4 Va1entine, E. R., 12
Popper, K. R., 11, 12
Potter, J., I 1 Well, A. D., 52, 71,271,276, 290, 620
Putnam, H., 12 Wetherall, M., 11
Wilson, T. D., 25
Riddoch, J. M., 9 Winer, B. J., 71, 271
Robson, C., 520 Winter, D. A., 98
Rogers, C. R., 95 Worthington, P. L., 271
Rosenthal, R., 188, 369, 546 Wright, P., 84
Rosnow, R. L., 188
Rosser, E., 11 Zechmeister, E. B., 13
Zimmerman, D. W., 196, 215, 243
Schlenker, B. R., 11 Zumbo, B. D., 196, 215, 243
Schme1kin, L. P., 327
,
Ín
ndice anal itico

ajuste de Bonferroni. Véase correcciones de de datos exploratorio (exploratory data


Bonferroni analysis, EDA), 115
alfa (a), 151-152,230 de frecuencia multivía. Véase modela-
ajustada, 230, 278, 284, 296, 483-484, ción log-ljneal
495,531 de poder discriminatorio, 94, 534
American Psychological Association de reactivos, 93-94, 533-534
conferencias, 20 de tendencia
lineamientos éticos, 13 ecuación general, 501-502
de trayectoria, 337, 356-357, 362
manual de estilo, 381
de varianza. Véase ANOVA
publicaciones, 381
de varianza multivariado. Véase
AMOS, 361
MANOVA

--
análisis
del componente principal (ACP), 359,
confirmatorio, 357, 360, 362
362
de conglomerados, 356, 362 del discurso, 11
de contenido, 99, 103-106 del proceso de interacción (API). Véase
definición, 8 observación
de covarianza. Véase ANCOVA discriminante, 354-355, 362
de covarianza multivariado. Véase descriptivo (ADD), 354-355
MANCOVA predictivo (ADP), 355

--------------------------------------------------------~ 633
6J4l~ _______________________ í_nd_i_ce
__an_a_ll_'t¡_·c_o____________________________

análisis (continuación) F de Welch, 243, 449-450


elección, 30 gl ajustados, 449
exploratorio, 357, 362 factorial. Véa•. e A NOVA: entre sujetos
factorial, 360, 362 hipótesis nula, 232
logit, 355, 362 intrasujetos
ANCOYA, 348, 353-354, 362 de dos vías, 262-266, 471-477
ANOYA interpretación, 264-266
colas de las pruebas, 234 segmentación de la varianza, 263-
diseños con más de dos VI, 270-271 264
diseños de trazo dividido. Véase tabla resumen, 264
ANOYA: diseños mixtos de una vía, 236-241, 450-457
diseños desequilibrados, 245, 448-449 interpretación, 241
diseños mixtos, 266-270, 478-482 segmentación de la varianza, 237
interpretación, 270 reporte de resultados, 241
segmentación de la vatianza, 267-269 tabla resumen, 239
tabla resumen, 269-270 esfericidad, 243-245, 266, 455-457
distribución F, 561-564 poder, 604
efecto principal, 260 media de cuadrados, 230-23 1
entre sujetos medias no ponderadas, 245, 261, 448-449
de dos vías, 255-262,467-471 medias ponderadas, 245, 448
interpretación, 258-260 nivel de medida, 242
segmentación de la varianza, no paramétrico, 247-252, 271,458-466
257-258 poder, 246, 271, 586-587
poder, 586-587 prueba
tabla resumen, 258 de Friedman, 249-250, 460-464
de una via, 234-236, 4457450 de K.ruskal-Wallis, 247-249,458-460
interpretación, 234 pruebas de tendencia. Véase pruebas de
medias ponderadas, 245, 448-449 tendencia
reporte de resultados, 236 razón F, 231
segmentación de la varianza, 232 razonamiento, 230-231
tabla resumen, 233 relación con la prueba t, 247
tamaño de muestra desigual, 245, reporte de resultados, 236, 241
448-449, 584 robustez, 242-243
varianza heterogénea, 243, 449-450 significación estadística, 235, 561-564
varianza homogénea, 242-243 similitud con la regresión, 346-348
tamaños de muestra desiguales, 245, suma de cuadrados, 230-231
261-262 tablas de poder, 603-611
esfericidad, 243-245, 266, 455-457 tablas de probabilidad, 561-564
_______________________________
ln_d_ic_e_a_na_l_ít_ic_o_____________________J~

ANOVA (continuación) distribución de chi cuadrada, 200-201


tamaño del efecto, 246, 271 frecu encias esperadas, 199, 202-204,44 1
tamaños de muestra desiguales, 245, 261- 'equeñas,224-225
262, 270, 448-449 gr~dos de libertad, 200, 222-223
supuestos, 241-243 hipótesis nula, 221-222
ANOVA de Friedman, 249-250, 460-464 informe de los resultados, 200, 223
corrección de empates, 249-250, 462-463 poder, 201-202, 221-222
informe de resultados, 250 prueba de bondad del ajuste, 203-204,
poder, 250, 464 425-427
significación estadística, 249-250 prueba de contingencias, 220-226, 250-
tablas de probabilidad, 566 251, 440-443
ANOVA de Kruskai-Wallis, 247-249,458- grados de libertad, 222-223
460 prueba de una muestra, J99-204
corrección de empates, 459-460 pruebas de una cola, 200, 223
informe de resultados, 248 significación estadística, 200-201, 222,
poder, 249 554-555
significación estadística, 248 supuestos, 202-204
supuestos, 247-248 tablas de poder, 594-602
tablas de probabilidad, 565 tablas de probabilidad, 554-555
apalancamiento. Véase regresión tamaño del efecto, 20 1, 221 , 224, 3 16-
artículo académico 317
redacción, 382 c ircularidad. Véase esfericidad
ayudas audiovisuales coeficiente
uso, 386-389 de concordancia de Kendall (W). Véase
correlación
bases de datos, 21-22 de contingencia. Véase correlación
beta (~), 188 de correlación producto momento de
bimodal, 118 Pearson (r). Véase correlación

·- British Psychological Society


lineamientos éticos, 13
conferencias, 20
de regresión estandarizado. Véase
regresión
R de correlación múltiple, 334
coeficientes de trayectoria, 357
cálculo, J52-153 cola, prueba de, 154-155
características de la demanda, 27 ANOVA, 234-235
censo, 81 x2,223
x2 contrastes, 282-283
corrección para continuidad, 224, 442-443 correlación, 301-302

_...,
6}6l~_______________________Í_n d_i_c e__
a n_a_ll_'
t ¡_·c_o____________________________

cola, prueba de (continuación) confiabilidad entre jueces. Véase


de dos colas, 154-155 con fiabilidad
de una cola, 154-155 confiabilidad prueba-reprueba. Véase
comparaciones. Véase contrastes confiabi 1idad
comportamiento consentimiento informado, 14
molar, 101 contaminación del criterio, 29
molecular, 1O1 contrabalanceo, 51
cond ición, 35 contrastes, 272-284, 484-497
conferencias datos de categoría, 284
como fuentes de investigación, 19-20 de Newman-Keuls, 490-491
confiabilidad, 26-27, 325-328 después del ANOVA de Friedman, 283-
coeficiente alfa de Cronbach, 327, 517 284, 496-497
consistencia interna, 326 después del ANOVA de Kruskal-Wallis,
definición, 26 283-284, 493-496
error estándar de medición, 327, 518 diferencia minima significativa protegida
escalas de actitud, 88-89 de Fisher (DMPS), 492
forma alternativa, 326 diferencia honestamente significativa de
interjuez, 26, 104, 106, 327-328, 519-520 Tukey (DHS), 281-282
intrajuez, 26 diferencia totalmente significativa de
kappa de Cohen, 328, 519-520 Tukey,492
Kuder-Richardson, 327, 517 diseños entre sujetos, 276
mitad dividida, 327, 516-517 diseños intrasujetos, 276 .. 277, 281
de Spearman-Brown, 327,516-517 ecuación general, 484-485
test, 326 estadísticas de rango estudentizado (q),
test-retest, 326 281-282, 490-491
confiabilidad 20 de Kuder-Richardson. tablas de probabilidad, 573-574
Véase confiabilidad familia de contrastes, 273
confiabilidad de consistencia interna. no paramétricos, 283-284, 493-497
Véase confiabilidad no planeados, 273-274
confiabilidad de la prueba. Véase ortogonalidad, 492-493
confiabilidad ,.....- pareados
confiabilidad de mitad dividida. Véase ponderaciones con tamaños de
confiabil idad muestra desiguales, 623-624
confiabilidad de Spearman-Brown. Véase planeados, 273-274
confiabilidad ponderaciones para tamaños de muestra
confiabilidad del alfa de Cronbach. Véase desiguales, 623-624
confiabilidad por pares, 272-273, 485-488, 490-493
_______________________________
ín_d_ic_e_a_n_al_ít_ic_o____________________~~

contrastes (continuación) confiabilidad. Véase confiabilidad


prueba de Scheffé datos nominales, 315-316
otras versiones, 488-490 diagrama de dispersión, 303-307
prueba de una cola, 282-283 diferencia entre dos coeficientes
prueba Tukey-Kramer, 282 grupos independientes, 321-322
pruebas de una cola, 282-283 grupos no independientes, 322, 510-
t de Bonferroni, 278-279 513
tablas de probabilidad, 278, 567-570
elección, 317
- , de Dunnett, 279
espuria, 305-306
tablas de probabilidad, 279, 571 -572
extremos
t de Scheffé, 280-28 1
efectos, 305
varianza heterogénea, 276-277
hipótesis direccional, 301
contrastes a posteriori. Véase contrastes: no
hipótesis no direccional, 302
planeados
hipótesis nula, 300-301, 322-323
contrastes a priori. Véase contrastes:
planeados importancia estadística, 300-301, 575,
contrastes post-hoc. Véase contrastes: no 576
planeados cuando H0 no es p = O, 322-323
control, 3 informe de resultados, 301
convergencia. Véase validez interpretación, 302, 307
corrección de Yates, 224, 442-443 intervalos de confianza, 323, 513-514
correcciones de Bonferroni, 278-279, 284, kappa de Cohen, 328, 519-520
296, 483-484 matriz, 318-319,338,511
correlación, 298-328 negativa, 298, 304
biserial, 310 no paramétrica, 311-316, 504-509
causalidad, 302 parámetro (p), 300-301,322-323
coeficiente de concordancia de Kendall parcial, 317-319, 338, 509-51 O
(W), 324-325,514-516 de orden mayor, 5 1O
tablas de probabilidad, 581
significación estadística, 5 1O
coeficiente de contingencia, 315-316
tau de Kendall, 311, 320-321
coeficiente de correlación producto
phi, 315-316
momento de Pearson (r), 300
de Cramer, 3 15-316
supuestos, 308-309
poder, 307-308,612-613
tablas de poder, 612-613
positiva, 298, 303
tablas de probabilidad, 575-576
prueba de dos colas, 302
coeficiente, 300
comparación entre la muestra y la pruebas de una cola, 301 -302
población, 322-323 punto biserial, 309-31 O
~~------------------------l_nd_i_c_e_a_n_al_ít_ic_o______________________________

correlación (continuación) datos faltantes, 261-262, 270


rango restringido datos, transformación de. Véase
efecto, 306-307 transformación de datos
recta del mejor ajuste, 303 desviación estándar. Véase medidas de
relación con la regresión, 334, 526-528 dispersión
relaciones no lineales, 306 conjunta, 434
rho de Spearrnan, 311-313,505-506 desviación intercuartiles. Véase medidas de
méritos relativos, 314 dispersión
poder, 315 diagramas de caja, 137-139
significación estadística, 311 , 506, bardas exteriores, 139,401-402
577-578 bardas interiores, 138, 400-401
tablas de probabilidad, 577-578 bigotes, 138-139
semiparcial, 317, 3 19-320 con muescas, 183
tamaño del efecto, 307 creacl.ón, 399-402
tau de Kendall, 311-314, 505, 506-509 lugar de bisagra, 400
correlación parcial, 320-321 rango H, 138, 400
tablas de probabilidad, 579-580 diagramas de caja y bigote. Véase diagramas
méritos relativos, 314 de caja
poder, 315 diagramas de dispersión, 129-132, 303, 306,
significación estadística, 313-314, 330-332
509, 579 girasoles, 132
tablas de probabilidad, 579 diferencia honestamente significante de
validez. Véase validez Tukey (DHS). Véase contrastes
correlación canónica, 356, 362 diferencial semántico, 96-97
covarianza, 299-300 diseño de investigación
cuadrados latinos. 52 e1eccl;>-, 24
cuadrículas de repertorio, 97-98 tipos, 46-71
cuasiexperimento. Véase método Diseños cruzados. Véase Diseños
cuestionario estructurado. Véase diseño(s)
planteamiento de preguntas anidados, 53, 66
Current Contents, 21, 22, 382 bivariables, 47
curtosis, 142-143, 423 bloques, 50
definición, 142 completamente factorial, 65
índice. 402-404 cruzado. 53
1eptocúrtica, 142-143 cuadrados latinos. 52
mesocúrtica, 142 cuasipanel, 57-58, 61
platicúrtica, 142-143 cuatro grupos de Solomon, 69
curva de Gauss. Véase distribución normal desequilibrados, 261-262
an_a_h_'tl_·c_o______________________~¡-639
________________________________ín_d_ic_e__

diseño(s) (continuación) diseños no pareados. Véase diseños entre


elección de, 24 sujetos
equilibrados, 54 diseños no relacionados. Véase diseños entre
estático, 57 sujetos
estudio de caso de una vez, 54, 55 diseños pareados. Véase diseños intrasujetos
experiment? clásico, 67 diseños relacionados. Véase diseños
grupo no equivalente, 57 intrasujetos
igualados, 50, 58, 62-63 distancia de Cook. Véase regresión
intrasUJétos. Véase diseños intrasujetos distribución de datos, 139-144
jerárquico, 53 distribución de medias, 175-176
mixtos, 51, 67-70 distribución normal, 139-140, 169, 242
multivariables,48 estandarizada, 171
panel, 59, 63 distribución t, 176-177
simple, 59 tablas de probabilidad, 551-553
distribuciones de chi cuadrada, 200
prepruebá, posprueba, 67
tablas de probabilidad, 554-555
serie de tiempo interrumpida, 64, 70
distribuciones de frecuencia, 122, 127-128,
serie de tiempo replicada, interrumpida,
148-149
70
distribuciones F
series de tiempo, 64, 70
tablas de probabilidades, 562-564
tipos, 46-71
divergencia. Véase validez
transversal, 56, 60
trazo dividido, 51, 67-70
univariables, 47 efecto principal
en el ANOVA, 260
diseños de grupos independientes. Véase
efectos de acarreo, 52-53
diseños entre sujetos
. efectos de orden
diseños de medidas repetidas. Véase diseños
definición, 51
intrasujetos
efecto de la fatiga, 51
diseños dependientes. Véase diseños
efecto de la práctica, 51
in trasujetos
efectos de piso, 29-30
diseños en bloque, 50
efectos de techo, 29-30
diseños entre sujetos, 49-50, 56-58, 60-62,
efectos en el entrevistador. Véase
65-66
planteamiento de preguntas
definición, 49-50
efectos simples, 288-296
diseños factoriales. Véase diseños entre diseños combinados, 294-296
sujetos diseños entre sujetos, 289-292
diseños intrasujetos, 51 -53, 59,63-64, 71 diseños intrasujetos, 292-294
defmición, 51 errores tipo 1, 296
~L----------------------~Í~n~di~c~e~a~n~al~ít~ic~o~----------------------------
efectos simples (continuación) error estándar
heterogeneidad de la varianza, 289-291 de la estimación. Véase validez
segmentación de la suma de cuadrados, de la medición. Véase confiabilidad
292 de la media, 175, 181-182
El Inteligente Hans, 15 error tipo l. Véase tipos de error
elección de la prueba error tipo JI. Véase tipos de error
contrastes, 283 escala de intervalos. Véase medidas
correlación, 317 escala de razón. Véase medidas
técnicas multivariadas, 362 escala nominal. Véase medición
una VI escala ordinal. Véase medición
dos niveles, 228 escalamiento multidimensional (EMD), 357-
más de dos niveles, 252 359,362
elementos de la población, 158-1 60 escalas continuas. Véase medidas
encuesta, 72, 85. Véase también escalas de actitud, 89-94
planteamiento de preguntas de Guttman. Véase planteamiento de
infonne, 382-383 preguntas
tamaño de la muestra requerido, 408-409 de Likert. Véase planteamiento de
encuestas postales. Véase planteamiento de preguntas
preguntas escalas de Thurstone. Véase
encuestas telefónicas. Véase planteamiento planteamiento de preguntas
de preguntas escalas de distancia social de Bogardus.
entrevistas cara a cara. Véase planteamiento Véase planteamiento de preguntas
de preguntas escalas de Guttman. Véase planteamiento de
preguntas
entrevistas estructuradas. Véase
planteamiento de preguntas escalas de Likert. Véase planteamiento de
preguntas
entrevistas libres. Véase planteamiento
esca1 ..: de medición, 108-114, 242
de preguntas: entrevistas no
escalas de Thurstone. Véase planteamiento
estructuradas
de preguntas
entrevistas no estructuradas. Véase
escalas dicotómicas. Véase medidas
planteamiento de preguntas
escalas discretas. Véase medidas
entrevistas semiestructuradas. Véase
esfericidad, 243-245, 266, 455-457
planteamiento de preguntas
estadística de rango estudentizado (q). Véase
épsilon de Greenhouse-Geisser, 244, 266,
contrastes
456-457
estadística inferencia!, 169
épsilon de Huynb-Feldt, 244, 266, 457
estudio piloto, 32
EQS, 361
en encuestas, 85
________________________________ín_d_ic_e_a_n_a_lí_ti_co______________________~~

estudios de caso, 9 H-F. Véase épsilon de Huynh-Feldt


ética, 13-17 heterogeneidad de varianza, 21 0-211 , 2 7 6-
etnografia. Véase observación 277
etogénica, 10-11 heterocedasticidad. Véase regresión
etología. Véase observación hipótesis
experimento. Véase método definición, 11
exposición direccional, 154
impartición, 385-:3~~ elección, 24, 44-45
preparación, 384-385 no direccional, 154
uso de ilustraciones, 386-389 hipótesis nula, 146, 150-152, 230, 273
extremos ANOVA, 232
definición, 117 x2, 221 -222
identificación, 139, 184- 185 correlación, 300-301, 322-323
definición, 44
prueba t entre sujetos, 206-207 -
F de Welch. Véase ANOVA
prueba t intrasujetos, 211
F-to-enter. Véase regresión
prueba U de Mann-Whitney, 215
F-to-remove. Véase regresión
hipótesis, prueba de, 146, 151-152
fi de Cramer. Véase correlación
de efecto nulo
fi. Véase correlación
poder necesario, 204
folletos, 386
definición, 44
forma alterna de la confiabilidad. Véase
direccional, 44, 154
confiabilidad no direccional, 44, 154
fracciones, 121 hipotético-deductivo, 12
histogramas, 124
G-G. Véase épsilon de Greenhouse-Geiss_er homogeneidad de varianza, 206, 242
girasoles. Véase 'diagramas de dispersión homocedasticidad. Véase regresión
grado de confianza, 167, 409-41 O
grados de libertad, 17 6-179 independencia de las puntuaciones, 195-196,
gráficas de barras, 123 -124, 134, 135, 137 242,243
gráficas de cuantil-cuantil normal, 144 índice riesgo/beneficio, 13
gráficas de líneas, 132- 137 influencia. Véase regresión
con intervalos de confianza, 182 inteligencia artificial, 4-5
con error estándar de la media, 181-182 interacción, 253 -255
gráficas de pastel, 125-127 intercepción. Véase regresión
creación, 398-399 interpolación lineal, 491, 549, 584-585
gráficas de tallo y hojas, 128-129 intervalo entre cuartiles. Véase medidas de
grupo control, 44, 56 dispersión
642l~----------------------~Í~nd~i~ce~an~a~h~'tl~·c~o____________________________
intervalos de confianza, 163-167, 181 medias
coeficientes de correlación, 323, 513-514 distribución, 175-176
coeficientes de regresión. 531-532 medición
defuüción, 163-164 en psicología, 24-26
efecto del grado de confianza, 409-41 O conducta encubierta, 25
en el metaanálisis, 369, 545 conducta abierta, 24
medianas, 183, 415 conducta verbal, 25
medias, 181, 182,413-415 escalas
proporciones, 164-167, 405-406 continuas, 112-113
investigación de razón, 110-113
objetivos, 1 dicotómicas, 112-113
etapas, 1, 18-33 discretas, 112-113
intervalo, l 09, 112, 113
nominales, 109-111, 113
kappa de Cohen. Véase correlación
ordinales, 109-111 , 113
indicadores, 112
lenguaje no sexista, 373 medidas
línea del mejor ajuste, 303, 329-331 , 523- elección, 25-26
524 confiabilidad. Véase confiabilidad
ecuación, 331, 523 medidas de dispersión, 118-121
LISREL (Linear Structural RELations), 361 desviación estándar, 120
cálculo, 395
conjunta, 434
MANCOVA, 348, 354, 362
desviación intercuartil, 121
MANOVA, 244, 248, 352-353, 362
máxima y mínima, 118
margen de error, 407
rango, 118-119
tamaño relativo de la muestra y de la
intercuartilar, 119
población, 407
varianza, 119-120
matriz de varianza-covarianza, 456
cálculo, '194-395
MDS. Véase escalamiento multidimensional
t.onjunta, 429
media. Véase medidas de tendencia central
medidas de tendencia central, 115-118
armónica. Véase medidas de tendencia media, 116
central: media armónica, 448-449, 583-584
de cuadrados, 230 cálculo, 394
recortada. Véase medidas de tendencia cálculo a partir de las frecuencias, 396
central desventajas, 117
mediana. Véase medidas de tendencia distribución, 175-176
central recortada, 117
-------------------------------2Ín=d~ic~e~a~n=a~lí~ti~co~--------------------_j~
medidas de tendencia central (continuación) ponderación, 366
mediana, 116-117 problema del archivero, 365-366, 369,
cálculo a partir de las frecuencias, 546-547
397-398 método
desventajas, 118 cuasiexpcrimental, 39-40, 53

-
modo, 117 definición, 5
desventajas, 118 definición, 2
promedio, 116 elección, 23
metaanálisis, 363-371, 535-547 experimental, 5
cálculo de un tamaño del efecto común, defmición, 3
536-538 observación. Véase observación
cálculo de una estadística de probabilidad definición, 4
común, 538-540 preguntas. Véase planteamiento de
clas ificación de estudios, 366 preguntas
combinación de probabilidades, 367, 544- definición, 3-4
545 razonamiento, 2

-
combinación de tamaños del efecto, 367, metodología Q, 94-96
543-544 métodos cualitativos, 2
comparación centrada, 369 definición, 2
definición, 8 ejemplos, 9-11
elección de la hipótesis por comprobar, métodos cuantitativos, 2
364 definición, 2
heterogeneidad de la probabilidad, 368, ejemplos, 3-9
542-543 mínima. Véase medidas de dispersión
heterogeneidad del tamaño del efecto, moda. Véase medidas de tendencia central
368, 540-542 modelación, 4, 360-362
homogeneidad de los estudios, 368 de ecuación estructural (MEE), 360-362
identificación de la investigación, 364 log-lineal, 351-352, 362
informe de resultados, 370-371, 383-384, modelo lineal general, 348
547 muestra
informes deficientes de estudios, 365, elección, 30-31, 80, 158-163, 408-409,
536 418-419
intervalo de confianza para el tamaño del muestras de probabi lidad. Véase muestreo
efecto, 369, 545 aleatorio
medición estándar de la probabilidad, 367 muestreo
medición estándar del tamaño del efecto, aleatorio. Véase muestreo aleatorio
367 no aleatorio. Véase muestreo no aleatorio
N fracaso-éxito, 369, 546-547 personas que no respondieron, 162

-
~~------------------------~~·n~d~~·c~e~a~n~a~lít~ic~o~----------------------------
muestreo aleatorio, I 59· I62 estructurada, 7-8, 101, 105-106
encuestas telefónicas, 160 etnografía, 1O, 1O1
estratificado, 161 etología, 1O1
desproporcionado, 161 infOimal, 101
proporcionado, 161 métodos de grabación, 102- 103
sistemático, 160-161 muestreo
muestreo de conglomerados, 161-162 continuo en tiempo real, 105
personas que no respondieron, 162 temporal de intervalo, 105
simple, 159 temporal de punto, 105
ventajas, 163 observador completo, 100
muestreo intencional. Véase muestreo no participante completo, l 00
aleatorio sistemática, 1Ol
muestreo no aleatorio, 162- 163 observación formal. Véase observación:
bola de nieve, 163 sistemática
dimensional, 163 observación participante. Véase observación:
muestra de cuota, 162- 163 etnografía
oportunidad, 162 ortogonalidad, 274-276, 492-493
prepositivo, 163
muestreo no probabilístico. Véase muestreo parámetros
no aleatorio definición, 157
multicolinealidad. Véase regresión estimación, 158, 195
multimodal, 118 pareado, 51
multivariable, 48, 350 igualación de precisión, 50
igualación de rango, 50
partición de tablas de contingencia, 497-500
niveles de las variables, 35
participantes
normal bivariable, 308-309
asignación, 49-54
normas, 169
elección, 30-31 , 39, 80-81, 158-163
números aleatorios
tratamiento, 14-16
tabla, 618-619
PCA. Véase análisis: del componente
principal
observación, 7-9, 100-106 placebo, 2
Análisis del Proceso d~ Interacción planteamiento de preguntas, 5-6
(API), 7, 106 ambientes, 74-80
casual, 101 anonimato de los encuestados, 76
ecológica, 1O1 confiabilidad de la medición, 87-88
el observador como participante, 100 control sobre el orden, 79-80
el participante como observador, 100 costo, 77-78
ít_ic_o____________________~j645
______________________________l_'n_dl_·c_e_a_na_l_

planteamiento de preguntas (continuación) de filtro, 82


cuadrículas de repertorio, 97-98 demográficas, 72
cuestionarios, 72-86 mal redactadas, 82-83
autoadministrados, 74-75 revisión de respuestas, 78-79
estructurados, 6, 73 supervisión de los entrevistadores, 78

-
diferencial semántico, 96-97 tasa de respuesta, 75-76
dimensiones, 88-89 población, 158-159
diseño del cuestionario, 84-85 poder
duración de la entrevista, 77 ANOVA, 246-247, 271, 584,586-588,
efectos del entrevistador, 76-77 603-611
elección de Friedman, 250, 464
de los participantes, 80-81 de K.ruskal-Wallis, 249
del ambiente, 80 de una vía, 246
encuestas, 72-85 intrasujetos, 246-247, 587-588
por correo, 75-76 multifactorial, 586-587
telefónicas, 75, 160 x , 201 -202, 221 , 594-602
2

entrevistas, 72-85 coeficiente de correlación producto mo-


cara a cara, 74 mento de Pearson (r), 308, 612-6 13
estructuradas, 6, 73 correlación (r), 307-308, 612-613
no estructuradas, 6, 73 definición, 188
semiestructuradas, 6, 73 eficiencia de poder, 2 16
escalas hipótesis de investigación, 192
de distancia social de Bogardus, 91 nivel a, 192
de Guttrnan, 88, 90-91 nive1recomendado, 189
de Likert, 88, 91-94 prospectiva, 189-190
de Thurstone, 88-90 prueba t
estudio piloto, 85 de un grupo, 192-193, 592-593
formato entre sujetos, 207, 590-591
elección del, 73-74 intrasujetos, 211-212, 214,592-593
medición de actitud, 87-94 prueba z de un grupo, 190-191, 416-418,
metodología Q, 94-95 588-589
motivación de los encuestados, 76 regresión, 342
muestra, 75, 80 retrospectivo, análisis de, 189, 193-194,
orden de las preguntas, 79-80, 85 214
preguntas rho de Spearman, 315
abiertas, 81 tamaño de la muestra, 192
cerradas, 8 1-82 tamaño del efecto, 192
confidenciales, 83-84 tau de Kendall, 315
'
646l~ _______________________í_nd_i_ce__a_na_l_ít_ic_o____________________________
poder discriminatorio, 94 prueba de comparación múltiple de Dunn.
poder estadistico. Véase poder Véase contrastes: t de Bonferroni
porcentajes, 121 prueba de contraste de Tukcy-Kramer. Véase
positivismo, 9 contrastes
preguntas abiertas. Véase planteamiento prueba de desequilibrio, 180
de preguntas prueba de dos colas, 154-15 5
preguntas cerradas. Véase planteamiento prueba de hipótesis, 146- 147
de preguntas nivel alfa, 151
preguntas de filtro. Véase planteamiento probabilidad critica, 150
de preguntas región de rechazo, 150
presentación mural, 389-390 significación estadística, 151
presentación verbal, 384-389 prueba de p robabilidad exacta de Fisber,
exposición, 385-386 225, 443-444
ilustración, 386-389 tablas de probabilidades, 559-560
preparación, 384-385 prueba de rangos con signo de Wilcoxon
préstamos interbibliotecarios, 22 para pares equiparados, 218-220,
probabilidad, 147-150 437-440
critica, 150 después del ANOVA de Friedman, 284
de r cuando H0 no es p = O, 322-323 poder, 218-219
problema del archivero. Véase metaanálisis puntuaciones empatadas, 220, 439-440
procedimiento, 31 reporte de resultados, 220
promedio, 116 significación estadística, 220, 438-440
proporciones, 121, 164-167, 405-406 suposiciones, 218
proyectores de transparencias, 386-389 tablas de probabilidad, 558
uso, 388 tamaño del efecto, 440
prueba prueba de una cola, 154-155
elección prueba de una sola muestra de
contrastes, 283 Kolmogorov-Smimov, 199, 424-425
correlación, 317 prueba rápida para la tabla de frecuencias de
multivariada, 361-362 dos por dos, 225-226
u na VI prueba t
dos niveles, 228 de un grupo, 176-180,4 13
más de dos niveles, 252 correlación parcial, 510
prueba de bondad de ajuste, 203-204, 424- grados de Libertad, 177-179
427 media de una sola muestra comparada
poder, 204 con la de la población, 176-180, 412-
prueba de cambio de McNemar, 226-227 4 13
significación estadistica, 227 relación con la razón F, 247
_____________________________í_nd_i_ce_a_n_a_lí_ti_co____________________~f647

prueba t (continuación) hipótesis nula, 215


reporte de resultados, 180 informe de resultados, 218
rho de Speannan, 506 poder, 216
significación estadística, 179-180, significación estadística, 217, 436
209-211,213-214, 551-553 supuestos, 215
tablas de poder, 592-593 tablas de probabilidad, 556-557
tablas de probabilidad, 552-553 tamaño del efecto, 215-216, 218,440
t de Welch, 21 O, 430-432 pruebas de tendencia, 284-288, 500-503
gl ajustados, 430-432 coeficientes lineales
intrasujetos, 211-214, 432-433 cálculo, 620-623
grados de libertad, 212, 551-553 ecuación general, 501-502
hipótesis nula, 211 intervalos desiguales, 503, 621-622
poder, 211-212,214 tabla de coeficientes, 624
significación estadística, 213-214, tendencia cuadrática, 285
551-553 tendencia cúbica, 286
tablas de poder, 592-593 tendencia lineal, 284-285
tamaño del efecto, 213-214, pruebas no paramétricas
585-586 correlación, 311 -317, 504-509
entre sujetos, 206-211, 428-432 diseños de una sola muestra, 199-204,
desviación estándar conjunta, 434 424-427
grados de libertad, 209-210 una VI con dos níveles, 215-227, 434-
heterogeneidad de varianza, 210-211 444
hipótesis nula, 206-207 una VI con más de dos niveles, 247-251,
poder, 207 458-466
efecto de una muestra desigual, 21 O pruebas paramétricas, 195-198
prueba t de Welch, 210, 430-432 definición, 195
significación estadística, 209-21 O, robustez, 197-198
552-553 suposiciones, 195-197
suposiciones, 206-207 pruebas t entre sujetos. Véase prueba t
tablas de poder, 590-591 pruebas z, 168-176
tamaño del efecto (el), 208-209, 433- de un grupo
434 elección del tamaño de la muestra,
varianza conjunta, 429, 434 418-419
prueba U de Mann-Whitney, 215-219,434- poder, 416-418
437 tablas de poder, 588-589
corrección para empates, 217, 436-437 media de la muestra comparada con la de
después de Kruskal-Wallis, 283-284 la población, 175-176,412-413
648lL______________________~f~nd~i~ce~an~a~h~'tl~·c~o____________________________
pruebas z (continuación) razón de error por familia, 273
para la media de la muestra, 175-176, razón F. Véase también ANOVA
411-412 tablas de probabilidad
para la prueba de rangos con signo de interpretación, 235
Wilcoxoo para pares equiparados, 220, relación con t, 247
438-440 redacción de un informe, 373-384
para la prueba U de Mano-Wbitney, 217- análisis y conclusión, 379-380
218, 436-437 apéndices, 381-382
para la rho de Spearman, 506 bibliografia, 380-381
para la tau de Kendall como correlación diseño, 376
parcial, 579 introducción, 375-376
para la tau de Kendall, 509 materiales y equipo, 377
método, 376-377
para una sola puntuación, 168-175, 411
participantes, 376-377
tablas de probabilidad, 550
sección de procedimiento, 377
una sola puntuación comparada con la
sección de resultados, 377-379
media de la población, 172-174, 411
síntesis, 374-375
psicología como ciencia, 11 -12
título, 374
PsychLit, 21, 364, 382
reduccionismo, 9
Psychological Abstracts, 21-22, 364
región de rechazo, 150, 154-155
publicaciones, 20, 382
definición, 150
punto biserial. Véase correlación regresión, 329-348, 522-532
puntuación z apalancamiento, 345-346
x
de 2 , 539 coeficiente beta. Véase regresión:
de la razón F, 539 coeficiente de regresión estandarizado
de r, 539 coeficiente de regresión estandarizado,
del valor d, 539 340-341, 527-528
del valor t, 538, 540 coeficiente estándar. Véase regresión:
significación estadística, 174-175 coeficiente de regresión estandarizado
valores negativos, 172, 551 coeficientes, 33 1, 523-524
puntuaciones estandarizadas, 184-185 intervalo de confianza, 531-532
significación estadística, 531
curvilinealidad, 345
Q de Cochran, 251, 464-466
de la media, 43
distancia de Cook, 345-346
R2 ajustada. Véase regresión división de los datos, 342
rango. Véase medidas de dispersión error estándar de un coeficiente de
razón de error por contraste, 273 regresión, 339, 528-529
-
r ------------------------------~Ín~d~ic~e~a~n~al_ít~ic~o--------------------~1649
regresión (continuación) raíz de la media de cuadrados del
error estándar. Véase regresión: error residuo, 340
estándar de un coeficiente de regresión residuos, 343
estadística PRESS, 343 estandarizados, 343-344
F que se elimina, 340 significación estadística, 332, 524-526
F que se introduce, 340 similitud con el ANOYA, 346-348
gráfica de residuos, 344-346 simple, 329-334, 522-528
heterocedasticidad, 344 ecuación, 33 1-332, 523-524
homocedasticidad, 344 vínculos con la correlación, 334, 526-
influencia, 345 528
intersección, 331, 523 tabla resumen, 333
intervalo de confianza para un coeficiente tablas de poder, 614-617
de regresión, 531 -532 tamaño de muestra, 341-342
linea del mejor ajuste, 330, 523 tamaño del efecto, 342, 586
lineal, 329 validación del modelo, 342-343
simple, 329 variable de criterio, 329

- logística, 355, 362


multicolinealidad, 341
múltiple, 334-348
variable de predicción, 329
variables ficticias, 346-348
verificaciones del diagnóstico, 343-346
ecuación, 334-335, 341 vínculos con la correlación, 334, 526-528
eliminación hacia atrás, 337 regresión logística, 355, 362
estadística, 337-340 regresión múltiple. Véase regresión
gradual, 338-340 regresión secuencial múltiple. Véase
interpretación, 340-341 regresión: múltiple: jerárquica
jerárquica, 337, 356 regresión simple. Véase regresión
que considera todos los subconjuntos, réplica de la condición, 49
337 réplica de un estudio, 39
R2 ajustada, 336 reseña narrativa, 1O
razonamiento, 334 resultados inesperados
secuencial, 337 trabajo con, 180
selección hacia delante, 337 retrospección, 16, 17, 139
tabla resumen, 335 revisión de la bibliografia, 19-22
tipos, 336-340 rho de Spearman. Véase correlación
uso, 334
poder, 342 serie de tiempo, 64, 70
pendiente, 331, 523 sesgo, 140-142, 144
R2 ajustada, 336, 528 índice. 402-403
65QlL----------------------~~~n~di~ce~a~na~l~ít~ic~o____________________________

sesgo (continuación) tablas 1, 551-553


negativo, 142,421 interpretación, 179-180, 551
positivo, 141-142,422 tablas z, 550
significación estadística interpretación, 172-173, 55 1
ANOVA, 235-236, 561-564 tamaño del efecto, 187-188
x2, 200-201, 554-555 (d), 187-188,208-209,213-214
correlación (r), 300-302 comparación entre dos condiciones
definición, 151 experimentales, 433-434
Kruskal-Wallis, 248 pequeño, mediano, grande, 188
limitaciones, 186 prueba t entre suje.tos, 208
prueba de rangos con signo de Wilcoxon prueba t intrasujctos, 213-214, 585-
para pares equiparados, 220, 438-439 586
prueba t entre sujetos, 209-21 O (r), 308
prueba 1 intrasujetos, 213 de x2, 537
prueba U de Mann-Whitney, 217, 436 de un valor d, 537
regresión, 332-333 de un valor t; 536-538
rho de Spearman, 313, 506 de un valor z, 537
tamaño del efecto de la muestra, 186 de una razón F, 536-537
tau de Kendall, 313-314,509 pequeño, mediano, grande, 308
simetría compuesta. Véase ANOVA: (w), 20 1,22 1, 224,3 16
esfericidad pequeño, mediano, grande, 20 l
Social Science Citation Jndex (SSCI), 21, ANOVA ('11 2), 246,271
22,364 pequeño, mediano, grande, 246, 586
SPSS (paquete estadístico para las ciencias correlación (r) . Véase tamaño del
sociales), 211 , 244,401,402 efecto: (r)
Stat View, 138 defini~ión, 187
suma de cuadrados, 230, 446 diferencia entre dos 1nedias. Véase
suma de las desviaciones al cuadrado, 230, tamaño del efecto: (d)
446 importancia, 188
SuperAnova, 244 prueba de rangos con signo de Wi1coxon
para pares equiparados, 440
t de Bonferroni. Véase contrastes prueba t entre sujetos. Véase tamaño del
t de Dunnett. Véase contrastes efecto: (d)
t de Scheffé. Véase contrastes prueba t intrasujetos. Véase tamaño del
T2 de Hotelling, 352, 362 efecto: (d)
tablas de contingencia, 122-123, 220-226 prueba t. Véase tamaño del efecto: (d)
tablas de probabilidad, 582 prueba U de Mann-Whitney, 440
------------------------------~Ín~d~ic~e~an~a~ll~,t~ic~o--------------------~~
tamaño del efecto (continuación) Validez
pruebas de x2 . Véase tamaño del de constructos, 28
efecto: (w) convergente, 28
R2,342 divergente, 28
pequeño, mediano, grande, 342, 586 de contenido, 28
regresión. Véase tamaño del efecto: R2 de criterio, 29
tau de Kendall. Véase correlación concurrente, 29
técnicas multivariadas predictiva, 29
elección, 361 -362 de finición , 27
ventajas, 351 error estándar de la estimación, 328, 339,
tema 520-521
elección, 18-22 potente, 27
tendencia cuadrática. Véase pruebas de validez concurTente. Véase validez
tendencia validez de contenido. Véase validez
tendencia cúbica. Véase pruebas de validez de los diseños de investigación, 37-
tendencia 44
validez ecológica, 3, 37
tendencia lineal. Véase pruebas de tendencia
validez externa, 37-39
teorema del límite central, 197
amenazas, 37-39
teoría del constructo personal de Kelly, 97-
ambiente, 38
98,356
tareas, 37
tipos de error
tiempo, 38
error tipo I, 152, 189, 230
definición, 37
error tipo ll, 152, 188-189
mejoramiento, 39
tra_nsforrnación de datos, 198, 345, 420-424
validez interna, 39-44
curtosis, 423
amenazas, 40
datos bivariados, 423-424
compensación, 42
sesgados negativamente, 421
desmoralización. 43
sesgados positivamente, 422-423 historia, 40-41
transformación de Fisher, 322, 323, 367, imitación, 42
513, 540-541 instrumentación, 41 , 326
ecuación, 624-625 maduración, 40
tabla, 626 mortalidad, 41
transparencias para proyectores prueba, 41
uso, 388 regresión a la media, 43
triangulación, 23, 1O1 rivalidad compensatoria, 42
selección por maduración, 42
validez (de medidas), 27-29, 328 selección, 40
~L_________________________I_'n_d _ic_e_a_n_a_lí_ti_c_o _______________________________

validez interna (continuación) de confusión, 36


definición, 39-40 dependientes, 36
mejoramiento, 44 ficticias, 251 , 346, 464-465
validez nominal. Véase validez fijas , 35
validez predictiva. Véase validez independientes, 34-35
validez relacionada con los criterios. Véase irrelevantes, 36-37
validez latentes, 355 , 357, 362
variables, 34-37 varianza. Véase medidas de dispersión
aleatorias, 35 conjunta, 429

Potrebbero piacerti anche