Sei sulla pagina 1di 191

ESTADÍSTICAS

APLICADAS EN
PSICOLOGÍA
Ciencias sociales y Educación

PSIC. GERARDO A. VALDERRAMA M .

DICIEMBRE 2011
ESTADÍSTICAS APLICADAS EN

PSICOLOGÍA

Ciencias Sociales y Educación

Psic. Gerardo A. Valderrama M.

Diciembre, 2011
TABLA DE CONTENIDO

DEDICATORIA
AGRADECIMIENTO
PRÓLOGO
INTRODUCCIÓN
CAPÍTULO 1 ESTADÍSTICAS Y PSICOLOGÍA ........................................................................................ 1
ESTADÍSTICAS E INVESTIGACIÓN ......................................................................................................... 2
Etapa 1 ....................................................................................................................................................... 3
Etapa 2 ....................................................................................................................................................... 3
Etapa 3 ....................................................................................................................................................... 5
CONCEPTOS IMPORTANTES .................................................................................................................... 7
CAPÍTULO 2 LA NATURALEZA DE LAS ESTADÍSTICAS .................................................................... 2
LAS POBLACIONES .................................................................................................................................... 4
MEDICIÓN DE LAS VARIABLES PSICOLÓGICAS ................................................................................. 5
ESCALAS DE MEDICIÓN ........................................................................................................................... 5
CONCEPTOS IMPORTANTES .................................................................................................................... 7
CAPÍTULO 3 ORGANIZACIÓN DE DATOS DISTRIBUCIONES DE FRECUENCIAS ..................... 8
CONCEPTOS IMPORTANTES .................................................................................................................. 13
EJERCICIOS PRÁCTICOS ......................................................................................................................... 14
Problema 1 ............................................................................................................................................... 14
Problema 2 ............................................................................................................................................... 14
Problema 3 ............................................................................................................................................... 14
CAPÍTULO 4 REPRESENTACIONES GRÁFICAS .................................................................................. 15
GRÁFICO DE BARRAS.............................................................................................................................. 16
HISTOGRAMA ........................................................................................................................................... 17
POLÍGONO DE FRECUENCIAS ............................................................................................................... 19
GRÁFICO DE FRECUENCIAS ACUMULADAS U OJIVA ...................................................................... 21
DIAGRAMA DE TALLO Y HOJAS ........................................................................................................... 22
LOS ORDENADORES Y LAS GRÁFICAS................................................................................................ 23
CONCEPTOS IMPORTANTES .................................................................................................................. 24
EJERCICIOS PRÁCTICOS ......................................................................................................................... 25
Problema 1 ............................................................................................................................................... 25
Problema 2 ............................................................................................................................................... 25
CAPÍTULO 5 MEDIDAS DE TENDENCIA CENTRAL ........................................................................... 26
LA MEDIA ARITMÉTICA ......................................................................................................................... 26
La media aritmética para distribuciones de frecuencias ......................................................................... 27
La media aritmética y los métodos abreviados ........................................................................................ 28
LOS PROMEDIOS DE POSICIÓN ............................................................................................................. 29
La mediana (mdn) .................................................................................................................................... 29
La moda ( ) .......................................................................................................................................... 32
COMPARACION DE LA MEDIA, LA MEDIANA Y LA MODA ............................................................. 34
CONCEPTOS IMPORTANTES .................................................................................................................. 35
EJERCICIOS PRÁCTICOS ......................................................................................................................... 36
Problema 1 ............................................................................................................................................... 36
CAPÍTULO 6 MEDIDAS DE VARIABILIDAD ......................................................................................... 37
MEDIDAS DE VARIABILIDAD QUE NO SE ASOCIAN CON LA MEDIA ARITMÉTICA .................. 37
La Fluctuación (Amplitud) ....................................................................................................................... 37
Los Percentiles ......................................................................................................................................... 38
MEDIDAS DE VARIABILIDAD QUE SE ASOCIAN CON LA MEDIA ARITMÉTICA ......................... 40
La Desviación Media ............................................................................................................................... 40
Desviación Estándar O Típica ................................................................................................................. 41
La Asimetría ............................................................................................................................................. 43
La Curtosis ............................................................................................................................................... 44
CONCEPTOS IMPORTANTES .................................................................................................................. 45
EJERCICIOS PRÁCTICOS ......................................................................................................................... 46
Problema 1 ............................................................................................................................................... 46
CAPÍTULO 7 MODELOS POBLACIONALES PROBABILÍSTICO ...................................................... 47
VARIABLES DISCRETAS ......................................................................................................................... 48
La Distribución Binomial ......................................................................................................................... 48
VARIABLES CONTÍNUAS ........................................................................................................................ 49
Puntuaciones estándar ............................................................................................................................. 49
La Distribución Normal ........................................................................................................................... 51
Aproximación Normal De La Distribución Binomial .............................................................................. 56
CONCEPTOS IMPORTANTES .................................................................................................................. 58
EJERCICIOS PRÁCTICOS ......................................................................................................................... 59
Problema 1 ............................................................................................................................................... 59
Binomial ................................................................................................................................................... 59
Aproximación Normal A La Binomial ...................................................................................................... 60
CAPÍTULO 8 CORRELACIÓN Y REGRESIÓN ...................................................................................... 61
CORRELACIÓN MÚLTIPLE ..................................................................................................................... 71
Como Interpretar El Coeficiente De Correlación. ................................................................................... 72
REGRESIÓN LINEAL SIMPLE. ................................................................................................................ 73
Error Típico De La Estimación ................................................................................................................ 75
CONCEPTOS IMPORTANTES .................................................................................................................. 77
EJERCICIOS PRÁCTICOS ......................................................................................................................... 78
Problema 1 ............................................................................................................................................... 78
CAPÍTULO 9 ESTADÍSTICA INFERENCIAL Y PROBABILIDADES ................................................. 79
TEORÍA DE LA PROBABILIDAD (TP)..................................................................................................... 80
El Experimento Aleatorio ......................................................................................................................... 81
Probabilidad ............................................................................................................................................ 83
Axiomas De Probabilidad ........................................................................................................................ 84
ASPECTOS BÁSICOS EN ELCÁLCULO DE PROBABILIDADES ......................................................... 85
CONCEPTOS IMPORTANTES .................................................................................................................. 89
EJERCICIOS PRÁCTICOS ......................................................................................................................... 90
CAPÍTULO 10 DE LA POBLACIÓN A LA MUESTRA ........................................................................... 92
¿QUÉ ES UNA VARIABLE ALEATORIA? ........................................................................................................... 92
¿QUÉ ES UNA DISTRIBUCIÓN MUESTRAL DE PROBABILIDADES? ................................................................... 94
ESTIMACIÓN ESTADÍSTICA ................................................................................................................... 97
Estimación Puntual: ................................................................................................................................. 97
Estimación Por Intervalos: ...................................................................................................................... 97
MÉTODOS DE MUESTREO ...................................................................................................................... 99
Muestreo No Aleatorio:.......................................................................................................................... 100
Muestreo Aleatorio: ............................................................................................................................... 100
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: N .................................................................... 103
Tamaño De Población Desconocido ...................................................................................................... 104
Tamaño De Población Conocido ........................................................................................................... 104
CONCEPTOS IMPORTANTES ................................................................................................................ 105
EJERCICIOS PRÁCTICOS ....................................................................................................................... 106
CAPÍTULO 11 INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS ..................................................... 109
LA PRUEBA DE HIPÓTESIS ................................................................................................................... 110
PASO 1: Hipótesis Estadística ............................................................................................................... 111
PASO II: Nivel De Significación ............................................................................................................ 112
PASO III: Estadístico De Prueba........................................................................................................... 116
PASO IV: Regla De Decisión ................................................................................................................. 117
PASO V: Aplicación de la Prueba Estadística ....................................................................................... 117
PASO VI: Decisión................................................................................................................................. 118
CONCEPTOS IMPORTANTES ................................................................................................................ 118
CAPÍTULO 12 PRINCIPALES TIPOS DE PRUEBA DE HIPÓTESIS ................................................. 119
PRUEBAS DE HIPÓTESIS PARA POBLACIONES O DATOS DISTRIBUIDOS NORMALMENTE. . 119
El Caso De Una Media Poblacional ...................................................................................................... 119
El Caso De Dos Medias Poblacionales ................................................................................................. 121
PRUEBA DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS................................................................... 123
Grados De Libertad ............................................................................................................................... 123
La Prueba “t” de Student ...................................................................................................................... 125
Prueba “t” para el caso de una media poblacional .............................................................................. 126
Prueba “t” para el caso de dos medias independientes ........................................................................ 127
Prueba “t” para dos muestras correlacionadas .................................................................................... 129
Prueba “t” para correlaciones .............................................................................................................. 131
CONCEPTOS IMPORTANTES ................................................................................................................ 132
EJERCICIOS PRÁCTICOS ....................................................................................................................... 133
Muestras grandes: pruebas de hipótesis para medias ........................................................................... 133
Muestras pequeñas: pruebas de hipótesis para medias y correlaciones ............................................... 134
CAPÍTULO 13 ANÁLISIS DE LA VARIANZA ....................................................................................... 136
LA DISTRIBUCIÓN F ............................................................................................................................... 136
Principios del ANOVA ........................................................................................................................... 138
Anova Simple o en un solo sentido ......................................................................................................... 139
La Prueba de comparación de dos medias de Tukey. ............................................................................ 143
Anova Factorial (dos o más variables independientes) ......................................................................... 145
CONCEPTOS IMPORTANTES ................................................................................................................ 152
EJERCICIOS PRÁCTICOS ....................................................................................................................... 153
Análisis de la Varianza Simple o de Un Solo factor .............................................................................. 153
APÉNDICE 1 DISTRIBUCIÓN NORMAL ............................................................................................... 157
APÉNDICE 2 VALORES CRÍTICOS DE LA DISTRIBUCIÓN T DE STUDENT .............................. 158
APÉNDICE 3 VALORES CRÍTICOS DE LA DE DISTRIBUCIÓN F DE FISHER ............................ 159
APÉNDICE 4 PROBABILIDADES BINOMIALES ................................................................................. 163
APÉNDICE 5 DISTRIBUCIÓN T DE STUDENT: SIGNIFICANCIA DE CORRELACIONES DE
PEARSON ..................................................................................................................................................... 168
APÉNDICE 6 VALORES CRÍTICOS DEL ESTADÍSTICO DE Q ........................................................ 169
APÉNDICE 7 TABLA DE NÚMEROS AL AZAR ................................................................................... 170
BIBLIOGRAFÍA .......................................................................................................................................... 174
DEDICATORIA

Quiero dedicar esta obra, a mi querida esposa

Bedsy Anais, a mis hijas e hijos: Lisbet, Marta,

Gerardo y Juan Carlos, símbolos permanentes

de mi existencia, mis principios y mi amor por

la vida.
AGRADECIMIENTO

Esta obra no se hubiera podido haber completado, sin la colaboración permanente de la Psicóloga
Elsa I. Fajardo, Magister en Estadísticas Aplicadas, quien colaboró desde un principio con el
desarrollo de este trabajo a través de sus observaciones, críticas y evaluaciones técnicas, de manera
desinteresada, honrada y motivadora.

Es necesario extender este agradecimiento al Psicólogo Rubén Díaz, quien aportó en el desarrollo
de esta obra, además de sus conocimientos en el área, una dimensión técnica de presentación de
gráficos, cuadros y fórmulas, que me ayudaron a enriquecer el objetivo principal de esta obra:
llegar a mis estudiantes con la mayor claridad y objetividad posible.

También deseo expresar mi gratitud, a mis estudiantes de las Escuelas de Psicología de la


Universidad de Panamá y la Universidad Católica Santa María La Antigua, quienes han sido a lo
largo de estos años de docencia, mi fuente de inspiración para transmitir, de la manera más
eficiente, la importancia que tiene una especialidad, considerada por la mayoría como difícil, pero
insustituible en el desarrollo de la investigación del comportamiento: las estadísticas.

Gerardo A. Valderrama M.
PRÓLOGO

La presente obra es un texto de estadísticas descriptivas e inferenciales dirigida especialmente a los


futuros psicólogos, estudiantes de licenciatura en Psicología. La finalidad principal es ofrecer a los
estudiantes un libro que integre las herramientas de análisis estadísticos y sus aplicaciones a su
quehacer profesional.

Su autor ha dedicado más de 30 años de su vida a la docencia en materia de Estadísticas,


Investigación y Medición Psicológica así como una invaluable experiencia en numerosas
investigaciones a nivel nacional e internacional. Su amplia experiencia y estudios garantizan que la
presente obra cuente con el rigor estadístico y aplicación psicológica necesarias tanto para el
público objetivo de la misma, como para cualquier otro profesional de las Ciencias Sociales que
requiera este nivel de conocimientos.

Este libro permite adentrarse en el ámbito de la ciencia, la psicología, la investigación del


comportamiento humano y a la vez aplicar los modelos y análisis estadísticos pertinentes.

El texto va desde un nivel introductorio sobre la relación inherente de la ciencia, la psicología, la


medición del comportamiento y la naturaleza estadística de los datos hasta llegar a los distintos
análisis estadísticos que aplican desde los más básicos (resumen de datos en tablas, gráficas,
medidas de tendencia, forma y variabilidad) hasta un mayor nivel de complejidad (modelos
poblaciones de probabilidades y pruebas de hipótesis).

El texto es de fácil manejo y con suficientes definiciones, demostraciones y prácticas para que el
estudiante logre aprehender su contenido. Por su amigable lenguaje y ejemplos aplicados, requiere
una preparación matemática básica.

Esta obra logra abordar temas extremadamente densos y complejos como las pruebas de hipótesis y
el análisis de varianza pero tomando de cada uno lo medular: concepto, aplicación, cálculo e
interpretación de manera inusualmente práctica y manejable. Sin perder, el rigor estadístico
requerido.

En resumen, esta obra académica constituye una alternativa de aproximación para la integración de
la teoría psicológica, la práctica y la investigación.

Elsa Isabel Fajardo


Lcda. en Psicología
Mgtra. en Estadísticas Aplicadas
INTRODUCCIÓN

Al iniciar un curso de estadísticas aplicadas en psicología, es frecuente que algunos estudiantes se


me aproximen y cuestionen sobre la pertinencia de las matemáticas, específicamente, de las
estadísticas, en los estudios relacionados con las ciencias del comportamiento. Es evidente que aún,
algunos estudiantes conciben a la psicología como una especialidad teórico-práctica, cuyo objetivo
principal es la atención de los problemas de los sujetos, ya sean de carácter individual y/o grupal,
exenta de aspectos cuantitativos que impliquen cuantificación y manipulación matemática.
Además, por lo general los estudiantes que ingresan a psicología no son “fanáticos” de las
matemáticas y mantienen una actitud poco favorable para el estudio sistemático de la misma. Sin
embargo, no puedo negar que hay un cambio de actitud en lo referente a la importancia que se le da
a las estadísticas en la formación profesional del psicólogo; no hay alternativa, si queremos ser
competentes y competitivos.

En la década de los 80, cuando la Escuela de Psicología de la Universidad de Panamá formaba parte
de la Facultad de Filosofía, Letras y Educación, confeccionamos un “folleto” que denominamos:
Estadística Descriptivas Aplicadas en Psicología,, con el cual intentamos aproximarnos
académicamente, a nuestros estudiantes, transmitiéndole nuestros conocimientos, inquietudes y
actitudes hacia esta asignatura, en un lenguaje más amistoso, y más propio de nuestra cultura y de
mi perspectiva personal de la materia. El folleto fue exitoso desde el momento en que muchos
estudiantes lo obtuvieron y lo utilizaron, ya sea como texto o como apoyo bibliográfico para
reforzar su proceso de aprendizaje.

Es importante destacar que siempre han existido excelentes textos de estadísticas al alcance de
nuestros estudiantes, inclusive haciendo énfasis en su aplicabilidad en las ciencias del
comportamiento. Más sin embargo, desde mi punto de vista, los mismos por lo general estaban
polarizados: por un lado, encontramos los cargados en matemáticas que eran un verdadero dolor de
cabeza para los estudiantes; y por otro, aquellos que consideraban a los estudiosos de la psicología,
sujetos incapaces de aproximarse exitosamente a los procesos de razonamiento numérico, y se
caracterizaban por su exagerada simplicidad, convirtiéndolos en textos con muy poco nivel
cuantitativo. El detalle estaba en lograr concebir un texto que, sin caer en exigencias matemáticas
innecesarias, pero respetando su pertinencia, tanto teórica como práctica, favoreciera el estudio
sistemático de las estadísticas y permitiera al estudiante su aplicación, con validez, sistematización
y sustento científico.

A continuación presentamos de manera experimental, nuestra concepción de las estadísticas


básicas que deben ser dominadas por un profesional de la psicología. Está escrito con nuestras
propias palabras, actitudes, sentimientos y emociones; tal y como me dirijo al estudiante en el aula
de clases. Espero que esta forma de comunicación mejore el interés de los estudiantes hacia la
asignatura, reduzca un poco la brecha que hay en términos de razonamiento cuantitativo y
modifique las actitudes hacia esta importante asignatura, cuyo conocimiento es inevitable para todo
aquel profesional de las ciencias del comportamiento, respetuoso de sus obligaciones hacia sus
pacientes y la sociedad…. Pero no olvide esta premisa: mientras más conocimientos tenga en el área
de las matemáticas, y mejor actitud manifieste hacia la utilización de las mismas en la profesión,
indudablemente que será un mejor psicólogo…no le quepa la menor duda.
El presente texto, que hemos denominado: Estadísticas Aplicadas en Psicología…Ciencias
Sociales y Educación, consta de 13 capítulos de estadísticas aplicadas formales y un capítulo de
problemas y ejercicios. Los 13 capítulos están organizados de tal manera, que permiten dividir los
contenidos en las dos grandes áreas de conocimientos y estudio de las estadísticas: la descriptiva y
la inferencial. Además, antes de adentrarnos en el procesamiento y análisis de datos, intentamos
una importante aproximación a la investigación aplicada en psicología, que en mi opinión
representa el más alto nivel de desarrollo profesional en esta especialidad (junto con la
investigación básica o pura). La estadística es una herramienta fundamental en el desarrollo de la
actividad científica para los psicólogos. Dos aspectos ineludibles de la esta profesión están
fundamentados en las estadísticas: la medición del comportamiento, desde sus perspectivas teóricas
y prácticas, y la investigación científica.

El área de la estadística descriptiva la comprenden los capítulos que se refieren a la naturaleza de


las estadísticas (2), la organización de datos (3), las representaciones gráficas (4), las medidas de
tendencia central (5), las medidas de variabilidad (6), los modelos poblacionales (7) y la correlación
y regresión (8). En estos capítulos presentamos, analizamos, discutimos y desarrollamos ejercicios,
con el objetivo de que el estudiante comprenda de qué manera se le hace frente a la información
cuantitativa que se utiliza en los diversos estudios comportamentales; todo proceso de análisis
estadístico requiere de la descripción de los datos, esto es ineludible.

La estadística inferencial está desarrollada en los capítulos de estadística inferencial y


probabilidades (9), de la población a la muestra (10), introducción a la prueba de hipótesis (11),
principales tipos de pruebas de hipótesis (12) y

análisis de la varianza (13). En esos capítulos compartimos nuestras experiencias y conocimientos


en lo referente al estudio de las poblaciones a través de muestras, que es el procedimiento más
efectivo para investigar los grandes conjuntos de datos. Esta situación obliga al psicólogo a
comprender que entre la población y la muestra hay diferencias, y que si está verdaderamente
interesado en interpretar correctamente los resultados, debe saber comprender e interpretar estas
diferencias, a través de la comprensión del papel que juega en las decisiones de la psicología, la
teoría de la probabilidad; esto es en el fondo, el objetivo que tratamos de alcanzar con estos
capítulos de introducción a la inferencia estadística

Este libro es muy sencillo en comparación con otros, es menos matemático en comparación con
otros, respeta la cuantificación y la importancia de las matemáticas en la actividad del psicólogo en
comparación con otros. Sin embargo está hecho con amor y respeto hacia los estudiantes y hacia
los conocimientos que intento representar. Pedimos disculpas por los errores que encuentren a lo
largo de la lectura y estamos totalmente anuentes a las observaciones que tengan a bien
hacernos……..Y no olviden: más conocimientos y mejor actitud hacia la investigación cuantitativa,
mayores probabilidades de éxito profesional, especialmente en las áreas referentes al
comportamiento humano.

Gerardo Abraham Valderrama Morales.


1

CAPÍTULO 1
ESTADÍSTICAS Y PSICOLOGÍA

Al iniciar un curso de estadísticas para estudiantes de psicología, es frecuente que algunos de ellos,
intrigados, pregunten la razón por la cual en esta especialidad es necesario estudiar una asignatura
con un contenido cuantitativo importante. La concepción generalizada es que la psicología es una
especialidad teórico-práctica, cuyo objetivo principal es “atender” problemas de conducta, tanto
individuales como grupales, sin la participación de elementos cuantitativos; seamos más objetivos,
sin matemáticas.

Esta actitud de duda, y en algunas ocasiones de rechazo, está relacionada con la experiencia y
formación previa de muchos estudiantes en al área de las matemáticas, la cual con mucha frecuencia
ha sido dolorosa y de aporte limitado, en cuanto al desarrollo del conocimiento. Es común en los
estudiantes una actitud de temor y poco interés hacia esta área científica. La situación anteriormente
descrita no es exclusiva de los estudiantes, al observarse la misma en algunos profesionales del área
del comportamiento en cualquiera de sus especialidades, haciendo más difícil la transmisión del
conocimiento de los temas que involucran la cuantificación al momento de estudiarse el
comportamiento humano.

Sin embargo, a pesar de lo anteriormente señalado, la mayoría de los especialistas en el


comportamiento coinciden en que la psicología dio sus primeros pasos como una ciencia, a partir
del momento en que logró aplicar el método científico. En mi opinión, esto sucedió específicamente
en el momento en que se logró definir los conceptos teóricos presentes en las teorías de manera
operacional, lo cual trajo como consecuencia inevitable: la medición del comportamiento. A partir
de esta situación, la psicología contó con una nueva herramienta que favoreció la transición de la
especulación a la observación más directa y natural de los fenómenos comportamentales, y su
posterior análisis objetivo y preciso. Había nacido la psicología científica.

La medición psicológica, a través de las definiciones operacionales, permitió adscribirle valores


numéricos, no solamente a algunos fenómenos de observación directa asociados con el
comportamiento tales como la estatura, el peso corporal, la presión sanguínea, etc., sino a otros que
no se pueden observar directamente con tanta facilidad, tal y como sucede con factores
comportamentales tales como la inteligencia, las actitudes, las aptitudes, y otros. De esta manera,
las matemáticas se convirtieron en colaboradoras permanentes de la investigación psicológica en la
solución de sus problemas: la comprobación científica, era una realidad.

Las estadísticas aplicadas han resultado ser el conjunto de técnicas matemáticas de mayor eficiencia
en la investigación psicológica. Ya Lun Chou (1972) presentó una definición del término
estadística muy importante para los investigadores en general y en especial, para los psicólogos:

“la estadística es un método empleado en la toma de decisiones frente a la


incertidumbre, partiendo de datos numéricos y calculando los riesgos”
2

Esta definición cuenta con cuatro elementos fundamentales, a través de los cuales se justifica
plenamente la pertinencia de las estadísticas en la investigación psicológica: toma de decisiones,
incertidumbre, datos numéricos y riesgos; veamos su relación con la psicología.

La psicología es una ciencia muy especial. No cuenta con un cuerpo único y universal de teorías e
hipótesis; por el contrario, cuenta con un número plural de éstas, a través de los cuales se intenta
describir, explicar, analizar e interpretar la conducta del hombre; la psicología cuenta con muchas
corrientes o escuelas. Lo importante de esta situación es que todas funcionan a niveles teóricos y
que requieren, constantemente de comprobación y evaluación de sus postulados teóricos y
epistemológicos. En otras palabras, el psicólogo se enfrenta constantemente a la toma de
decisiones sin importar a que corriente psicológica pertenezca o en qué área de la psicología esté
laborando. Todo problema del comportamiento, ya sea individual o grupal, requiere de una toma de
decisión, y muchos de ellos necesitan la cuantificación de sus variables y el análisis estadístico
requerido para lograr una solución científicamente acertada.

Los problemas asociados con el comportamiento no son estáticos, muy por el contrario, son muy
dinámicos. Son universales pero pueden diferir de sujeto a sujeto, de sociedad a sociedad, de
población a población, de muestra a muestra; lo que es válido para un grupo no lo es para otros, lo
que se logró demostrar hoy, no se repite en las mismas condiciones mañana, y así sucesivamente. El
psicólogo se enfrenta a la incertidumbre propia de los fenómenos conductuales, la cual ha
encontrado en la teoría de la probabilidad un modelo de explicación, evaluación e investigación; la
conducta no es exacta en su medición y evaluación, sino aproximada. La conducta es
probabilística.

La psicología, a través de las escalas de medición, ha logrado asignarle valores numéricos a sus
constructos teóricos cuando éstos se han definido operacionalmente, favoreciendo de esta manera la
evaluación del comportamiento con niveles de objetividad muy satisfactorios. Partiendo de la
premisa de que la medición del comportamiento no es exacta sino aproximada, las estadísticas
aplicadas a la investigación del comportamiento han logrado incorporar el concepto de
probabilidad a la medición y evaluación comportamental. El análisis estadístico ha permitido
calcular los riesgos propios de esta actividad, favoreciendo la minimización de los errores y la
disminución de la incertidumbre al momento de la toma de decisiones.

Las estadísticas están estrechamente ligadas con la psicología, en la medida en que los estudiantes,
profesores y especialistas del comportamiento, en cualquiera de sus áreas e independientes de su
formación, le den relevancia a la investigación científica y consideren esta actividad, el método más
adecuado para conocer y comprender el comportamiento humano. En tal caso, las estadísticas serán
la mejor herramienta para la evaluación comportamental precisa., válida y confiable.

ESTADÍSTICAS E INVESTIGACIÓN

Partiendo de la premisa de que la investigación científica es una actividad fundamental en el


desarrollo de la psicología, y de que las estadísticas son herramientas básicas en la investigación del
comportamiento, a continuación presentamos un resumen de los principales pasos a seguir en el
proceso de investigación. Además, intentaremos ir señalando los momentos en que el investigador
3

debe ir tomando en consideración los procedimientos estadísticos requeridos para la ejecución


exitosa de una investigación.

Etapa 1

1. Planteamiento del problema

Toda investigación nace a partir del planteamiento de un problema que requiere una solución. En el
caso de los estudiantes, y principalmente por falta de experiencia, el problema nace de la intuición,
de sus intereses personales o sencillamente porque se le ocurrió. Con mucha frecuencia, cuando los
problemas a investigar nacen de alguna de las formas anteriormente señaladas, se presentan
problemas de orden metodológico que dificultan el desarrollo del estudio.

Los problemas a investigar no se inventan, ellos existen; el detalle está en tener la habilidad para
detectarlo y definirlo con claridad y objetividad, evitando confusiones y tratando de hacerlo lo más
sencillo posible: el principio de la parsimonia. La observación, la lectura especializada, el estudio
constante y sistemático y la discusión científica objetiva y desapasionada, son fuentes inagotables
de ideas que pueden cristalizar en problemas de investigación genuinos.

2. Revisión Bibliográfica

Una vez planteado el problema, es necesaria una revisión exhaustiva de la información científica
recabada sobre el problema planteado: investigaciones previas, teorías, ensayos, conferencias,
entrevistas personales, y toda fuente de información que brinde información objetiva y científica. El
objetivo principal de esta revisión, es el de encontrar (descubrir) posibles soluciones, variables y sus
relaciones, explicaciones teóricas (modelos), que permitan al investigador desarrollar una
explicación coherente y científica de los factores que inciden en el problema planteado y que a la
vez favorezcan el desarrollo de un modelo teórico aplicable a dicho problema; a esta estructura se le
llama con frecuencia Fundamentación Teórica del Problema. A través de esta figura, el
investigador crea un modelo teórico que debe explicar de manera organizada la estructura dinámica
del problema (variables y relaciones) y debe plantear una posible solución al mismo. De aquí se
desprenden las hipótesis de investigación.

En la actualidad, gracias al desarrollo de la tecnología, el conocimiento es más fácil de obtener que


en décadas pasadas, en las cuales los investigadores sólo dependían de las bibliotecas, librerías,
congresos, etc., para la consecución de los últimos conocimientos científicos. Con el desarrollo de
los ordenadores y el advenimiento del Internet, el conocimiento está a la vuelta de un “click”, que
permite accesar fuentes inagotables de información al servicio de la investigación científica.

Etapa 2

Metodología

Luego de planteado el problema, fundamentado teóricamente tras una revisión bibliográfica


efectiva, y planteadas las correspondientes hipótesis, la siguiente etapa consiste en establecer
sistemáticamente los procedimientos, las técnicas, la logística y los controles requeridos para llevar
adelante el estudio, preferiblemente en una muestra de sujetos seleccionados de la población
4

pertinente al problema de investigación. Esta fase se conoce como metodología y a continuación


presentamos algunas características de la misma.

1. Tipo de Investi gación

Las investigaciones deben definirse dentro de ciertos parámetros que permitan identificar con
claridad los elementos propios del problema y las condiciones requeridas para la solución del
mismo. Las investigaciones pueden clasificarse como básicas cuando tienen como objetivo crear o
alimentar las teorías ya existentes; también se les conoce como puras. Las investigaciones también
pueden ser definidas como aplicadas, cuando su objetivo es la solución de un problema dentro de
un contexto social. Atendiendo a las dos definiciones señaladas anteriormente, las investigaciones
que se desarrollan en nuestro contexto científico pueden ser básicas o aplicadas, siendo las más
frecuentes, éstas últimas.

Las investigaciones también se pueden clasificar como de campo cuando se desarrollan en un


contexto social específico, y de laboratorio cuando las condiciones de control son muy rigurosas y
por lo general las variables no se manifiestan naturalmente.

2. Diseño de Investigación

La tarea de diseñar corresponde a la definición y delimitación de las condiciones de control a través


de las cuales se va a investigar un problema específico. El objetivo fundamental del diseño es el de
aislar la variable independiente a tal punto que los resultados obtenidos se deban, presumiblemente,
a la acción de dicha variable y no de otras variables rivales. Los diseños pueden ser experimentales,
cuasiexperimentales, no experimentales, correlacionales, etc., atendiendo a las situaciones de
manipulación de las variables involucradas.

3. Variables

Las variables corresponden a ciertas propiedades que se dan en los sujetos, tomando en
consideración, las diferencias individuales. Estas son susceptibles de ser manipuladas por el
investigador. Las tres variables identificadas como las más importantes en todo proceso de
investigación son: la independiente, la dependiente y las extrañas. De acuerdo a Aroldo
Rodríguez (1977), estas variables se pueden definir de la siguiente manera:

 Variable Independiente: es la propiedad manipulada por el experimentador y que se supone


será responsable de las modificaciones de la propiedad observada mediante la investigación
experimental.

 Variable dependiente es la propiedad afectada por la variable independiente; es la que se


supone debe modificarse y esta modificación debe ser susceptible de ser medida y evaluada por
el investigador.

 Variables extrañas son aquellas que pueden influir en los resultados del experimento sin que
en el modelo su efecto esté considerado. Las variables extrañas compiten con la variable
independiente y por lo general son las que el investigador intenta controlar en su diseño.
5

4. Muestras

Se refieren a conjuntos o grupos de sujetos seleccionados de las poblaciones en las cuales se


desarrollan las investigaciones. Las muestras pueden ser representativas o no representativas de una
población, y estas condiciones son importantes al momento de analizar estadísticamente los
resultados, en vista de que la elección del modelo estadístico está determinada por la
representatividad o no de la muestra con respecto de una determinada población.

5. Técnicas de Medición

En psicología, los resultados obtenidos en una investigación son recabados a través de instrumentos
de medición especiales denominados, por lo general, test psicológicos. Los psicólogos cuentan con
una pluralidad de organizaciones internacionales que se responsabilizan por la construcción de tests,
aplicables en casi todas las situaciones de medición y evaluación del comportamiento. Estos tests
son construidos siguiendo teorías y métodos muy especializados, lo que permite que dichos
instrumentos sean objetivos, válidos y confiables. Sin embargo, los psicólogos deben estar
preparados para hacerle frente a situaciones en las cuales los instrumentos utilizados no satisfacen
plenamente los criterios científicos de construcción de pruebas pero sus resultados deben ser
utilizados a pesar de estas deficiencias. En otras ocasiones, los psicólogos deben construir los
instrumentos de medición requeridos para sus estudios.

En cualquiera de estos casos, los psicólogos deben estar en capacidad de construir los instrumentos
de evaluación psicológica que requieran para sus estudios e investigaciones. Es una obligación del
psicólogo conocer con rigurosidad las teorías y técnicas propias de la medición psicológica, ya sea
para interpretar resultados provenientes de pruebas de calidad indiscutible, como para construir los
test que necesite en situaciones específicas. En el caso de la medición psicológica, la estadística es
una herramienta crucial en la elaboración de test.

6. Modelo Estadístico

Se refiere a los procedimientos de procesamiento y análisis estadístico de los datos que provienen
de las investigaciones. Incluye los supuestos, modelos, metodología y pruebas estadísticas
requeridas en la investigación. Los modelos estadísticos pueden ser paramétricos o no paramétricos
y los mismos están apoyados por supuestos de carácter probabilísticos.

Los modelos estadísticos que se utilizan en las investigaciones están previamente determinados por
el problema planteado, las hipótesis de investigación, el tipo y diseño de investigación, el tipo de
medición de las variables involucradas y los instrumentos o test psicológicos aplicados en el estudio

Etapa 3

1. Análisis Estadístico

Una vez recogida la data proveniente de las mediciones psicológicas, el paso siguiente sería la
organización y análisis estadístico de los resultados obtenidos, utilizando los modelos, metodología
y procedimientos estadísticos previamente señalados. Básicamente se desarrollan dos tipos de
análisis: descriptivos y/o inferenciales.
6

2. Discusión

Concluido los análisis estadísticos, los resultados deben ser discutidos y analizados a la luz de los
objetivos del estudio y/o las hipótesis planteadas. En esta sección, el investigador no se circunscribe
únicamente a verificar sus objetivos y/o hipótesis, sino que observa el comportamiento de los datos
y analiza elementos adicionales y complementarios, que permiten enriquecer y profundizar en la
información obtenida, en muchas ocasiones, más allá de sus objetivos e hipótesis originales.

3. Conclusiones y recomendaciones

Finalmente, atendiendo a los resultados obtenidos en el análisis estadístico, el investigador está en


condiciones de concluir si los objetivos del estudio se alcanzaron plenamente, medianamente o no
se alcanzaron, y si las hipótesis planteadas fueron verificadas o no.

Las tres Etapas presentadas anteriormente, son un esbozo general de los principales pasos que se
siguen en el desarrollo de una investigación. El objetivo principal de la presentación de las mismas
ha sido el de establecer, con la mayor claridad posible, en qué momento de la investigación las
estadísticas son pertinentes. Como se observó, el modelo estadístico es el último punto de la Etapa 2
y el análisis estadístico es el primero de la Etapa 3. Esto debe ser así, porque las estadísticas están
condicionadas a los fundamentos teóricos del problema y a los aspectos metodológicos inherentes al
mismo. Para ser más específico, en una investigación, las estadísticas están determinadas por las
siguientes condiciones:

1. Los objetivos de la investigación


2. Las hipótesis de la investigación
3. El tipo de investigación y el diseño de investigación a desarrollar
4. El nivel de manipulación de las variables independientes
5. Los sujetos participantes del estudio: puede tratarse de una población o una muestra. Si se trata
de una muestra es determinante si la misma es aleatoria o no, si es una muestra grande o
pequeña, si se trata de una sola muestra o de varias muestras.
6. Las técnicas de medición que se utilizaron para recabar la información. Esto incluye las
características psicométricas de los instrumentos de medición, la escala de medición de las
variables, etc.

Las estadísticas aplicadas en una investigación no deben ser una improvisación de última hora,
como se observa frecuentemente en algunos trabajos de graduación. El modelo estadístico debe ser
planificado al momento de diseñarse la investigación. Es común observar a estudiantes e inclusive a
profesionales de la psicología solicitar asesoría estadística después de haber desarrollado la
investigación (recogido la data) casi en su totalidad. Cuando esto sucede, se corre el riesgo de que la
estructura metodológica del estudio no coincida con los objetivos e inclusive, las hipótesis del
estudio. En muchos casos, las investigaciones no se pueden concluir tal y como fueron diseñadas y
los investigadores deben hacer profundas modificaciones a las mismas o, inclusive, desistir del
estudio.
7

CONCEPTOS IMPORTANTES

Desarrolle cada uno de los conceptos presentados en la columna anterior. Intente establecer el
significado técnico de cada uno de ellos e interrelacionarlos en la actividad de la investigación
psicológica. Es importante que trate de alcanzar un nivel de comprensión importante para cada uno
de ellos. Como verá posteriormente, son básicos para el diseño de investigaciones psicológicas.

 Estadística  Población
 Incertidumbre  Muestra
 Riesgos  Test psicológico
 Parsimonia  Medición psicológica
 Metodología  Modelo estadístico
 Diseño  Estadística descriptiva
 Variables  Estadística inferencial
2

CAPÍTULO 2
LA NATURALEZA DE LAS ESTADÍSTICAS

La estadística se puede definir como el conjunto de métodos que se emplean para la toma de
decisiones. Los problemas psicológicos que se tratan de resolver a través de la investigación
científica, en especial aquellos en los que el análisis estadístico es pertinente, están afectados por la
“incertidumbre”, la cual proviene de la capacidad que tienen los datos numéricos de reflejar, con
cierta precisión, los fenómenos comportamentales que se analizan para determinada población.

POBLACIÓN MUESTRA DECISIÓN

RIESGO ERROR

FIGURA 2—1

Los fenómenos psicológicos se dan en poblaciones de sujetos. En algunas ocasiones estos


problemas se pueden investigar directamente sobre la población (censo), pero en la mayoría de las
situaciones, es imposible analizar la totalidad de la población, y el estudio se desarrolla entonces
con una parte de la misma a la que se denomina muestra. Las muestras, que son sub conjuntos de
las poblaciones mayores, están constituidas por un número mucho menor de sujetos, situación que
determina que los resultados numéricos o estadísticos de éstas no sean iguales a los de la población;
por lo que se produce, lo que en estadísticas se denomina error de muestreo.

Como el interés está centrado en tomar una decisión sobre una población a partir de una muestra
que está afectada de errores, los investigadores están en la obligación de analizar los errores de las
muestras para tomar una decisión con relación a la población partiendo de los datos de la muestra
(ver Figura 2—1).

Para que las decisiones estadísticas sean lo más acertadas posibles, los errores cometidos se
analizan a través de teorías y métodos estadísticos que permiten establecer hasta qué punto los
errores son significativos o no; en otras palabras, lo que se trata de establecer es si la muestra, a
pesar de los errores que presenta en comparación con la población, es lo suficientemente
representativa de la misma como para considerarse que sus resultados son “semejantes” a los que se
hubieran obtenido en la población de haberse analizado estadísticamente esta última.

Para llegar a este nivel de precisión estadística, se debe hacer uso de la Teoría de la Probabilidad,
que analiza y evalúa las diferencias entre muestras y poblaciones en términos de probabilidad (ver
Figura 2—2)
3

ERRORES
TEORÍAS Y DECISIONES
MÉTODOS ACERTADAS
ESTADÍSTICOS
Riesgos
calculados

Probabilidad

FIGURA 2—2

Es importante destacar la trascendencia que tiene el concepto de “incertidumbre” en el análisis


estadístico. Hay una fuente de incertidumbre que corresponde a aquellas situaciones en las que el
estado natural del fenómeno se puede conocer; este es el caso de la incertidumbre que se genera en
los juegos de azar; lotería, dados, cartas, etc. En estas situaciones se conoce de antemano cuáles son
los eventos que se pueden dar en cualquier experimento e inclusive cuáles son las probabilidades
correspondientes a cada uno de ellos; veamos un ejemplo:

TABLA 2-1:
Experimento denominado lanzamiento de un dado de seis caras
Eventos 1 2 3 4 5 6
Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6

Al lanzarse un dado común, sabemos de antemano qué eventos se pueden producir e inclusive
conocemos las probabilidades de cada uno de ellos; la incertidumbre nace del desconocimiento de
cuál será el evento que se presentará en un acto específico, dado que todos tienen las mismas
probabilidades. Nosotros conocemos el estado natural del dado y por lo tanto podemos hipotetizar
sobre los posibles resultados a obtener. Veamos otro ejemplo.

TABLA 2-2:
Experimento denominado lanzamiento de dos dados de seis caras
Evento 2 3 4 5 6 7 8 9 10 11 12
Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Al lanzarse los dos dados, independientemente de las veces que sean lanzados, la suma de los
puntos de las caras superiores daría resultados entre 2 y 12. Se observa, además, que las
probabilidades varían para cada uno de estos posibles resultados: el 2 tiene 1/36 de ocurrir, el 5
tiene 4/36, el 7 tiene 6/36, etc. Esto significa que al arrojarse los dos dados, potencialmente
conocemos los eventos que pueden suceder, e inclusive, las probabilidades para cada uno de ellos.
4

En este caso, la incertidumbre nace de las distintas probabilidades asignadas a cada evento: hay
eventos con más probabilidades y otros con menos.

En los dos experimentos anteriormente analizados, se conoce el estado natural de cada fenómeno y
sus probabilidades, siendo esto último la fuente de la incertidumbre.

El problema para los psicólogos radica en que no se conoce, con tanta facilidad, el estado natural de
los fenómenos comportamentales, ni tampoco las probabilidades asignadas a cada uno de ellos. Este
desconocimiento a priori de los hechos y sus probabilidades, es la fuente de incertidumbre para el
investigador del comportamiento.

Veamos un ejemplo. Supongamos que estamos interesados en investigar las actitudes de los
estudiantes universitarios hacia la apertura del denominado Tapón del Darién. Supongamos además,
que esta actitud va a ser evaluada en una escala de 1 a 5, en la que 1 significa totalmente en
desacuerdo y 5 significa totalmente de acuerdo. Al aplicarse el instrumento de medición, sabemos
de antemano que los resultados numéricos para cada encuestado puede ser numéricamente entre 1 y
5, pero no sabemos a priori, el estado natural de cada uno de estos eventos en la población de
estudiantes; no sabemos cuáles son sus probabilidades, tal y como sucede con los dados. Esto
significa que en psicología, la fuente principal de incertidumbre es el desconocimiento del estado
natural de los fenómenos conductuales en las poblaciones. Solamente se logra disminuir esta
condición de incertidumbre, desarrollando observaciones empíricas en las poblaciones
(investigaciones), analizando los resultados obtenidos y estableciendo de manera a posteriori, cuales
son los eventos que se dan y las probabilidades de cada uno de ellos.

LAS POBLACIONES

Una población se puede definir como un conjunto completo de elementos individuales, definidos
dentro de un problema específico. Por lo general, las poblaciones se definen como un conjunto de
cosas o sujetos, que se manifiestan, por lo general, en grandes cantidades. La cantidad no es lo
importante en este momento, porque hay poblaciones constituidas por pequeñas cantidades de
unidades individuales como también las hay constituidas por grandes cantidades. Lo importante es
tener claro que para la investigación, una población existe a la luz de un problema específico y que
contiene la totalidad de unidades que se desean investigar.

Sobre cada una de estas unidades individuales se hacen observaciones directas que son las que en
última instancia ofrecen la información cuantitativa referente al problema psicológico a investigar.
Por ejemplo, si estamos interesados en investigar las aptitudes numéricas de los aspirantes a
ingresar a Psicología, las puntuaciones obtenidas por cada uno de ellos en la prueba de aptitud es
considerada como una observación, y todas las observaciones (puntuaciones) obtenidas de la
totalidad de aspirantes constituye la población.

El número de sujetos que conforman una población también permite definir a las mismas como:
infinitas si el número de sujetos es muy grande y finitas si el número es pequeño. En la
investigación psicológica, por lo general las poblaciones a investigar se consideran finitas.
5

MEDICIÓN DE LAS VARIABLES PSICOLÓGICAS

Los atributos, características o propiedades psicológicas susceptibles de ser definidas


numéricamente se denominan variables. La característica principal de una variable es que puede
adquirir distintos valores atendiendo a las diferencias individuales. Algunos ejemplos de variables
psicológicas son: la inteligencia, el autoritarismo, la ansiedad, el liderazgo, el aprovechamiento, los
intereses, las aptitudes, la tolerancia, etc. Supuestamente, cada una de estas variables es susceptible
de ser medida y esto debe reflejar las diferencias que se pueden dar de sujeto a sujeto atendiendo a
las individualidades.

Al respecto de definir una variable, Kerlinger (1979) dice:

“Los científicos designan de manera un tanto vaga con el término de variable a las
construcciones hipotéticas o propiedades que estudian. Podemos afirmar que una
variable es una propiedad que adquiere distintos valores; diremos que una variable es
algo que varía”

Las variables pueden ser continuas o discretas. Una variable continua es aquella que puede asumir
cualquier valor dentro de un intervalo; puede asumir valores fraccionales. Una variable discreta es
aquella en la que las mediciones no pueden asumir valores fraccionales tales como el sexo, número
de hijos, correcto-incorrecto, etc. Chou (1972) hace algunos señalamientos al respecto de variables
continuas y discretas:

“Una serie continua es una variable que puede asumir cualquier valor numérico dentro
de un recorrido específico. Por otro lado, la naturaleza de cierto tipo de datos es tal que
la unidad de medida se puede definir solamente en términos enteros; una serie en la que
las medidas no pueden darse entre las unidades de escala se llama serie discreta”

ESCALAS DE MEDICIÓN

Hasta este punto de la lectura se puede observar que hay un aspecto importante en lo referente a la
aplicación de las estadísticas en la investigación científica: la medición de los fenómenos
naturales, en nuestro caso, de los fenómenos comportamentales. Por esta razón, es necesario
discutir cuáles son las alternativas con las que se enfrenta un investigador al momento de definir o
decidirse por una escala de medición para sus observaciones.

Las mediciones se pueden dar en uno de cuatro niveles y cada uno de ellos corresponde a una escala
de medición determinada: nominal, ordinal, de intervalos y de razones. Además, es necesario
destacar que cada escala satisface ciertas condiciones que favorecen la realización de ciertas
operaciones matemáticas. Estas condiciones están satisfechas por una serie de postulados básicos de
la medición, los cuales presentamos a continuación.

 Postulado #1: ( ) ( ) . Este postulado es básico para establecer


clasificaciones y señalar si los objetos son iguales o diferentes de acuerdo a una característica
especial.
6

 Postulado #2: ( ) ( ) ( ). Este postulado, de tipo transitivo, es


importante para determinar la igualdad de dos o más eventos atendiendo a una o más
características comunes.

 Postulado #3: ( ) ( ) ( ). Este postulado también es de


transitividad, e incorpora un concepto de mucha importancia en la medición psicológica como
lo es “mayor que” y “menor que”, en el que se basan la mayoría de las mediciones que se
hacen en psicología.

Al respecto Kerlinger señala:

“en dicho postulado se fundan la mayoría de las mediciones psicológicas y pedagógicas.


Hemos de estar en condiciones de hacer enunciados de tipo ordinal o de ordenación por
rangos”

1. Escala Nominal

Corresponde al nivel más bajo de medición y con la misma se alcanza únicamente la


identificación de sujetos u objetos, ya sea por el nombre o por un número. Por ejemplo: los
números con los que identifican a los jugadores de un equipo de baloncesto, las clasificaciones
por categorías tales como altos o bajos, masculinos o femeninos, etc.

2. Escala Ordinal

Representa un avance en comparación con la nominal, porque requiere de la ordenación de los


objetos o sujetos por rangos, atendiendo a cierta condición o característica en particular; los
operadores mayor que (>) y menor que (< ) son fundamentales. Esta escala demuestra quién es
mayor o menor, quién está por encima o quién por debajo, qué es más duro o más blando, etc. A
pesar de que brinda información sobre quién posee más o menos del atributo, no brinda
información sobre la cantidad de atributo de cada sujeto u objeto.

3. Escala de Inter valos:

Tiene sus propias características, pero además posee las de la escala nominal y la ordinal. Su
característica principal es que las unidades de medición son iguales, situación ésta que le permite
una manipulación algebraica mucho más amplia que los casos anteriores. Las escalas de
temperatura, el tiempo, las escalas de medición psicológicas, etc., son ejemplos de esta situación.
Presentamos un ejemplo:

a b c d e
1 2 3 4 5

La escala que se presenta con anterioridad, supuestamente mide una propiedad (X) en cinco
posibles alternativas. Se supone que las unidades de medición entre cada alternativa son iguales
y por lo tanto también representan distancias iguales con respecto a la propiedad investigada. La
diferencia entre e – d, o sea, 5 – 4 = 1, es la misma diferencia que hay entre b – a, 2 – 1 =1.
7

Ambas representan las mismas distancias con respecto a la propiedad evaluada. Otra ventaja es
que se pueden combinar procesos matemáticos diferentes, como por ejemplo:

, lo cual se puede representar también así:

( ) ( ), donde,

( ) ( ), donde,

( ) ( )

4. Escala de Razones o Proporciones:

Corresponde al más alto nivel de medición; posee todas las características de las escalas
discutidas anteriormente, pero a diferencia de ellas, es la única que posee un cero natural. El cero
representa ausencia absoluta de la propiedad en mención y esto permite aplicar operaciones
matemáticas que no se podían aplicar en las escalas anteriores (multiplicación y división). Se
considera que en esta escala, una medición que representa numéricamente el doble que otra,
también representa el doble de la propiedad medida.

La utilización de las escalas de medición en la investigación aplicada en psicología, es muy


importante porque determina el tipo de estadísticas que se deben utilizar para el análisis de los
resultados. Cuando la medición se da en una escala nominal u ordinal, el procesamiento
estadístico es diferente a los casos en que la medición se hace en escala de intervalos o de razón.
Por ejemplo, las investigaciones en escala nominal u ordinal, por lo general se procesan con
estadísticos no paramétricos, mientras que si se utilizan escalas de intervalos o razón, las
estadísticas a utilizar son de tipo paramétricas.

CONCEPTOS IMPORTANTES

 Incertidumbre
 Variable continua
 Probabilidad
 Acto o Prueba
 Experimento
 Variable discreta
 Escala de medición
 Nominal
 Ordinal
 Intervalos
 De razón o proporción
8

CAPÍTULO 3
ORGANIZACIÓN DE DATOS
DISTRIBUCIONES DE FRECUENCIAS

Los análisis estadísticos comienzan, por lo general, en el momento en que se recogen los datos.
Estos datos son los resultados de mediciones y/o evaluaciones realizadas con instrumentos
psicológicos muy específicos y que por lo general dan información cuantitativa (o cualitativa) sobre
ciertos aspectos del comportamiento que son objeto de investigación en momentos determinados. A
continuación presentamos un ejemplo:

TABLA 3-1:
Resultados de la medición de las aptitudes en una muestra de
70 estudiantes de los cursos de capacitación en una universidad.

95 101 92 67 118 105 76


104 84 122 86 87 97 87
94 94 79 94 89 90 103
101 81 94 91 77 107 94
100 102 93 94 105 68 82
117 94 119 117 89 106 111
107 92 91 89 83 73 97
99 91 120 103 90 89 112
93 100 117 78 99 111 91
83 84 81 88 84 81 110

Los puntajes resumidos en la tabla anterior no presentan ninguna información sistematizada, ni


organizada sobre la variable aptitudes: el investigador no podría, a partir de dichos puntajes, ofrecer
ningún tipo de información sobre el fenómeno psicológico en mención y su incidencia en la muestra
de estudiantes. Los puntajes deben ser organizados de tal manera que faciliten su posterior
utilización en los análisis estadísticos necesarios para la interpretación de los resultados.

Un primer método de organización de los datos es el denominado: distribución en una tabla de


frecuencias simples. Esta tabla se caracteriza porque los datos se ordenan, preferiblemente de menor
a mayor, indicándose para cada uno de los puntajes la frecuencia correspondiente; o sea, el número
de sujetos que obtuvo dicho puntaje. A continuación se presenta la tabla correspondiente.
9

TABLA 3-2:
Distribución de frecuencias simples de los promedios de las aptitudes de
70 estudiantes de los cursos de capacitación
X f X f X f X f
67 1 81 3 95 1 109 0
68 1 82 1 96 0 110 1
69 0 83 2 97 2 111 2
70 0 84 3 98 0 112 1
71 0 85 0 99 2 113 0
72 0 86 1 100 2 114 0
73 1 87 2 101 2 115 0
74 0 88 1 102 1 116 0
75 0 89 4 103 2 117 3
76 1 90 2 104 1 118 1
77 1 91 4 105 2 119 1
78 1 92 2 106 1 120 1
79 1 93 2 107 2 121 0
80 0 94 7 108 0 122 1

La tabla anterior representa un gran adelanto en comparación con la Tabla 3-1, en vista que presenta
la información mejor organizada y sistematizada: los puntajes se ordenaron de menor a mayor
(podría haber sido a la inversa), cada puntaje tiene asignada una frecuencia, o sea, el número de
sujetos que obtuvieron dicha puntuación. Se observa un primer indicio de agrupamiento hacia los
puntajes centrales en comparación con los valores extremos.

La organización de los datos en distribuciones de frecuencias simples, a pesar de la ventaja que


presenta, tampoco es el procedimiento más adecuado, especialmente si el tamaño de la muestra es
muy grande al igual que su amplitud. En tales casos, la información tiende a verse muy disgregada
y no se dramatizan las características particulares de la muestra, que pueden resultar muy
importantes para el análisis de los resultados. En el caso de muestras pequeñas, este tipo de
organización es bastante efectiva.

Una segunda forma de organizar los resultados, especialmente si la muestra es grande, es la Tabla
de Frecuencia por intervalos. Bajo este método, se logra que los puntajes se presenten de manera
más compacta en la distribución, lo cual facilita la observación clara de las principales
características estadísticas de los puntajes de la muestra. Este método se caracteriza por la creación
de intervalos, distancias entre puntajes, que facilita la distribución de todos los puntajes de la
muestra en dichos intervalos. Para el uso de este tipo de distribución, el investigador debe tener
claro algunos aspectos que pasamos a discutir:

1. El agrupamiento de los puntajes en algunas ocasiones puede favorecer la pérdida de


información.
2. El tamaño del intervalo y el número de los mismos se darán a criterio del investigador.
10

3. Se acepta, generalmente, que el número de intervalos debe oscilar entre 10 y 20.


4. El tamaño del intervalo puede ser par o impar, aunque se sugiere un tamaño impar porque de
esta manera se reduce la probabilidad de trabajar con datos fraccionales.

Los pasos para construir una distribución de frecuencias por intervalos son los siguientes:

1. Se calcula el “rango” o “amplitud” de la distribución, lo que corresponde a la diferencia entre


el puntaje más alto y el más bajo de la muestra más uno:
 ,

En donde, es amplitud, es puntaje mayor y es puntaje menor. La amplitud


identifica los valores que están dentro de este intervalo, lo cual facilita la
identificación de los puntajes particulares dentro del mismo. Para el caso de la
Tabla 3-1,

 .

2. Divida la amplitud entre el número de intervalos que se han considerado adecuados, recordando
que preferiblemente deben ser entre 10 y 20. Se recomienda que se utilice un número de
intervalos tal, que al dividir la amplitud entre el número de intervalos, el número resultante sea
un valor impar, el cual va a representar el tamaño de cada uno de los intervalos; este tamaño es
constante para todos. Para nuestro ejemplo, hemos decidido que sean 12 intervalos; para
calcular el tamaño del intervalo se lleva a cabo la siguiente operación:
 Amplitud = 56
 No. de intervalos estimado (No.i) = 12; con esta información se calcula el
tamaño del intervalo (Ti):
 , que redondeado al entero más próximo corresponde
a 5.

3. A partir de estos datos, se construye la Tabla de frecuencias por intervalos que para este caso
será de menor a mayor. En el primer intervalo debe quedar incluido el valor más pequeño de la
distribución y en el último se incluirá el valor más grande. La estructura de cada intervalo se
caracteriza por las siguientes condiciones:
 Los intervalos tendrán un puntaje inferior que se denominará límite inferior, y
un puntaje superior que se denominará límite superior; el recorrido entre ambos
extremos debe ser igual al Ti, incluidos estos dos valores. Por ejemplo:
65 ----------------------- 69
Límite inferior Límite superior

 Para escoger el límite inferior del primer intervalo, debe utilizarse la siguiente
regla: “debe corresponder al número más cercano al puntaje más pequeño
de la distribución, y que a su vez sea un múltiplo del tamaño del
intervalo”. Para efectos de este ejemplo, el límite inferior del primer intervalo
corresponde a 65 y el mayor a 69.
11

4. A partir de esta información, construya la Tabla de frecuencias partiendo del intervalo 65 – 69,
en el cual está incluido el puntaje más bajo que es 67, hasta llegar al último intervalo que debe
incluir el puntaje más alto: 122. Todos los intervalos deben ser de tamaño 5 para efectos de este
problema.

5. Una vez confeccionada la columna de intervalos, se determina el número de casos de la muestra


que caen dentro de cada uno de ellos. Para facilitar esta información, se crea una columna
adyacente a la de los intervalos y se van asignando marcas a cada valor encontrado en la
muestra, tal y como lo presenta el siguiente ejemplo:

Intervalo Tabulación Frecuencia

65 – 69 // 2

6. Se procede de esta manera con todos los intervalos hasta obtener toda la información
correspondiente a las frecuencias simples. Se completa la tabla con el resto de las columnas que
contendrán la información requerida para adelantar los primeros análisis estadísticos. Las otras
columnas más frecuentes son: tabulación (tab), frecuencias (f), frecuencias acumuladas (fa),
puntos medios (Pm), proporciones (p), y porcentajes (%).

A continuación se presenta la Tabla de Frecuencias por intervalos correspondiente a los datos


presentados en la Tabla 3-1.

TABLA 3-3:
Distribución de frecuencias por intervalos
correspondientes a las aptitudes de una muestra de 70 estudiantes
i f fa Pm p %
65-69 2 2 67 0.03 2.86
70-74 1 3 72 0.01 1.43
75-79 4 7 77 0.06 5.71
80-84 9 16 82 0.13 12.86
85-89 8 24 87 0.11 11.43
90-94 17 41 92 0.24 24.29
95-99 5 46 97 0.07 7.14
100-104 8 54 102 0.11 11.43
105-109 5 59 107 0.07 7.14
110-114 4 63 112 0.06 5.71
115-119 5 68 117 0.07 7.14
120-124 2 70 122 0.03 2.86
∑ 0 ∑ 0.99a ∑ 00.00
a La sumatoria de p es <1.00 por efectos de redondeo
12

La Tabla anteriormente presentada, no toma en consideración los denominados “límites


verdaderos o reales” de cada intervalo. Por ejemplo, los límites verdaderos de 65 serían: 64.5 y
65.5; de igual manera, los límites verdaderos de 69 serían 68.5 y 69.5. Si se construye la Tabla de
frecuencias utilizando este concepto, en el caso del primer intervalo, el intervalo real sería: 64.5 –
69.5, y el resto de los intervalos se construirían de la misma manera. Este concepto de los límites
verdaderos, es importante para el cálculo de ciertos estadísticos tales como la mediana, los
percentiles y otros.

El resto de los elementos de la Tabla de Frecuencias por intervalos se determinarían de la siguiente


manera:

 Frecuencias acumuladas (fa): a partir de la frecuencia del intervalo más pequeño, se van
sumando de manera acumulativa las frecuencias de los intervalos posteriores y se van indicando
en la Tabla. Para verificar, debe observarse que en el primer intervalo está acumulada la
frecuencia de este intervalo y que en el último intervalo debe estar acumulada la totalidad de las
frecuencias de la muestra. Ejemplo: (ver Tabla 3-3)
 Primer intervalo = 65 – 69 Frecuencia = 2
 Último intervalo = 120 – 124 Frecuencia = 70

 Punto medio (Pm): se refiere al puntaje que se ubica en la mitad de cada intervalo y se calcula
a través de la siguiente operación:
( )
o , en donde, Li representa al límite inferior del intervalo y Ls, al límite
superior.
( )
o Para efectos del primer intervalo, el Pm sería igual a: , tal y como se
puede verificar en la Tabla 3-3.

o Esta operación se debe desarrollar para todos los intervalos de la distribución y señalar
el resultado en su correspondiente columna.

Otro procedimiento para construir una Tabla de Frecuencias es La Regla de Sturges. En el mismo
se aplica una regla (fórmula) especial, a través de la cual se puede determinar (K), que representa el
número aproximado de intervalos en la distribución: ( ), en donde:

K: número aproximado de intervalos


n: número de sujetos de la muestra
log: logaritmo ordinario de base 10.

Si aplicamos dicha regla a los datos de nuestra muestra, los resultados serían los siguientes:

( )( 0) 0
Tamaño de intervalos ( )
13

Como se puede observar el número de intervalos es menor que en el procedimiento anterior;


además, el tamaño del intervalo tiende a ser mayor. A continuación se presenta la Tabla
desarrollada con la Regla de Sturges.

TABLA 3-4:
Distribución de frecuencias por intervalos correspondientes
a las aptitudes de una muestra de 70 estudiantes.
i f fa Pm p %
63 - 69 2 2 67 0.03 2.86
70 - 76 2 4 72 0.03 2.86
77 - 83 9 13 77 0.13 12.86
84 - 90 13 26 82 0.19 18.57
91 - 97 18 44 87 0.26 25.71
98- 104 10 54 92 0.14 14.29
105 - 111 8 62 97 0.11 11.43
112 - 118 5 67 102 0.07 7.14
119 - 125 3 70 107 0.04 4.29
∑ 0 ∑ .00 ∑ 00.01a
a La sumatoria de % es >100.00 por efectos de redondeo

Como se puede observar, la distribución de frecuencias por intervalos generada a través de la Regla
de Sturges, tiende a producir distribuciones más compactas que en el primer caso, por el hecho de
que genera menor número de intervalos pero con un tamaño mayor, lo cual hace que dentro de los
mismos haya un mayor número de sujetos. Ahora, no existe ninguna regla que señale que Sturges
produce resultados superiores que el primer método estudiado. Nada supera el buen juicio del
investigador para determinar cuál es la distribución más conveniente.

CONCEPTOS IMPORTANTES

 Distribución de frecuencias
 Simples
 Por Intervalos
 Intervalos
 Amplitud o Rango
 Límites de intervalos
 Frecuencias simples
 Frecuencias acumuladas
 Proporciones
 Porcentajes
14

EJERCICIOS PRÁCTICOS

Problema 1

110 113 111 108 113 134 124 80 112 106


133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
128 93 93 105 118 119 89 143 108 142
85 108 108 136 115 117 110 128 145 127
100 100 100 123 126 119 113 102 100 93
105 111 122 100 114 91 123 132 97 110
150 130 130 89 108 137 121 142 111 123
118 104 104 94 115 112 125 129 131 110
97 135 135 139 133 107 115 83 109 116
154 131 113 82 106 101 122 96 145 101

Los datos anteriores corresponden a los puntajes obtenidos en una prueba de admisión universitaria,
por una muestra de estudiantes graduados de escuela secundaria. Organice los datos en una Tabla de
Frecuencias por intervalos, satisfaciendo los siguientes requisitos:

1. Calcule la amplitud de la distribución de datos.


2. La tabla debe ser construida de menos a más.
3. El tamaño del intervalo debe ser de 5.
4. La Tabla debe incluir las siguientes columnas: intervalos, puntos medios, frecuencias simples,
frecuencias acumuladas, proporciones y porcentajes.

Problema 2

Con los mismos datos, del problema construya una Tabla de Frecuencias utilizando un tamaño de
intervalo igual a 4. Repita el mismo procedimiento que en el problema anterior. Observe, analice y
discuta las diferencias entre una distribución y la otra.

Problema 3

Elimine de forma aleatoria (por azar) un dato de cada columna del problema 1; esto creará una
nueva distribución de datos. Para la misma, construya dos Tablas de frecuencias utilizando las
recomendaciones brindadas en este Texto. Una de las tablas debe tener un tamaño de intervalo
impar y la otra, un tamaño par. Complete ambas tablas con los elementos solicitados anteriormente;
analice y discuta los resultados obtenidos.

Si desea practicar más, puede eliminar columnas de la distribución de datos y desarrollar sus
correspondientes tablas. También puede revisar los textos señalados en la bibliografía y hacer otros
problemas.
15

CAPÍTULO 4
REPRESENTACIONES GRÁFICAS

En el capítulo anterior se inició un proceso de organización de los datos tendiente a sistematizarlos,


lo cual facilitaría el posterior análisis de los mismos. Se observa que dicho proceso de organización
se caracteriza por una cuidadosa reorganización de la data (Tabla 3-1), a través de las denominadas
Tablas de Frecuencias, especialmente la de intervalos (Tabla 3-3 y Tabla 3-4).

Otro aspecto importante en la organización de datos lo constituyen las representaciones gráficas,


las cuales se caracterizan por lo siguiente:

1. Facilitan la observación de hechos esenciales en las distribuciones.


2. Permiten la comparación de diferentes distribuciones al mismo tiempo.
3. Son de fácil comprensión para el lector porque facilita la percepción de los hechos.

Existen diferentes tipos de representaciones gráficas utilizadas para diferentes objetivos. Para
efectos de este capítulo, se analizarán tres tipos de gráficas, las cuales son básicas para el análisis
científico de la data proveniente de la medición comportamental: el gráfico de barra (histogramas),
el polígono de frecuencias y la ojiva. Pero antes de iniciar este estudio formalmente, es necesario
señalar algunos detalles importantes en la construcción de las mismas y que son comunes en todas
ellas. Los gráficos serán construidos en el cuadrante cartesiano en que los ejes X e Y son positivos.
Al eje X se le denominará abscisa y al Y ordenada.

Y
X e Y son positivos

FIGURA 4—1

 En el eje de las ordenadas (Y) se colocan las frecuencias, porcentajes, etc, mientras que en el
eje de las abscisas (X) se colocarán los puntajes, los cuales pueden estar representados por los
valores correspondientes a los puntos medios, los límites de los intervalos ya sean los superiores
o los inferiores; no se deben combinar estos en un mismo gráfico. También se considera que en
el eje de X se coloca la variable independiente y en el de la Y la variable dependiente.

 Cuando los gráficos se construyen manualmente, se sugiere la regla de los tres cuartos, la
cual se caracteriza por lo siguiente: “en la representación gráfica de las frecuencias,
el eje vertical debe hacerse de tal forma que la altura del punto máximo (que
representa el resultado asociado con la frecuencia más alta) debe ser
aproximadamente igual a tres cuartos de la longitud del eje horizontal”.
16

En la práctica, esta es una condición difícil de cumplir, por lo cual se sugiere que tanto
X como Y sean más o menos proporcionales. Este problema ha sido superado con la
utilización de ordenadores para la construcción de los gráficos.

GRÁFICO DE BARRAS

Se refiere a un gráfico diseñado para variables medidas en escalas nominales y ordinales; o sea, que
los datos no están relacionados numéricamente entre ellos. Cada categoría o intervalo se representa
por una barra y la frecuencia determina la altura de la misma; además, las barras son independientes
una de otras. Para la construcción de un gráfico de este tipo, se sugieren los siguientes pasos:

1. En el eje de Y se representan las frecuencias dentro de cada categoría; esto determina


la altura de la barra. En el eje de las X se ubican las categorías o estratos. A
continuación presentamos un ejemplo.

TABLA 4-1:
Frecuencias De Las Carreras A Las Que Aplican 70 Aspirantes A La Universidad
Facultad f
Admón de Empresas 8
Arquitectura 9
Ciencias Agropecuarias 8
Ciencias de la Educación 4
Ciencias Exactas y Tecnología 4
Comunicación Social 8
Derecho y Ciencias Políticas 6
Economía 2
Enfermería 2
Humanidades 6
Medicina 1
Odontología 6
Psicología 6
∑ 0
17

GRÁFICO 4-1

Facultad a la que aplican 70 aspirantes universitarios


10
9
8
Frecuencia

7
6
5
4
3
2
1
0

Como se puede observar, el gráfico representa cada intervalo con su correspondiente altura
(frecuencia), la cual está identificada por la barra. Este tipo de gráfico también puede representarse
de manera horizontal, tal y como se demuestra a continuación.

GRÁFICO 4-2

Facultad a la que aplican 70 aspirantes universitarios


Psicología
Odontología
Medicina
Humanidades
Enfermería
Economía
Derecho y Ciencias Políticas
Comunicación Social
Ciencias Exactas y Tecnología
Ciencias de la Educación
Ciencias Agropecuarias
Arquitectura
Admón de Empresas

0 1 2 3 4 5 6 7 8 9 10
Frecuencia

HISTOGRAMA

El histograma también es un gráfico de barras, pero a diferencia del anterior, se utiliza en el caso en
que las distribuciones de frecuencias corresponden, por lo menos a una escala de intervalos. Desde
el punto de vista estadístico, las barras comparten información en vista de que se construyen con los
18

límites reales de cada una de ellas. El límite superior de cada barra se convierte en el límite inferior
de la siguiente, apoyados en el concepto de continuidad de la variable. A continuación se presenta
un ejemplo.

TABLA 4-2:
Distribución De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
i f
65-69 2
70-74 1
75-79 4
80-84 9
85-89 8
90-94 17
95-99 5
100-104 8
105-109 5
110-114 4
115-119 5
120-124 2
∑ 0

GRÁFICO 4-3

Aptitudes de n=70 aspirantes universitarios


18
16
14
12
Frecuencia

10
8
6
4
2
0

Aptitudes
19

POLÍGONO DE FRECUENCIAS

El Polígono de Frecuencias es otra alternativa de representación gráfica de las distribuciones de


frecuencias. Al igual que los gráficos de barras, se construye sobre un eje de coordenadas (X,Y),
con la diferencia que no se utilizan los intervalos completos, sino que éstos están representados por:
los límites superiores, los límites inferiores, o, los puntos medios de cada intervalo. Se genera un
gráfico lineal que se traza sobre cada uno de los puntos que representan a los intervalos. A
continuación presentamos un ejemplo.

TABLA 4-3:
Distribución De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
i f
65-69 2
70-74 1
75-79 4
80-84 9
85-89 8
90-94 17
95-99 5
100-104 8
105-109 5
110-114 4
115-119 5
120-124 2
∑ 0

GRÁFICO 4-4

Polígono de frecuencias de las aptitudes en una muestra de n=70


aspirantes universitarios

18
16
14
Frecuencias

12
10
8
6
4
2
0
20

El polígono anterior utiliza como representativo de los datos, cada uno de los intervalos. Sin
embargo, por lo general, se utilizan los puntos medios de los intervalos, lo cual facilita la
descripción de los datos. A continuación presentamos un ejemplo.

TABLA 4-4:
Distribución De Frecuencias Por Intervalos
Correspondientes A Las Aptitudes De Una Muestra De 70 Estudiantes
pm f
67 2
72 1
77 4
82 9
87 8
92 17
97 5
102 8
107 5
112 4
117 5
122 2
∑ 0

GRÁFICO 4-5

Polígono de frecuencias de las aptitudes en una muestra de n=70


aspirantes universitarios
18
16
14
12
Frecuencias

10
8
6
4
2
0
67 72 77 82 87 92 97 102 107 112 117 122
Puntos medios

Para construir un Polígono de Frecuencias sugerimos los siguientes pasos:


21

1. Represente el eje de coordenadas (X, Y) en el cual se va a construir el gráfico; recuerde que


estamos utilizando el cuadrante de valores positivos. En X deben estar identificados los valores
de los sujetos, representados por los puntos medios de los intervalos (o por los límites
superiores o los inferiores). En Y deben estar identificadas las frecuencias de cada intervalo.

2. Señale en el cuadrante los pares ordenados para cada X e Y con un punto. En otras palabras, la
intersección de cada valor X con su correspondiente Y, se marca con un punto. Repita esta
acción para cada intervalo y una vez terminado, una los puntos con rectas hasta que se dibuje la
figura del polígono.

3. Los extremos del polígono quedan suspendidos (no se unen con el eje de X). En tal caso, únalos
con segmentos de recta que deben estar ubicados a medio intervalo por debajo y por encima de
los dos valores extremos (Gráfico 4-4 y Gráfico 4-5).

4. La utilización de los puntos medios está plenamente justificado teóricamente, en vista de que
los mismos representan cada uno de los intervalos, lo cual quedará demostrado al momento de
calcularse ciertos estadísticos básicos para los análisis.

GRÁFICO DE FRECUENCIAS ACUMULADAS U OJIVA

Hay ocasiones en las que el investigador necesita que los datos se ordenen acumulativamente. Ya
observamos en la Tabla 3-4 que es posible resumir las frecuencias de los intervalos de manera
acumulada. Para tales casos, los datos acumulados pueden representarse gráficamente a través de
una ojiva o curva acumulativa de frecuencias; a continuación se presenta un ejemplo.

TABLA 4-5:
Distribución De Frecuencias Por Intervalos Correspondientes
A Las Aptitudes De Una Muestra De 70 Estudiantes.
i f fa Pm
63 - 69 2 2 67
70 - 76 2 4 72
77 - 83 9 13 77
84 - 90 13 26 82
91 - 97 18 44 87
98- 104 10 54 92
105 - 111 8 62 97
112 - 118 5 67 102
119 - 125 3 70 107
∑ 0
22

GRÁFICO 4-6

Ojiva correspondiente a las aptitudes de n=70 aspirantes


universitarios
80

70
Frecuencias acumuladas

60

50

40

30

20

10

0
67 72 77 82 87 92 97 102 107

Los pasos a seguir para confeccionar una gráfica de frecuencias acumuladas (OJIVA) son los
siguientes:

1. Confeccione el cuadrante de coordenadas


2. En el eje Y se colocan las frecuencias acumuladas de la distribución y en el eje X se colocan los
puntos medios de cada intervalo.
3. Localice, en el cuadrante, el punto en que coinciden el intervalo (punto medio) y la frecuencia
acumulada de dicho intervalo: márquelo con un punto. Repita esta acción con todos los
intervalos y con sus correspondientes frecuencias acumuladas.
4. Una todos los puntos a través de líneas rectas obteniéndose finalmente el gráfico denominado
Ojiva.

A través de éste gráfico se puede calcular algunas medidas de posición importantes tales como los
percentiles, los rangos percentiles, la mediana, etc.

DIAGRAMA DE TALLO Y HOJAS

Es una alternativa muy sencilla de describir los datos de una muestra, especialmente cuando la
misma no es muy grande (n ≤ 100). Cada dato se va a dividir en dos partes: el primer dígito (y el
segundo, en algunas ocasiones), corresponde al tallo y el segundo a la hoja. Veamos un ejemplo con
el dato X = 46. Para este caso:

Tallo = 4, Hoja = 6.

Este procedimiento se seguiría con todos los puntajes de la distribución, pero el diagrama tiene una
estructura especial, la cual pasamos a presentar a continuación. Para tal efecto utilizaremos los datos
resumidos en la Tabla 3-2.
23

GRÁFICO 4-7
TALLO HOJA

6 7 8

7 3 6 7 8 9

8 1 1 1 2 3 3 4 4 4 4 6 7 7 8 9 9 9 9

9 0 0 1 1 1 1 2 2 3 3 4 4 4 4 4 4 4 5 7 7 9 9

10 0 0 1 1 2 3 3 4 5 5 6 7 7

11 0 1 1 2 7 7 7 8 9

12 0 2

En el ejemplo anterior se observa que el puntaje más bajo corresponde al número 67, por esta razón
el diagrama se inicia en el tallo 6. Las hojas correspondientes a este tallo son el 7 y el 8 porque
únicamente en esta decena están el número 67 y 68. A continuación vendría la decena del 70, cuyo
tallo sería el 7; las hojas en este tallo serían 3, 6, 7, 8 y 9, porque corresponderían a los números 73,
76, 77, 78 y 79. De esta manera se desarrollarían los restantes tallos con sus correspondientes hojas.

LOS ORDENADORES Y LAS GRÁFICAS

El desarrollo y crecimiento de la informática, tanto en lo que respecta a los ordenadores como a los
programas, han facilitado la presentación de gráficos y han enriquecido este aspecto tan importante
de las estadísticas. A continuación presentamos algunos ejemplos de presentaciones gráficas que se
pueden desarrollar gracias al avance de la tecnología.
24

18
16
14
12
10
8
6
4
2
0
65- 75- 85- 95- 105- 115
69 79 89 99 109 -119

CONCEPTOS IMPORTANTES

 Gráfico
 Cuadrante cartesiano
 Ordenada
 Gráfico de barras
 Histograma
 Polígono de frecuencias
 Pares ordenados
 Ojiva
 Diagrama Tallo – Hoja
25

EJERCICIOS PRÁCTICOS

Problema 1

110 113 111 108 113 134 124 80 112 106


133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
128 93 93 105 118 119 89 143 108 142
85 108 108 136 115 117 110 128 145 127
100 100 100 123 126 119 113 102 100 93
105 111 122 100 114 91 123 132 97 110
150 130 130 89 108 137 121 142 111 123
118 104 104 94 115 112 125 129 131 110
97 135 135 139 133 107 115 83 109 116
154 131 113 82 106 101 122 96 145 101

Los datos presentados son los mismos que se dieron para el ejercicio del Capítulo III, para los
cuales usted ya ha generado varias tablas de frecuencias por intervalos. Utilizando la Tabla de
intervalos de tamaño 5, construya los siguientes gráficos:

1. Polígono de frecuencias usando los puntos medios. También lo debe hacer utilizando uno de los
límites del intervalo.
2. Gráfico de barras
3. Histograma
4. Ojiva
5. Diagrama de tallo y hojas

Problema 2

Construya estos gráficos, utilizando las diferentes distribuciones de frecuencias que construyó en el
Capítulo III. Observe, analice y discuta las diferencias encontradas entre los gráficos construidos.
26

CAPÍTULO 5
MEDIDAS DE TENDENCIA CENTRAL

Hasta este momento, el proceso de sistematización y organización de los datos que hemos seguido,
ha permitido reducir la información inicial (datos originales) correspondientes a las aptitudes de 70
aspirantes a ingresar a la Universidad, a partir de tablas y gráficos descriptivos. A pesar de esta
reducción, la calidad de la información mejoró tanto cuantitativa como cualitativamente, en vista de
que se logró identificar características especiales de la muestra que no resaltaban en su forma
original de presentación: datos brutos.

Estas características particulares de las muestras, favorecen un análisis más profundo y dinámico de
la información cuantitativa resumida en las tablas y gráficos, a tal punto, que logran resumir, en
muy pocos valores cuantitativos, las características de las variables analizadas y como consecuencia
directa, las características de las muestras que están siendo objeto de análisis. Esta nueva
información se identifica como medidas estadísticas y se pueden definir desde dos perspectivas
particulares pero complementarias: las medidas de tendencia central y las medidas de
variabilidad. A continuación pasaremos a analizar y discutir lo que significan las medidas de
tendencia central y su importancia en el análisis descriptivo de los datos.

Las muestras de datos, con mucha frecuencia, tienden a comportarse de manera muy particular, lo
cual tiende a dramatizarse con mucho detalle en las tablas y los gráficos correspondientes. Por lo
general, hay uno o varios puntajes que al analizarlos en las tablas y gráficos, presentan una mayor
frecuencia de ocurrencia que los otros; en muchas ocasiones, es un solo valor de la distribución el
que se destaca por esta cualidad.

Si observamos los resultados resumidos en la Tabla 3-3 y en la Tabla 3-4, la mayor frecuencia de
datos se observa en el intervalo 90-94 (frecuencia 17) y en el intervalo 91-97 (frecuencia 18),
respectivamente. Es evidente que un número importante de datos tiende a agruparse alrededor de
ciertos valores centrales (intervalos), y consecuentemente, el resto se distribuye por encima y por
debajo de estos intervalos de mayor frecuencia. A partir de este comportamiento, se determina que
en las distribuciones muestrales hay un valor que es el más frecuente y alrededor del cual se agrupa
el resto de los valores; este puntaje se considera representativo de toda la distribución. A estos
valores, que representan la tendencia de una distribución se les denomina: medidas de tendencia
central. A continuación pasaremos a analizar las más importantes en el análisis estadístico de los
resultados obtenidos en una investigación del comportamiento.

LA MEDIA ARITMÉTICA

Es la medida de tendencia central más conocida y la más importante. Su utilización no es una


experiencia tan novedosa cuando se inician los estudios de estadística, en vista de que se le conoce
ampliamente como el promedio. Todos recordamos en el colegio cuando el profesor nos pedía que
calculáramos el promedio de la materia en el bimestre, lo cual era equivalente a sumar todas
nuestras notas, dividir la suma entre la totalidad de éstas y alcanzar un puntaje que era el
representativo de nuestro rendimiento.
27

Una definición simple y adecuada de la media aritmética es: la suma de todos los datos
correspondientes a una muestra, dividida entre el total de los datos. Definida de manera estadística
sería:

 Para el caso de una muestra

Se refiere a la sumatoria de todos los datos de la muestra, dividida entre la totalidad de


sujetos de la misma.

 Para el caso de una población:

Se refiere a la sumatoria de todos los datos de la población, dividida entre la totalidad


de sujetos de la misma.

La fórmula anterior se conoce como la fórmula general de la media aritmética y se aplica cuando
se utiliza la totalidad de las observaciones, tanto de las muestras como las poblaciones. Es el
procedimiento que usan los programas estadísticos tanto de las calculadoras manuales como los
ordenadores.

Las principales características de la media aritmética son las siguientes:

1. Por ser el promedio de todas las observaciones está afectada por todos los valores, lo cual
determina que la media sea muy sensible a las puntuaciones extremas de las distribuciones.

2. A partir de la fórmula general, si dos de los componentes son conocidos, se puede
conocer el tercero.
3. La suma de las desviaciones de cada puntaje con relación a la media es igual a cero: ∑ 0.
4. La media representa un punto de equilibrio o centro de gravedad de la distribución, a partir de
los puntajes extremos de la misma.

La media aritmética para distribuciones de frecuencias

Cuando las muestras están organizadas en Tablas de Frecuencias, la media aritmética se calcula a
partir de algunos de los componentes de la misma, tal y como se demuestra a continuación. Es
importante que la tabla resumen contenga la información necesaria para que se puedan aplicar las
fórmulas requeridas para el cálculo de la media aritmética siguiendo este procedimiento.
28

TABLA 5-1:
Cálculo de la media aritmética para datos agrupados
i f Pm f * Pm
65-69 2 67 134
70-74 1 72 72
75-79 4 77 308
80-84 9 82 738
85-89 8 87 696
90-94 17 92 1564
95-99 5 97 485
100-104 8 102 816
105-109 5 107 535
110-114 4 112 448
115-119 5 117 585
120-124 2 122 244

∑ 0 ∑

A partir de los datos de la Tabla anterior, se aplica la siguiente fórmula:

∑( )
0
El resultado obtenido indica que la media aritmética de las aptitudes de los 70 aspirantes a ingresar
a la Universidad fue igual a 94.64. Si se observa la Tabla 5-1, se puede verificar la cercanía de este
resultado con el intervalo de mayor frecuencia. Es evidente que la correcta construcción de la Tabla
y de sus componentes, son una garantía para la obtención de resultados precisos en el cálculo de
estadísticos como la media aritmética.

La media aritmética y los métodos abreviados

La media aritmética puede ser calculada a través de los denominados métodos abreviados.
Aprovechando la propiedad de que la ∑ 0, se han desarrollado dos métodos alternativos para el
cálculo de este estadístico. En ambos se determina una media supuesta, que puede corresponder a
cualquier puntaje de la distribución, ya sea que esté por encima o por debajo de la media real. A
partir de este valor se calcula un corrector, que se va a agregar algebraicamente a la media
supuesta:

 Si la media supuesta es mayor que la media verdadera, el corrector será restado de la primera,
corrigiendo el exceso. De esta manera, el resultado final corresponde a la media real.

 Si la media supuesta es menor que la media verdadera, el corrector será sumado a la primera
corrigiendo el defecto; el resultado corresponderá a la media verdadera.

Las fórmulas correspondientes a los métodos abreviados son:


29


1. , en donde:

A corresponde a la media supuesta


∑ es igual a la sumatoria de las diferencias alrededor de la media supuesta

es el factor de corrección, cuyo signo será positivo o negativo atendiendo a las
características de la media supuesta (por encima o debajo de la media real)

∑( )
2. ( ) , en donde:

A es la media supuesta
∑( ) corresponde a la sumatoria del producto de las frecuencias de cada intervalo
con su correspondiente diferencia
∑( )
es el factor de corrección
i es el tamaño del intervalo

Cualquiera de los dos métodos abreviados tendrá como resultado la misma media: la verdadera.

Con el desarrollo de la tecnología y la informática, en la actualidad la utilización de los métodos


abreviados se ha reducido de manera significativa. Sin embargo, son un ejemplo claro de la
posibilidad de calcular la media real, a partir de cualquier valor de la distribución.

LOS PROMEDIOS DE POSICIÓN

Otros promedios, diferentes que la media aritmética, permiten estimar el valor representativo de la
distribución. A estos promedios se les denomina promedios de posición, en vista de que los mismos
corresponden a un lugar en la distribución. Para calcularlos, se deben satisfacer las siguientes
condiciones:

1. La distribución debe estar ordenada de menor a mayor


2. Hay que determinar el lugar o posición de la distribución, en que debe caer el promedio.
3. A diferencia de la media aritmética, no están afectados por las puntuaciones extremas de la
distribución en vista de que no se calculan a partir de los datos individuales de las muestras.

Los promedios de posición más importantes son: la mediana y la moda, los cuales pasaremos a
analizar a continuación.

La mediana (mdn)

Se considera la medida de tendencia central que divide la distribución de datos en dos partes
iguales, dejando por encima y por debajo de ella igual cantidad de observaciones. Para el cálculo de
la mediana, es necesario que los datos estén ordenados de menor a mayor atendiendo a sus
magnitudes. A continuación presentamos un ejemplo para datos no organizados en tablas de
frecuencias:
30

Puntuación (ficticios)

1
2
3
4
5 mediana
6
7
8
9

La mediana de los datos anteriores es 5, porque es el valor que en la distribución ordenada deja por
encima y por debajo igual número de puntajes. Cuando el número de observaciones es impar, la
mediana coincide con uno de los valores de la distribución; cuando el número es par, la mediana
será una fracción y estará ubicada entre los dos valores centrales de la distribución, y habrá
necesidad de promediar los mismos, tal y como se presenta a continuación:

X
1
2
3
4 mediana:
5
6
7
8
Como se puede observar, la mediana sólo se puede calcular en una distribución ordenada
previamente y no está afectada por los dos valores más extremos (1 y 8).

Cuando los datos están agrupados en tablas de frecuencias, la mediana se calcula utilizando un
procedimiento de interpolación, siendo su fórmula de cálculo la siguiente:

( )
( )

: límite inferior real del intervalo en que debe caer la mediana


: lugar(intervalo) en la columna de frecuencias acumuladas en que debe caer la
mediana
fa : frecuencia acumulada hasta el intervalo anterior al de la mediana
: frecuencias simples dentro del intervalo en donde debe caer la mediana
i : tamaño del intervalo
31

TABLA 5-2:
Cálculo de la mediana en una distribución de frecuencias
i f fa
65-69 2 2
70-74 1 3
75-79 4 7
80-84 9 16
85-89 8 24
90-94 17 41
95-99 5 46
100-104 8 54
105-109 5 59
110-114 4 63
115-119 5 68
120-124 2 70
∑ 0

Para el cálculo de la mediana se requiere de las columnas intervalos, frecuencias y frecuencias


acumuladas de la tabla de intervalos (ver Tabla 5-2). Como se puede observar, la tabla está
organizada de menor a mayor. A continuación se detalla el procedimiento para el cálculo de dicho
estadístico:

1. Se calcula
2. 35 se ubica en las frecuencias acumuladas en el intervalo 90 – 94. A este intervalo se le
denomina la clase mediana.
3. Se determina fa que corresponde a la frecuencia acumulada anterior a la clase mediana; en este
caso es igual a 24
4. De igual manera se señala el valor de fmdn , o sea, la frecuencia simple dentro de la clase
mediana, que resultó ser igual a 17
5. El tamaño del intervalo, i, para este problema es de (5)
6. Finalmente se sustituye en la fórmula de la mediana:

( )
( )

El valor de la mediana para estos datos es de 92.73 y se considera que deja por encima y por debajo
de él al 50% de los datos de la distribución. Como se puede observar, el valor de la mediana es
ligeramente inferior al de la media aritmética, situación que se presentará siempre que se analicen
datos muestrales. Sin embargo, siempre aspiraremos a que la diferencia entre estos dos estadísticos
sea la menor posible, lo cual indicaría lo que se denominará posteriormente asimetría.
32

La moda ( )

La definición más simple y frecuente de la moda es: el valor o puntaje que más se repite en una
distribución. A continuación se presenta un ejemplo, cuando las puntuaciones no están afectadas
por intervalos:

Puntajes (ficticios)

1
2
3
4
……moda
4
5
6
7
8
Para el ejemplo anterior, la moda es 4 porque es el puntaje que más se repite. El cálculo de este
estadístico en distribuciones simples es sencillo, presentándose dificultades si en la distribución hay
más de un puntaje con la mayor frecuencia; en estas condiciones, estamos ante la presencia de
varias modas en una sola distribución, situación que no es la más adecuada para el análisis de la
tendencia central de las observaciones.

1. La moda para datos agrupados en inter valos

Existen varios procedimientos para el cálculo de la moda en datos agrupados en distribuciones por
intervalos: el método de interpolación algebraica y el método empírico. A continuación
analizaremos cada uno de ellos.
33

 Moda por el método de interpolación algebraica

TABLA 5-3:
Cálculo de la moda por interpolación algebraica
i f
65-69 2
70-74 1
75-79 4
80-84 9
85-89 8
90-94 17
95-99 5
100-104 8
105-109 5
110-114 4
115-119 5
120-124 2
∑ 0

La fórmula general para el cálculo de la moda por el método de interpolación algebraica es la


siguiente:

( )

: límite inferior real del intervalo donde cae la moda (clase modal), o sea, el que tiene
mayor frecuencia
: Delta 1, que se refiere a la diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase pre modal (despréciense los signos).
: Delta 2, que se refiere a la diferencia entre la frecuencia de la clase modal y la
frecuencia de la post modal (despréciense los signos).
i : tamaño del intervalo.

Al igual que en la mediana, los datos están organizados de menor a mayor y se requiere determinar
previamente el lugar (intervalo) en que debe caer el valor de la moda. A continuación se presenta un
ejemplo a partir de los datos de la Tabla 5-3.
( )
( ) ( )

El valor de la moda calculada a través del método de interpolación algebraica es de 91.64, que es un
valor ligeramente diferente al de la media y la mediana, calculadas para el mismo conjunto de datos.
34

 Moda por el método empírico

Otro método a través del cual también se puede calcular la moda es el método empírico, el cual se
utiliza preferiblemente cuando la distribución es moderadamente asimétrica, o sea, cuando la media
y la mediana difieren ligeramente. En este caso se requiere que la media y mediana hayan sido
calculadas previamente y la fórmula general es la siguiente:

( )

Como ya se tienen los valores de la media y la mediana calculados, 94.64 y 92.73 respectivamente,
se hacen las correspondientes sustituciones en la fórmula:

( )

En este caso, la moda alcanzó un valor de 88.91, menor que el obtenido en el método de
interpolación algebraica. La diferencia entre ambos valores calculados no debe inquietar al
estudiante si los procedimientos han sido correctamente ejecutados; estos procedimientos no llevan
a resultados iguales. Sin embargo, el buen juicio del investigador debe prevalecer en situaciones
como ésta antes de escoger el método más conveniente. Para este caso, sería prudente evaluar el
coeficiente de asimetría para verificar que la diferencia entre la media y la mediana es
estadísticamente aceptable.

COMPARACION DE LA MEDIA, LA MEDIANA Y LA MODA

Es importante destacar que de las tres medidas de tendencia central, la media presenta
características estadísticas que la hacen poseer un mayor nivel de utilidad; es la más importante. Sus
propiedades favorecen su utilización en cálculos estadístico más avanzados, especialmente en las
estadísticas inferenciales y el muestreo. Se le considera la más estable y confiable entre las medidas
de tendencia central, lo cual significa que si tomáramos varias muestras, la media aritmética
presentaría menor fluctuación que la mediana y la moda.

Hay ocasiones en que se prefiere utilizar la mediana, especialmente cuando queremos hacer ciertas
descripciones.

Finalmente, la moda es la medida de tendencia central con menos aplicaciones en la investigación


psicológica. Fundamentalmente, es una medida muy inestable, no es susceptible de manipulación
algebraica y su verdadero valor es difícil de establecer.

La media, mediana y moda pueden relacionarse a través de ciertas condiciones que pasaremos a
señalar:

 Para una distribución simétrica y unimodal, la media ≈ mediana ≈ moda

 Para una distribución positivamente asimétrica, la media es la mayor, la mediana se ubica en el


centro y la moda es la menor.
35

 Para una distribución negativamente asimétrica, la media es la menor, la moda la mayor y la


mediana se ubica entre las dos.

CONCEPTOS IMPORTANTES

 Datos originales o brutos


 Media aritmética
 Promedios de posición
 Mediana
 Moda
 Medidas estadísticas
 Tendencia Central
 Variabilidad
36

EJERCICIOS PRÁCTICOS

Problema 1

110 113 111 108 113 134 124 80 112 106


133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
128 93 93 105 118 119 89 143 108 142
85 108 108 136 115 117 110 128 145 127
100 100 100 123 126 119 113 102 100 93
105 111 122 100 114 91 123 132 97 110
150 130 130 89 108 137 121 142 111 123
118 104 104 94 115 112 125 129 131 110
97 135 135 139 133 107 115 83 109 116
154 131 113 82 106 101 122 96 145 101

Los datos anteriores son los mismos para los cuales ha creado distribuciones de frecuencias y
gráficos. En esta ocasión, utilizando la tabla de Frecuencias con intervalos de tamaño 5, determine:

1. La media aritmética
2. La mediana
3. La moda (por el método de interpolación u por el método empírico)

Como usted ha construido para estos datos, distintos tipos de tablas de frecuencias, calcule las
medidas de tendencia central identificadas anteriormente. Trate de desarrollar estas prácticas que
serán de gran beneficio para su proceso de aprendizaje.
37

CAPÍTULO 6
MEDIDAS DE VARIABILIDAD

En el capítulo anterior analizamos las denominadas Medidas de Tendencia Central más


importantes en las estadísticas aplicadas en psicología. La importancia de la “tendencia central” es
incuestionable, pero es importante destacar que las mismas no son totalmente exhaustivas para
describir todas las características de una muestra de puntajes.

Además de la tendencia central o el agrupamiento de los puntajes alrededor de ciertos valores


centrales, se observan manifiestas diferencias entre los valores obtenidos por cada sujeto. Algunos
sujetos obtienen puntajes que sobrepasan las medidas de tendencia central, mientras que otros
corresponden a valores inferiores a la tendencia central. Esto se debe, principalmente, a las
diferencias individuales, que se reflejan en los resultados obtenidos en las mediciones
psicológicas, las cuales determinan una evidente “variabilidad” de las puntuaciones individuales.

En la misma forma en que la tendencia central fue analizada a través de varios estadísticos
denominados medidas de tendencia central, las variaciones observadas entre los puntajes pueden ser
descritas a través de estadísticos denominados medidas de variabilidad o dispersión, las cuales
permiten analizar las condiciones de variación que se dan entre los puntajes de la muestra y las
medidas de tendencia central.

Las medidas de variabilidad que se analizarán a lo largo de este capítulo son: la fluctuación, los
percentiles, la varianza y la desviación estándar. Las dos primeras, la fluctuación y los
percentiles, son medidas de variabilidad que no están asociadas con ninguna medida de tendencia
central, mientras que la desviación media, la varianza y la desviación estándar, son medidas de
variabilidad asociadas con la media aritmética.

Las medidas de variabilidad anteriormente presentadas no son las únicas medidas de de este tipo
existentes, pero para efectos de nuestros estudios y posteriores aplicaciones, se considerarán las más
importantes.

MEDIDAS DE VARIABILIDAD QUE NO SE ASOCIAN CON LA


MEDIA ARITMÉTICA

La Fluctuación (Amplitud)

La fluctuación es la medida de variabilidad más sencilla, tanto en su forma de calcularse como de


interpretarse. También se le reconoce como rango o amplitud, y se refiere a la diferencia que hay
entre la puntuación mayor de la distribución, menos la puntuación menor de la distribución, más
uno:

= fluctuación
= puntuación mayor
= puntuación menor
1 : corrector por continuidad
38

Si nos referimos a los datos de la muestra No.1, Capítulo 3 (ver Tabla 3-1), el puntaje mayor fue
122 y el menor 67, lo que implica que su fluctuación es de:

Para datos agrupados en tablas de distribuciones de frecuencias, la fluctuación es la diferencia entre


el límite de clase superior del intervalo más alto, menos el límite de clase inferior del intervalo más
bajo.

Como puede observarse, la fluctuación está afectada por los puntajes extremos de la distribución, y
esta situación establece la probabilidad de que valores inusuales pueden estar afectándola. Además,
la fluctuación no está relacionada con ninguna medida de tendencia central, lo cual le resta poder en
los análisis estadísticos.

Es importante destacar, que la fluctuación es muy sensible al tamaño de la muestra, lo que significa
que está muy afectada por las modificaciones en el tamaño de las mismas. Ante este conjunto de
condiciones desfavorables, es claro que la utilidad de la fluctuación es bastante limitada en
comparación con otras medidas de variabilidad que analizaremos posteriormente. Sin embargo, ya
vimos que la misma es importante para la construcción de las tablas de frecuencias por intervalos.

A continuación vamos a introducir una medida de variabilidad de mucha importancia para la


psicometría y el diseño de normas: los percentiles.

Los Percentiles

Se conoce como percentil, al puntaje de una distribución que deja por debajo de él un cierto
porcentaje de los casos de dicha distribución. Por ejemplo, el percentil 50, o sea, P50 en notación
estadística, es aquel que deja por debajo de sí al 50% de la totalidad de los casos; el percentil 32,
P32, es aquel que deja por debajo de sí al 32%, y así sucesivamente. Para el cálculo de los
percentiles, es necesario que los datos estén organizados en una Tabla de Frecuencias ordenada de
menor a mayor. El procedimiento de cálculo de un percentil es idéntico al de la mediana y se le
considera un estadístico de posición. Para el cálculo de los percentiles en una tabla de frecuencias se
recurre a la siguiente fórmula:
( )
( ), donde:

Li = límite inferior real del intervalo en que cae el percentil.


%n= número de casos correspondientes al percentil y se encuentra en la columna de las
frecuencias acumuladas.
= frecuencias acumuladas hasta el intervalo anterior al del percentil.
= frecuencias simples dentro del intervalo donde cae el percentil.
i = tamaño del intervalo.

A continuación se presenta un ejemplo:


39

TABLA 6-1:
Cálculo del P40 en una muestra de 78 sujetos
I F Fa

5-9 3 3
10-14 8 11
15-19 16 27
20-24 17 44 Intervalo en que cae 31.2

25-29 12 56

30-34 7 63
35-39 5 68

40-44 4 72
45-49 2 74
50-54 2 76

55-59 1 77
60-64 1 78

Supongamos que se desea calcular el P40 en los datos de la Tabla anterior:

Paso 1: se calcula el %/n, o sea, el 40% de 78 = (0 0)( )


Paso 2: se ubica 31.2 en el intervalo 20 – 24 que tiene una fa = 44, porque es en ese
intervalo en el que se encuentra dicho valor.
Paso 3: a partir de este intervalo se desarrolla la fórmula:

( ) 0

De acuerdo con el resultado obtenido, el puntaje 20.74 deja por debajo de él al 40% de la
distribución. Es necesario destacar que los percentiles también pueden ser identificados con otras
denominaciones, la cuales están asociadas con los porcentajes de puntajes que dejen por debajo de
si:

 Deciles (D): se refieren al 10%. En este caso, se les denominaría: decil 1 al primer 10% (D 1),
decil 2 al 20% (D2), decil 3 al 30% (D3) y así sucesivamente hasta el decil 10 que dejaría por
debajo de sí al 100%.

 Quartil (Q) : se refieren a intervalos de 25%. El cuartil 1 (Q1) deja por debajo al 25%, el Q2 se
refiere al que deja por debajo al 50% (observe que este caso es igual a la mediana), el Q3 que
deja por debajo el 75% y el Q4 que corresponde al 100%.
40

 Observe que el D5, el Q2 y la mediana, corresponden al mismo dato: el que deja por debajo de si
al 50% de la distribución.

 Todas estas denominaciones corresponden a percentiles y son calculados de acuerdo con la


fórmula ya presentada.

MEDIDAS DE VARIABILIDAD QUE SE ASOCIAN CON LA MEDIA


ARITMÉTICA

La Desviación Media

A partir de la “desviación media”, nuestro interés se centra en las medidas de variabilidad que
parten de algún tipo de promedio, ya sea la mediana o en especial la media. La desviación media se
define como el promedio de las desviaciones absolutas alrededor de la media. La fórmula para el
cálculo de dicho estadístico para datos no organizados por intervalos es:

∑| | ∑| |

A continuación se presenta un ejemplo:

X |d|

2 3.5

3 2.5
Diferencia
4 1.5 entre el
puntaje y la
5 0.5 media
aritmética,
6 0.5 sin
considerar
7 1.5 el signo

8 2.5

9__ 3.5__

∑ 16.0

Como se puede observar, cada puntaje se resta de la media (d) pero no se toma en consideración el
signo (diferencias absolutas), se suman y dividen entre n, obteniéndose una estimación de la
variabilidad la cual tiene la restricción de que no da información sobre la ubicación del puntaje con
relación a la media.
41

Para datos organizados en tablas de frecuencias, los puntos medios de cada intervalo se restan de la
media aritmética, sin tomar en consideración los signos (| |). Luego se multiplican las frecuencias
de cada intervalo por sus respectivas desviaciones, f(d), se suman los resultados de esta columna y
se dividen entre la n muestral. La fórmula para calcular de DM en datos agrupados es la siguiente:

∑( | |) ∑( | |)

Considerando los datos de la Tabla 6-2, la 0

TABLA 6-2:
Cálculo de la DM para una muestra de 70 estudiantes aspirantes a ingresar a la universidad.
I F Pm |d| f(|d|)
65-69 2 67 27.64 55.28
70-74 1 72 22.64 22.64
75-79 4 77 17.64 70.56
80-84 9 82 12.64 113.76
85-89 8 87 7.64 61.12
90-94 17 92 2.64 44.88
95-99 5 97 2.36 11.8
100-104 8 102 7.36 58.88
105-109 5 107 12.36 61.8
110-114 4 112 17.36 69.44
115-119 5 117 22.36 111.8
120-124 2 122 27.36 54.72
∑ = 70 ∑= 736.68

La DM representa una modificación del cálculo e interpretación de las medidas de variabilidad.


Esto se debe a que en este caso existe un punto o criterio a partir del cual se determinan las
desviaciones: la media aritmética. En otras palabras, desviación significa diferencia entre el puntaje
y la media aritmética. La DM no es aconsejable en muestras grandes, aunque puede utilizarse en
muestras pequeñas; además, no toma en consideración los signos positivos o negativos de las
diferencias, atendiendo a la posición del puntaje con relación a su media.; esto no favorece la
utilización de esta medida en el análisis de la Distribución Normal.

Desviación Estándar O Típica

Es la más importante de las medidas de variabilidad. Está afectada por todos los valores de la
distribución y mide la dispersión de los puntajes a partir de la media aritmética, con la característica
fundamental de que considera los signos + y – de cada diferencia. Esta situación la coloca en una
posición superior, matemáticamente, con respecto de las otras medidas de variabilidad
42

anteriormente discutidas. Para el caso de poblaciones, la desviación estándar se representa por el


2
símbolo σ; y al cuadrado de la desviación estándar σ , se le denomina varianza. Cuando nos
referimos a muestras, la desviación estándar está representada por s y el cuadrado de esta desviación
s2 se denomina varianza muestral.

En distribuciones de frecuencias simples (no afectadas por intervalos), la fórmula para calcular la
desviación estándar es a siguiente:

∑( )

Para el cálculo de la S, se requieren los siguientes pasos:

1. Calcular la media aritmética de la distribución


2. Calcular la diferencia algebraica entre cada puntaje (x) y la media:
3. ( ̅); a esta diferencia se le denomina desviación (d).
4. Elevar al cuadrado las desviaciones de cada puntaje con respecto a la media ( ̅) y sumar
el total de las desviaciones cuadráticas
5. Dividir la suma de las desviaciones cuadráticas en la muestra entre el número total de casos (n).
Este valor se denomina la varianza muestral, la cual será muy útil al momento de analizar las
estadísticas inferenciales.
6. Finalmente le extrae la raíz cuadrada a la varianza y se obtiene la desviación estándar (s).

Para datos agrupados en tablas de intervalos, la fórmula para el cálculo de la s es la siguiente:



A continuación se presenta un ejemplo del cálculo de la varianza y la desviación estándar, para


datos agrupados en tablas de intervalos.

A partir de los datos organizados en la Tabla 6-3, se sustituye en la fórmula, y se obtiene el valor de
la s:

√ ( ) √ √ 0
0 0

168.20 representa la varianza


Al extraérsele la raíz cuadrada a la varianza, se calcula la s (desviación estándar de la
muestra).
43

TABLA 6-3:
Cálculo de la desviación estándar para una muestra de 70 aspirantes a ingresar a la universidad
I f Pm fpm fpm2
65-69 2 67 134 8978
70-74 1 72 72 5184
75-79 4 77 308 23716
80-84 9 82 738 60516
85-89 8 87 696 60552
90-94 17 92 1564 143888
95-99 5 97 485 47045
100-104 8 102 816 83232
105-109 5 107 535 57245
110-114 4 112 448 50176
115-119 5 117 585 68445
120-124 2 122 244 29768
Total ∑ 0 6625 638745

La s es la medida de variabilidad más confiable y se puede definir como la raíz cuadrada del
promedio de las desviaciones cuadráticas alrededor de la media, siendo ésta su propiedad
matemática más importante. A partir de estas propiedades, la s es de gran utilidad en análisis
estadístico más avanzados tales como: muestreo, prueba de hipótesis, Análisis de la Varianza, teoría
de regresión y correlación, etc.

La Asimetría

Se entiende por simetría el grado de equilibrio que presentan las observaciones a ambos lados de su
tendencia central. Por lo tanto, la asimetría es la ausencia de equilibrio entre dichas puntuaciones.
Estadísticamente, la simetría se refiere a que las tres medidas de tendencia central son iguales; como
esta situación es poco probable que suceda en las muestras, las mismas son asimétricas en vista de
que dichas medidas tienden a ser diferentes por efecto de los errores de muestreo. En el fondo, los
investigadores aspiramos a obtener muestras con bajos niveles de asimetría y tratamos de verificar
esta situación calculando el índice de asimetría.

La condición de asimetría de una muestra se puede verificar, inicialmente, a través del polígono de
frecuencias, en el cual se puede observar las distintas formas de asimetría o sesgo, como también se
le denomina. Veamos algunos ejemplos.
44

FIGURA 6—1

Si la cola izquierda del polígono es más alargada que la derecha, estamos ante un caso de asimetría
negativa. Esto significa que por debajo de la media se encuentran los puntajes más extremos y la
media aritmética ha tenido que correrse en esta dirección, para mantener los pesos positivos y
negativos equilibrados. Si la cola de la derecha está más alargada, significa que estamos ante un
caso de asimetría positiva. Es decir, los puntajes más extremos están por encima de la media
aritmética y ella ha tenido que correrse en dicha dirección. En la distribución ubicada en el centro
de la Figura 6—1, ambos lados de la curva están equilibrados y esto indica que sus medidas de
tendencia central tienden a ser más o menos iguales.

Existen diversas fórmulas para calcular el Coeficiente de Asimetría o CA.; a continuación


presentamos dos de ellas.

 Primer Coeficiente de Asimetría de Pearson:

 Segundo Coeficiente de Asimetría de Pearson:

( )

Cuando el coeficiente de asimetría es ≤ 1, se considera que el mismo está dentro de los límites
aceptables de sesgo; mucho mejor a medida que tiende a cero (0).

La Curtosis

Se define como el grado de apuntalamiento (alargamiento vertical) que tiene una distribución y que
se refleja con claridad en los gráficos estudiados anteriormente. Cuando el apuntalamiento es poco
marcado (bajo), se considera que la distribución es platicúrtica. Cuando el apuntalamiento es muy
marcado, la distribución se considera leptocúrtica. Y cuando el apuntalamiento es mesurado, se
considera mesocúrtica, siendo esta última la que mejor nos aproxima al modelo de la curva normal.
45

FIGURA 6—2

Al igual que en la asimetría, hay diversos métodos para calcular la curtosis. A continuación
presentamos uno de ellos: K = coeficiente de curtosis percentílico, cuya fórmula es la siguiente:

K = coeficiente de curtósis percentílico


Q = desviación intercuartil =
P90 : percentil 90
P10 : percentil 10

CONCEPTOS IMPORTANTES

 Variabilidad o dispersion
 Fluctuación
 Percentil
 Variable
 Varianza
 Desviación estándar (típica)
 Decil
 Quartil
 Desviación media
 Asimetría
 Curtósis
46

EJERCICIOS PRÁCTICOS

Problema 1

110 113 111 108 113 134 124 80 112 106


133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
128 93 93 105 118 119 89 143 108 142
85 108 108 136 115 117 110 128 145 127
100 100 100 123 126 119 113 102 100 93
105 111 122 100 114 91 123 132 97 110
150 130 130 89 108 137 121 142 111 123
118 104 104 94 115 112 125 129 131 110
97 135 135 139 133 107 115 83 109 116
154 131 113 82 106 101 122 96 145 101

Para los datos presentados, los cuales están debidamente organizados en Tablas y gráficos, y para
los cuales se han calculado las principales medidas de tendencia central, determine, utilizando la
tabla con intervalos de tamaño 5:

1. Los percentiles 25, 50, 75 y 95


2. La desviación media
3. La Varianza y la desviación estándar
4. La asimetría primero, y segundo, coeficiente de asimetría
5. La Curtosis

Calcule los estadísticos de variabilidad anteriormente señalados, para todas las tablas de práctica
que ha desarrollado utilizando los datos presentados.
47

CAPÍTULO 7
MODELOS POBLACIONALES PROBABILÍSTICO

A lo largo de los capítulos anteriores, se ha hecho énfasis en la relación existente entre las medidas
de tendencia central y las de variabilidad, especialmente entre la media aritmética y la desviación
estándar. Es incuestionable que una medida pierde mucha significatividad si no va acompañada de
la otra, dado que ambas conjugan las dos características más importantes que se pueden observar en
una distribución de puntajes.

La media y la desviación estándar son las dos medidas descriptivas más poderosas y más
importantes en los análisis estadísticos aplicados en la investigación del comportamiento. Bajo
ciertos supuestos teóricos, las muestras analizadas estadísticamente se aproximan a un modelo
poblacional teórico denominado curva normal; esto es posible a partir de la información
proporcionada por la media y la desviación estándar.

Para comprender mejor lo anteriormente señalado, es necesario tener claro el significado del
concepto modelo poblacional o probabilístico. Un modelo poblacional (o probabilístico) es una
expresión matemática deducida de un conjunto de supuestos con el propósito de:

1. Estudiar los resultados de un experimento aleatorio y


2. Pronosticar resultados futuros del experimento o investigación, cuando se realizan un número
repetido de veces.

Algunos modelos poblacionales se utilizan para aproximar un gran conjunto de distribuciones de


datos obtenidos de grandes poblaciones, las cuales se hacen representar por subconjuntos menores
denominados muestras. En vista de que las variables se han definido como discretas y continuas, se
han creado modelos poblacionales para cada uno de estos tipos de variables. Lo anteriormente
señalado nos permite hacer las siguientes observaciones:

 En los casos en que la(s) variable(s) de estudio se considere discreta, o sea, que está
representada por categorías, las cuales reflejan la cantidad de sujetos, objetos o fenómenos que
comparten dicha categoría, hay un conjunto de modelos poblacionales probabilísticos que
permitirán llevar adelante estudios e investigaciones con dichas variables, independientemente
del área científica en la que se desarrolla el estudio. Lo importante es que la variable, además de
ser discreta y no poseer valores fraccionales, satisfaga las restricciones que el modelo
probabilístico exige. Algunos ejemplos de estos modelos serían: Bernoulli, Binomial,
Multinomial, Hipergeométrico, Poisson, y otros. Para el caso de este libro, analizaremos el
modelo Binomial, en vista de que el mismo se aplica a diversas experiencias, situaciones e
investigaciones propias de los estudios del comportamiento, en especial en el área de la
psicometría y construcción de pruebas.
48

 En los casos en que la(s) variable(s) de estudio se considere continua, o sea, que puede asumir
valores fraccionales dentro de intervalos y que por lo tanto indica la cantidad que cada sujeto
posee del atributo, los resultados serán aproximados a modelos de probabilidad continuos, tales
como la Distribución Normal para muestras grandes (>) de 30 sujetos, la “t” de student y la “F”
de Fisher para muestras ≤ de 30sujetos.

VARIABLES DISCRETAS

La Distribución Binomial

La Distribución Binomial es útil en aquellos casos en los cuales la variable de estudio es discreta en
el sentido de que puede asumir únicamente dos posibles valores y se satisfacen las siguientes
restricciones:

1. El experimento o investigación está compuesto por n casos, para cada uno de los cuales hay n
cantidad de pruebas o actos, con dos posibles alternativas cada una.
2. Cada una de las pruebas se debe desarrollar en las mismas condiciones
3. Los resultados obtenidos en cada prueba se clasifican en una de dos posibles categorías que son
mutuamente excluyentes denominadas éxitos o fracasos.
4. La probabilidad de éxito se identifica por “p” y la de fracaso por “q”, las cuales son
mutuamente excluyentes.
5. En cada acto, la probabilidad de éxito no varía, y por lo tanto, la probabilidad de “q” sería igual
a1–p
6. El objetivo del experimento es determinar para cada acto o prueba, si el evento venturoso o
esperado, se presentó o no.

Cuando se desarrollan investigaciones de esta índole, las mismas se consideran de carácter binomial
y tienen n + 1 resultados posibles. El 1 representa la posibilidad de que el evento esperado no se
dé. Veamos algunas situaciones relacionadas con este tipo de estudio.

 Se lanza una moneda 5 veces. El evento de interés es la aparición de caras y por lo tanto la
misma podría aparecer: 1, 2, 3, 4 y 5 veces, pero también puede suceder que no aparezca
ninguna vez. Por lo tanto, cara tiene 5 + 1 formas diferentes de aparecer (n + 1), lo cual incluye
que no aparezca. Su representación correcta sería: 0, 1, 2, 3, 4, 5.

 Se aplica un examen de 25 preguntas y el evento de interés es el número de preguntas


respondidas correctamente. Esto significa que el estudiante puede obtener desde 1… hasta 25
preguntas correctas, pero hay que incluirle que no responda correctamente ninguna de las 25 lo
que significa que obtuvo 0 éxitos. Bajo estas condiciones, el experimento tiene 25 + 1 posibles
resultados, o sea, 26. Desde 0, 1, 2, 3, 4… hasta 25.

El modelo binomial es útil en casos en los cuales estamos interesados en determinar la probabilidad
de ocurrencia de un número X de éxitos, cuando se han desarrollado n pruebas o actos, y la
probabilidad p de éxitos se ha mantenido constante a lo largo de las n pruebas. Por ejemplo:

 ¿Cuál es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?
49

 ¿Cuál es la probabilidad de responder satisfactoriamente 10 preguntas de un examen de 30


preguntas, si cada pregunta es de selección múltiple con cuatro alternativas?

Para responder a estas preguntas, se debe aplicar la fórmula de la función probabilística binomial, la
cual detallamos a continuación:

( ) ( )

Esta expresión se leería de la siguiente manera: ¿cuál es la probabilidad de obtener exactamente X


éxitos, en un experimento de n pruebas, siendo p la probabilidad de éxito en cada prueba? Los
elementos que componen la ecuación son los siguientes:

b : función binomial o probabilidad binomial


X: número de éxitos
p: probabilidad de cada éxito (es una constante, que será explicada en el capítulo 9)
nCx: combinación de x éxitos en n pruebas. ( ) ( )

A continuación se desarrollarán los dos problemas presentados como ejemplos:

 Ejemplo 1

¿Cuál es la probabilidad de obtener exactamente tres caras al lanzar una moneda 5 veces?

( 0 0) ( )(0 0 )(0 0 ) ( 0)(0 )(0 ) 0

 Ejemplo 2

¿Cuál es la probabilidad de responder satisfactoriamente 4 preguntas de un examen de 10


preguntas, si cada pregunta es de selección múltiple con cuatro alternativas?

( 00 ) ( )(0 )(0 0 ) ( 0)(0 00 )(0 ) 0

VARIABLES CONTÍNUAS

Puntuaciones estándar

Daremos inicio a nuestro estudio de los modelos poblacionales continuos, a través de la


Distribución Normal, considerada la más importante de todas las distribuciones por las propiedades
estadísticas que la definen.

Si tomáramos en consideración todos los puntajes de la muestra resumida en la Tabla 5-1,


podríamos llegar a la conclusión que la media aritmética de dichos datos fue de 94.64. A partir de
este dato podemos observar que las puntuaciones de dicha muestra se desvían por encima y por
debajo de su media muestral, tal y como lo presentamos en los ejemplos a continuación:
50

TABLA 7-1:
Desviaciones con respecto a la media
(d)
Dato Límite real Media
Desviación
75 74.5 94.64 -20.14
90 89.5 94.64 -5.14
99 99.5 94.64 +4.86
112 112.5 94.64 +17.86

Los ejemplos anteriores demuestran que los puntajes de las distribuciones se desvían por encima y
por debajo de su media aritmética; si recordamos una propiedad de la media sabemos que ∑ 0.
Otro aspecto a destacar en el cuadro anterior es que para calcular la desviación (d), se utilizan los
límites reales de cada dato, atendiendo a la posición que ocupe con relación a la media: si es menor
que la media, la desviación se haría desde el límite inferior real del dato (75 y 90); si es mayor que
la media, se utilizaría el límite superior real del dato (99 y 112). Estos ejemplos permiten aclarar el
concepto de desviación con respecto a la media, desde el punto de vista de que las desviaciones
alrededor de la media pueden ser negativas (-) para los casos de X menores que la media, y
positivas (+) para los casos de X mayores que la media.

Para la muestra de datos de la Tabla 5-1, la desviación estándar (s) fue de 12.97, lo cual representa
el promedio de las desviaciones alrededor de la media. Si cada desviación de los puntajes
observados en la Tabla 7-1, fuera dividida entre la desviación estándar (12.97), se obtendrían las
desviaciones de los puntajes expresados en unidades de desviación estándar, tal y como se presenta
en la siguiente Tabla.

TABLA 7-2:
Desviación estandarizada de los puntajes originales a partir de la relación d/s
d
x Desviación
(Desviación ⁄
(Puntajes) estandarizada
original)
75 -20.14 0 ⁄ -1.55
90 -5.14 ⁄ -0.40
99 +4.86 ⁄ +0.37
112 +17.86 ⁄ +1.38

Si observamos la Tabla anterior, las “d” han sido transformadas a unidades de desviación estándar.
Esta nueva situación se interpreta de la siguiente manera:

1. El puntaje 75 se desvía de la media aritmética en -1.55 unidades de desviación estándar.


2. El puntaje 90 se desvía de la media aritmética en -0.40 unidades de desviación estándar.
3. El puntaje 99 se desvía de la media aritmética en 0.37 unidades de desviación estándar.
4. El puntaje 112 se desvía de la media aritmética en 1.38 unidades de desviación estándar
51

Como se puede observar, las “d” con la media aritmética son relativas en función de la desviación
estándar; la interpretación ahora es la siguiente: cuántas unidades de desviación estándar se
desvía cada puntaje de su media aritmética.

Una puntuación estándar, identificada a partir de este momento por “z”, se refiere a la
transformación de la diferencia de un puntaje con respecto a su media aritmética en unidades de
desviación estándar. La regla (fórmula) para calcular esta medida es la siguiente:

En términos de puntuaciones estandarizadas Z, una distribución de puntajes está definida dentro de


los siguientes intervalos:

| | | | | | |
-3s -2s -1s 𝑥 1s 2s 3s
-3z -2z -1z 0 1z 2z 3z

FIGURA 7—1

De acuerdo con el diagrama anterior, podemos hacer las siguientes deducciones:

 Cada desviación estándar (s) corresponde a una z

 En una distribución de puntajes, los mismos estarán definidos entre -3z y +3z.

 Esto significa que el puntaje menor de la distribución estará muy cerca de -3z pero nunca más
allá de este valor

 De igual manera, el puntaje mayor de la distribución estará muy cerca de +3z, pero nunca será
mayor a éste.

 La media de las puntuaciones z será igual a cero y la desviación estándar será igual a uno.

La Distribución Normal

La Distribución Normal es un modelo poblacional, teórico, que permite analizar las observaciones
correspondientes a ciertas muestras en términos de probabilidades. La Distribución normal se
identifica por una curva perfecta en forma de campana, que satisface las siguientes propiedades:

1. Es una distribución teórica de los datos de una población


2. Tiene forma de campana
3. Es asintótica, o sea, que las colas de la curva nunca se unen con el eje de X
4. Tiene como parámetros a (media) y a (desviación estándar). Esto significa que el área bajo
la curva está definida por y un valor determinado de .
5. El valor de es de 0, mientras que el valor de es de 1.
52

6. Está definida totalmente a partir de la media, por 3 desviaciones a la derecha (por encima de )
y 3 desviaciones a la izquierda (por debajo de ), lo que significa que la totalidad de los casos
de la muestra están definidos dentro de este intervalo. (Ver la Figura 7—2)

34.13% 34.13%

13.59% 13.59%

2.15% 2.15%

-3 -2 -1 0 1 2 3

FIGURA 7—2

Otra característica de la Distribución Normal es su perfecta simetría; la media aritmética = a la


mediana = a la moda, lo que determina que una mitad de la curva sea igual a la otra mitad. Esto
implica que las características estadísticas de una mitad, sean igual a las de la otra.

Entre cada desviación estándar se describe la probabilidad de los datos bajo la curva, tal y como se
observa en la Figura 7—2. Esta probabilidad también se expresa en % para facilitar su
interpretación. A continuación se detalla la distribución de probabilidades bajo la curva:

 Entre la media y una desviación estándar positiva se encuentra el 0.3413 de probabilidad que
corresponde al 34.13%. Por identidad, se dan los mismos valores a una desviación negativa.

 Entre una desviación y dos desviaciones positivas, se da el 0.1359 de probabilidad que


corresponde al 13.59%; lo mismo sucede el lado izquierdo.

 Entre dos desviaciones y tres desviaciones positivas se observa el 0.0215; de igual manera
sucede en el lado izquierdo. Esto corresponde al 2.15% de la probabilidad total.

 Desde la media hasta tres desviaciones positivas se da un total de 0.4987 de probabilidad; de


igual manera sucede en el lado izquierdo.

 La probabilidad total bajo la curva, o sea, entre -3z y + 3z es igual a 0.9974, que corresponde a
un 99.74% de la totalidad del área bajo la curva. La Curva Normal no tiene un 100% de
probabilidades bajo ella, por su condición asintótica; la curva normal va al infinito tanto en la
cola derecha como en la izquierda.
53

 Así como las probabilidades bajo la curva son infinitas, de igual manera lo son las puntuaciones
z. Sin embargo, cuando se aproximan muestras a la curva normal, las probabilidades se
determinan entre +3z y – 3z.

 Para cada valor z hay una probabilidad asignada, la cual se determina a través de una Tabla
especialmente confeccionada para estos fines (Ver Apéndice)

Aplicación

Una de las aplicaciones al trabajar con la distribución normal mediante las puntuaciones z es el
cálculo de la probabilidad de ocurrencia de una determinada puntuación.

El procedimiento para este cálculo conlleva los siguientes pasos:

1. Determinar el puntaje z correspondiente a la puntuación cuya probabilidad se quiere calcular.


2. Se determina el área correspondiente entre la media y el valor z (Utilizar la tabla de Áreas bajo
la curva normal en el Apéndice 1)
3. Realizar la operación de acuerdo con el área que se solicita
 Si Z es positiva y se solicita área por encima de x, entonces resta
0 000

P de Z

 Si Z es positiva y se solicita área por debajo de x, entonces suma


0 000

P de Z

0.5000

 Si Z es negativa y se solicita área por encima de, entonces suma


0 000
54

P de Z

0.5000

 Si Z es negativa y se solicita área por debajo de, entonces resta


0 000

P de Z

 Si Z1 y Z2 tienen signos iguales y se solicita el área entre ellas, entonces se resta

P de Z2

P de Z1

 Si Z1 y Z2 tienen signos distintos y se solicita el área entre ellas, entonces se


suma

P de Z1 P de Z2

Ej emplos
55

1. Se aplicó una prueba de aptitudes generales a una muestra de 250 estudiantes de primer ingreso
a la universidad. La media fue de 65 y la desviación estándar de 8.25. Determine la “p” de
obtener una puntuación mayor de 68 puntos
 Se calcula el valor “z” correspondiente al puntaje 68. En vista de que ese
puntaje es mayor que la media aritmética, se utiliza el límite superior real del
mismo.

 Se determina el área o probabilidad bajo la Tabla de la curva normal


correspondiente al valor de z, lo cual equivale a 0.1628
 Como la probabilidad pedida es mayor que 68, se resta a la mitad de la curva
(0.5000) la probabilidad correspondiente a X = 68, tal y como se demuestra a
continuación: 0 000 0 0 , lo cual corresponde a la
respuesta correcta.

2. Con los mismos datos del problema, determine la probabilidad de obtener una puntuación
menor o igual a 71 puntos.
 Se calcula el valor “z” correspondiente al puntaje 71; por ser el mismo mayor
que la media aritmética, se utiliza el límite superior real.

 Se determina el área o probabilidad de z = 0.79, que corresponde a 0.2852


 En vista de que la probabilidad solicitada es ≤ que 71, a la probabilidad
correspondiente a 71 que va desde la media hasta este puntaje, se le suma la
mitad inferior de la curva, tal y como se presenta a continuación:
0 0 000 0 , que representa la respuesta correcta

3. Con los mismos datos, indique la probabilidad de obtener una puntuación entre 60 y 71.
 Por el problema anterior ya se conoce la probabilidad del puntaje 71, que fue
igual a 0.2852
 Se determina el valor Z del puntaje 60, que por ser inferior a la media
aritmética, requerirá que se utilice el límite inferior real de dicho puntaje.

 Como se pudo observar, este valor es negativo por ser 60 inferior a la media de
65.
 Se determina el área o probabilidad de Z = -0.67 utilizando la Tabla; el
resultado fue de 0.2486
 Finalmente se suman las dos áreas y se determina la probabilidad de obtener un
puntaje ente 60 y 71, tal y como se presenta a continuación:
0 0 0 , que representa la respuesta correcta.
56

Hay ocasiones en que el problema se debe desarrollar íntegramente en una mitad de la curva. Por
ejemplo, si se busca un área en la mitad superior de la media o en la mitad inferior de la media
aritmética.

Tomando como referencia el problema planteado, suponga que se requiere determinar la


probabilidad que hay entre los puntajes 53 y 62. Como se puede observar, ambos puntajes están
por debajo de la media aritmética, lo cual afecta la definición de los límites reales. Para estos
casos, se procedería de la siguiente manera.

1. Ubique el puntaje más alejado de la media aritmética, el cual sería, en este caso 53, y
determine su valor Z, utilizando su límite real inferior.

2. Determine el área correspondiente a este valor Z, que es igual a 0.4357


3. Ubique el puntaje más cercano a la media, el cual corresponde a 62. Como usted está buscando
la probabilidad entre 53 y 62, en realidad está buscando la probabilidad entre 52.5 y 62.5, por lo
tanto, necesita determinar la probabilidad entre la media y el límite superior de 62, que es 62.5.
Se determina la Z de 62.5.

0 0
4. Determine el área o probabilidad correspondiente a esta Z, que es 0.1179
5. Teniendo el área del límite inferior del puntaje más lejano (53) y el área del límite superior del
puntaje más cercano (62), se restan ambas probabilidades, tal y como se presenta a
continuación: 0 0 0 , que es la respuesta correcta al problema.

El manejo correcto de la Distribución Normal es una obligación de los especialistas del


comportamiento, en vista de que un número importante de investigaciones se refieren a muestras
provenientes de grandes poblaciones. Además, un número importante de pruebas de hipótesis se
fundamentan en los principios de la Distribución Normal, tanto en el caso de muestras grandes
como pequeñas. Finalmente, la medición del comportamiento requiere del dominio de la curva
normal en los aspectos de muestreo, análisis de reactivos y diseño de normas.

Aproximación Normal De La Distribución Binomial

En algunas ocasiones, los investigadores se encuentran con la necesidad de analizar un problema


utilizando una distribución de probabilidad diferente a la que corresponde a la(s) variable(s) de
estudio. Uno de los casos más frecuente en psicología es el evaluar a través de la normal, datos que
originalmente corresponden a la binomial. A esta situación se le conoce como la aproximación
normal de la binomial.
57

Su aplicación es muy útil en investigación general del comportamiento, pero en mi opinión, su


aporte más importante se da en la medición psicológica, especialmente en los casos en que
deseamos analizar probabilísticamente los resultados de pruebas, cuyas respuestas se pueden
brindar en dos posibles alternativas: éxitos y fracasos, y en las cuales, el número de reactivos que la
conforman es grande.

Para utilizar esta aproximación es necesario que se cumplan algunas condiciones:

 N debe ser grande. Para efectos prácticos estadísticos, np debe ser > 5.

 p y q no deben estar próximos a cero; mientras más se aproximen a su límite, 0.50, mejor.

La aproximación se realiza transformando los puntajes binomiales a normales, o sea, a puntuaciones


z. La fórmula para alcanzar éste objetivo es:

z : puntuaciones normales estandarizadas


np : media de la distribución binomial
√ : desviación estándar de la distribución binomial
x : puntaje.

A continuación se presenta un ejemplo:

Se aplicó una prueba de conocimientos generales constituida por 60 reactivos; la prueba es de


cierto-falso, o sea, dos alternativas. Estamos interesados en determinar la probabilidad de
obtener hasta 38 preguntas correctas.

( 0)(0 0) 0
0
√ √( 0)(0 0)(0 0)

Area (p) de Z = 2.20 = 0.4861

Probabilidad solicitada: mitad inferior de la curva = 0.5000 + 0.4861 = 0.9861

A partir del cálculo de Z, el resto del procedimiento se hace tal y como se estudió en el capítulo de
la Distribución Normal.
58

CONCEPTOS IMPORTANTES

 Curva Normal
 Área o probabilidad
 Desviación
 Distribución binomial
 Modelo poblacional
 Límites reales
 Puntuación estándar
 Puntuación Z
59

EJERCICIOS PRÁCTICOS

Problema 1

110 113 111 108 113 134 124 80 112 106


133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
128 93 93 105 118 119 89 143 108 142
85 108 108 136 115 117 110 128 145 127
100 100 100 123 126 119 113 102 100 93
105 111 122 100 114 91 123 132 97 110
150 130 130 89 108 137 121 142 111 123
118 104 104 94 115 112 125 129 131 110
97 135 135 139 133 107 115 83 109 116
154 131 113 82 106 101 122 96 145 101

Para los datos presentados, usted ya ha desarrollado en los capítulos anteriores, todo un modelo de
análisis descriptivo que incluye: tablas de frecuencias, gráficos, medidas de tendencia central y de
variabilidad. En estas dos últimas, ha calculado la media aritmética y la desviación estándar. Como
ya es de su conocimiento, estos dos estadísticos se consideran los estimadores requeridos para
ajustar los datos a la distribución normal o curva normal. Desarrolle los problemas que le
presentamos, a continuación:

1. ¿Cuál es el área o “p” por encima del puntaje (X) = 103?


2. ¿Cuál es el área o “p” por debajo de X = 90?
3. ¿Cuál es el área o “p” por encima de X = 79?
4. ¿Cuál es el área o “p” por debajo de X = 112?
5. ¿Cuál es el área o “p” entre X = 77 y X = 94?
6. ¿Cuál es el área o “p” entre X = 99 y X = 112?
7. ¿Cuál es el área o “p” por debajo de X = 80 y por encima de X = 107?
8. ¿Cuál es el área o “p” exactamente = a X=103?
9. Para cada uno de los 8 ejercicios anteriores, determine el número de sujetos (n) incluidos dentro
de cada uno de los intervalos presentados.

Binomial

10. Se ha presentado un examen de cierto-falso con 20 preguntas. Determine la “p” de obtener:


 0 preguntas correctas
 4 preguntas correctas
 Entre 3 y 6 preguntas correctas
11. La probabilidad de que nazca una niña mujer es de 0.51. Si en cierta fecha se producen tres
nacimientos, ¿cuál es la “p” de: que nacieran:
 tres mujeres?
 Por lo menos una mujer?
 Ninguna mujer?
60

12. En un “test” psicológico de relaciones espaciales, se tiene una probabilidad de 0.40 de acertar
en cada una de las pruebas. Si un sujeto realiza 5 pruebas, ¿cuál es la probabilidad de obtener:
 un éxito?
 tres éxitos?
 hasta cuatro éxitos?
 Ningún éxito?
13. El 30% de los hogares de cierta ciudad, tiene por lo menos una persona desempleada. Un
investigador visita 6 hogares. ¿Cuál es la probabilidad de que encuentre:
 Un hogar en estas condiciones?
 Entre 0 y 3 hogares en estas condiciones?
 Todos los hogares en estas condiciones?
 No menos de 2 hogares en estas condiciones?
14. La probabilidad de que un niño tenga Déficit de Atención (DA) en una escuela elemental es de
0.20. Se seleccionan 7 niños de dicha escuela. ¿Cuál es la probabilidad de que:
 por lo menos 4 niños sufran de DA?
 2 niños sufran de DA?
 A lo máximo 3 niños sufran de DA?
 Entre uno y 4 niños sufran de DA?

Aproximación Normal A La Binomial

15. Una prueba de aptitudes cuyas preguntas son de 4 alternativas cada una, consta de 50 reactivos.
¿Cuál es la probabilidad de obtener:
 entre 20 y 38 respuestas correctas
 entre 30 y 42 correctas
 más de 26 correctas
 menos de 20 correctas
16. En un centro de rehabilitación de menores el 40% ingresó por consumo de drogas. Se
selecciona una muestra de 60 menores. ¿Cuál es la probabilidad de obtener:
 entre 20 y 29 menores consumidores?
 menos de 30 menores consumidores?
 15 o más menores consumidores?
 Entre 12 y 22 menores consumidores?
61

CAPÍTULO 8
CORRELACIÓN Y REGRESIÓN

En los capítulos anteriores nos hemos dedicado a analizar los resultados correspondientes a la
medición de una sola variable. Pero en muchas ocasiones, los psicólogos se interesan por las
relaciones que existen entre dos o más variables, asumiendo que las mismas no funcionan
independientemente, sino que una afecta o se relaciona con la otra.

Por lo general, las teorías psicológicas que tratan de explicar la conducta del hombre, analizan la
misma a través de modelos teóricos multivariantes, que exploran el comportamiento desde dos
perspectivas: la teórica y la operacional; en ambos casos, el enfoque principal se centra en
considerar el comportamiento como el efecto combinado de dos o más variables. El análisis
operacional de las relaciones entre variables se lleva a cabo utilizando una herramienta de las
estadísticas denominada correlación. El análisis de las correlaciones permite explicar, en términos
estadísticos, el tipo de relación entre las variables y la magnitud (cantidad) de la relación entre las
mismas.

Las correlaciones favorecen la interpretación del comportamiento desde diferentes puntos de vista:

 La predicción: no es otra cosa que la posibilidad que tienen los especialistas de la conducta de
pronosticar, dentro de ciertos márgenes de error, el comportamiento de una o más variables, a
través del análisis del comportamiento de otras variables diferentes. Suponga que yo considero
que dos variables comportamentales X y Y se relacionan de alguna manera. Si logro comprobar
dicha relación, desde una perspectiva estadística, puedo estar en capacidad de pronosticar que
sucederá en el futuro con una de ellas, a partir del conocimiento del comportamiento de la otra.
Por ejemplo:

o Se ha logrado establecer estadísticamente, que la aptitud numérica (X) se relaciona


con el rendimiento académico en ingeniería (Y).

o Por lo tanto es posible, probabilísticamente, que se pueda pronosticar qué resultados se


pueden obtener en el futuro en la variable Y, si tengo información previa de los
resultados obtenidos de un atributo en la variable X.

 Relación causa-efecto: a partir de la correlación, se puede establecer si entre dos o más


variables se da una relación de causa y efecto; o sea, que el comportamiento de una(s), es(son)
la(s) responsable(s) del comportamiento de la otra(s).

 La Confiabilidad: es una de las dos características imprescindibles en toda prueba psicológica;


la otra es la validez. Se entiende por confiabilidad, la capacidad que tiene una prueba de
mantener resultados más o menos parecidos en dos o más mediciones de una variable, siempre
y cuando entre dichas mediciones, el sujeto no sufra cambios significativos (cognitivos,
cognoscitivos, emocionales, etc.). La correlación es un método que favorece la determinación
de la confiabilidad de una prueba.
62

 La Regresión: es un procedimiento estadístico a partir del cual se puede establecer una


predicción y requiere que previamente se establezca que entre las variables involucradas exista
correlación.

Después de haber presentado algunas características propias de la correlación, es prudente brindar


una definición de este concepto: se entiende por correlación, el grado de relación que existe entre
dos o más variables. La correlación nos brinda información sobre la magnitud o cantidad de
relación y la dirección de dicha relación. Más adelante aclararemos estos dos conceptos, porque
consideramos prudente aclarar el concepto de relación, antes de continuar avanzando en este tema.
Además, para facilitar la presentación del módulo, nos referiremos específicamente a la relación
que hay entre dos variables; a esta situación la llamaremos relación bivariante. Las relaciones de
más de tres variables las presentaremos al finalizar del capítulo.

La relación entre dos variables puede ser de dos tipos:

1. Relación lineal, que se refiere al caso en que dicha relación puede ser representada con mayor
precisión, a través de una línea recta.
2. Relación no lineal, que se refiere al caso en que la misma no se aproxima a una línea recta.

Para el desarrollo de nuestro tema nos referiremos, tanto en teoría como en la práctica, al modelo de
relación lineal.

A continuación presentamos un ejemplo de relación lineal. Supongamos que un investigador en


psicología escolar está interesado en determinar si las variables Habilidad General y Habilidad
Verbal están relacionadas. Para tal efecto, toma una muestra de 10 estudiantes preuniversitarios y
les aplica pruebas que miden ambos factores. Los resultados son los siguientes:

TABLA 8-1
Puntajes obtenidos en habilidad general y en habilidad verbal por 10 estudiantes preuniversitarios
H. General H. Verbal
Sujetos
X Y
1 10 10
2 12 15
3 20 17
4 25 25
5 27 32
6 35 37
7 43 40
8 40 38
9 32 30
10 47 49

Los puntajes resumidos en la Tabla 8-1 indican, de forma descriptiva, los resultados que obtuvieron
cada uno de los diez sujetos de la investigación, en la medición de las variables contempladas en el
estudio. Para determinar la correlación se sugiere que, como primer paso, se determine el
63

Diagrama de Dispersión correspondiente a dichos datos, el cual nos brindará información gráfica
de la relación entre ambas variables.

GRÁFICO 8-1

Gráfico de dispersión de los datos


60

50
Y (Habilidad verbal)

40

30

20

10

0
0 5 10 15 20 25 30 35 40 45 50
X (Habilidad general)

El Diagrama de Dispersión consiste en localizar cada par de puntos (X, Y) en un sistema de


coordenadas rectangulares, el cual se construye en el cuadrante cartesiano en el cual tanto X (eje
horizontal) como Y (eje vertical) son positivos. Como se puede observar en el diagrama, hay diez
puntos que corresponden a la intersección de las X y las Y para cada sujeto. La variable Habilidad
General está ubicada en el eje X y la variable Habilidad Verbal en el eje Y; la totalidad de los
puntos localizados en el diagrama se denomina nube de puntos.

Los puntos localizados en el Diagrama permiten identificar ciertas características de la relación de


las variables X y Y, las cuales se deben generalizar para cualquier Diagrama de Dispersión que se
construya:

1. Si la nube de puntos tiende a una línea recta, estamos ante una relación lineal.
2. Si la nube de puntos tiende a algún tipo de curva, la relación es no lineal.

Para nuestro ejemplo, la nube de puntos tiende a una línea recta, lo cual es indicativo que estamos
ante una relación lineal.

La nube de puntos además de aproximar los datos a una línea recta, puede presentar una de dos
direcciones dentro del diagrama:
64

1. Una dirección positiva, que es aquella en que la nube de puntos va de izquierda a derecha del
diagrama de dispersión.

X
2. Una dirección negativa, cuando la nube de puntos va de derecha a izquierda del diagrama de
dispersión.

Si analizamos con detenimiento la información presentada con relación al Diagrama de Dispersión,


podemos hacer las siguientes observaciones:

 El Diagrama nos permite establecer si la relación será lineal o no lineal.

 Además, el Diagrama permite pronosticar que la relación será positiva (+) o negativa (-)
atendiendo a la dirección de la nube de puntos.

Otro aspecto importante que se puede deducir de la inspección del Diagrama de Dispersión es la
estimación de la magnitud (cantidad) de la relación entre ambas variables, lo cual se podrá
determinar observando si los puntos tienen poca variabilidad o mucha variabilidad; en otras
palabras, si los puntos al trazarse una línea recta tienden a caer sobre la misma, o si los puntos
tienden a caer fuera de la línea, ya sea por encima o por debajo de ella. La siguiente figura presenta
las principales alternativas.
65

FIGURA 8—1

En la Figura 8—1 se presenta con mucha claridad la información que se puede extraer de un
Diagrama de Dispersión.

 Los tres primeros diagramas horizontales nos indican que corresponden a relaciones positivas,
por la dirección de la nube de puntos. Además se observa que la magnitud de las correlaciones
(información que está sobre recta de regresión) varía en cada uno de los Diagramas. En el
primero de observa que r = 1.00; en el segundo r = 0.91; en el tercero r = 0.56. Si observamos
con detalle cada diagrama resalta el hecho de que en cada uno de ellos, los puntos que
constituyen la nube se dispersan de manera diferente en cada ejemplo: en el primero, todos los
puntos caen sobre la línea recta; en el segundo, los puntos no caen en su totalidad sobre la línea
y se dispersan por arriba y por debajo de la misma, pero no están muy alejados de ella; en el
tercero, los puntos no caen sobre la línea y se dispersan de la misma en un mayor grado que en
los dos ejemplos anteriores. De esto podemos extraer como conclusión de que a menor
dispersión, mayor magnitud de la correlación. De los tres ejemplos se desprende que, la mayor
relación corresponde al primero (r=1.00), en segundo lugar está el ejemplo número dos (r =
0.91) y finalmente, el ejemplo número tres (r=0.56). Se ha introducido un elemento nuevo a
nuestra discusión: r, que se lee coeficiente de correlación y es el indicador matemático de la
cantidad de relación entre las variables. Más adelante, vamos a discutir ampliamente este
concepto.
66

 Los tres diagramas que están en la segunda línea de la Figura No.1 indican que, por la dirección
de la nube de puntos, o no hay relación (primer diagrama) o la relación es negativa (segundo y
tercer diagrama), lo cual se observa en los valores de r para cada uno de ellos: para el primero
r = 0 y los puntajes no se aproximan a una línea recta; en el segundo caso, la nube si se
aproxima a una línea recta pero a la inversa, además de que los mismos no caen exactamente
sobre la recta (r = - 0.66); y en el tercer caso, la nube se ajusta totalmente a una recta y el valor
de r = - 1.00.

 El Diagrama de Dispersión es una herramienta que permite hacer una estimación cualitativa de
la relación entre dos variables. Esta relación se debe establecer cuantitativamente a través del
denominado coeficiente de correlación, el cual se representa por r. Los valores de r
presentados para cada uno de los seis ejemplos anteriores, no se calculan a través del diagrama
de dispersión; han sido presentados en los mismos con la intención de hacer más clara la
explicación de la importancia de dicha figura en el establecimiento de la relación entre dos
variables. El cálculo de r se presentará a continuación.

 Si los incrementos en X van acompañados de incrementos en Y, se produce una correlación


positiva, lo cual se refleja en la dirección de la nube de puntos. Si al incrementarse X se observa
que Y tiende a disminuir, estamos ante una correlación negativa y esto se reflejará en la
dirección de la nube de puntos. Si no se observa en la nube de puntos, tendencia a aproximarse
a una línea recta, entonces estamos ante una evidente situación de ausencia de correlación.

Vamos a continuación a referirnos al coeficiente de correlación como indicador de la magnitud o


cantidad de relación que se presenta entre las variables involucradas.

Un coeficiente de correlación es una estimación matemática de la relación entre dos o más


variables. El valor del coeficiente de correlación estará comprendido entre + 1 y -1, pasando por
cero. El máximo valor que puede alcanzar un coeficiente de correlación positivo es +1; esto indica
que la relación es perfecta entre los valores de X y Y. Por lo tanto, decimos que estamos ante una
relación de este tipo, cuando la posición que ocupa el sujeto en la variable X es exactamente la
misma que ocupa en la variable Y. En el momento en que esta situación no se dé sistemáticamente,
el valor de r será menor a 1.00, y se aproximará a cero (0) a medida que las diferencias de posición
(rango) sean mayores.

Por otro lado, cuando el valor de r es igual a -1, estamos ante una correlación perfecta negativa y
corresponde al valor de r más alto con este signo. Esto nos indica que el sujeto más alto en X es el
más bajo en Y, el segundo sujeto más alto en X es, a su vez, el segundo sujeto más bajo en Y, y así
sucesivamente. Si esta relación inversamente proporcional no se cumple sistemáticamente, el valor
de r va a disminuir y se aproximará a cero en la medida que las diferencias de posición en ambas
variables sean mayores.

/ / /

r = -1.00 r=0 r = 1.00


67

La correlación se centra en dos aspectos de la relación: la dirección que puede ser positiva o
negativa, y el grado, fuerza o magnitud, que se refiere al valor cuantitativo de la relación. Cuando la
relación es perfecta (+1 ó -1), la predicción de una variable hacia la otra es exacta; cuando la
correlación es imperfecta (< 1 ó > -1), la predicción es aproximada y se debe establecer el margen
de error, siendo ésta la situación más común cuando se trabaja con muestras. Cuando no hay
correlación (r = 0), no se puede hacer predicción.

El coeficiente de correlación, que a partir de este momento representaremos por rxy se denomina
Coeficiente de Correlación de Pearson, y el mismo es aplicable al cálculo de relaciones lineales.
Para determinar el rxy, es necesario que ambas variables estén medidas en la misma escala y se
pueden utilizar dos métodos para calcular el mismo:

1. El método normalizado, en el cual se aproximan los datos a la curva normal, y cuya fórmula
es:
∑( )

2. El método de los puntajes originales, cuya fórmula es:

(∑ )(∑ )

(∑ ) (∑ )
√[∑ ] [∑ ]

A continuación se presenta el cálculo de rxy para los datos de la Tabla 8-1, utilizando ambos
métodos: el normalizado y el de datos originales. Con ambos métodos los resultados deben ser
iguales aunque, en la situación de laboratorios o talleres, puede suceder que se observen diferencias
de +/- 0.01; en estos casos, por la situación del redondeo, las diferencias pueden ser aceptadas.

TABLA 8-2:
Cálculo de rxy para las variables habilidad general y habilidad verbal (n = 10)
H. General H. Verbal
Sujetos Z de X Z de Y (ZxZy)
X Y
1 10 10 -1.51 -1.55 2,34
2 12 15 -1.35 -1.15 1,55
3 20 17 -0.72 -0.99 0.71
4 25 25 -0.32 -0.35 0.11
5 27 32 -0.17 0.22 -0.04
6 35 37 0.47 0.62 0.29
7 43 40 1.10 0.86 0.95
8 40 38 0.86 0.70 0.60
9 32 30 0.23 0.06 0.01
10 47 49 1.42 1.58 2.24


68

La Tabla 8-2 presenta el resumen del procedimiento para calcular el coeficiente de correlación r xy
para dos variables, utilizando el procedimiento de los datos normalizados z. A continuación
presentamos los pasos requeridos. En primera instancia, organice los datos en una matriz o Tabla
que contenga las siguientes columnas: Sujetos, X, Y, Zx, Zy, ZxZy

1. Calcule la media y la desviación estándar tanto para la variable X como para la Y.


2. Transforme todos los valores X en puntuaciones Z (columna Zx) al igual que los valores Y
(columna Zy)
3. Multiplique cada valor de Zx por su correspondiente valor de Zy y coloque cada resultado en la
columna (ZxZy) y sume esta columna.
4. Sustituya en la fórmula los datos calculados en el ejemplo:

∑( )
0 0
0
El resultado obtenido de 0.97 indica, que entre las variables Habilidad General y Habilidad
Numérica se observa una relación positiva y alta. Esto implica que, en general, los sujetos con
puntuaciones altas en X, también obtuvieron puntuaciones alta en la variable Y; los que obtuvieron
puntuaciones medias en X, también las obtuvieron en Y, y de igual manera sucedió con los de
puntajes bajos.

El método de las puntuaciones originales es una forma alternativa para calcular el coeficiente de
correlación lineal de Pearson. Tal y como su nombre lo indica, se utilizan las puntuaciones
originales para calcular la rxy. A continuación se desarrolla el procedimiento, utilizando los datos de
la Tabla anterior

TABLA 8-3:
Cálculo de rxy para las variables habilidad general y habilidad verbal (n = 10)
H. General H. Verbal
Sujetos X2 Y2 XY
X Y
1 10 10 100 100 100
2 12 15 144 225 180
3 20 17 400 289 340
4 25 25 625 625 625
5 27 32 729 1024 864
6 35 37 1225 1369 1295
7 43 40 1849 1600 1720
8 40 38 1600 1444 1520
9 32 30 1024 900 960
10 47 49 2209 2401 2303
∑ 291 293 9905 9977 9907
69

(∑ )(∑ )

(∑ ) (∑ )
√[∑ ] [∑ ]

( )( )
0 0
√[ 0 0 ][ 0 ]

0 0
√[ 0 00 0][ 0]

0 0 0
0
√( 0)( )

Los pasos a seguir para calcular rxy utilizando el método de las puntuaciones originales son los
siguientes:

1. Cree una tabla en la que deben aparecer las columnas de X y Y. Sume las puntuaciones de cada
columna.
2. Incorpore a la Tabla las columnas de X2 y Y2; sume las puntuaciones de dichas columnas.
3. Incluya en la Tabla la columna de XY, o sea, que para cada sujeto se multiplica el puntaje X por
el puntaje Y; sume los puntajes de la misma.
4. Sustituya en la fórmula los datos obtenidos en la Tabla y obtendrá el coeficiente de correlación
para datos originales.

Los métodos analizados anteriormente están dirigidos a variables que han sido medidas por lo
menos en una escala de intervalos. Para estos casos, el Coeficiente de Correlación de Pearson, ya
sea en su forma normal (Z) o en la de puntuaciones originales, es el adecuado para establecer la
magnitud y el sentido de la relación entre las dos variables.

Sin embargo, hay ocasiones en las cuales las variables no satisfacen la condición de medición
intervalar, sino que ambas o una de ellas está medida en una escala ordinal. En estos casos, el
Coeficiente de Correlación de Rangos de Spearman (rho) es el método más eficiente para
determinar la relación entre estas variables; es una aplicación del coeficiente lineal de Pearson para
datos medidos en escala ordinal. Es importante destacar que los datos originales no necesariamente
deben estar medidos en escala ordinal, pero si el investigador considera que los daos no satisfacen
los requisitos exigidos para la aplicación del método de Pearson, puede transformarlos a una escala
ordinal y aplicar el coeficiente Rho. La fórmula para el cálculo de rho es la siguiente:

D: diferencia entre los rangos de ambas variables


n: número de pares de rangos (X y Y)

A continuación presentamos un ejemplo:


70

TABLA 8-4:
Cálculo del coeficiente de correlación rho de Spearman para una muestra de 5 sujetos
D
D
Sujetos X Y R(X) R(y) (Rx-
(Rx-Ry)
Ry)2
1 5 6 1 2 -1 1
2 6 9 2 5 -3 9
3 8 4 3 1 2 4
4 9 8 4 4 0 0
5 11 7 5 3 2 4
18
( )
0 0

El coeficiente rho del problema anterior es de 0.10, el cual es positivo y bajo, en vista de que se
aproxima a cero. Como se puede observar, la interpretación del Coeficiente rho es exactamente
igual a la de Pearson. Los pasos para calcular el Coeficiente rho son los siguientes:

1. Organice los datos X y Y en una matriz, tal y como se presenta en la Tabla 8-4:
2. Se crea la columna R(X), rangos de X, para la cual se asigna a cada puntaje X un rango de
menor a mayor. Para nuestro ejemplo X = 5 es el de menor valor, se le asigna el rango 1, a
continuación sigue el puntaje 6 al que corresponde el rango 2, y así sucesivamente.
3. Se crea la columna R(Y), rangos de Y, para la cual se asigna a cada puntaje Y un rango de
menor a mayor. Para nuestro ejemplo, Y = 4 es el de menor valor y se le asigna el rango 1,
luego sigue el puntaje 6 al que corresponde el rango 2, y así sucesivamente.
4. Se crea la columna D, que corresponde a la diferencia de cada par de rangos X y Y, tomando en
consideración los signos.
5. Se desarrolla la columna D2 que corresponde a elevar al cuadrado cada diferencia entre los
pares de rangos. Estas diferencias al cuadrado se suman.
6. Se desarrolla la fórmula correspondiente a Rho y se obtiene el coeficiente de correlación.

Hay ocasionas en que en una variable se repite el mismo valor varias veces. A esta situación se le
denomina ligas, y las mismas son resueltas promediando los rangos que se le hubieran adjudicado
originalmente. A continuación se presenta un ejemplo.
71

TABLA 8-5:
Cálculo del coeficiente de correlación de spearman para una muestra de 10 sujetos (método de ligas)
H. General H. Verbal
Sujetos R(X) R(Y) D D2
X Y
1 10 10 1 1 0 0
2 12 15 2.5 2 0.5 0.25
3 12 17 2.5 3 -0.5 0.25
4 25 25 4 4.5 -0.5 0.25
5 27 25 5 4.5 0.5 0.25
6 35 37 7 7 0.0 0.00
7 40 40 8.5 9 -0.5 0.25
8 40 38 8.5 8 0.5 0.25
9 32 30 6 6 0.0 0.00
10 47 49 10 10 0.0 0.00

( )
00
0 0 0

Como puede observarse, el coeficiente de correlación Rho es muy alto (0.99), casi perfecto y
positivo. En este ejemplo se observa cómo se tratan las ligas. En la variable X, el puntaje menor es
10 y se le asignó el rango 1, a continuación los siguientes puntajes son 12 y 12, como son iguales, al
primero se le asigna el rango 2 y al segundo el rango 3, se promedia la suma de estos dos rangos
que es 2.5, y se les asigna a los dos valores 12, el rango 2.5. Esto se repite en cada ocasión en que
aparezcan ligas. Las ligas pueden corresponder a 2, 3 ó más sujetos a quienes se les asigna el mismo
puntaje; en cada caso, se promedian los rangos que originalmente se les asignaría.

CORRELACIÓN MÚLTIPLE

Hasta este momento, los análisis de correlaciones discutidos en esta obra se han referido a la
relación lineal entre dos variables. Sin embargo, se dan circunstancias en las cuales estamos
interesados en la relación que hay entre tres o más variables, o específicamente, en la relación de
una variable con una combinación lineal de otras variables. A este análisis de correlaciones se le
denomina correlación múltiple, la cual vamos a presentar en su forma más simple: la relación entre
una variable y la combinación lineal de otras dos variables.

Suponga que una muestra de estudiantes ha sido evaluada en tres factores psicoeducativos que se
consideran relacionados:

1. Factor 1: Rendimiento académico


2. Factor 2: Aptitud general
3. Factor 3: Aptitud verbal

Estamos interesados en analizar la relación que hay entre el rendimiento académico (F1) y los
efectos combinados de la aptitud general (F2) y la aptitud verbal (F3): F1 VS F2+F3. La regla
general (fórmula) para el cálculo de dicha relación es la siguiente:
72

( )

Los pasos para calcular r1.23 son los siguientes:

1. Calcule las relaciones simples entre las combinaciones de pares de variables r 12, r13 y r23. Para
efecto de nuestro ejemplo, dichas correlaciones fueron las siguientes:
 r12 = 0.52
 r13 = 0.45
 r23 = 0.60
2. Sustituya estos valores en la fórmula de correlación múltiple, tal y como se presenta a
continuación:

(0 ) (0 [( )(0 )(0 )(0 0)]


)
0 0
(0 0)
A partir de esta regla, se puede generalizar para cuatro o más variables, situaciones éstas que
escapan de los objetivos de este texto. Para analizarlas, recomendamos revisar la bibliografía que
acompaña esta obra.

Como Interpretar El Coeficiente De Correlación.

La interpretación del coeficiente de correlación, debe hacerse cuidadosamente, atendiendo


principalmente a las características de las variables involucradas y al tipo de problema que se está
tratando de solucionar. Es evidente que a medida que r se aproxima a 1.00, la correlación se
considera más alta, siendo este valor el más extremo, tanto en el lado positivo como en el negativo
(-1.00). O sea, que la correlación tiende a aumentar tanto positiva como negativamente, a medida
que se aleja de 0 y se aproxima a sus valores extremos (+1.00 ó -1.00).

Sin embargo, hay ocasiones en que los coeficiente de correlación que son bajos se consideran lo
suficientemente saludables como para utilizarlos de manera efectiva. Por ejemplo, en la
construcción de pruebas es muy frecuente que los coeficientes de correlación no alcanzan valores
altos, y observamos en estos casos coeficientes efectivos desde 0.35 hasta 0.60, en el mejor de los
casos.

A pesar de los casos especiales citados anteriormente, algunos autores sugieren que para facilitar la
interpretación de los coeficientes de correlación, se tome en consideración la siguiente escala:

r…………….0.00 hasta 0.20……….correlaciones bajas


r…………….0.21 hasta 0.40……….correlaciones inferiores al término medio
r…………….0.41 hasta 0.60……….correlaciones promedio
r…………….0.61 hasta 0.80……….correlaciones superiores al término medio
r…………….0.81 hasta 1.00……….correlaciones altas

Esto se puede aplicar tanto en el caso de las correlaciones positivas, > 0, como en las negativas, - 0.
Sin embargo no olvide que el buen juicio del psicólogo investigador, es la principal herramienta
73

para el análisis de los coeficientes de correlación, porque también se dan casos de coeficientes de
correlación relativamente altos, pero ineficaces.

REGRESIÓN LINEAL SIMPLE.

A través del estudio de la correlaciones se logró analizar la asociación que existe entre dos o más
variables. Se logró establecer que la magnitud de estas relaciones se podían determinar
cuantitativamente a través del coeficiente de correlación, además de establecerse el sentido de las
mismas: positivo, negativo o ausencia de correlación.

Pero, la relación de variables nos permite obtener información que va mas allá de lo anteriormente
señalado. También permite alcanzar uno de los objetivos más apreciados en la investigación del
comportamiento: la predicción.

Para comprender en qué forma el análisis de la asociación de variables nos permite hacer
predicciones, es necesario recordar algunos aspectos básicos de la teoría de la correlación.

Como se observó anteriormente, la primera aproximación al análisis estadístico de la correlación, es


el diagrama de dispersión. En el mismo, se analiza la nube de puntos generada por la combinación
de cada X con su respectiva Y, sobre un sistema de coordenadas rectangulares. Se explicó, además,
que la nube tomaba diferentes formas y que una de ellas, la que se aproxima a una línea recta, era de
gran importancia para el análisis de las correlaciones. En realidad, lo que sucede es que la nube de
puntos se puede aproximar a través de diferentes curvas entre las cuales tenemos: parábolas,
hipérbolas, etc, y la línea recta.

Haremos énfasis en los diagramas de dispersión cuya nube de puntos está aproximada por una línea
recta, dado que éste es el tipo de dispersión más común al estudiarse las relaciones de variables
psicológicas. Por lo tanto, vamos a considerar a la línea recta como la que mejor aproxima los datos
de la nube de puntos. A esta línea recta se le denomina Recta de Mínimos Cuadrados, en vista de
que tiene la propiedad de que la suma de las diferencias cuadráticas de los puntos del diagrama con
relación a su valor teórico sobre la curva, es mínimo. O sea: ∑D2 es mínimo, tal y como se presenta
en el siguiente gráfico:
74

GRÁFICO 8-2

En el Gráfico 8-2 se presenta el diagrama de dispersión correspondiente a dos variables X y Y. Se


puede observar con claridad que los puntos oscuros corresponden a los pares ordenados (XY), los
cuales generan una nube de puntos. Adicionalmente se presenta un conjunto de puntos más claros,
ordenados de tal manera que, si los uniera, generarían una línea recta; esta es la recta de mínimos
cuadrados porque las distancias entre cada punto del diagrama y su correspondiente valor en la
recta, al elevarse al cuadrado y sumarse, darían el valor más pequeño que se podría alcanzar.

La figura incluye otra línea recta, de color oscuro que también cruza el diagrama pero en otro
sentido. En este caso, que no corresponde a la recta de mínimos cuadrados, la ∑D2 no sería la
mínima, como si lo es para el otro caso (línea clara).

La recta de mínimos cuadrados se construye a partir de la siguiente ecuación:

( )

La cual corresponde a la ecuación de la línea recta. Esta ecuación se utiliza para pronosticar Y a
partir de un valor conocido de X. En dicha ecuación se identifican dos constantes:

a0 : corresponde a la intersección de la recta de regresión con el eje Y.


a1: corresponde a la pendiente (inclinación) de la recta de regresión.
X : corresponde al valor de X para el cual se va a pronosticar el valor de Y.

Las constantes se calculan a través de las siguientes fórmulas:

(∑ )(∑ ) (∑ )(∑ )
∑ (∑ )

(∑ ) (∑ )(∑ )
∑ (∑ )

En los casos en que se requiera estimar X a partir de Y, las ecuaciones serían las siguientes:
75

( )

Para la cual:

(∑ )(∑ ) (∑ )(∑ )
∑ (∑ )

(∑ ) (∑ )(∑ )
∑ (∑ )

Error Típico De La Estimación

La recta de regresión representa el centro de gravedad de la nube de puntos, siendo evidente que
alrededor de la misma se dispersan los puntos del diagrama. En tales circunstancias, se puede
calcular una medida de la dispersión de los valores a través de las siguientes expresiones:

∑( )
|

Que se denomina error típico de la estima de Y a partir de X.

En los casos que se refieren a la recta de regresión de X a partir de Y, el error típico de la


estimación viene dado por la expresión:

∑( )
|

A partir del error típico de la estimación, se puede estimar (pronosticar), para cualquiera de los
valores X, su correspondiente valor esperado Y, al igual que para cualquier valor de Y, se puede
estimar su correspondiente valor esperado X. A continuación presentamos un ejemplo de
estimación estadística.

TABLA 8-6
H. General H. Verbal
Sujetos X2 Y2 XY
X Y
1 10 10 100 100 100
2 12 15 144 225 180
3 20 17 400 289 340
4 25 25 625 625 625
5 27 32 729 1024 864
6 35 37 1225 1369 1295
7 43 40 1849 1600 1720
8 40 38 1600 1444 1520
9 32 30 1024 900 960
10 47 49 2209 2401 2303
∑ 291 293 9905 9977 9907
76

Ya se demostró que entre ambas variables existe una correlación importante:


r = 0.98. Por lo tanto es factible desarrollar un modelo de estimación estadística que permita el
pronóstico de Y a partir de X o viceversa.

En primera instancia se calculan las dos constantes que requiere el modelo:

( )( 0 ) ( )( 0 )
( 0)( 0 ) ( )

0( 0 ) ( )( ) 0
0
0( 0 ) ( )

Una vez determinadas las constantes de regresión, se desarrolla la ecuación de mínimos cuadrados,
tal y como se presenta a continuación:

( ) : ecuación de mínimos cuadrados


0 ( )

Cada valor de X obtenido por el sujeto se sustituye en la ecuación, obteniéndose el valor Y


estimado o pronosticado para cada persona que, perteneciendo a la misma población, obtenga dicho
valor X. A continuación se presenta la Tabla resumen correspondiente a los datos analizados.

TABLA 8-7
H. General H. Verbal
Sujetos Y’ (Y-Y’)2
X Y
1 10 10 10.94 0.88
2 12 15 12.86 4.58
3 20 17 20.54 12.53
4 25 25 25.34 0.12
5 27 32 27.26 22.47
6 35 37 34.94 4.24
7 43 40 42.62 6.86
8 40 38 39.74 3.03
9 32 30 32.06 4.24
10 47 49 46.46 6.45
65.40

Como se puede observar, para cada valor de X se estimó un posible valor de Y, el cual corresponde
al punto en que cae dicha estimación sobre la recta de regresión; en el fondo, la recta de regresión es
el conjunto de todos los valores estimados para cada uno de los valores de X. Además, la Y
estimada es el promedio de todos los posibles valores esperados para cada una de las X. Esto
significa que para cada valor de X, la Y estimada sería el pronóstico promedio, aunque algunos
valores de Y estarán por encima y otros por debajo de dicha estimación.
77

Tal y como señalamos anteriormente, de todas las estimaciones de Y se puede determinar una
desviación estándar de las mismas, la que se denomina error típico de la estimación. Los datos
requeridos para este cálculo están descritos en la última columna de la Tabla anterior (Y – Y’)2 y
con los mismos resolvemos la ecuación del error típico:

0
| √
0

Esto significa que, en promedio, las Y estimadas varían en 2.56 unidades, información que favorece
el análisis de la estimación a la luz de la Distribución Normal, siempre y cuando los datos se ajusten
a dicha distribución. Este mismo procedimiento se puede desarrollar para estimar X a partir de Y,
siempre y cuando se utilice la ecuación de estimación correspondiente.

CONCEPTOS IMPORTANTES

 Relación lineal
 Correlación simple
 Correlación múltiple
 Predicción
 Relación causa-efecto
 Confiabilidad
 Diagrama de dispersión
 Nube de Puntos
 Ecuación de mínimos cuadrados
 Regresión lineal simple
 Constantes de regresión
 Error típico de estimación
 Y estimada
 X estimada
78

EJERCICIOS PRÁCTICOS

Problema 1

Un investigador del comportamiento seleccionó una muestra aleatoria de 20 estudiantes de primer


ingreso a la Universidad y obtuvo las puntuaciones en las pruebas de Conocimientos Generales (X)
y de Comprensión Verbal (Y). A continuación, se presentan los puntajes:

E 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X 52 49 26 28 63 44 70 32 49 51 64 28 49 43 30 65 35 60 49 66
Y 49 49 17 34 52 41 45 32 29 49 53 17 40 41 15 50 28 55 37 50

A partir de los datos anteriores determine:

1. Las medias de X y de Y.
2. Las desviaciones estándar de X y de Y
3. Confeccione el Diagrama de Dispersión correspondiente
4. Calcule el coeficiente de correlación Producto Momento de Pearson (rxy) a partir del:
 Método de puntuaciones estandarizadas; analice y discuta el resultado
 Método de puntuaciones originales: analice y discuta el resultado
5. Calcule el coeficiente de determinación r2 para ambos casos. Analice y discuta los resultados.
6. Calcule los valores de las constantes a0 y a1 y presente la ecuación de regresión (predicción) de
Y a partir de X.
7. Escoja cinco pares de valores de la tabla de datos originales y construya la recta de regresión
sobre el diagrama de dispersión. Analice y discuta los resultados.
8. Calcule el error estándar de la estimación de Y a partir de X.
9. Desarrolle los pasos 6, 7 y 8, para la estimación de X a partir de Y.
10. Con los datos de la Tabla, determine el Coeficiente de Correlación por Rangos (Rho). Analice y
discuta los mismos; compare los resultados con los obtenidos por el método de Producto
Momento de Pearson.

11. Suponga que está interesado(a) en determinar la correlación entre el rendimiento académico (1)
y las variables aptitud verbal (2) y razonamiento lógico (3). Las intercorrelaciones obtenidas
entre estas tres variables fueron: r12 = 0.64, r13 = 0.50 y r23 = 0.41. Calcule el coeficiente de
correlación múltiple entre el rendimiento académico y las variables aptitud verbal y
razonamiento lógico. Analice y discuta los resultados.
79

CAPÍTULO 9
ESTADÍSTICA INFERENCIAL Y PROBABILIDADES

Ya hemos analizado los principios de la estadística descriptiva, los cuales hacen énfasis en la
organización, presentación y descripción de los datos obtenidos en las investigaciones
comportamentales, de una manera, objetiva, coherente y eficiente. Para tal efecto, se discutieron
conceptos tales como: organización de datos, medidas de tendencia central y variabilidad, la curva
normal y los principios de la correlación y regresión simple.

La estadística inferencial se preocupa, principalmente, por analizar cuantitativamente los datos


provenientes de las muestras y demostrar cuán cerca o alejados están estos datos de los que se
hubieran obtenido, si los mismos hubieran sido obtenidos de la totalidad de la población. Por lo
tanto, es evidente que la estadística inferencial se desarrolla a través de muestras, que son sectores
de la población, y no de la información proveniente de la totalidad de la misma. A continuación
presentamos un diagrama que explica la relación entre población y la muestra.

Probabilidad
Población Muestra
Error

Muestra
Generalización aleatoria

Muestras aleatorias Muestra no


 Igual oportunidad de ser seleccionadas aleatoria
 Margen de error conocido
 Tamaño muestral específico
 Inferencia estadística: Generalizar los datos estadísticos
muestrales a los parámetros poblacionales.

FIGURA 9—1

Como se puede observar en la Figura 9—1, la muestra es un segmento de la población, una parte de
la población que ha sido segregada de la misma con fines de investigación. Al trabajar con
segmentos de la población, es evidente que algunas características de ésta no estarán presentes en la
muestra, porque los tamaños muestrales son muy inferiores a los poblacionales: n < N. Esta
situación trae como consecuencia, que entre la información proveniente de la muestra y la existente
en la población real, se produzcan diferencias a la cuales denominaremos errores de muestreo.
80

En realidad la estadística inferencial está constituida por dos aspectos:

(1) la estimación de parámetros, que se refiere a establecer con la mayor precisión posible,
cuáles son los valores correspondientes a los principales indicadores o parámetros que hay en la
población y que están siendo utilizados en las investigaciones muestrales. Como debe recordar,
esto se realiza a partir de la información de la muestra y no de la población, y (2) el desarrollo de
la prueba de hipótesis, en el cual el investigador intenta demostrar si las hipótesis que han
presentado sobre diversos aspectos comportamentales que él espera que se estén manifestando
en la población, se pueden o no demostrar a través del análisis de las muestras.

Otro aspecto relevante que se observa en al diagrama antes mencionado lo son las dos categorías de
muestreo que pueden ser utilizadas en una investigación: el muestreo aleatorio, por un lado, que
permite seleccionar los sujetos de la población a partir de la condición de que todos tengan igual
probabilidad de ser seleccionados al momento de constituirse la muestra. Es evidente que, para
efectos de representar a la población, este tipo de muestreo es el más indicado. Por otro lado, está el
muestreo no aleatorio, en el cual no hay garantías de que todos los sujetos de la población hayan
tenido la misma probabilidad de ser seleccionados al momento de constituir la muestra, y por lo
tanto, sus resultados son dudosos en cuanto a representar a la población.

En ambos casos de muestreo se cometen errores. La diferencia estriba en que en el muestreo


aleatorio, el error puede ser determinado de antemano por el investigador, al igual que la
probabilidad de cometer el mismo; mientras que en el muestreo no aleatorio, el investigador no
cuenta con información objetiva sobre el margen de error y la probabilidad asociada con él.

Se considera que el muestreo aleatorizado es más eficiente para generalizar sus resultados hacia la
población por las siguientes razones:

 se determina el margen de error,

 se determina la probabilidad de este margen de error,

 y además, a partir de la información anteriormente señalada, se puede establecer el tamaño


muestral (n) mínimo requerido para que estos dos primeros aspectos se cumplan.

TEORÍA DE LA PROBABILIDAD (TP)

La explicación teórica sobre la relación matemática entre las observaciones poblacionales y las
muestrales la ofrece la Teoría de la Probabilidad. Sería ostentoso concebir que en este libro se
pueda hacer una presentación efectiva de dicha teoría; tampoco es uno de los objetivos que se tratan
de alcanzar con esta obra. Sin embargo, es necesario plantear algunos principios de la probabilidad,
que permitirán un mayor nivel de comprensión de los aspectos básicos de la inferencia estadística.

En la TP, hay algunos conceptos que deben ser comprendidos con claridad, especialmente por los
que no somos especialistas en las matemáticas, con el fin de que los mismos puedan ser utilizados
81

de la manera más correcta al momento de aplicar la TP. A continuación, detallaremos los más
importantes y los más utilizados en la investigación del comportamiento.

El Experimento Aleatorio

Siempre que se desarrolle una investigación, y que el método (actos o pruebas) para obtener los
resultados se desarrolle en las mismas condiciones, estamos ante un experimento aleatorio. Por
ejemplo, en el juego de la lotería oficial nacional, siempre se repite el mismo acto: las bolas
numeradas están en una urna que se hace girar para que las mismas se revuelvan y así se evite
cualquier picardía. Se detiene la urna, se abre, un niño selecciona una de las bolas, se la pasa a la
autoridad, ésta la abre y dentro de la misma se encuentra un número entre el 0 y el 9. Este acto se
repite tantas veces como sea necesario, sin que se observen cambios de ninguna clase en la
metodología. Por esta razón, la lotería es un experimento aleatorio, en vista de que en cada acto,
cualquier número entre 0 y 9, tiene la misma probabilidad de aparecer.

Veamos ahora, una actividad que no se refiere a un juego de azar, sino a una medición educativa. El
profesor confecciona un examen de 30 preguntas, todas de selección múltiple con cuatro
alternativas, con las mismas instrucciones, con el mismo procedimiento para responder a las
preguntas y para corregirlas. Esta metodología será la misma para todos los estudiantes que reciban
la prueba, al igual que la metodología que se exigió para extraer una bola de la urna de la lotería.
Como la prueba tiene cuatro alternativas, todos los estudiantes tienen la misma probabilidad de
escoger cualquiera de las cuatro alternativas, y si el examen vale 30 puntos, y los puntajes finales
pueden ser entre 0 y 30, todos los estudiantes tendrán la misma probabilidad de obtener cualquiera
de estos puntajes totales al corregirse su examen. Esto significa que la medición educativa se regula
por las mismas reglas que regulan el juego de azar de la lotería; por lo tanto, para la ciencia, la
medición científica también es un experimento aleatorio.

Cada acto que se desarrolla en un experimento aleatorio genera un resultado que se denomina punto
muestral. En el examen que pusimos de ejemplo, si un estudiante gana 6 puntos, esto es un punto
muestral, al igual que lo es los 30 puntos que gana el que obtuvo todas las respuestas correctas. Bajo
esta perspectiva, un experimento aleatorio genera un espacio muestral (S), que no es otra cosa, que
todos los posibles resultados que se pueden obtener al desarrollar el experimento. Veamos a
continuación algunos ejemplos de espacios muestrales:

 Lanzamiento de una moneda: S: (C, S), 2 puntos muestrales.

 Lanzamiento de un dado común: S (1, 2, 3, 4, 5 ó 6), 6 puntos muestrales


82

 Lanzamiento de un dado y una moneda juntos: S(12 puntos muestrales)

Dado
1 2 3 4 5 6
Cara C1 C2 C3 C4 C5 C6
Sello S1 S2 S3 S4 S5 S6

 Los resultados de un examen como el del ejemplo de los 30 reactivos: S (31 puntos muestrales,
porque se incluye el cero (0)

Éxito: 1 punto
Fracaso: 0 puntos
Resultados exitosos: espacio muestral, desde 0 hasta 30.

 Los resultados de la Lotería Nacional

El juego de la lotería es un buen ejemplo de lo que son los juegos de azar. Los controles
metodológicos que se aplican en el mismo, han dado suficiente confianza a la
población como para asegurar que en el mismo no hay picardía, aunque muchas
personas digan lo contrario. Este juego se caracteriza porque se cumple la condición
de que todas las bolas tienen la misma probabilidad de ser seleccionadas, y el
espacio muestral que se genera es el siguiente S: (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9). Los
eventos del S se combinan de acuerdo con el tipo de jugada que el cliente haya
comprado: chances o billetes, y a medida que el juego se desarrolla (experimento
aleatorio), siempre hay la certeza de que su número está en la urna y que tiene la
misma probabilidad de ocurrencia que cualquier otro número.

Es evidente que el proceso de selección aleatoria es muy importante para el estudio de las
inferencias estadísticas, en vista de que a través del mismo se cumple el requisito estadístico de que
cada evento posible de un espacio muestral, debe tener la misma probabilidad de ser seleccionado.
En un experimento aleatorio, la selección de una unidad del total se denomina acto o prueba. Cada
acto o prueba produce un resultado que debe corresponder a algunos de los posibles eventos del
espacio muestral (S). En el espacio muestral (S), los posibles resultados o eventos se denominan
puntos muestrales.
83

Probabilidad

Por lo general, la probabilidad de un evento P(x), se define como el cociente entre el número de
veces que se da un evento en el espacio muestral y la totalidad de posibles eventos del espacio
muestral; o, el número de veces que se da un evento entre el número de pruebas en un experimento
o investigación. Como se puede observar, se han presentado dos definiciones de probabilidad,
aunque ambas comparten el concepto de que la probabilidad es un cociente y se presenta como un
valor que tiene un rango entre 0.00 hasta 1.00, siendo el primero ausencia total de probabilidad y el
último probabilidad máxima de un evento. Sin embargo, para efectos descriptivos, la probabilidad
se puede expresar en porcentajes: P(A) = 0.60, es equivalente al 60%. Para aclarar esta situación, es
necesario estudiar la probabilidad desde el punto de vista de dos teorías o escuelas, que pasaremos a
discutir a continuación.

1. Escuela Clásica de la Probabilidad:

También se conoce como la Escuela a Priori, en vista de que las probabilidades pueden ser
determinadas por la razón. Esto es factible en vista de que los espacios muestrales son conocidos
antes de desarrollarse los experimentos, tal y como sucede con algunos juegos de azar tales
como: las barajas, los dados, la lotería, etc. La regla básica (fórmula) para el cálculo de las
probabilidades en estos casos es:

( )
( )
( )

m(A): número de eventos clasificables como A en el espacio muestral.


n(S): número total de eventos posibles en el espacio muestral (S).

Ejemplos:

 Se lanza un dado. Cuál es la probabilidad de que resulte el número 1?

( ) 0

 Se extrae una carta de un paquete de 52. ¿Cuál es la probabilidad de que sea el


No.8?

( ) 00

2. Escuela Empírica o Aposteriori:

En este caso del cálculo de las probabilidades, se requiere de la recolección previa de la data; o
sea, se requiere de una muestra sobre la cual se hace una medición; no se conoce previamente y
con exactitud, el espacio muestral del experimento. La regla básica (fórmula) para el cálculo de
probabilidades es la siguiente:
84

( )
( )
( )

m(a): número de veces que ocurre A en la experimentación.


n(S): número de pruebas en el experimento

Ejemplos:

 En una muestra de 250 sujetos, 130 son estudiantes sin educación secundaria.
¿Cuál es la probabilidad de seleccionar a un estudiante sin educación
secundaria?

0
( ) 0
0
Mientras mayor sea el número de pruebas que se desarrollen en el experimento, mejor será la
aproximación de la probabilidad a su valor teórico. Esto es muy importante porque indica que,
mientras más sujetos de una población se seleccionen, las probabilidades obtenidas de dicha
muestra estarán más próximas a las probabilidades reales de dichos eventos en la población.

Axiomas De Probabilidad

La probabilidad está condicionada por una serie de axiomas que favorecen el desarrollo de los
modelos y procedimientos requeridos para el cálculo de la misma.

A continuación se presentan los tres axiomas básicos asociados con el cálculo de las probabilidades.

1. Axioma de la positi vidad:

Este axioma señala que la probabilidad de un evento no puede ser negativa; la probabilidad es
igual a cero (0) o mayor que cero (0). P(A) ≥ 0.

2. Axioma de la certidumbre:

La probabilidad de todo el espacio muestral es igual a 1: P(S) = 1

 De los axiomas 1 y 2 podemos deducir que: 0 ≤ P(E) ≤ 1.

3. Axioma de las uniones:

Este axioma se aplica especialmente en el caso de los eventos compuestos. Los eventos
compuestos son aquellos que están constituidos por eventos simples:
P(EC) = p(e1) + P(e2)+…+P(ek).

Por ejemplo: ¿Cuál es la probabilidad de un número par al lanzar un dado? Un número par en un
dado serían: 2, 4 y 6; cada uno de ellos tiene en el espacio muestral una . Aplicando la
regla: ( ) ( ) ( ) ( ) 0 0
85

ASPECTOS BÁSICOS EN ELCÁLCULO DE PROBABILIDADES

1. Un evento que tiene una P(X) = 1, es seguro que ocurrirá en cada una de las pruebas que se
registren en el experimento. Un evento con P(X) = 0, es seguro que no ocurrirá en ninguno de
los actos del experimento.
2. La probabilidad de un evento, P(E), se expresa como una fracción, en vista de que los límites de
sus posibles valores están entre 0 y 1. Se acostumbra expresar la probabilidad como un valor
decimal: 0.55, 0.83, 0.19, etc.
3. Las probabilidades también pueden expresarse en base a 100, o sea, porcentajes, como por
ejemplo: P = 0.05 se puede expresar descriptivamente como 5%; P= 0.28, es semejante a 28%,
y así sucesivamente.
4. Las probabilidades pueden expresarse a favor o en contra de un evento, tal y como se explica a
continuación:
 La P de que suceda un evento es de 3 a 1 (3/4), o sea, que tiene una
P = 0.75.
 También se puede expresar en contra: la P de que el evento anterior no suceda
es de 1 a 3 (1/4), o sea, que tiene una probabilidad P= 0.25.

El cálculo de probabilidades puede ser muy complejo. Para efectos de este curso, tomaremos en
consideración algunas reglas básicas aplicadas a eventos particulares, que se consideran
fundamentales para el cálculo de probabilidades en las investigaciones comportamentales.

1. Eventos Mutuamente Excluyentes:

Dos eventos se definen como mutuamente excluyentes, si no pueden suceder al unísono o en


un solo acto. También se conocen como eventos simples. Por ejemplo:

1. Se lanza una moneda una sola vez; o sale cara o sale sello, pero no ambas en el mismo acto.
2. Se extrae una carta de un mazo de 52 cartas, o es roja o es negra, pero no puede ser ambas en un
solo acto.
3. Se desarrolla un reactivo de selección múltiple con cuatro alternativas de las cuales una es la
correcta y las otras tres restantes, son incorrectas. En este caso, el reactivo se tiene como bueno
o como malo, pero no ambos en una sola respuesta.

La regla para calcular probabilidades para eventos mutuamente excluyentes es la siguiente:


86

( ) ( ) ( )

Por ejemplo:

 Al seleccionar una carta (baraja), ¿cuál es la probabilidad de que sea un As o


una K?

( ) ( ) ( ) 0

 Al seleccionar una carta (baraja) de un paquete, ¿cuál es la probabilidad de que


sea un corazón o un trébol?

( ) ( ) ( ) 0 0

2. Eventos Solap ados:

Dos eventos son solapados o también se conocen como unidos, si tienen puntos muestrales en
común. La regla o fórmula para el cálculo de estas probabilidades es:

( ) ( ) ( ) ( )

Como se puede observar en la fórmula, se determina la probabilidad de A y B como si fueran


mutuamente excluyentes, pero se les resta el área compartida por ambos eventos.

Ejemplo:

 Se selecciona una baraja, ¿cuál es la probabilidad de que sea una K o un trébol?


En el paquete de barajas existe una carta que es K y es trébol al unísono, por lo
tanto, se refiere al caso de dos eventos solapados.
87

( ) ( ) ( ) ( ) 0

 Se lanza una moneda y un dado juntos. Sea A, el evento sello en la moneda y


B, el evento 3 ó 4 en el dado. ¿Cuál es la probabilidad de que A o B aparezcan?
DADO

1 2 3 4 5 6
( ) 0
Cara X X X X X X

Sello X X X X X X
3. Eventos Independientes :

Dos eventos son unidos o compuestos, si aparecen al unísono o en consecuencia. De acuerdo a


lo anteriormente señalado, los eventos unidos o compuestos son independientes, si el resultado
de uno no afecta la probabilidad de ocurrencia del otro. La regla o fórmula para el cálculo de las
probabilidades de estos eventos es:

( ) ( ) ( )

Ejemplo:

 Se lanzan al unísono dos dados. ¿Cuál es la probabilidad de que el dado B ≥ 5 y


el dado A ≤ 4?

( ) ( ) ( ) ( )( ) 0

Observación:

 B ≥ 5 = 5 y 6 (dos eventos de posibles seis en el dado B)

 A ≤ 4 = 4, 3, 2, 1 (cuatro eventos de posibles seis en el dado A)

4. Eventos dependientes:

Los eventos dependientes también están referidos a eventos compuestos, o sea, que pueden
suceder al unísono o en consecuencia. En este caso, dos eventos son dependientes, si la
ocurrencia de uno, afecta la probabilidad de ocurrencia del otro. La regla o fórmula para el
cálculo de sus probabilidades es:

( ) ( ) ( )⁄

Si A ya sucedió, cuál es la probabilidad de que suceda B, si la aparición de A afecta la


probabilidad de aparición de B.

Ejemplo:
88

 ¿Cuál es la probabilidad de extraer dos cartas rojas de un paquete, sin


reemplazamiento? En la primera extracción hay 26 cartas rojas en el paquete
(26/52); pero en la segunda extracción, como no ha habido sustitución, ya no
quedan 26 rojas sino únicamente 25, o sea, 25/51. Por lo tanto si aplicamos la
fórmula el resultado sería:

( ) ( ) ( ) ( ) ( )( ) (0 0)(0 ) 0

5. Eventos Complementarios:

Dos eventos son complementarios, E1 y E2, si el segundo de ellos contiene todos los elementos
del espacio muestral que no están en el primero. La suma de las probabilidades de los eventos
complementarios debe ser igual a 1. La regla para el cálculo de estas probabilidades es:

( ) ( ) ( ) ( )

Ejemplo:

 Se tienen 500 bolas rojas y blancas en una urna. Si 300 son rojas, ¿cuál es la
probabilidad de extraer una bola blanca?

00
( ) ( ) 0 0 0 0
00
6. Eventos Condicionados:

Los eventos condicionados son aquellos que se manifiestan como un sub conjunto del espacio
muestral. Por ejemplo: en un mazo de 52 cartas, los eventos que son iguales o mayores que 10:
10, J, Q y K, se consideran un sub conjunto dentro del espacio muestral de las 52 cartas. Si
estuviera interesado en saber cuál es la probabilidad de un evento, dentro de este sub conjunto de
eventos, tendría que aplicar la regla correspondiente:

( )
( | ) ( ) ( )
( )

Que se lee: ¿cuál es la probabilidad de que ocurra A, habiendo ocurrido B?

Para efectos del desarrollo de este evento, desarrollemos el siguiente problema:

 Se lanza una moneda y un dado juntos. Si la moneda cae cara, ¿cuál es la


probabilidad de que el dado resulte par?

ESPACIO MUESTRAL
Dado
1 2 3 4 5 6
Cara C1 C2 C3 C4 C5 C6
Sello S1 S2 S3 S4 S5 S6
89

1. Únicamente se toman en consideración los eventos correspondientes a cara. Estos son C1, C2,
C3, C4, C5, C6
2. En los eventos Cara, se dan tres eventos pares: C2, C4 y C6, los cuales corresponden al 50% de
los eventos asociados con cara (en negrita)
3. En tal caso, la P pedida en el problema es igual a 3/6 = 0.50.
4. Este procedimiento es válido cuando usted conoce todo el espacio muestral.

Hay ocasiones en que el cálculo de la probabilidad condicional no se puede desarrollar


directamente por la observación del espacio muestral En tales casos, se utiliza la regla o fórmula
anteriormente presentada, bajo la condición de que, al momento de reemplazar en la misma, se
debe considerar todos los eventos del espacio muestral. A continuación presentamos el
procedimiento correspondiente.

( ) ⁄
( | ) ( )( ) 0 0
( ) ⁄

Observación: Las probabilidades dentro de los sub conjuntos, son mayores que las
probabilidades dentro de todo el espacio muestral.

El conocimiento exhaustivo de la Teoría de la Probabilidad, es una garantía en cuanto a la


comprensión e interpretación correcta de la estadística inferencial. A pesar de que en este capítulo,
el enfoque de la probabilidad no ha sido profundo, consideramos que los conceptos emitidos serán
de gran ayuda para la interpretación correcta de los capítulos que a continuación se presentarán,
relacionados con la inferencia estadística.

CONCEPTOS IMPORTANTES

 Estimación de parámetros
 Teoría de la probabilidad
 Experimento aleatorio
 Espacio muestral
 Eventos
 Acto o Prueba
 Eventos mutuamente excluyentes
 Eventos solapados
 Eventos independientes
 Eventos dependientes
 Eventos complementarios
 Eventos condicionados
90

EJERCICIOS PRÁCTICOS

1. Determine la probabilidad de los siguientes eventos:


 Al lanzar un dado el resultado sea un número impar
 Un 10, un 9 de trébol o el 5 de diamantes, en la extracción de una baraja.
 Al lanzar dos dados, la suma de las caras sea mayor que 9
2. Una caja contiene 6 bolas rojas, 4 blancas y 5 azules. Hallar la probabilidad de que la bola
extraída sea:
 Roja
 Blanca
 Azul
 No roja
 Roja o blanca
3. Un dado se lanza dos veces. Hallar la probabilidad de obtener 4, 5 ó 6 en la primera tirada y 1,
2, 3 ó 4 en la segunda.
4. Se sacan sucesivamente tres bolas de la caja del problema 2. Hallar la probabilidad de que
salgan en el orden roja, blanca y azul, si cada bola: (a) se repone y (b) si no se repone.
5. Hallar la probabilidad de que salga al menos un 4 en dos tiradas de un dado.
6. Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5 bolas
negras. Si se saca una bola de cada bolsa, hallar la probabilidad de que: (a) ambas sean blancas,
(b) ambas sean negras y (c) una sea blanca y la otra negra.
7. A y B juegan 12 partidas de ajedrez .A gana 6, B gana 4 y en 2 hacen tablas (empate).Juegan un
nuevo torneo de 3 partidas. Hallar la probabilidad de que: (a) A gane las 3, (b) hagan tablas en
2, (c) A y B ganen alternadamente y (d) B gane al menos una partida.
8. Se lanza un par de dados corrientes. Hallar la probabilidad de que la suma de sus números sea
10 o mayor si:
 Aparece un 5 en el primer dado
 Aparece un 5 en uno de los dos dados por lo menos
9. Se lanzan tres monedas corrientes. Hallar la probabilidad de que todas sean caras si:
 La primera de las monedas es cara
 Una de las monedas es cara
10. Una clase tiene 12 niños y 4 niñas. Se escogen tres estudiantes de la clase al azar, ¿cuál es la
probabilidad de que todos sean niños?
11. Una urna contiene 7 bolas rojas y 3 bolas blancas. Se sacan 3 bolas de la urna una tras otra.
Hallar la probabilidad de que las dos primeras sean rojas y la tercera blanca.
12. Una urna contiene 3 bolas blancas y 7 negras; se extraen dos bolas sin reemplazamiento. ¿Cuál
es la probabilidad de los siguientes eventos?
 Blanca y blanca
 Blanca y negra
 Negra y blanca
 Negra y negra
13. ¿Al extraer una carta de un mazo de 52, ¿cuál es la probabilidad de que el resultado sea una
carta entre 3 y 13 inclusive?
14. Al seleccionar una carta de un paquete de 52, ¿cuál es la probabilidad de obtener una carta igual
o menor que 6 o un 3?
91

15. Se lanzan dos dados. ¿Cuál es la probabilidad de que uno resulte impar, si el otro muestra un 6?
16. En una universidad hay 200 estudiantes distribuidos de la siguiente forma: bachilleres en
ciencias, letras y humanidades, hombres y mujeres. Atendiendo a estas condiciones se sabe que:
 20 son bachilleres en ciencias y hombres
 88 son mujeres y bachilleres en letras
 87 son hombres
 140 son bachilleres en letras
 30 son bachilleres en ciencias
 Construya el espacio muestral de todos los eventos.
 A partir del espacio muestral determine:
 La “p” de seleccionar un bachiller en ciencias
 La “p” de seleccionar un bachiller en ciencias hombre
 La “p” de seleccionar una mujer
 L “p” de seleccionar un bachiller en letras si fue hombre
 La “p” de no seleccionar una mujer
 La “p” de seleccionar un hombre de ciencias o una mujer de letras
 La probabilidad de seleccionar una mujer de letras, si fue mujer
 La “p” de seleccionar un hombre de letras y una mujer de
Humanidades.
17. En un vuelo de cierta línea aérea viajan 18 muchachos, 178 adultos hombres, 10 mexicanos del
sexo masculino, dos muchachos mexicanos, 26 personas de nacionalidad mexicana y 14
muchachas extranjeras, sin contar la tripulación. Desarrolle el espacio muestral correspondiente,
y calcule sus probabilidades.
92

CAPÍTULO 10
DE LA POBLACIÓN A LA MUESTRA

El objetivo principal de un investigador del comportamiento es el de describir, analizar,


diagnosticar y pronosticar el comportamiento de una variable en una población determinada. Esta
meta se alcanza, por lo general, seleccionando una muestra de la población, midiendo la variable de
interés en la misma y aplicando procesos y modelos estadísticos que permitan llegar a una decisión
final con relación a la variable en estudio y su comportamiento en la muestra y en la población. Es
evidente que el trabajar con una muestra es más económico que hacerlo con toda la población, pero
para alcanzar tal objetivo, se deben satisfacer ciertos requerimientos estadísticos, que pasaremos a
discutir a continuación.

¿Qué es una variable aleatoria?

Una variable aleatoria es aquella que se genera tras un proceso de selección aleatoria. Si recordamos
los temas anteriormente discutidos, para que un experimento sea aleatorio, todos los miembros de la
población deben tener la misma probabilidad de ser seleccionados. Si la variable que se estudia en
la población puede asumir X posibles valores, entonces los sujetos seleccionados aleatoriamente
pueden asumir cualquiera de estos X valores, y si además, cada uno de estos valores tiene una
probabilidad en la población, entonces una definición más acertada de variable aleatoria sería:
aquella que puede tomar cualquier valor de un número total de valores, teniendo cada uno de ellos
una probabilidad asignada. Veamos los siguientes ejemplos:

1. Se lanzan un dado, identifique los posibles valores (Xi) que puede asumir cada lanzamiento y
determine sus probabilidades.

TABLA 10-1
POSIBLES RESULTADOS
Resultado 1 2 3 4 5 6
Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6

Como se puede observar, del lanzamiento del dado se puede obtener uno de 6 posibles
resultados y cada uno de ellos tiene una probabilidad asignada. Por lo tanto, el resultado del
lanzamiento de un dado es una variable aleatoria porque combina ambas condiciones: un
resultado y su probabilidad de ocurrencia.
93

2. En una población escolar hay 300 estudiantes de los cuales 175 son mujeres y 125 son hombres.
Se selecciona aleatoriamente un estudiante. Demuestre que el sexo es una variable aleatoria.

TABLA 10-2
Masculino Femenino Total
Total 125 175 300
Probabilidad 0.42 0.58 1.00

En este ejemplo, sexo es una variable aleatoria en vista de que puede asumir uno de dos valores
(masculino o femenino) y cada uno de ellos tiene una probabilidad de ocurrencia.

De acuerdo a Chou (1974), podemos presentar los siguientes conceptos asociados con una variable
aleatoria:

 Una variable aleatoria es aquella cuyo valor es un número determinado por el resultado de un
experimento aleatorio.

 Si X es una variable aleatoria que puede asumir distintos valores (xi), y si cada uno de estos
valores está asociado a una probabilidad (p), entonces la combinación de cada valor de X con su
probabilidad, X(p), se denomina Función de Probabilidad o Distribución de Probabilidad. Por
lo tanto, los resultados organizados en la Tabla 10-1 y en la Tabla 10-2, son ejemplos de
Distribuciones de Probabilidad.

 De todo lo anteriormente señalado se desprende que para el investigador es muy importante


conocer los posibles resultados que se pueden obtener con cada observación, además de las
probabilidades asociadas con los mismos.

Los ejemplos anteriormente desarrollados indican que, en el proceso de investigación del


comportamiento, al momento de seleccionarse una muestra, los resultados obtenidos en la medición
de cada uno de ellos deben reflejar, por un lado, un valor y por el otro, el mismo debe corresponder
a una probabilidad existente en la población. Esta situación no se cumple con precisión con un solo
sujeto o con una muestra muy pequeña de sujetos, pero a medida que aumenta el número de
selecciones, aumenta la posibilidad de que se cumpla la probabilidad real de dicho evento en la
población.

Al momento de hacerse una medición en una muestra, los resultados deben corresponder a una de
las dos posibles alternativas de variables aleatorias: discretas o continuas. Es importante que el
investigador determine con claridad a cuál de estas categorías pertenece la medición de la variable
estudiada; también puede suceder que en una misma investigación se combinen ambas categorías de
variables. A continuación discutiremos el significado de cada una de ellas.
94

 Variable aleatoria discreta (categórica):

Se refiere a aquella variable que al momento de ser medida, los resultados


correspondientes no pueden asumir valores fraccionales. Según Kerlinger y Lee
(2001), también se reconocen como variables nominales y se caracterizan por tener
dos o más subconjuntos del tipo de objetos medidos. Los sujetos que están en una
clase se caracterizan por poseer o no la propiedad definitoria: es un asunto del todo
o nada. Algunos ejemplos simples serían: masculino-femenino, correcto-incorrecto,
etc. Por lo general, cada categoría se identifica con un nombre o un número:
correcto o incorrecto, ó 1 si posee la característica, ó 0 si no la posee. En estos
casos, los números no tienen significado cuantitativo, sino únicamente nominal.

 Variable aleatoria continua:

Es aquella que es capaz de asumir un conjunto ordenado de valores dentro de cierto


rango y que además puede asumir valores fraccionales. Esto implica que dicha
variable refleja, al menos, un orden de rango, o sea, que un valor mayor implica
más de la propiedad estudiada que un valor menor. Las medidas continuas están
contenidas dentro de rangos y los sujetos obtienen un puntaje dentro del mismo. Por
ejemplo, si se miden actitudes, la escala puede ser de 1 a 5: 1 significa una actitud
muy negativa y 5 una actitud my positiva. Además, dentro de la escala, se pueden
asumir valores fraccionales tales como: 1.75, 3.25, 4.50, etc. Por esta razón, las
variables continuas se miden por lo menos en una escala de intervalos.

Es evidente que los resultados obtenidos en las mediciones psicológicas corresponden a una de estas
dos categorías de variables, y que los mismos deben reflejar, hasta donde la muestra lo permita, el
espacio muestral de los resultados de la investigación y sus posibles probabilidades. En otras
palabras, deben corresponder a una distribución muestral de probabilidades

¿Qué es una Distribución Muestral de Probabilidades?

Se puede definir una a una distribución muestral como una descripción matemática de todos los
posibles resultados de los eventos muestrales y de sus probabilidades. Este concepto se aplica a
todas las muestras de un mismo tamaño que se pueden seleccionar de una población y a los
estadísticos calculados en las mismas. Específicamente, una distribución muestral se refiere a la
distribución de cualquier estadístico calculado sobre todas las posibles muestras de un mismo
tamaño, seleccionadas de una población. Este concepto estadístico se cumple con mayor certeza,
cuando la población es grande y genera muestras lo suficientemente grandes como para que se
cumplan algunos criterios que pasaremos a analizar a continuación; el ejemplo no es el más válido
porque la población es pequeña, pero se cumplen con claridad los principios básicos de las
distribuciones muestrales.

Supongamos que tenemos una población de tamaño N de la cual se seleccionan todas las posibles
muestras de tamaño n. Si para cada muestra es factible calcular la media, la varianza y la desviación
95

estándar, entonces es factible generar la distribución muestral de cada uno de estos estadísticos, las
cuales se denominarían: distribución muestral de medias, distribución muestral de varianzas y
distribución muestral de desviaciones estándares; esto es posible para cualquier estadístico
muestral. El siguiente ejemplo nos ayudará a comprender mejor el concepto:

1. Suponga que tenemos la siguiente población de datos: 2, 4, 6, 8, 10.


 Calculamos la Media (µ) y la Desviación Estándar (S) de dicha población de
datos: µ = 6; S = 2.83
 Seleccionamos todas las posibles muestras de tamaño 2 de dicha población.
Son un total de 25 combinaciones o muestras:

2 4 6 8 10
2 2,2 2,4 2,6 2,8 2,10
4 4,2 4,4 4,6 4,8 4,10
6 6,2 6,4 6,6 6,8 6,10
8 8,2 8,4 8,6 8,8 8,10
10 10,2 10,4 10,6 10,8 10,10

 Si calculamos la media aritmética de cada una de las muestras, los resultados


serían los siguientes:

2.0 3.0 4.0 5.0 6.0


3.0 4.0 5.0 6.0 7.0
4.0 5.0 6.0 7.0 8.0
5.0 6.0 7.0 8.0 9.0
6.0 7.0 8.0 9.0 10.0

 Si calculamos la media de todas las medias anteriores tendríamos como


resultado:
∑ 0
00
 Como se puede observar:
00

Se ha podido demostrar que la media de la población original de los cinco datos (6.00) es igual a
la media de todas las 25 medias de tamaño 2 (6.00). Las 25 medias constituyen lo que se
denomina la distribución muestral de las medias, lo cual es una importantísima propiedad
estadística en la cual se fundamenta el proceso de muestreo. Esta propiedad es cierta para
cualquiera distribución de muestras del mismo tamaño. A partir de esta propiedad, podemos
llegar a las siguientes conclusiones:
96

 La distribución muestral de todas las medias se aproxima a una curva normal,


independientemente de la forma de la distribución de los puntajes originales. Si se graficaran
todas las medias muestrales, la forma se aproximaría a una curva. Esta propiedad está
fundamentada en el Teorema Central del Límite.

 La media de una distribución de medias (media de medias) es igual a la media original de la


población de los puntajes.

 La desviación estándar de la distribución muestral de medias es menor que la desviación


estándar de la población original.

Es evidente que al seleccionar muestras aleatorias, las medias aritméticas resultantes de ellas serán
diferentes y esta diferencia se considera aleatoria, o sea, independiente del proceso de selección; es
inevitable. Es también lógico esperar que entre la media real de la población y la media de la
muestra seleccionada exista una diferencia; esta diferencia se denomina error de muestreo.

Ante esta situación, el investigador se enfrenta a la situación de que, independientemente de que su


proceso de selección sea el más adecuado, él sabe que la media obtenida de la muestra no será igual
a la media de la población, la cual es desconocida para el investigador. En estos casos, ¿Qué hace el
investigador para determinar el error o diferencia que hay entre la media de su muestra y la de la
población desconocida?

El primer paso para conocer el grado de aproximación que hay entre la media muestral y la
poblacional, es el cálculo de un estadístico denominado error estándar de la media. A través de
este indicador, el investigador se ahorra el largo proceso de determinar la distribución muestral de
las medias de cada muestra y calcular el promedio de las mismas para conocer el valor de la media
poblacional, o en última instancia, calcular la media poblacional sobre la totalidad de sujetos de la
población. Veremos algunos ejemplos:

 Si estoy interesado en conocer el promedio de la habilidad verbal de los 19,000


aspirantes a ingresar a la Universidad, tendría que aplicar una prueba que mida
dicha variable a cada uno de ellos, determinar la puntuación individual, el valor
por cada sujeto y promediarla. Además de ser un trabajo metodológicamente
complicado, debe resultar muy caro.

 Otra alternativa es que lo haga a través del promedio de la distribución muestral


de las medias de cada muestra de un mismo tamaño. Para el ejemplo anterior, si
establecemos muestras de 1,250 personas, necesitaríamos un número
infinitamente grande de muestras de este tamaño, lo cual hace de este
procedimiento algo imposible de lograr.

Para evitar estas situaciones complicadas, partiendo de la premisa de que la distribución muestral de
las medias se aproxima una curva normal, se calcula un estimador de la desviación estándar de la
distribución muestral de medias denominado: error estándar de la media, a partir de los datos
recogidos en una sola muestra. La fórmula para alcanzar este valor es:
97

: error estándar de la media


s : desviación estándar de la muestra
n : tamaño de la muestra

Veamos un ejemplo: Una muestra de 75 entrevistados determinó una media de 46 con una
desviación estándar de 4.8. ¿Cuál sería el error estándar de la media aritmética?

A partir del valor del error estándar, estamos en capacidad de poder desarrollar una metodología
que nos permitirá aproximar la media aritmética conocida de la muestra, a la media poblacional
desconocida. A este procedimiento se le denomina ESTIMACIÓN, y es el primer objetivo de la
inferencia estadística.

ESTIMACIÓN ESTADÍSTICA

Se entiende por estimación estadística al conjunto de procedimientos estadísticos dirigidos a


aproximar los valores muestrales a los correspondientes valores poblacionales. Solamente podemos
aproximarlos; nunca se podrán calcular con exactitud. Hay dos métodos de estimación estadística:

 la estimación puntual, y,

 la estimación por intervalos

A continuación analizaremos cada uno de ellos.

Estimación Puntual:

Se refiere al procedimiento de seleccionar una muestra aleatoriamente de una población, calcular


uno o más valores estadísticos determinados por el problema de investigación (media, varianzas,
desviaciones estándar, etc.) y considerarlos como estimadores de sus correspondientes valores
poblacionales (parámetros). A este valor se le considera un buen estimador, aunque no se tenga
evidencia estadística de cuán cerca o lejos esté de su correspondiente valor poblacional; el
investigador depende plenamente de su juicio científico y, principalmente del método de muestreo
que se sugiere sea completamente aleatorio. Ante las dudas que presenta la estimación puntual, se
ha desarrollado un segundo método que no calcula el valor poblacional con exactitud, pero que
establece una estimación probabilística entre la muestra y la población. A este método se le
denomina: estimación por intervalos.

Estimación Por Intervalos:

Se refiere al procedimiento a través del cual se estima, probabilísticamente, que a partir de los datos
muestrales, el parámetro poblacional se encuentre dentro de un intervalo bajo la curva normal. Esto
98

es posible porque al determinar que la distribución muestral de las medias se aproxima a la curva
normal y que es factible determinar la desviación estándar de las distribución muestral de las
medias, éstas quedan definidas por los límites de la curva normal, que están entre -3z y + 3z a partir
de la media aritmética muestral. En otras palabras, se puede inferir probabilísticamente que la media
poblacional está ubicada dentro de un intervalo bajo la curva normal. Esta es la estimación más
precisa que se puede hacer de la media poblacional desconocida, a partir de la información obtenida
a través de una muestra aleatoria.

Para tal efecto se define lo que se denomina un intervalo de confianza, que es una zona de
probabilidad bajo la curva normal y que toma a la media muestral como estimadora de la media
poblacional. De esta manera, las puntuaciones Z se ubicarán por encima y por debajo de la media
muestral hasta -3z y + 3z, asociándose esta zona con un valor probabilístico. Si recordamos las
probabilidades bajo la curva, tenemos que:

o entre –1z y +1z hay un 0.6826 de probabilidades: zc = ± 1.64

o entre –2z y +2z hay un 0.9544 de probabilidades: zc = ± 1.96

o entre –3z y +3z hay un 0.9900 de probabilidades: zc = ± 2.58

O sea, que la probabilidad de que la media poblacional esté entre –z y +z es de 68.26%, la


probabilidad de que esté entre -2z y +2z es de 95.44%, y la probabilidad de estar entre -3z y +3z es
de 0.99.

Para tener claro el concepto, volvamos al ejemplo de la muestra de 75 entrevistados que obtuvo una
S = 4.8, y un error estándar de estimación de 0.55. ¿Cuál es el intervalo de confianza en el que se
espera que se encuentre la media poblacional desconocida?

Para responder a este cuestionamiento, debemos decidir dentro de cuál nivel de probabilidad
queremos hacer la estimación. Por lo general, se calculan los intervalos de confianza en los niveles
de probabilidad del 95% o el 99%. Para el 95%, el valor de Z es de 1.96, mientras que para el 99%,
el valor de Z será de 2.58. Para estos casos, Z se identificará como Zc (Z crítica)

La fórmula para determinar el intervalo de confianza es:

( ) ……si la población es infinita


( )√ …..si la población es finita



Donde Np es el tamaño de la población y n el de la muestra.

Supongamos que para el problema planteado queremos calcular el intervalo de confianza al 95%.
Como no se conoce el tamaño de la población, se utiliza la fórmula de poblaciones infinitas:

( )( ) ( )( ) 0

Límite superior: 46 + 0.55 = 46.55
Límite inferior: 46 – 0.55 = 45.45
99

Este resultado indica que, con un 95% de probabilidad, la media poblacional


desconocida estará entre 45.45 y 46.55.

Suponga que, para el mismo problema se conoce el tamaño de la población, N = 500. ¿cuál sería el
intervalo de confianza al 95%? En este caso se utiliza el método de las poblaciones finitas.

00
0 √
00

0 √ (0 )(0 ) 0

Límite superior: 46 + 0.51 = 46.51


Límite inferior: 46 – 0.51 = 45.49
Este resultado indica que con un 95% de probabilidad, la media poblacional
desconocida estará entre 45.49 y 46.51.

El procedimiento anteriormente señalado, el cálculo del intervalo de confianza para la media


poblacional, es el más preciso con que se cuenta en estadística para aproximarnos al valor verdadero
de la media. También se pueden desarrollar intervalos de confianza para otros valores
poblacionales, pero para efectos de este texto, sólo nos referiremos a la media aritmética, por ser el
estadístico en el que se fundamentarán los procedimientos de prueba de hipótesis que se estudiarán
en capítulos posteriores.

Es evidente que la estimación estadística determina, en gran parte, la utilidad que se le podrá dar a
la muestra de estudio. A continuación introduciremos las técnicas de muestreo más efectivas, con la
intención de tener un panorama amplio de la relación que debe existir entre la muestra y su
correspondiente población.

MÉTODOS DE MUESTREO

El muestreo es el procedimiento a través del cual se seleccionan subconjuntos de las poblaciones a


las que se les denomina muestras. Las muestras son herramientas importantes para la investigación
del comportamiento, en vista de que favorecen el estudio de las poblaciones sin necesidad de
utilizar todas las observaciones poblacionales. Las muestras, además de ser métodos económicos en
comparación con los estudios poblacionales, mantienen un alto nivel de representatividad de dichas
poblaciones, si el procedimiento de muestreo es desarrollado de manera adecuada, respetándose los
criterios metodológicos que las estadísticas señalan al respecto.

Básicamente hay dos tipos de muestreo que pueden ser utilizados en el proceso de organización de
una muestra: el muestreo aleatorio que se caracteriza porque todos los sujetos de la población
tienen la misma probabilidad de ser seleccionados para conformar la muestra, y el muestreo no
aleatorio, en el cual cada miembro de la población no tiene la misma probabilidad de ser
seleccionado. A continuación analizaremos cada una de estas alternativas.
100

Muestreo No Aleatorio:

También se le conoce como muestreo no probabilístico, en vista de que la selección de cada unidad
(sujeto) no está determinada por su probabilidad en la población, ni está sustentada por un
procedimiento que asegure que dicha probabilidad poblacional ha sido considerada al momento de
hacer la selección. Algunos ejemplos de muestreo no aleatorio son.

1. Muestreo dirigido:

Se caracteriza porque los ítems (sujetos) son seleccionados con base en el juicio del encuestador;
en otras palabras, se escogen de la población aquellas unidades, que de acuerdo al investigador,
son representativos de la misma. En tales casos, La Probabilidad de selección del ítem (sujeto) es
desconocida. En estos casos, no se pueden establecer intervalos de confianza y la estimación es
de tipo puntual únicamente. A pesar de esta limitación, es un tipo de muestreo que se utiliza con
relativa frecuencia en estudios económicos y comerciales (Chou, 1974)

2. Muestreo por cuota s:

Se caracteriza porque a cada investigador (encuestador) se le da una cuota o número de


encuestas para ser cubiertas por el mismo. Los sujetos que constituyen la cuota que debe cubrir
el encuestador, deben satisfacer ciertas características previamente establecidas tales como:
nacionalidad, género, raza, afiliación política, etc. En algunas ocasiones se considera que se
puede obtener información de ciertos estratos, a bajos costos y con problemas metodológicos
inferiores a la verdadera estratificación. La limitación principal de este tipo de muestreo es que
la selección de las unidades refleja de manera significativa el juicio del encuestador. Bajo estas
características, las muestras no pueden ser tratadas como aleatorias en el mejor sentido de la
palabra. A pesar de esto, se utiliza con relativa frecuencia en estudios de opiniones y actitudes.

3. Muestreo deliberado:

También se le denomina muestreo por segmento. Se caracteriza porque se utiliza un segmento de


la población en función de su accesibilidad y comodidad para el investigador. Las guías
telefónicas, las listas de compradores de supermercados, etc., son ejemplos de unidades
observacionales en este tipo de muestreo. Sin embargo, los resultados obtenidos suelen ser muy
sesgados y poco representativos. No obstante, no se puede negar su utilidad como investigación
piloto, en vista de que se puede someter a prueba preguntas de los cuestionarios, encuestas, etc.,
antes de diseñar el estudio de manera definitiva.

Muestreo Aleatorio:

Se caracteriza porque todos los miembros de la población tienen igual oportunidad de ser
seleccionados para la muestra. Esta situación determina que cada uno de los miembros de la
población debe ser identificado previamente, tal y como sucedería, por ejemplo, con los estudiantes
de una escuela, los miembros de una empresa, los habitantes de un corregimiento, etc. La población
y cada una de sus unidades participantes del muestreo, deben ser conocidas previamente y se debe
desarrollar una metodología para su correcta identificación al momento de la selección. Es evidente
que la definición de la población y la identificación de cada uno de sus miembros, es una de las
101

dificultades más importantes a la que se deben enfrentar los investigadores. Los principales tipos de
muestreo aleatorio son los siguientes:

1. Muestreo Aleatorio Si mple:

Se refiere a la extracción de una muestra de una población, a través de un procedimiento en el


cual todos los sujetos de la población tuvieron la misma oportunidad de ser seleccionados. Para
alcanzar este objetivo, el procedimiento de selección debe ser meticulosamente planificado de tal
manera que se cumplan todos los controles exigidos para este tipo de actividad.

En teoría, para que se cumpla la aleatoriedad, los sujetos seleccionados deben ser devueltos a la
población original, manteniendo los eventos y sus probabilidades invariantes. Pero en la práctica
esto no es necesario, porque por lo general, el tamaño de la población es muy grande en
comparación con el de la muestra y el error cometido por la no sustitución no tiene importancia
práctica. Sin embargo, si la población es muy grande, en ocasiones se hace difícil numerar a
cada uno de los miembros de la población para poder identificarlos. En la actualidad, este
inconveniente está superado con el desarrollo de la informática que agiliza estos procedimientos
de manera significativa.

El proceso de selección de la muestra, una vez identificados de manera adecuada todos los
sujetos de la población, se lleva a cabo utilizando una Tabla de Números Aleatorios, que no es
otra cosa que una serie de números generados electrónicamente sin ningún patrón u orden pre
establecido. A continuación presentamos una parte de una Tabla de Números Aleatorios, tomada
de Pagano, 2006.

TABLA 10-3:
Tabla de números aleatorios (PAGANO, 2006)
1 2 3 4 5 6 7 8
1 32942 95416 42339 59045 26693 49057 87596 20624
2 07410 99859 83828 21409 29094 65114 36701 25762
3 59981 68155 45673 76210 58219 45738 29550 24736
4 46251 25437 69654 99716 11563 08803 86027 51867
5 65558 51904 93123 27887 53138 21488 09095 78777
6 99187 19258 86421 16401 19397 83297 40111 49326
7 35641 00301 16096 34775 21562 97983 45040 19200

Como se puede observar, una Tabla de Números Aleatorios no es otra cosa que una matriz
(combinación de filas y columnas) constituida por celdillas, dentro de las cuales se observan
series numéricas en desorden, generadas a través de ordenadores. Para nuestro ejemplo, las
celdillas están constituidas por series de cinco números, pero cada celdilla puede generar
cualquier conjunto de números, desde 1 hasta k; lo importante es que los mismos no representen
ningún orden predeterminado. Como en la población cada sujeto estará identificado por un
número o combinación de números, se entra a la Tabla de manera aleatoria y se va
102

seleccionando a los sujetos de acuerdo la aparición del número que corresponde a los mismos.
En los Laboratorios se estudiará el método para utilizar la Tabla en la selección aleatoria de
sujetos.

2. Muestreo Aleatorio Si stemático:

Se trata de una forma de muestreo aleatorio simple, en la cual no es necesario utilizar la Tabla de
Números Aleatorios a lo largo del muestreo; se utiliza para hacer la primera selección
únicamente. El resto del muestreo se hará sistemáticamente, o sea, a través de intervalos fijos
previamente establecidos por el investigador. A los intervalos fijos los llamaremos K, y los
mismos serán definidos a través de la siguiente regla: ⁄ . Por ejemplo, si se tiene una
población de N=1000 sujetos y se desea seleccionar una muestra de 100 sujetos, se divide el
tamaño de la población entre el tamaño de la muestra, obteniéndose K o intervalo de selección
aleatoria. Para nuestro ejemplo sería 000⁄ 00 0. Esto significa que a partir del primer
sujeto seleccionado aleatoriamente utilizando la Tabla, el resto de los sujetos de la muestra se
seleccionarán en intervalos de tamaño 10, directamente de la población hasta obtener los 100
sujetos que conforman la muestra. Como el primer sujeto fue seleccionado aleatoriamente, el
resto de las selecciones que se hagan utilizando el intervalo de tamaño 10 también se consideran
aleatorias. Este procedimiento es más rápido y por lo tanto más económico que el muestreo
aleatorio simple, manteniéndose el concepto de aleatoriedad a lo largo del proceso.

3. Muestreo Aleatorio Estratificado:

Se trata de una aplicación del método aleatorio simple, que permite desarrollar un muestreo más
eficiente y completo. Este caso requiere que la población esté dividida en estratos o categorías
homogéneos internamente pero heterogéneos entre ellos. Este sería el caso de poblaciones
estratificadas por género, por nivel académico, por nivel socioeconómico, por género y tipo de
organización familiar, etc. Para estos casos, una vez determinado el tamaño muestral a utilizar,
se selecciona de cada estrato una sub muestra utilizando uno de los métodos aleatorios
anteriormente explicados, de tal manera que en la muestra estarán representados los estratos
originales de la población.

Hay dos tipos de muestra aleatoria estratificada: la proporcional y la no proporcional. Una


muestra es aleatoria estratificada proporcional, si el número de sujetos seleccionados de cada
estrato es proporcional a su representación en la población. A continuación presentamos un
ejemplo:

 Para ingresar a una carrera universitaria hay un total de 450 aspirantes, los
cuales pertenecen a los siguientes bachilleratos:

Estrato N p
Ciencias 250 0.50
Letras 100 0.20
Comercio 150 0.30
Total 500 1.00
103

 Se va a seleccionar una muestra de 75 estudiantes para ingresar a la


universidad. ¿Cuál sería la cuota de estudiantes por estrato y de qué
manera serían seleccionados?
 Se trata de un muestro aleatorio estratificado proporcional.

Estrato n!(p) n
Ciencias 75(0.50) 37.5
Letras 75(0.50) 15.0
Comercio 75(0.50) 22.5
∑ 0

Como se observa en el ejemplo anterior, los 75 estudiantes seleccionados están conformados por
los tres bachilleratos, pero el número de estudiantes de cada bachillerato es proporcional a la
cantidad de estudiantes que originalmente constituían el estrato en la población. Este
procedimiento permite seleccionar una muestra que representa al universo con relación a la
proporción de cada estrato de la población. Sin embargo, es prudente utilizar este procedimiento
en aquellos casos en los que no hay gran diferencia en la dispersión entre los estratos.

Una vez asignada la cuota de muestreo a cada uno de los estratos, se les trata como si fueran una
población y se selecciona la cuota asignada a cada uno de ellos, utilizando cualquiera de los
métodos de muestreo aleatorio anteriormente analizados: simple o sistemático.

Es evidente que el muestreo estratificado no proporcional no es una alternativa adecuada para la


selección de muestras constituidas por estratos. Este tipo de muestreo puede presentar
distorsiones de la información proveniente de cada uno de los estratos, especialmente si hay
diferencias marcadas en la dispersión entre los estratos. Este método de muestreo no es
recomendable para el desarrollo de investigaciones aplicadas en psicología.

DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: n

Este capítulo sobre poblaciones y muestras no podía darse por concluido, si no se abordaba el
problema del tamaño de la muestra. A continuación discutiremos los aspectos básicos que deben ser
tomados en consideración, para determinar el tamaño mínimo que debe tener una muestra al
momento de desarrollarse un estudio. Es importante destacar que el concepto de la aleatoriedad se
mantiene como un aspecto básico en el desarrollo del tema. Además, los principios que se
presentarán a continuación se refieren específicamente a la determinación de n, para la estimación
de la media de la población, por ser éste el parámetro que más se utiliza en investigaciones del
comportamiento.

Para determinar “n”, es importante tomar en consideración los siguientes aspectos estadísticos
básicos:

1. El intervalo de confianza para la media, ya sea del 95% o del 99%


2. El nivel de probabilidad que desea para el intervalo de confianza
104

3. La diferencia que espera entre los límites del intervalo y el valor de la media verdadera: d
4. La σ2 de la población

En el caso de la σ2, en pocas ocasiones el investigador cuenta con este dato; por lo general se
requiere que el mismo sea estimado de la población, para lo cual se sugiere una de las siguientes
alternativas:

 El investigador saca de la población una muestra piloto, por lo general pequeña, y hace una
estimación de la σ2.

 Se investigan estudios previos en los cuales se han tocado temas similares a los que le interesan
al investigador. Si los temas, objetivos y contenidos de dichos estudios son lo suficientemente
similares, puede hacer uso de las varianzas muestrales obtenidas y considerarlas estimadoras de
la σ2.

Al momento de determinar “n”, el investigador debe considerar si la población en la cual se hará el


muestreo es infinita (desconocido el número de sujetos o significativamente grande), o si es finita,
en cuyo caso, se tiene información sobre el amaño de la población. A continuación se presentan las
fórmulas correspondientes a cada una de estas alternativas.

Tamaño De Población Desconocido

z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58)


σ2 : varianza de la población o un estimador de ella
d2: diferencia esperada entre la media de la muestra y la de la población

Tamaño De Población Conocido

( )
z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58)
σ2 : varianza de la población o un estimador de ella
d2: diferencia esperada entre la media de la muestra y la de la población
N : tamaño de la población
105

CONCEPTOS IMPORTANTES

 Variables aleatorias
 Variable aleatoria contínua
 Variable aleatoria nominal (discreta)
 Distribución muestral
 Error de muestreo
 Error típico de la media
 Estimación estadística
 Intervalo de confianza
106

EJERCICIOS PRÁCTICOS

DISEÑO DE MUESTREO
TABLA 1
POBLACIÓN
HOMBRES MUJERES

01 17 33 49 65

02 18 34 50 66

03 19 35 51 67

04 20 36 52 68

05 21 37 53 69

06 22 38 54 71

07 23 39 55 71

08 24 40 56 72

09 25 41 57 73

10 26 42 58 74

11 27 43 58 75

12 28 44 60 76

13 29 45 61 77

14 30 46 62 78

15 31 47 63 79

16 32 48 64 80

A partir de la población anterior, seleccionaremos muestras de manera aleatoria.

1. Selecciones una muestra aleatoria de tamaño n = 30, utilizando el método de muestreo aleatorio
simple.
2. Seleccione una muestra aleatoria de tamaño n= 30, utilizando el método sistemático
3. Seleccione una muestra aleatoria de tamaño n=30, utilizando el método de muestreo
estratificado proporcional.
107

DISEÑO DE MUESTREO
SEGUNDA PARTE
TABLA 2
POBLACIÓN
HOMBRES MUJERES
60 75 72 92 85

72 64 75 49 94

55 88 64 79 68

45 73 85 83 71

82 68 71 69 65

84 77 87 64 55

93 67 83 82 62

63 89 81 72 73

94 82 57 75 77

85 78 62 70 72

90 81 91 66 67

76 68 73 85 87

78 70 78 98 61

69 81 79 72 76

56 71 72 78 82

73 78 93 76 90

Suponga que a los sujetos de la población de la Tabla 1, se les aplicó una prueba de Conocimientos
Generales y los resultados están descritos en la Tabla 2 de este laboratorio. Como usted seleccionó
muestras de tamaño 30, acredite a cada sujeto de las muestras seleccionadas el puntaje que obtuvo
en la prueba y desarrolle el laboratorio que presentamos a continuación. Recuerde: la Tabla 1
identifica a los sujetos de la población; la Tabla 2 identifica los puntajes que obtuvo cada uno de
ellos en la prueba.

4. A partir de la muestra aleatoria simple de tamaño 30 seleccionada anteriormente determine:


 La media aritmética de la muestra y la desviación estándar de la muestra
 El error estándar de la media aritmética
 El intervalo de confianza para la media aritmética al:
 95%
 99%
5. A partir de la muestra aleatoria estratificada de tamaño 30, seleccionada anteriormente,
determine: :
 La media aritmética y la desviación estándar del estrato masculino
108

 El error estándar de la media del estrato masculino


 El intervalo de confianza para la media del estrato masculino al:
 95%
 99%
6. Desarrolle el mismo procedimiento del punto 2, para el estrato femenino
7. A partir de la población hipotética resumida en la Tabla 2 del capítulo, y sin tomar en
consideración diferencias por sexo, determine el tamaño de muestra (n) mínimo requerido, si el
intervalo de confianza es del 95% y la estimación (margen de error) aceptada con relación a la
media real es de 2 puntos. La varianza estimada a través de otros estudios semejantes fue de
121 puntos.
8. Un investigador desea hacer una estimación de la puntuación promedio de la ansiedad, de un
grupo de estudiantes que pertenecen a cierta área de la ciudad. El investigador desea que su
estimación se encuentre a 0.25 puntos del valor verdadero, con un intervalo de confianza del
99%. La desviación estándar obtenida en estudios previos fue de 0.75. ¿Qué tamaño de muestra
debe tener el estudio?
109

CAPÍTULO 11
INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS

Uno de los objetivos de la inferencia estadística es la prueba de hipótesis. Para tener una idea más
clara de su real significado, es necesario discutir el concepto hipótesis estadística. En el plano de la
investigación psicológica, una hipótesis es una afirmación referente al comportamiento esperado de
una o más variables y de las posibles relaciones que pueden existir entre las mismas. Las hipótesis
de investigación se plantean, por lo general, desde una perspectiva conceptual, y se fundamentan en
modelos teóricos, evidencia empírica obtenida a través de otras investigaciones, e inclusive, la
intuición, experiencia o sentido común del investigador. Las hipótesis de investigación requieren ser
verificadas empíricamente, lo cual permitirá decidir sobre la veracidad o no de la afirmación
efectuada. La verificación de las hipótesis de investigación se realiza a través de una herramienta de
la estadística inferencial denominada hipótesis estadísticas.

Problemas

Teorías Hipótesis
estadísticas
Hipótesis de
investigación

FIGURA 11—1

El problema básico al que se enfrenta el investigador es el de establecer un vínculo entre la(s)


hipótesis de investigación que se refieren a variables y las relaciones de las mismas definidas
conceptualmente, y el comportamiento observable de las mismas en el contexto de la investigación.
En las ciencias del comportamiento, ese vínculo se logra a través de las definiciones operacionales
de dichas variables, o sea, la descripción precisa de la forma en que las mismas serán medidas. A
través de la medición podemos pasar del concepto (constructo o variable) al dato, favoreciéndose de
esta manera, la aplicación de procedimientos matemáticos y estadísticos capaces de verificar con
objetividad, las afirmaciones (o conjeturas) planteadas a través de las hipótesis de investigación.

Veamos un ejemplo hipotético.

Un psicólogo cree poseer evidencias como para considerar que el razonamiento analógico está
relacionado con el rendimiento en las matemáticas. Para ser más específico, conjetura que la
relación entre ambas variables es directamente proporcional, o sea que, incrementos en una, van
acompañados de incrementos en la otra. Para solucionar esta sospecha, el primer paso que debe
satisfacer el investigador es el de determinar si estas variables pueden ser definidas
operacionalmente, o sea, que puedan ser medidas. Descubrió que el razonamiento analógico se
puede medir a través de la Prueba del WISC mientras que el rendimiento en las matemáticas lo
110

mide a través de las notas obtenidas en el colegio; bajo estas perspectivas, ambas variables
pueden ser transformadas de conceptos a datos o valores cuantitativos. De cada sujeto
investigado se puede obtener información que permita determinar: si poseen los atributos y la
magnitud (cantidad) de los mismos. A partir de la cuantificación, el investigador está en
capacidad de verificar si su hipótesis es acertada o no, sobre la base de la aplicación de las
estadísticas inferenciales, específicamente a través de una prueba de hipótesis.

LA PRUEBA DE HIPÓTESIS

Es un procedimiento que permite establecer si el comportamiento esperado de los datos estadísticos


provenientes de una investigación, se han cumplido tal y como conjeturó el investigador, o si por el
contrario, dicho comportamiento no se manifestó de acuerdo a lo esperado. Para desarrollar esta
acción se requiere de evidencia estadística proveniente de la(s) muestra(s) de estudio y de una
acertada aplicación de la teoría de la probabilidad. Esto último es fundamental, en vista de que las
investigaciones comportamentales se desarrollan sobre muestras extraídas de poblaciones y toda la
teoría del muestreo está basada en probabilidades.

Evidencia Teoría de Hipótesis


muestral probabilidad estadística

FIGURA 11—2

La Prueba de Hipótesis es un procedimiento que consta de seis pasos que deben ser cumplidos con
la mayor objetividad posible. A continuación se desarrolla cada uno de ellos. El estudiante debe
comprender, analizar y sintetizar el contenido, de tal manera que al momento de llevar a la práctica
el procedimiento, el mismo esté correctamente sustentado.
111

PASO 1: PASO 2: PASO 3


•Hipótesis estadísticas •Nivel de significación •Identificar el
estadístico de prueba

PASO 4 PASO 5 PASO 6


•Formular una regla de •Tomar una muestra y •Decisión
decisión llegar a una decisión

FIGURA 11—3

PASO 1: Hipótesis Estadística

Una hipótesis estadística es una que hace el investigador acerca del comportamiento de uno o más
parámetros poblacionales, de acuerdo a la hipótesis de investigación planteada en el estudio. La
hipótesis estadística se hace sobre valores cuantitativos que deben representar la misma relación
planteada en la hipótesis de investigación. Para tal efecto, la Prueba de Hipótesis está constituida
por dos hipótesis que deben ser rivales y mutuamente excluyentes: la Hipótesis nula (H0) y la
Hipótesis alterna (H1).

La Hipótesis Nula, H0, se plantea de manera opuesta a la hipótesis de investigación; en otras


palabras, rivaliza con la hipótesis de investigación. Por otro lado, la Hipótesis Alterna, H1, se
plantea de tal manera que debe coincidir totalmente con la hipótesis de investigación, por lo tanto,
es opuesta a la hipótesis nula. Bajo estas circunstancias, la Prueba de Hipótesis se diseña con la
intención de rechazar la H0 y confirmar la H1. Si se rechaza la H0, se confirma la H1; si no se
rechaza la H0, no se confirma la H1 y por lo tanto, tampoco se confirma la hipótesis de
investigación. El planteamiento formal de ambas hipótesis es el siguiente:

H0: Se plantea la hipótesis nula


H1: Se plantea la hipótesis alterna

Veamos el ejemplo del razonamiento analógico y el rendimiento en matemáticas. La hipótesis del


investigador se verifica con un procedimiento de correlación del cual se desprende un coeficiente
que él espera que sea positivo y mayor que cero (0). Las hipótesis estadísticas correspondientes
serían:

0
0
112

Como se puede observar, la H1 coincide con la hipótesis de investigación que decía que la relación
esperada debía ser directamente proporcional entre ambas variables, situación que se corrobora
cuando el coeficiente rxy es mayor que cero (0). Lo importante en el ejemplo es observar que si se
rechaza la H0, automáticamente se considera confirmada la H1; de no ser rechazada la H0, no se
podría confirmar o aceptar la H1. Este es un ejemplo, y más adelante, explicaremos los diversos
estadísticos que se utilizan al plantear las hipótesis.

Otros ejemplos de planteamiento de hipótesis estadísticas

1. El Ingreso mensual promedio de los jubilados panameños es menor de B/385.00

00
00

2. El índice académico de las estudiantes de psicología del sexo femenino es mayor que el de los
estudiantes del sexo masculino

3. El nivel de conocimientos de matemáticas básicas es diferente entre los bachilleres en letras y


los bachilleres en comercio.

Como se puede observar en los ejemplos, la Hi se puede plantear en una dirección (> ó <) al igual
que en dos direcciones ( ≠ ). Cuando se plantea en una dirección, la prueba es de una cola a la
derecha y el operador utilizado es >, o de una cola a la izquierda y el operador corresponde a <. En
el caso de una cola a la derecha se indica que el resultado esperado debe ser positivo y se ubicará a
la derecha de la distribución de probabilidad que se esté utilizando. Por el contrario, si la prueba es
de una cola a la izquierda se indica que el resultado esperado debe ser negativo y debe ubicarse a la
izquierda de la distribución de probabilidad correspondiente. En el caso de dos colas se indica que
no hay certeza por parte de investigador con relación a la dirección en que se darán los resultados, o
sea, que pueden darse a la derecha y ser positivos, o pueden darse a la izquierda y ser negativos. Es
importante volver a destacar que la hipótesis alterna debe ser semejante a la hipótesis de
investigación, lo que significa que la dirección de la prueba de hipótesis debe corresponder a lo
planteado en la hipótesis de investigación.

PASO II: Nivel De Significación

El nivel de significación se refiere a una zona de probabilidad bajo la distribución probabilística,


que determinará el rechazo de la Ho y por consiguiente la confirmación de la Hi. Siempre que los
resultados de la prueba de hipótesis caigan dentro del nivel de significación, se ha verificado la
hipótesis alterna. El nivel de significación se identifica por el símbolo α el cual se lee como alfa y
por lo general, en las investigaciones comportamentales puede tener uno de los siguientes valores:

1. α = 0.05.
113

En ese caso se indica que la probabilidad asignada a la ocurrencia de la H1 por azar, es


de 0.05, y la misma se ubicará siempre en los extremos de la distribución de
probabilidad, ya sea para una o para dos colas.

2. α = 0.01

Para este caso, la probabilidad asignada a la ocurrencia de la Hi por azar, es de 0.01 y,


al igual que en el caso anterior, se ubicará en los extremos de la distribución, tanto
para una como para dos colas.

Como se puede observar, los alfas tienen tamaños diferentes y esta situación es importante al
momento de diseñar y desarrollar la prueba de hipótesis. Cuando se establece un alfa de 0.05, se
comete lo que se denomina el error de tipo I. Este error se refiere a la probabilidad de rechazar la
Ho y confirmar la Hi cuando la primera no debió de haberse rechazado. O sea, que el rechazo se
debe principalmente a que alfa tiene un tamaño grande y de esa manera aumenta la probabilidad de
que los resultados caigan en esta zona. Esta situación nos lleva a concluir que cada vez que
decidimos tomar un alfa más grande, se aumenta la probabilidad de cometer el error de tipo I, o sea,
verificar su hipótesis alterna, cuando no debió ser verificada. Cuando se establece un alfa de 0.01,
se comete lo que se denomina el error de tipo II, que se refiere a la probabilidad de no rechazar la
Ho y por lo tanto, no confirmar su Hi, cuando la primera debió haberse rechazado. En este caso,
como alfa es tan pequeña, se ubica muy al extremo de la distribución de probabilidad haciendo
difícil que resultados muy importantes sean considerados como tales en vista de que no caen en
dicha zona de probabilidades. A continuación se presentan algunas figuras que favorecen la
comprensión del tema.
114

Error de tipo I:
α grande

Error de tipo II:


α pequeña

FIGURA 11—4

La figura anterior presenta la situación típica de una prueba de hipótesis en la que se ha definido
alfa. Como se puede observar, la distribución ha sido dividida en dos áreas: la del extremo derecho,
la más pequeña, representa a alfa, la cual puede ser de 0.05 ó de 0.01 de acuerdo a las necesidades
del investigador. Este es el caso típico de una prueba de una cola a la derecha, porque se está
indicando que la zona de alfa está en el extremo derecho. Si por el contrario, la prueba hubiese sido
de una cola hacia la izquierda, entonces la zona de alfa se hubiese ubicado en la cola de la izquierda
de la distribución.

Tal y como hemos observado, al definirse alfa, se divide la distribución en dos partes: una para alfa
que es la más pequeña y otra mayor que se denomina beta y se identifica por el símbolo β. Beta
representa la probabilidad asociada con la H0, es complementaria con alfa y ambas son mutuamente
115

excluyentes. Por lo tanto, la prueba de hipótesis puede caer en alguna de las dos áreas: si cae en alfa
se rechaza la H0 y se confirma la Hi; si cae en beta, no se rechaza la H0 y no se ha podido confirmar
la Hi.

En el caso de que la prueba de hipótesis sea de dos colas, entonces alfa se divide entre dos (α / 2) y
se asignan las correspondientes probabilidades a cada extremo de la curva; o sea, que hay dos zonas
de rechazo probables para la H0. El área central que queda entre las dos zonas de alfa corresponde a
beta.

La figura a continuación permite observar la situación anteriormente señalada, identificando cada


uno de los componentes de la situación de prueba de hipótesis planteada.

α = 0.025 ó 0.005 α = 0.025 ó 0.005

Β = 0.95 ó 0.99

 α representa la probabilidad de ocurrencia de H1 por azar


 β representa la probabilidad de ocurrencia de Ho por azar

FIGURA 11—5

Es importante destacar que α + β = 1, por ser eventos mutuamente excluyentes y complementarios.


Cambios en alfa representan automáticamente cambios en beta. El investigador decide cuál valor de
alfa va a utilizar, o sea, cuál tipo de error está dispuesto a cometer. Es evidente que mientras más
importante sea la decisión a tomar, más exigente se hace la prueba de hipótesis, y por lo tanto, más
pequeño será alfa. En psicología, educación y ciencias sociales, estos dos niveles de significación
son los que se estudian y utilizan con mayor generalidad. Sin embargo, es importante señalar que
existen procedimientos muy específicos para determinar estos niveles de probabilidad, tales como la
determinación de la potencia y eficiencia de una prueba de hipótesis. Estos temas se estudian en
niveles superiores de educación universitaria.
116

PASO III: Estadístico De Prueba

Una vez definidas las hipótesis y establecido el nivel de significación, se debe establecer el
procedimiento estadístico a través del cual se va a desarrollar la prueba de hipótesis. El
procedimiento estadístico seleccionado debe tomar en consideración varios aspectos críticos:

 El tamaño de la muestra: si la muestra es ≤ a 30, el estadístico a seleccionar debe ser adecuado


para esta restricción del muestreo, o en otras palabras, debe corresponder a una muestra
pequeña. Si la muestra es > 30, el estadístico debe corresponder a una muestra grande.

 El nivel de medición de la(s) variable(s): se debe considerar si la(s) variable(s) han sido
medidas como continuas o discretas, y si corresponden al nivel nominal, ordinal, de intervalo o
de proporción.

 El tipo de parámetro poblacional que está bajo estudio a través de la evidencia muestral

 Si las muestras analizadas (estimadores a someter a prueba) provienen de poblaciones


semejantes o diferentes.

Bajo estas consideraciones, los estadísticos de prueba que se utilizarán para el estudio de las
pruebas de hipótesis son:

1. El estadístico z para las pruebas de hipótesis de dos medias o dos proporciones provenientes de
muestras grandes y que supongan que las variables son continuas, se distribuyen normalmente
y la σ es conocida.
2. El estadístico “t” de Student, para las pruebas de hipótesis de dos medias aritméticas,
desarrolladas en muestras pequeñas (o grandes) y que se asume que las variables son continuas
y la σ es desconocida por lo que se utiliza la S muestral.
3. El estadístico “F” de Fisher para las pruebas de hipótesis de medias aritméticas, muestras
pequeñas y variables continuas, cuando se comparan dos o medias aritméticas.
4. La prueba Chi Cuadrado para muestras pequeñas, variables discretas medidas en escala
nominal. La prueba de proporción y asociación de Chi Cuadrado requiere de muestras grandes.
Recuerde que si la frecuencia esperada es menor a 5 no aplica; para el caso de muestras
pequeñas y tablas sólo 2x2, la prueba sería la Exacta de Fisher.

Para el caso de pruebas de hipótesis para medias aritméticas, a continuación presentamos una tabla
en la que se resumen los valores críticos de Z, a diferentes niveles α, a una o a dos colas.

TABLA 11-1:
Valores críticos de z para diferentes niveles de α, a una o a dos colas
Alfa 0.05 0.01
Una cola 1.96 ó -1.64 2.33 ó -2.33
Dos colas 1.96 ó -1.96 2.58 ó - 2.58
117

Para cada uno de los estadísticos señalados, se ha definido una regla (fórmula) para calcular su
valor exacto, las cuales serán presentadas a medida que se vayan desarrollando los diferentes tipos
de pruebas de hipótesis.

PASO IV: Regla De Decisión

La regla de decisión identifica los hechos estadísticos que permitirán determinar si la H 0 se rechaza
o no se rechaza. Al momento de determinarse alfa, la distribución de probabilidad utilizada se
divide en dos partes: la zona de aceptación y la de rechazo. El punto en que se divide la distribución
debe ser representado por un valor crítico proveniente de la Tabla de Probabilidades
correspondiente a la distribución de probabilidad utilizada para el estudio, el alfa de la prueba y el
tipo de cola de la hipótesis alterna. Esto significa que se determinarán valores críticos para z, t, F y
Chi Cuadrado, y que los mismos serán los criterios contra lo que vamos a comparar los resultados
obtenidos al aplicar las pruebas estadísticas. La regla de decisión establecerá que se rechazará la H 0,
si el estadístico obtenido de los datos de la investigación, supera el valor crítico obtenido en la tabla.

Por ejemplo, si está haciendo una prueba de hipótesis para una media poblacional, con alfa de 0.05,
una cola a la derecha y una muestra grande, el valor crítico que separa alfa de beta se obtiene de la
Tabla de la Curva Normal y el mismo es igual a Zc = 1.64. Quiere decir que para rechazar la H0, la
z que obtenga de los datos de la investigación (Zo) debe ser superior al valor crítico de 1.64. Si esto
sucede, la z de los datos cae en la zona de alfa y por lo tanto se rechaza la Ho confirmándose la
alterna; de lo contrario, no se puede rechazar la H0. Esto debe estar debidamente explicado en la
prueba de hipótesis, más o menos en los siguientes términos:

Se rechaza la H0 si la Zo (z obtenida) es mayor que la Zc (z crítica) que es igual a 1.64.

Región
de
rechazo

Región de aceptación

0 Z = 1.64

Probabilidad 0.95

Probabilidad
0.05

FIGURA 11—6

PASO V: Aplicación de la Prueba Estadística

Se refiere al procesamiento estadístico de los datos provenientes de la(s) muestra(s) de estudio y del
desarrollo de la prueba estadística seleccionada. Como ya hemos dicho anteriormente, se utilizarán
118

las pruebas z, t, F y Chi Cuadrado de acuerdo a las necesidades. Los resultados obtenidos serán
comparados con los correspondientes valores críticos provenientes de las Tablas y se determinará si
los valores observados superan o no a los críticos lo cual permitirá tomar una decisión final.

PASO VI: Decisión

La decisión se refiere al rechazo o no de la H0, atendiendo al planteamiento de la prueba de


hipótesis, a los resultados de la prueba estadística y a la regla de decisión establecida en el estudio.
Si el valor observado en la prueba supera al valor crítico de la Tabla, se rechaza la Ho y se confirma
la alterna; de no ser así, no se rechaza la Ho y por lo tanto no se confirma la hipótesis alterna.

CONCEPTOS IMPORTANTES

 Hipótesis estadística
 Prueba de hipótesis
 Hipótesis nula
 Hipótesis alterna
 Nivel de significación
 Alfa y Beta
 Errores Tipo I y Tipo II
 Prueba de una cola
 Prueba de dos colas
119

CAPÍTULO 12
PRINCIPALES TIPOS DE PRUEBA DE HIPÓTESIS

Al iniciar el capítulo de “Poblaciones y Muestras” señalamos que se haría énfasis en los estudios
relacionados con la media aritmética, en vista de que este estadístico es posiblemente el más
importante, junto con la desviación estándar, para los análisis de resultados provenientes de
investigaciones comportamentales. Por tal razón, las pruebas de hipótesis que a continuación se
discutirán, se dirigen en particular hacia este estadístico.

PRUEBAS DE HIPÓTESIS PARA POBLACIONES O DATOS


DISTRIBUIDOS NORMALMENTE.

Cuando se presume que los datos están distribuidos normalmente, ya sea porque la muestra es
grande o porque se tiene suficiente evidencia como para aseverar la distribución normal, se puede
estudiar la significancia de las puntuaciones correspondientes a la(s) media(s), utilizando el
estadístico estandarizado “z”. Para tal efecto se deben satisfacer ciertas condiciones:

 Los datos se distribuyen normalmente

 Los datos han sido medidos por lo menos en una escala de intervalos

 La µ poblacional es conocida

 La σ2 poblacional es conocida

 Si la σ2 es desconocida, pero la muestra es lo suficientemente grande, la S2 muestral puede ser


utilizada como estimadora de su correspondiente parámetro poblacional.

Si las condiciones anteriores son satisfechas, se pueden desarrollar dos tipos de pruebas de hipótesis
para la media: a) el caso de una media poblacional y, b) el caso de dos medias poblacionales. A
continuación presentaremos las principales características de ambos procedimientos.

El Caso De Una Media Poblacional

En muchas ocasiones, los investigadores están interesados en evaluar si una media poblacional
conocida ha variado o se mantiene igual. En estos casos, una vez verificadas las propiedades
anteriormente señaladas, se extrae una muestra aleatoria de la población y se calcula la media
aritmética de la misma. El estadístico de análisis es:


A continuación presentamos un ejemplo de una prueba de hipótesis para el caso de una media
poblacional.
120

La media de las aptitudes generales de los aspirantes a ingresar a la Universidad A, en los


últimos diez años, es de 43, con una σ = 8.56. Una muestra de 275 aspirantes del año 2010
obtuvo una media de 46.65. Con alfa de 0.05 determine si la media de las aptitudes generales de
los aspirantes ha aumentado en comparación con los últimos diez años.

1. Hipótesis estadísticas

2. Ni vel de si gnificación

00

3. Estadístico de prueba


4. Regla de decisión

Rechazar Ho si la Zo es mayor que la Zc = 1.64

5. Resultados

0
0

6. Decisión:

En vista de que zo > zc, hay evidencias estadísticas para rechazar la Ho y confirmar la H1;
la media de la muestra actual es mayor que la de la población de los últimos 10 años.

En este problema, la información correspondiente a la σ2 poblacional formaba parte de los datos del
mismo. Sin embargo, en la mayoría de los casos, este dato se desconoce y el error estándar de la
media no es posible determinarlo, por lo que el investigador debe echar mano de otros recursos que
la estadística inferencial pone a su disposición, los cuales analizaremos a continuación.
121

 Si el tamaño de la muestra es grande (se considera una muestra grande la que es de al menos 30
sujetos), es factible hacer una estimación de la σ poblacional, y a partir de ella calcular el error
estándar de la media aritmética. Esto es factible por el poder de los números grandes (muestras
grandes) combinados con el Teorema Central del Límite.

 Si la variable objeto de estudio está distribuida normalmente, o existe suficiente evidencia


estadística para considerar que esta situación está presente, se puede asumir que la distribución
muestral de las medias aritméticas de tamaño “n” se distribuye normalmente. En tal caso, la
prueba “z” es pertinente para llevar adelante la prueba de hipótesis.

El Caso De Dos Medias Poblacionales

Muchas investigaciones en el campo de la psicología se refieren a la comparación de dos medias


poblacionales. Para tal efecto, el procedimiento es semejante al seguido en el ejemplo de una media
poblacional, aunque en este caso, se comparan las medias muestrales obtenidas de muestras que
fueron seleccionadas de dos poblaciones. Para el desarrollo de este tipo de prueba de hipótesis se
deben cumplir con los siguientes requisitos:

 Los datos se distribuyen normalmente en ambas poblaciones o existen suficientes evidencias


que le permiten al investigador lanzar este supuesto

 Los datos han sido medidos por lo menos en una escala de intervalos

 Las σ2 poblacionales pueden ser conocidas como también desconocidas; por lo general son
desconocidas.

 Si la σ2 es desconocida, pero la muestra es lo suficientemente grande, la S2 muestral puede ser


utilizada como estimadora de su correspondiente parámetro poblacional.

El estadístico requerido para desarrollar este tipo de prueba de hipótesis es:

, en donde, σ √ , que representa el error estándar de la diferencia de dos


medias.

A continuación se presenta un ejemplo:

El nivel promedio de la ansiedad evaluada en una muestra de 50 estudiantes femeninas de una


universidad fue de 68.2 puntos con una desviación estándar de 2.5 puntos. Una muestra
semejante de varones, obtuvo una media de 67.5 con una desviación estándar de 2.8. Verifique
la hipótesis de que los niveles de ansiedad de las mujeres fueron mayor que los de los varones,
con alfa de 0.05.

1. Hipótesis estadísticas
122

2. Ni vel de si gnificación

00

( )

3. Estadístico de prueba

, en donde, σ √ ,

4. Regla de decisión

Rechazar Ho si la Zo es mayor que la Zc = 1.64

5. Resultados

( ) ( )
√ 0
0 0

0 0
0
6. Decisión:

En vista de que Zo = 1.32 es menor que la Zc = 1.64, no hay evidencias estadísticas para
rechazar Ho y considerar confirmada la hipótesis alterna. No hay diferencias
estadísticamente significativas entre las medias de la ansiedad de las estudiantes femeninas
y la de los estudiantes masculinos.

Como se pudo observar, ambos grupos satisfacen los requerimientos exigidos para desarrollar
pruebas de hipótesis para muestras grandes, o sea, que la aproximación normal es favorable: los
tamaños son mayores de 30, la variable de interés es continua porque la medición de la misma
refleja magnitud, y dicha variable ha sido medida en una escala de intervalos; se asume la
aleatoriedad.
123

¿Pero qué sucede si la normalidad no se puede asumir, principalmente porque las muestras son
pequeñas, o sea n < 30? En tales casos, las propiedades de la normal no se satisfacen y se requiere
tomar en consideración la teoría estadística de las muestras pequeñas, la cual discutiremos, de
manera sencilla, a continuación.

PRUEBA DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS

En muchas ocasiones, los investigadores del comportamiento requieren desarrollar estudios


poblacionales, sin contar con los supuestos básicos de las grandes poblaciones: tamaño de muestra
grande, desviación estándar conocida, etc. En tales situaciones, los investigadores tienen que
fundamentar sus decisiones a partir de la información obtenida en las muestras pequeñas, las cuales
presentan limitaciones en lo referente a la aproximación normal, especialmente el Teorema Central
del Límite.

A pesar de estas limitaciones, el procedimiento de prueba de hipótesis no difiere con relación al


utilizado en las muestras grandes, excepto que no se puede asumir que las distribuciones muestrales
son normales y por lo tanto, las propiedades asociadas con la normalidad no se pueden sostener. En
el caso de las grandes muestras, se supone que las distribuciones muestrales son normales, mientras
que en las pequeñas muestras este supuesto no puede mantenerse, en vista de que ellas pueden
asumir diversas formas. A pesar de esta limitación, las muestras pequeñas mantienen una gran
relación con la teoría de las muestras grandes, a tal punto, que si la n muestral aumentara, se
aproximaría a la normal, siendo esta aproximación más evidente, a medida que n aumenta. Es como
si consideráramos que las muestras pequeñas se transforman y funcionan como muestras grandes.

Grados De Libertad

La introducción a la prueba de hipótesis para muestras pequeñas, nos obliga a analizar el concepto
de grados de libertad, que a partir de este momento se indicará por gl. Este concepto es aplicable
tanto en las muestras pequeñas como en las grandes, aunque su importancia fundamental radica en
las muestras pequeñas.

Si se tuviera la oportunidad de comparar la varianza de una población con la varianza de una


muestra (σ2 vs s2) se observaría que entre ambas hay una diferencia, la cual se denomina sesgo, el
cual es más pronunciado a medida que n < N. Para corregir este sesgo muestral, la varianza
muestral se calcula dividiendo las diferencias cuadráticas obtenidas entre los puntajes X y la media
muestral entre n-1, de tal manera que la s2 se considera un estimador insesgado de la varianza
poblacional

∑( )

o sea, que corrige el sesgo y permite la utilización de la varianza de la muestra como un estimador
eficiente de la varianza muestral.
124

Al denominador de la varianza muestral, n – 1, se le denomina grados de libertad (gl), y significa, el


número de observaciones muestrales que pueden variar libremente (asumir cualquier valor) cuando
se estima un parámetro poblacional.

Veamos un ejemplo: suponga que a cinco sujetos se les ha hecho una medición sobre un atributo
psicológico X, y que la media obtenida por los cinco sujetos fue de 25 puntos. ¿Cuántos puntos
ganó cada uno de los sujetos?

Sujeto X (puntuaciones arbitrarias)


1 15
2 16
3 29
4 30
5 ?

Los cuatro primeros sujetos pudieron obtener cualquier puntaje dentro del rango establecido por
la escala de medición utilizada. Pero el sujeto número 5, sólo tenía una opción: su puntaje debía
ser aquel que asegurara que al sumarse los 5 datos y dividirse entre n = 5, la media aritmética
sería igual a 25, tal y como se observa a continuación.

Sujeto X
1 15
2 16
3 29
4 30
5 35

que comprueba lo planteado anteriormente.


125

Otro ejemplo de los gl lo podríamos observar en la propiedad de que la ∑d (sumatoria de las


diferencias) alrededor de la media real es igual a cero; para tal efecto, utilizaremos el ejemplo
anterior.

Sujeto X D
1 15 15-25=-10
2 16 16-25=-9
3 29 29-25=4
4 30 30-25=5
5 35 35-25=10
∑ ∑0

Como se puede observar, siempre que se estime un parámetro a partir de un valor muestral, podrán
variar libremente n – 1 de los valores muestrales; el último, corresponde al valor requerido para
calcular el estadístico muestral. Por esta razón, en las muestras pequeñas, al estimar el valor de la
varianza o la desviación estándar, es necesario que se utilicen los grados de libertad, con el fin de
que dichas medidas de variabilidad sean consideradas estimadoras eficientes de sus
correspondientes parámetros poblacionales. Recuerde que la variabilidad es fundamental en la
prueba de hipótesis, especialmente para determinar el error estándar de la estimación.

A partir de los conceptos presentados anteriormente, daremos inicio al estudio de las principales
pruebas de hipótesis para muestras pequeñas: la prueba “t” de student para una y dos medias, y la
prueba “F” para tres o más medias.

La Prueba “t” de Student

La prueba “t” está respaldada por la distribución muestral del mismo nombre, en la cual las
variables se consideran normales, estandarizadas e independientes. Es una distribución continua y
se aplica tanto en muestras pequeñas como en las grandes. Varía entre -∞ hasta +∞, es simétrica con
una media igual a cero. En realidad es una familia de distribuciones, asociadas cada una de ellas a
su correspondiente grado de libertad; de acuerdo al tamaño de la muestra sus “s” varían. En
comparación con la normal, “t” es menos aguda en el centro que la normal y es más extendida. A
medida que n aumenta, la curva de “t” se aproxima a la curva normal. Sus valores estandarizados se
denominan “t” y tiene una Tabla asociada con las probabilidades de cada uno de estos valores.

Para desarrollar pruebas de hipótesis con “t”, es necesario tener evidencias de que las varianzas
muestrales no son estadísticamente diferentes. A esta condición se le denomina homogeneidad de
las varianzas, y debe ser comprobada en cada prueba; más sin embargo, en la mayoría de las
ocasiones los investigadores suponen que dicha condición está presente siempre y cuando las
muestras comparadas estén formadas por la misma cantidad de sujetos (n).

Además, debe conocerse la media de la(s) muestra(s), aunque la σ es desconocida. La misma será
estimada a partir de la “S” de la muestra tomando en consideración los grados de libertad (gl).
126

Es importante señalar que la Distribución “t” de Student cuenta con una Tabla de valores “t”
críticos, definida por los grados de libertad y el nivel de significación, tanto para una como para dos
colas. La comparación de los valores t observados y críticos, determinará si se rechaza o no la Ho.

Prueba “t” para el caso de una media poblacional

El estadístico “t” para el caso de una media poblacional es el siguiente:

(∑ )
, en donde ∑ ; y
√ ( )

Hay ocasiones en que se sospecha que una media poblacional conocida ha sufrido cambios: ya sea a
favor o en contra de los valores conocidos sobre la misma. En estos casos, se sigue el procedimiento
de los 5 pasos estudiados en las muestras grandes, tal y como lo presentamos en el siguiente
ejemplo a continuación.

Una investigadora sospecha que el peso corporal de una población de adolescentes infractoras
internadas en un Centro de Observación, ha sufrido cambios recientemente. La última medición
desarrollada hace tres años, señalaba un promedio 61 kilos y no se tenía información sobre la
desviación estándar del pesos corporal. La investigadora toma una muestra aleatoria de 8
menores y mide sus pesos corporales, obteniendo los siguientes resultados: 63, 60, 59, 65, 67,
66, 59 y 65. Con estos datos desarrolla una prueba de hipótesis con alfa (α) = 0.01. ¿A qué
conclusión llegó la investigadora?

Para desarrollar la prueba de hipótesis, es recomendable que resuma los datos que va a requerir y
con los mismos desarrolle la prueba.

DATOS

( )
( )
0

1. Hipótesis estadísticas

2. Ni vel de si gnificación

00

0
127

3. Estadístico de prueba

(∑ )
, en donde ∑
√ ( )

4. Regla de decisión

Rechazar Ho si “to” > 3.50 ó si “to” < -3.50

5. Resultados

( 0 )


( )

6. Decisión:

En vista de que “to” = 1.74 es < que tc = 3.50, no hay evidencias estadísticas para rechazar
la Ho. La µ poblacional del peso no es diferente que 61, por lo tanto, la sospecha de la
investigadora no se ha demostrado

Como se pudo observar, se trató de una prueba de hipótesis de una media poblacional de dos colas.
El procedimiento es semejante al seguido para muestras grandes.

Prueba “t” para el caso de dos medias independientes

Este caso se refiere a la situación en la que el investigador desea determinar si dos medias
muestrales difieren en alguna medida entre ellas, y si esa diferencia es significativa, o sea, que va
más allá de una simple fluctuación muestral. Está claro que las dos medias provienen de dos
muestras independientes las que presentan los efectos de dos condiciones diferentes; el interés
radica en determinar, de acuerdo a la hipótesis planteada, si ambas medias son estadísticamente
diferentes.

Para estos casos se sugiere que se presenten las siguientes condiciones previas:

 Las muestras son pequeñas y se desconoce la varianza poblacional de cada una,

 Los sujetos han sido, preferiblemente seleccionados aleatoriamente de la población y


distribuidos de la misma manera en ambas condiciones.

A continuación se presenta un ejemplo de una prueba de hipótesis para dos medias.

Un Psicólogo Escolar considera que el nivel de ansiedad de los hombres es mayor que el de las
mujeres, antes de desarrollar un examen. Para demostrar esta sospecha, aplica una prueba de
ansiedad antes de un examen de física a una muestra de 10 estudiantes varones y 10 estudiantes
128

mujeres, seleccionados ambos grupos de manera aleatoria de sus correspondientes poblaciones.


Los resultados obtenidos en la medición de la ansiedad fueron los siguientes:

Grupos Puntuaciones de ansiedad


Hombres 10 10 12 6 8 7 9 9 7 11
Mujeres 6 6 4 3 6 8 6 5 4 8

Con los resultados anteriores, se desarrolló una prueba de hipótesis con un alfa α de 0.05. ¿A
qué conclusión llegó el Psicólogo?

Se recomienda que resuma los datos que necesitará para desarrollar su prueba de hipótesis.

Hombres Mujeres
0 0

1. Hipótesis estadísticas

2. Ni vel de si gnificación

00

0 0

3. Estadístico de prueba

(∑ )
, en donde √( )( ); y ∑

4. Regla de decisión

Rechazar Ho si to > 1.73

5. Resultados

( ) ( )

√( )( ) 0 0
0 0
129

0 0
6. Decisión:

En vista de que to = 4.12 es > que tc = 1.73, se rechaza Ho y se confirma H1: la media de
la ansiedad de los hombres es > que la media de la ansiedad de las mujeres.

Prueba “t” para dos muestras correlacionadas

Se considera que dos muestras están correlacionadas, si los resultados obtenidos en una de ellas
afectan los resultados obtenidos en la otra. Esto es característico de las situaciones siguientes:

 Un mismo grupo es medido dos veces y se intenta determinar las diferencias observadas entre
las medias de ambos. Tal es el caso de las investigaciones de carácter experimental o cuasi
experimental, en las cuales la condición de antes-después es característica.

 Cuando se organizan dos grupos “apareados” y se intenta establecer las diferencias existentes
entre ambos. Apareados debe ser interpretado como la situación en que se intenta que parejas de
sujetos que pertenecen a grupos diferentes, mantengan las mismas características que rivalizan
con la variable independiente (por ejemplo, CI, género, edad, aptitudes, etc.). En estos casos, la
aleatoriedad no fue el factor que distribuyó a los sujetos de manera semejante en cada muestra,
sino la acción del investigador: el apareamiento.

 En estas situaciones, no se cuenta con la condición previa de independencia estadística que se


considera se alcanza plenamente con la aleatoriedad, y se utiliza una forma de “t” de student,
que además de tomar en consideración la magnitud de las diferencias entre ambas mediciones,
toma en consideración la dirección de la misma a través del signo. Para estos casos, los grados
de libertad son iguales a n-1

A continuación presentamos un problema en el cual, una muestra de sujetos se mide antes y después
de aplicada una intervención o tratamiento. Ambas mediciones se desarrollan en el mismo grupo de
sujetos, lo que hace de las mismas mediciones correlacionadas.

A fin de motivar a los ciudadanos al ahorro en el consumo de luz , una ONG estudia la idea de
emprender una campaña nacional a favor del ahorro de la misma. Sin embargo, antes de
emprender dicha campaña, la organización decide realizar un experimento que le permita
evaluar la eficiencia de la campaña. Para el experimento, realiza la campaña de ahorro de luz
en un área geográfica representativa. Doce (12) familias de esa área son elegidas al azar y se
determina el costo (en balboas) del consumo durante el mes anterior al lanzamiento de la
campaña de publicidad; al mes siguiente de la campaña de publicidad, nuevamente se
determina el costo del consumo. La idea de los investigadores es la de determinar si hubo o no
diferencias entre el consumo de luz, antes y después de la campaña publicitaria, y de esta forma,
evaluar la capacidad de dicha campaña para modificar los hábitos de consumo. Como se puede
observar, se trata de 12 personas medidas dos veces, antes y después, caso típico de muestras
correlacionadas. A continuación se presenta un ejemplo de la prueba de hipótesis
correspondiente
130

Antes Después Diferencia Diferencia


Familia
(costo) (costo) D D2
A 65 58 7 49
B 53 48 5 25
C 61 63 -2 4
D 72 68 4 16
E 45 46 -1 1
F 58 52 6 36
G 68 65 3 9
H 55 50 5 25
I 58 59 -1 1
J 64 60 4 16
K 66 68 -2 4
J 42 35 7 49
Totales ∑ 235

1. Hipótesis estadísticas

0
0

2. Ni vel de si gnificación

00

3. Estadístico de prueba

(∑ )
en donde √ ; y ∑
( )

4. Regla de decisión

Rechazar H0, si to > 2.201 ó rechazar H0, si to < 2.201

5. Resultados

( )
131

√ 00
( )

0
00
6. Decisión:

En vista de que to = 2.90 > tc = 2.201, se rechaza H0 y se confirma la H1. La campaña


publicitaria si afectó a la comunidad experimental, en vista de que se disminuyó el consumo
de luz en al grupo experimental.

Como se pudo observar en el ejemplo anterior, el procedimiento de prueba de hipótesis se mantiene


igual que en los casos anteriores, haciéndose las modificaciones requeridas por el tipo de problema
y el modelo estadístico a utilizar, siendo en éste caso la “t” de student para datos correlacionados.
Este ejemplo se aplicó en un caso de antes-después; de igual manera se hubiese procedido si se
tratara de grupos apareados. Cómo se pudo observar, para éste caso, los grados de libertad son
iguales a n – 1.

Prueba “t” para correlaciones

Las correlaciones son uno de los procedimientos más utilizados en el análisis de resultados
obtenidos en investigaciones del comportamiento. Siendo el comportamiento humano un factor
afectado por un número plural de variables, es evidente que las mismas interactúan mutuamente y
se afectan unas a otras, asociándose de diversas maneras. La correlación es una técnica estadística
que permite estudiar el nivel de asociación de dos o más variables. Para efectos de este curso de
prueba de hipótesis, vamos a estudiar si el coeficiente de correlación obtenido entre dos variables es
estadísticamente diferente que cero y por lo tanto, si la asociación de estas variables es válida.

Para representar al coeficiente correlación se utilizará en símbolo rxy, y la prueba de hipótesis se


desarrollará siguiendo el mismo procedimiento que en los casos anteriores: los cinco pasos. La H 0
que dice que entre las dos variables no existe correlación, contra las hipótesis alternas de que: 1) la
H1: r > 0 si se espera una correlación positiva, 2) H1: r < 1 si la correlación esperada es menor que 1,
3), r ≠ 0 si el investigador sospecha de que hay correlación pero no puede señalar de antemano una
dirección en especial. Para este caso, los grados de libertad son iguales a n – 2. A continuación
presentamos un ejemplo.

A una muestra de 20 estudiantes universitarios se les aplicó una prueba de razonamiento verbal,
con el fin de determinar si esta variable se asocia positivamente con los puntajes
correspondientes al índice académico de los dos primeros semestres de una carrera
universitaria. El coeficiente de correlación obtenido fue de 0.38. ¿Es esta correlación
estadísticamente significativa, o sea, es verdaderamente positiva? Sea alfa igual a 0.05.

1. Hipótesis estadísticas

0
0
132

2. Ni vel de si gnificación

00

0 0

3. Estadístico de prueba

4. Regla de decisión

Rechazar Ho si to > tc = 2.101

5. Resultados

0 0
(0 ) 0

0

6. Decisión:

En vista de que to = 1.810 es < que tc = 2.101, no hay evidencias para rechazar la H0; la
correlación entre estas variables no es diferente que cero.

Como se ha podido observar, en el caso de una correlación es posible determinar si la relación entre
las variables es estadísticamente significativa o es simplemente una fluctuación de la muestra, como
lo fue el caso anterior. De esta misma manera, pero con su estadístico correspondiente, se puede
determinar la significancia de otros valores correlacionales (comparación de dos correlaciones) y de
parámetros de regresión (a0 y a1), los cuales no serán tratados en este libro.

CONCEPTOS IMPORTANTES

 Muestras grandes
 Muestras pequeñas
 Sesgo muestral
 “t” de Student
 Homogeneidad de varianzas
133

EJERCICIOS PRÁCTICOS

Muestras grandes: pruebas de hipótesis para medias

1. Una muestra de 42 sujetos infractores, seleccionada de una población de sujetos privados de


libertad, obtuvo una media de 42 con una desviación típica de 9, en una prueba de razonamiento
abstracto. En los últimos 5 años, los resultados obtenidos indicaban una media de 48. ¿De
acuerdo a estos resultados se puede concluir que el promedio de la población de infractores ha
disminuido en comparación de los últimos cinco años? Sea alfa 0.05.

2. Los aspirantes a ingresar al servicio de Guardia Costera de los últimos 10 años obtuvieron un
promedio de ansiedad de 26 puntos con una desviación típica de 4 puntos. Se seleccionó una
muestra de 45 sujetos que aspiraron en el presente año, los cuales obtuvieron una media de 29
puntos. De acuerdo a estos resultados se puede considerar que los niveles de ansiedad de los
aspirantes han aumentado en comparación con los años anteriores? Utilice alfa de 0.05 y 0.01.

3. Un estudio desarrollado en 75 personas que residen en una comunidad sub urbana indicó que el
promedio de ingreso familiar fue de B/235.00 mensuales, con una desviación típica de 25.00.
Verifique la hipótesis de que el promedio salarial en ésta comunidad es menor a B/250.00. Sea
alfa = 0.05.

4. Se analizó el rendimiento académico de dos muestras independientes de estudiantes


universitarias de sexo femenino, pertenecientes a la misma carrera en una Facultad, pero
matriculadas en turnos diferentes. En el grupo matutino, el promedio del rendimiento
académico fue de 3.66 con una desviación estándar típica de 0.15. Por otro lado, el grupo
vespertino obtuvo una media de 3.53 con una desviación típica de 0.19. De acuerdo a estos
resultados, ¿existen diferencias en el rendimiento académico de ambos grupos? Sea alfa = 0.05
y 0.01.

5. Un grupo de estudiantes de primer ingreso a la Facultad de Ciencias Sociales se dividió


aleatoriamente en dos, uno denominado experimental y otro control. El grupo de experimental
constituido por 40 personas, recibió en el verano un programa de matemáticas generales,
mientras que el grupo de control, compuesto por 43 personas, recibió un placebo. Al finalizar el
primer semestre, se determinó el promedio de la puntuación final obtenida por cada grupo en el
curso de de Estadísticas Aplicadas. El grupo experimental obtuvo una media de 67 con una
desviación estándar de 9. Por otro lado, el grupo de control obtuvo un promedio de 62 con una
desviación típica 12. Con alfa de 0.05 determine si hay diferencias entre los dos grupos con
relación al conocimiento alcanzado en la asignatura. Sea alfa = 0.05 y 0.01.
134

6. Se desarrolla una investigación para determinar si las horas dedicadas diariamente al estudio
afectan el rendimiento académico de los estudiantes. Se distribuyeron aleatoriamente en dos
grupos a 30 estudiantes, del mismo nivel académico y que tenían al mismo profesor: 15 en el
Grupo A y 15 en el Grupo B. El Grupo A dedicó 5 horas diarias al estudio, mientras que el
grupo B dedicó 3.5 horas diarias a la misma actividad. Al terminar el año académico se evaluó
el rendimiento promedio de cada grupo, los cuales se presentan a continuación:
Grupo Promedio Desviación
A 3.97 0.56
B 3.77 0.87

Con alfa de 0.05, determiné si el promedio del grupo A fue mayor que el grupo B.

Muestras pequeñas: pruebas de hipótesis para medias y


correlaciones

7. Los problemas 1, 2, 3, desarróllelos utilizando la distribución “t” de Student

8. Un Psicólogo Industrial está interesado en evaluar la efectividad de un programa de incentivos


en la producción de vestidos en una fábrica. Para tal efecto, seleccionó a 26 operarios para que
trabajaran siguiendo el plan tradicional (T) de incentivos, y por otro lado, seleccionó a otros 26
operarios a quienes pusieron a trabajar con el nuevo plan de incentivos (N). El programa duró
10 días y a continuación se presentan el número de trajes confeccionado por cada operario, en
cada uno de los planes:

Plan T 75 72 73 76 78 72 80 74 76 75
Plan N 80 83 84 78 79 81 84 85 78 56

Los salarios por hora para ambos grupos eran iguales; la diferencia la hacía el plan de
incentivos. ¿Se puede concluir que el nuevo plan de incentivos es más eficiente y
productivo que el tradicional? Sea alfa = 0.05

9. Una investigación se diseñó para establecer si cierto tipo de comportamiento estaba o no


influenciado por una droga. La variable criterio fue el número de intentos que se requerían para
alcanzar el comportamiento evaluado. Se organizaron dos grupos: el experimental (Ex) que
recibió la droga, y el control (CL) que recibió un placebo. Los resultados se presentan a
continuación:
Número de intentos
EX 6 8 14 9 10 4 7
CL 4 5 3 7 4 2 1 3

Con alfa de 0.01, determine si hay diferencias entre los promedios de intentos entre los
dos grupos.
135

10. Un Psicólogo Clínico desarrolla un estudio del autoconcepto familiar en dos grupos de sujetos
adultos con problemas de adicción: un grupo masculino (A) y otro femenino (B) Los resultados
obtenidos con la Escala de Autoconcepto Tennessee fueron los siguientes:
A 72 83 57 71 72 68 70 68 77 67
B 36 52 41 44 39 51 47 41 55 46

Con alfa de 0.05, determine si hay diferencias en las medias del autoconcepto familiar
entre ambos grupos.

11. En un estudio dirigido para determinar la efectividad de una nueva dieta, una compañía de
seguros seleccionó una muestra de 10 sujetos con sobrepeso entre las edades de 40 y 50 años.
Se les midió el peso al iniciar el tratamiento (A) y se volvió a medir 60 días después (D). Los
resultados fueron los siguientes:
A 202 237 173 161 185 210 209 191 200 189
D 180 221 175 158 180 197 205 196 185 187

Con alfa de 0.05, determine si la nueva dieta produjo los resultados esperados.

12. Una muestra de 10 niños fueron diagnosticados inicialmente con el trastorno de Déficit de
Atención tipo Hiperactivo-Impulsivo. Se kles aplicó un tratamiento co0n el fin de disminuir los
síntomas de éste trastorno. A continuación se presentan los puntajes obtenidos en la Escala de
Conners antes y después del tratamiento.
Antes 80 75 78 82 71 79 73 86 79 84
Después 70 71 70 71 71 73 74 78 74 79

Con alfa de 0.05, determine si el tratamiento logró disminuir los puntajes obtenidos en la
prueba.

13. Dos investigadores del comportamiento desarrollaron un estudio para determinar si existe una
correlación significativa entre ansiedad y razonamiento lógico. Seleccionaron una muestra de
28 sujetos, obtuvieron mediciones de estas variables y correlacionaron las mismas,
obteniéndose u coeficiente de correlación r=0.30. Determine la significancia de esta
correlación, con alfa de 0.05.

14. Una muestra de 45 estudiantes fue evaluada en los factores depresión y rendimiento en
matemáticas. Los resultados obtenidos obtuvieron un coeficiente de correlación r= 0.29. Es ésta
correlación significativa, a un nivel alfa de 0.05?
136

CAPÍTULO 13
ANÁLISIS DE LA VARIANZA

Las pruebas de hipótesis analizadas en los capítulos anteriores, hacían énfasis en la comparación de
la media aritmética de una muestra con una media poblacional, o se comparaban dos medias
aritméticas provenientes de dos muestras. Estas situaciones se analizaron tanto para el caso de
muestras grandes (n>30 sujetos), en los cuales se utilizaba el estadístico “z” y la curva normal como
modelo de probabilidades, al igual que para las muestras pequeñas (n≤ 30) casos en los que se
utilizaba la prueba “t de student”, respaldada por el modelo de probabilidades denominado t de
student. En ambos casos, el número máximo de medias aritméticas que se podían comparar era de
dos; pero si hay tres o más medias, ninguno de los dos modelos probabilísticos anteriormente
discutidos, sería el adecuado para la comparación de dicho número de medias. En estos casos, el
procedimiento adecuado se denomina ANOVA o Análisis de la Varianza, que utiliza como modelo
de probabilidades una distribución denominada F de Fisher y la Prueba F como procedimiento de
análisis estadístico.

LA DISTRIBUCIÓN F

El ANOVA es un procedimiento de análisis estadístico que se aplica cuando estamos interesados en


determinar si tres o más medias son estadísticamente diferentes. Aunque este procedimiento permite
determinar la diferencia entre las medias, se vale de la varianza de los datos para determinar si hay
o no diferencias. El procedimiento permite obtener una Fo que proviene del cociente de la
estimación de dos varianzas que provienen de la misma población:

1. : que es la estimación de la varianza que proviene de los efectos observados en las muestras
que se están analizando, los cuales son independientes entre sí,
2. : que es la estimación de los errores aleatorios dentro de cada una de las muestras analizadas.

Esta relación se puede presentar a través de la siguiente ecuación:

El resultado obtenido a través de este cociente, Fo, se compara con la F crítica (Fc) obtenida de la
tabla correspondiente, de acuerdo al nivel alfa establecido y los grados de libertad correspondientes
al problema. Esto significa que, al igual que como sucede con la normal y la “t”, existe una
distribución muestral resumida en una tabla, en la cual se asocian los valores teóricos de F con sus
correspondientes probabilidades, dando como resultado los valores Fc que son los que separan la
zona de rechazo de Ho con la zona de no rechazo de dicha hipótesis.

Por ser la Prueba F un procedimiento aplicado en muestras pequeñas, los valores de Fc variarán de
acuerdo con los grados de libertad, que para efectos de esta distribución, se deben tomar en cuenta
dos valores: los gl para el numerador (efectos de cada muestra) que son iguales a n 1-1 y los gl para
el denominador (efectos aleatorios dentro de cada muestra) que son iguales a n-1.
137

La prueba F tiene algunas propiedades particulares que pasaremos a señalar a continuación:

 no tiene valores negativos, por ser el cociente de dos σ2,

 es una distribución sesgada positivamente

 el valor mediano de F es aproximadamente igual a 1

Para la prueba F existe una familia de curvas, tal y como sucede con la “t”, aunque en este caso, hay
un valor de F para cada combinación de S2 en el numerador y en el denominador, lo cual está
debidamente contemplado en las tablas de valores críticos de F. Para determinar si se rechaza o no
la Ho, se compara el valor Fo que proviene de los datos experimentales, con la Fc de la tabla; si Fo
> Fc, se rechaza Ho y se considera confirmada la H1, lo cual significa que por lo menos una de las
medias es estadísticamente diferente al resto.

Es importante destacar que la H1 no se presenta direccionadamente, o sea, que no se plantea hacia


la derecha o hacia la izquierda, tal y como sucede con “t”. Esto se debe a que Fo por provenir de
comparaciones de S2, siempre tendrá valores positivos y los valores críticos de la tabla siempre
serán positivos. Por lo tanto, la H1 sería del tipo: µ1 ≠ µ2 ≠ …….≠ µk. Si se diera el caso de que se
rechaza la Ho y se confirma la H1, los resultados indican únicamente que por lo menos una media
aritmética es diferente; para determinar cuál o cuáles son las diferentes, hay que desarrollar otras
pruebas adicionales que arrojarían luces sobre las diferencias existentes en el modelo.

Los valores críticos de F (Fc), asociados con la distribución de probabilidad F, se presentan


resumidos en Tablas para valores α de 0.05 y 0.01, los cuales están relacionados con los grados de
libertad. Para efectos de la distribución F, los grados de libertad dentro se refieren a los efectos
dentro de los grupos o de error (gldentro); por otro lado, los grados de libertad entre, están
asociados con los efectos entre los tratamientos. En algunos casos, la Tabla se presenta para 0.05 y
0.01 de manera independiente, pero en otros casos, en una misma Tabla, se presentan los dos alfas
para cada grado de libertad. En estos casos, 0.05 se coloca arriba y 0.01 se coloca abajo, y en
muchas ocasiones el valor está en negrita.

A continuación presentaremos un ejemplo de este último tipo de organización de la Tabla F, aunque


el estudiante debe estar preparado para interpretar los valores de Fcrítica cuando estos provienen de
tablas separadas.
138

Ejemplo de la Tabla de valores críticos de la Distribución F

gl gl entre (numerador)
dentro(denominador)
1 2 3 4 5 …..∞…

1 161 200 216 225 230 254

4052 4999 5403 5625 5764 6366

2 18.51 19.00 19.16 19.25 19.30 19.50

98.49 99.00 99.17 88.25 99.30 99.50

3 10.13 9.55 9.28 9.12 9.01 8.53

34.12 30.82 29.46 28.71 28.24 26.12

4 7.71 6.94 6.59 6.39 6.26 5.63

21.20 18.00 16.69 15.98 15.52 13.46

5 6.61 5.79 5.41 5.19 5.05 4.36

16.26 13.27 12.06 11.39 10.97 9.02

……∞…… 3.84 2.99 2.60 2.37 2.21 1.00

6.64 4.60 3.78 3.32 3.02 1.00

Para utilizar la Tabla de F, se combinan los grados de libertad entre, con los grados de libertad
dentro. Por ejemplo, si un experimento presenta glentre=3 y gldentro= 5, con alfa de 0.05, la F(c) =
5.41. Debe recordar que los valores críticos se presentan en pares: el primero corresponde a 0.05 y
el segundo a 0.01 (negrita).

Otro aspecto a destacar es que la Prueba F se utiliza para evaluar los efectos de una variable
independiente a varios niveles, al igual que en los casos en que hay más de una variable
independiente también a varios niveles. Para ambos casos, los efectos de la(s) variable(s)
independiente(s) se asocian con una sola variable dependiente; si hay más de una variable
dependiente, tendríamos que analizar dichos efectos a través de modelos multivariados, los cuales
escapan a los objetivos de este libro.

Principios del ANOVA

Tal y como se mencionó anteriormente, el ANOVA es una técnica estadística que permite evaluar
experimentos en los que intervienen tres o más grupos. El objetivo final es el de establecer si las
medias aritméticas de dichos grupos difieren o las mismas son estadísticamente iguales. Si nos
refiriéramos a tratamientos psicológicos, estaríamos interesados en determinar a través de las
medias aritméticas, si los tratamientos ejercen efectos diferentes sobre las muestras o si todos ellos
139

producen efectos semejantes. Existen diversos tipos de ANOVA que se aplican para situaciones
experimentales en las cuales hay tres o más muestras. En primera instancia, presentaremos y
discutiremos el modelo denominado ANOVA SIMPLE O EN UN SOLO SENTIDO,

Anova Simple o en un solo sentido

Esta técnica de análisis estadístico se caracteriza porque se refiere a una sola fuente de variación, o
sea, una variable independiente a distintos niveles, tal y como se puede observar en el siguiente
ejemplo.

Tres psicólogos de la Escuela de Psicología han desarrollado, de manera independiente, tres


tratamientos dirigidos a disminuir la ansiedad en los estudiantes que desarrollan las pruebas de
admisión a dicha escuela. Como se puede observar, se trata de una sola variable independiente, la
cual se aplica en tres niveles, considerándose como nivel, cada tratamiento desarrollado por cada
uno de los profesores. Se supone que los tres tratamientos van dirigidos a modificar una sola
variable dependiente: la ansiedad. El experimento trata de verificar el efecto de los tratamientos
sobre la ansiedad y si se observan diferencias entre dichos tratamientos con relación al efecto
producido en la ansiedad. Como son tres grupos, se ha decidido aplicar una ANOVA para
determinar la efectividad de los tratamientos.

Para que ANOVA pueda aplicarse de manera válida, es necesario que se cumplan algunos
requisitos de carácter metodológico y estadístico:

 Las muestras deben estar constituidas preferiblemente por igual número de sujetos,

 Los sujetos deben ser elegidos aleatoriamente para cada muestra y los tratamientos deben ser
asignados de la misma forma para cada una de ellas,

 Se supone o demuestra estadísticamente, que las varianzas de los grupos son iguales; a esto, se
le denomina homogeneidad de las varianzas

 Los grupos se suponen independientes entre sí, o sea, que cada grupo recibe un nivel de la
variable independiente diferente al recibido por cualquiera de los otros grupos.

El objetivo del ANOVA es el de establecer cuánto de la variabilidad observada en los grupos se


debe a los efectos entre los tratamientos y cuanto se debe a efectos aleatorios dentro de los
tratamientos. El supuesto básico es que las medias deben ser afectadas por la calidad de los
tratamientos y no las varianzas dentro de cada grupo. La siguiente figura describe el procedimiento
del ANOVA simple:
140

ESTRUCTURA DEL ANOVA

SCentre S2entre
Fobt= S2entre
SC total
S2dentro
SCdentro S2dentro

•SCtotal: Variabilidad total de los datos


•Scentre: Variabilidad entre lo grupos
•Scdentro: Variabilidad dentro de los grupos
•S2entre: Varianza entre los grupos: S2B
•S2dentro: Varianza dentro de los grupos: S2w
•Fobt: Razón F

La SC total se puede interpretar como la totalidad de la variabilidad observada en las puntuaciones


individuales, sin tomar en consideración cuánto de esta variabilidad proviene de los efectos de
tratamiento y cuánto proviene de la aleatoriedad dentro de las muestras: es una variabilidad confusa
en la cual no se discrimina entre las fuentes de variabilidad. El ANOVA divide esta variabilidad en
dos componentes: el que corresponde a los efectos de los tratamientos entre cada uno de los grupos
(SCentre), y el que corresponde a la variabilidad proveniente del azar dentro de cada grupo (SCdentro).
Posteriormente se determina la cantidad de varianza que proviene de cada fuente: S 2entre que es el
numerador, y la S2dentro que es el denominador. Se dividen ambas varianzas y se obtiene la

La comparación de la Fo con la Fc determina si se rechaza o no se rechaza la Ho siguiendo el


modelo que a continuación presentamos:

Si Fo > Fc, se rechaza la Ho,


Si Fo ≤ Fc, no se rechaza la Ho

Para determinar la variabilidad proveniente de cada una de las fuentes, SCentre, SCdentro y SCtotal, se
utilizan las siguientes fórmulas:

(∑ ) (∑ )
 [∑ ]
(∑ )
 ∑ [∑ ]

141

Una vez desarrollada la partición de la varianza, que no es otra cosa que determinar cuánto de la
varianza total proviene de las dos fuentes principales: tratamientos y error, se organizan estos datos
en un cuadro resumen que permite la integración de todos los elementos requeridos para rechazar o
no la hipótesis nula, o sea: verificar o no la hipótesis alterna. El cuadro resumen está constituido por
los siguientes elementos:

CUADRO RESUMEN DEL ANOVA


2
Fuente SC Gl S Fo
(∑ ) (∑ )
Entre grupos [∑ ]

Dentro de grupos (∑ )
∑ [∑ ]

Total

La Fo se compara con la F de la Tabla de Fisher, la cual se denomina Fcrítica (Fc): si la Fo es > que la
Fc, se rechaza la Ho que dice que todas las medias son iguales: Ho: µ1=µ2=…….=µk, y se considera
confirmada la H1 que dice que por lo menos una de las medias es diferente; µ1≠µ2….≠µk. En este
caso, los resultados indican que hay medias que son diferentes, pero no da información sobre cuál o
cuáles medias lo son. Para determinar esta(s) diferencia(s), se requiere la aplicación de pruebas
especializadas que permitirán obtener dicha información. Para efectos de este texto, presentaremos
la Prueba de Tukey como un ejemplo de pruebas especiales para determinar cuáles medias son las
diferentes. Si la Fo no fuese significativa, o sea, que la misma es igual o menor que la F c, se ha
determinado que las medias son iguales estadísticamente y el ANOVA finalizaría con este
indicador.

A continuación presentamos los resultados del experimento de la ansiedad, al que nos referimos con
anterioridad, y el desarrollo estadístico del Anova Simple correspondiente:
142

Tres psicólogos clínicos han desarrollado, de manera independiente, tres tratamientos para
reducir la ansiedad en estudiantes que aspiran a ingresar a la Escuela de Psicología. Los
tratamientos se aplican a tres muestras aleatorias de aspirantes, y posteriormente se les evalúa
su nivel de ansiedad, con el fin de evaluar si los tratamientos ejercen distintos efectos sobre los
grupos. A continuación se presentan los resultados obtenidos.

RESULTADOS DE LOS TRATAMIENTOS APLICADOS


T1 T2 T3
12 15 9
14 14 6
15 17 7
14 18 8
13 15 7
12 19 8
13 20 6
10 17 7
12 16 8
n 9 9 9
115 151 66
( ) 13225 22801 4356
1487 2565 492
12.78 16.78 7.33
1.48 1.99 1.00

Pasos sugeridos para el desarrollo de anova simple

A partir de las puntuaciones originales obtenidas por cada sujeto en cada tratamiento, determine los
estadísticos básicos para el cálculo de ANOVA, tal y como se muestra en la Tabla anterior. Estos
estadísticos permitirán la partición de la varianza y el desarrollo del cuadro resumen, anteriormente
explicados.

A continuación se desarrolla la prueba de hipótesis.

1. Hipótesis estadísticas

2. Ni vel de si gnificación

00

0
143

3. Estadístico de prueba

4. Regla de decisión

Rechazar H0, si Fo > Fc = 3.40

5. Resultados

( )
[ ] ( ) ( 0 ) 0

0
( )

CUADRO RESUMEN DEL ANOVA


Fuente SC Gl S2 Fo
0 0
Entre grupos 404.51 0

Dentro de grupos 57.12


Total 461.63

6. Decisión:

En vista de que Fo = 84.98 > Fc = 3.40, se rechaza la H0 y se confirma la H1: por lo menos
una de las medias es estadísticamente significativa.

De esta manera se ha concluido con esta etapa del ANOVA, y en vista de que los resultados son
significativos, es necesario determinar estadísticamente cuál o cuáles medias han resultado
diferentes. Este objetivo se alcanza desarrollando pruebas de significación que permiten comparar
las medias entre sí, tales como: la Prueba de Tukey, la Prueba de Newman-Keuls, la Prueba “t” si la
comparación es planeada previamente, la prueba de Scheffe, etc. En este caso, desarrollaremos la
prueba de Tukey para dos medias, por ser la misma de fácil desarrollo y comprensión.

Es importante que el estudiante recuerde que si la Fo no es significativa, no hay que desarrollar


ninguna prueba de comparación de medias, en vista de que la hipótesis nula no se ha rechazado, lo
cual indica que las medias aritméticas analizadas no son estadísticamente diferentes.

La Prueba de comparación de dos medias de Tukey.

La prueba de Tukey ha sido diseñada para comparar todos los pares de medias aritméticas
provenientes de un experimento; además, requiere que los tamaños muestrales sean iguales para
144

todas las muestras que participan del experimento. El estadístico de prueba es Qobtenida (Qo), cuya
fórmula es la siguiente

La prueba Q se utiliza para comparar las medias tomadas de dos en dos y su valor será siempre
positivo en vista de que en el numerador, la primera media será siempre la mayor y la segunda será
la media menor. Además, para estimar el error estándar en el denominador, se utiliza la varianza
dentro de los grupos (S2d) que ya fue determinada en el cuadro resumen.

La Qo se compara con la Qcrítica (obtenida de la Tabla Q de Rangos estudiantizados) a la cual se


ingresa con el número de medias del experimento (columnas) y los gl dentro para las filas. En el
punto en que se cruzan ambos valores, se obtiene la Qcrítica (Qc) o Q de la tabla, el cual será el
criterio de comparación de la Qo. Si la Qo es > que la Qc, se rechaza la H0 que dice que ambas
medias son iguales y se verifica la H1 que dice que dichas medias son diferentes, específicamente, la
primera es mayor que la segunda. A continuación se presenta la aplicación de la prueba Q,
utilizando el ejemplo con el que se desarrolló el ANOVA.

7. Prueba Q

Las tres medias ordenadas de mayor a menor:

00
( )

1. Comparación

00
0

Decisión: en vista de que Qo = 7.84 > Qc = 3.53, se rechaza Ho y se confirma H1. La media
del tratamiento 2 es mayor que la del tratamiento 1. El tratamiento 1 presentó un promedio
de ansiedad menor que el tratamiento 2. Dicho tratamiento es más efectivo en la reducción
de la ansiedad.

2. Comparación

0

Decisión: en vista de que Qo = 18.53 > Qc = 3.53, se rechaza Ho y se confirma H1. La


media del tratamiento 2 es mayor que la media del tratamiento 3. El tratamiento 3 presentó
145

un promedio de ansiedad menor que el del tratamiento 2. Este tratamiento es más efectivo
en la reducción de la ansiedad.

3. Comparación

0
0

Decisión: en vista de que Qo = 10.69 > Qc = 3.53, se rechaza Ho y se confirma H1. La


media del tratamiento 1 es mayor que la media del tratamiento 3. El tratamiento 3 presentó
un promedio de ansiedad menor que el del tratamiento 1. Este tratamiento es más efectivo
en la reducción de la ansiedad.

El nivel de efectividad de los tratamientos para reducir la ansiedad fue el siguiente: 3, 1 y 2.

A continuación presentaremos los fundamentos del Anova Factorial, que es una aplicación de
dicha técnica pero para el caso en que hay más de una variable independiente afectando a una
variable dependiente. Se hará énfasis en el caso de dos variables independientes a distintos niveles
cada una, pero queda claro que el modelo se puede generalizar a más de dos variables
independientes.

Anova Factorial (dos o más variables independientes)

En muchas ocasiones, la investigación del comportamiento se enfrenta a situaciones en las cuales,


una variable dependiente se encuentra afectada o intervenida por dos o más variables
independientes. A estos casos se les denomina Diseño factorial, y el procedimiento de análisis es a
través del desarrollo de un ANOVA especializado para el caso. No hay muchas diferencias con
relación al modelo simple, salvo que la fuente de variación entre (tratamiento) se divide y toma en
consideración cada una de las variables independientes participantes del modelo.

Para aplicar el ANOVA Factorial, es necesario satisfacer los siguientes supuestos:

 La población original de la cual se extraen las muestras tiene una distribución normal

 Hay homogeneidad de varianzas en cada una de las condiciones experimentales analizadas


(celdillas)

 Los tamaños muestrales deben ser iguales, de tal manera que se minimicen las violaciones a
algunos supuestos.

Veamos un ejemplo basado en la variable dependiente ansiedad.

Un psicólogo investigador está interesado en evaluar los efectos que tienen dos tratamientos
experimentales en la reducción de la ansiedad en aspirantes a ingresar a la Escuela de
Psicología. Además considera que la ansiedad también estará afectada al momento del
experimento por la situación laboral de los sujetos, la cual ha dividido en dos categorías:
trabaja y no trabaja.
146

Como se puede observar, la variable dependiente (ansiedad) estará afectada por dos variables
independientes: en primer lugar está la variable tratamiento a la que denominaremos (A), que
se presenta a dos niveles: el tratamiento 1 (A1) y el tratamiento 2 (A2); en segundo lugar, está la
variable situación laboral a la que denominaremos B y que se presenta también a dos niveles
trabaja (B1), no trabaja (B2).

El modelo se puede describir de la siguiente manera:

DISEÑO FACTORIAL 2 X 2

Situación Tratamientos(A)

Laboral(B) A1 A2

B1 A 1B 1 A 2B 2

B2 A 1B 2 A 2B 1

La variable A está colocada de manera vertical y sub dividida en dos categorías, las cuales
corresponden a los dos tratamientos. La variable B, está colocada horizontalmente y corresponde
a la situación laboral en los niveles trabaja y no trabaja. El modelo se denomina de acuerdo al
número de variables participantes. En este caso, son 2 variables a 2 niveles, que generan un 2x2.
Si hubiese una variable a 3 niveles y otra a dos, el modelo se denominaría 2x3 ó 3x2, y así
sucesivamente. La colocación de las variables (columnas o filas) es una decisión que no afecta el
resultado del ANOVA.

En las celdillas A1B1…..hasta A2B2, se deben presentar, los puntajes de ansiedad de cada sujeto,
dependiendo del tratamiento recibido más su condición laboral. Es evidente que para cada
celdilla habrá una muestra de sujetos, preferiblemente asignados aleatoriamente y con igual
número de sujetos

El modelo de Anova Factorial determina que la variable dependiente, en este caso la ansiedad,
está afectada por cuatro fuentes principales de variabilidad:

1. Las diferencias en la ansiedad por recibir el tratamiento A1 en comparación con haber recibido
el tratamiento A2; En este caso, los efectos observados en A son independientes de los efectos
de la variable B.
2. Las diferencias en la ansiedad por pertenecer a una de las dos condiciones laborales: trabaja
(B1) o no trabaja (B2), son independientes de los efectos de la variable A.
3. Las diferencias en la ansiedad por haber recibido la combinación de las dos variables A y B, en
sus diferentes niveles, a lo cual se le denomina, interacción
4. Las diferencias en la ansiedad que provienen de la variabilidad aleatoria dentro de cada grupo,
la cual se considera que no es aditiva con ninguna de las fuentes anteriormente señaladas.
147

Al igual que en el ANOVA Simple, se estima la variación total proveniente de todas las fuentes,
y luego se hace una partición de la misma para evaluar cuánto aporta cada uno de los factores
participantes, tal y como se presenta a continuación:

Suma de Estimación de
Grados de
cuadrados la varianza Valor Fo
libertad (gl)
(SC) (σ2)

Número de
filas – 1

Número de
columnas - 1

Suma de
Cuadrados
total
(SCT) Total de
sujetos – celdas

A continuación se presentan las fórmulas y los gl requeridos para desarrollar la partición de los
cuadrados correspondientes al Anova Factorial.

(∑ ) (∑ ) (∑ )
1. ⌊ ⌋
1.1.
(∑ ) (∑ ) (∑ )
2. ⌊ ⌋
2.1.

(∑ ) (∑ ) (∑ ) (∑ ) (∑ )
3. [ ]
1.1.

(∑ ) (∑ ) (∑ ) (∑ )
4. ∑ [ ]
1.1.

5.

El desarrollo de la prueba de hipótesis para el problema de la ansiedad en estudiantes


universitarios, se presenta a continuación:
148

DATOS GENERALES

DISEÑO FACTORIAL 2 X 2

Situación Tratamientos(A)
Laboral(B) Totales
A1 A2
12 16
10 15 ∑X
9 12 ∑X2= 1517
B1 11 13 n = 10
9 14 Media= 12.1
∑ ∑ 0
Media: 10.2 Media: 14
17 20
15 21
14 18 ∑X 167
B2 15 16 ∑X2= 2837
16 15 n = 10
∑ ∑ 0 Media=16.7
Media: 15.4 Media: 18
∑X ∑X 0 ∑Xt
Totales ∑X2= 1718 ∑X2= 2636 ∑X2t= 4354
n = 10 n = 10
Media= 12.8 Media= 16

1. Hipótesis estadísticas

 (efectos por fila)

 (efectos por columna)

 (efectos por interacción)

2. Ni vel de si gnificación

00

0
( )
149

3. Estadístico de prueba

4. Regla de decisión

Rechazar Ho si Fo > Fc = 4.49 para las tres principales fuentes de variación: filas, columnas
e interacción.

5. Resultados
Partición de cuadrados

( ) ( ) ( )
⌊ ⌋ 0
0 0
( ) ( 0) ( )
⌊ ⌋
0 0
( ) ( 0) ( ) ( 0) ( )
[ ] 0
0
( ) ( 0) ( ) ( 0)
[ ] 0

0 0

CUADRO RESUMEN DEL ANOVA


Fuente SC Gl σ2 Fo
Fila (B) 105.8 1 105.8 35.27*

Columna (A) 51.2 1 51.2 17.07*

Interacción (A*B) 1.8 1 1.8 0.60

Dentro 48 16 3.0

Total 206.8 16
* Fo > Fc: estadísticamente significativa

6. Decisión:

De acuerdo a los resultados obtenidos, se rechaza la Ho para las filas y las columnas, pero
no se rechaza para la interacción. Estos resultados indican que:
150

a. Las medias de ansiedad son diferentes atendiendo a la condición laboral. Los que laboran
presentaron un promedio de ansiedad inferior a los que no laboran.
b. Las medias de ansiedad son diferentes atendiendo al tipo de tratamiento recibido. Los que
recibieron el tratamiento A1 presentaron un promedio de ansiedad inferior a los que
recibieron el tratamiento A2.
c. No hay diferencias significativas entre los promedios por la interacción de ambas variables
observados en cada una de las celdillas

Como se puede observar, la interacción (AxB) no resultó significativa, o sea, que los niveles de
ansiedad no son diferentes por la combinación de las dos variables independientes. En estos
casos, el análisis de la interacción finaliza al señalarse la ausencia de significatividad estadística.
Cuando la interacción es significativa, debe confeccionarse un Gráfico que refleje las diferencias
observadas entre las celdillas, específicamente entre las medias de las mismas; de no ser así, este
gráfico no es necesario confeccionarlo. Sin embargo, con el fin de que se observe como se
refleja la no significatividad en este ejemplo, presentaremos el gráfico de estos resultados.

INTERACCIÓN

20
A 18 A2, 18
N 16
A1, 15
S 14 A2, 14
I 12
E 10 A1, 10
D 8
A 6
4
D
2
0
B1 B2

LABORAL

Como se puede observar en la figura anterior, la línea azul representa las medias aritméticas
correspondientes al efecto combinado del tratamiento A1 con las dos condiciones laborales,
observándose que la ansiedad es más baja en los sujetos que trabajan en comparación con los
que no trabajan. Si se observa la línea rosada, representa los efectos combinados del tratamiento
A2 con las condiciones laborales: también en este caso, la condición de trabajo al combinarse
con dicho tratamiento, produce un nivel de ansiedad más bajo que con la condición de no
trabajar. En ambos casos el comportamiento es el mismo, lo que indica que no hay diferencias en
la ansiedad cuando se combinan ambos factores. Por esta razón, la interacción fue no
significativa.

¿Pero, qué sucede cuando los resultados indican efectos diferentes por interacción? A
continuación utilizaremos el mismo ejemplo de la ansiedad, pero cambiaremos las medias de
manera premeditada, para observar los efectos producidos. Suponga que las medias fueron las
siguientes:
151

A1B1 = 18
A1B2 = 10
A2B1 = 11
A2B1 = 16

En este caso, el gráfico sería el siguiente:

INTERACCIÓN
20
B1, 18
18
A B2, 16
16
N
14
S
I 12 B1
B1, 11
E 10
B2, 10
D 8 B2
A 6
D 4
2
0
A1 A2

TRATAMIENTOS

Al inspeccionar este gráfico se observa, a diferencia del anterior, que las dos rectas se cortan, lo
cual es una evidencia inequívoca de que existe interacción entre las variables. Cuando A1 se
combina con B1, el promedio de la ansiedad es más elevado que cuando se combina con B2.
Sucede lo contrario con el tratamiento A2, que al combinarse con B1, el promedio de la ansiedad
es menor que cuando se combina con B2. Si esta combinación de valores se hubiese sometido al
ANOVA, la Fo hubiese resultado significativa, lo cual obliga a la confección del gráfico y a su
debida explicación.

Recapitulamos:

 Si la Fo para la interacción resulta estadísticamente significativa, es necesario desarrollar el


gráfico de interacción y explicar el comportamiento de las variables. Este gráfico se caracteriza
porque las líneas rectas que representan las combinaciones de las variables, tienden a cortarse,
o, por lo menos, no tienden a ser paralelas.

 Si la Fo para la interacción resulta no significativa, no se rechaza la Ho, lo que significa que las
medias dentro de las celdas no son estadísticamente significativas; las combinaciones de
variables no producen efectos diferentes. En estos casos, no hay necesidad de desarrollar el
gráfico.
152

CONCEPTOS IMPORTANTES

 Anova
 F obtenida (Fo)
 F crítica (Fc)
 Anova simple
 Suma de cuadrados (SC)
 Partición de la varianza
 Prueba de Tukey
 Anova Factorial
 Niveles de tratamiento
 Interacción
153

EJERCICIOS PRÁCTICOS

Análisis de la Varianza Simple o de Un Solo factor

1. Un psicólogo escolar de un colegio comercial está interesado en comparar la velocidad que


alcanzan en el teclado de una computadora (palabras por minuto) las estudiantes graduandas de
cuatro colegios( C ) diferentes. Selecciona cuatro colegios, de cada uno de ellos selecciona seis
estudiantes graduandas y les aplica una prueba de velocidad al escribir en una computadora.
Los resultados fueron los siguientes:

C1 C2 C3 C4
51 56 51 71
50 60 65 80
56 66 76 66
60 55 55 70
45 71 61 76
55 65 65 60

¿Hay diferencias significativas en la velocidad de escritura en la computadora, entre las


estudiantes de los cuatro colegios. Si la hay, determine las diferencias. Sea alfa de 0.05.

2. Se desarrolla una investigación para establecer la eficacia de tres métodos de enseñanza de un


curso de psicofisiología. Los métodos investigados son los siguientes: 1. Lectura personalizada,
2. Discusión de grupos y 3. Tutorías. Se conforman aleatoriamente 3 grupos de 10 estudiantes
cada uno, con los mismos pre-requisitos para recibir el curso. Los resultados con los siguientes:
G1 5 8 10 7 10 7 6 8 8 10
G2 6 7 4 9 4 3 6 7 8 6
G3 4 6 2 5 5 6 8 4 6 4

Con alfa de 0.05, determine si hay diferencias significativas entre los tratamientos. De
ser así, determine las mismas.

3. Un psicólogo escolar está interesado en establecer si la ansiedad en los exámenes está afectada
por. A. el sexo (masculino y femenino) y B. situación laboral (trabaja tiempo completo, trabaja
parcialmente y no trabaja. Se Seleccionan 24 estudiantes universitarios de una misma carrera y
nivel académico, 12 hombres y 12 mujeres, y se distribuyen aleatoriamente en las condiciones
experimentales. Además, se les aplica una prueba de ansiedad una hora antes del desarrollo de
una prueba de matemáticas. Los resultados son los siguientes:
154

A
A1 A2
10 5
8 4
B1
10 6
10 5
6 8
8 6
B B2
7 6
5 6
4 8
5 7
B3
5 7
4 6

Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos
correspondiente. Debe determinar:
 Efectos de fila
 Efectos de columna
 Efectos de interacción
 En los casos en que se encuentren diferencias estadísticamente significativas,
debe aplicar la Prueba de Tukey.

4. Un psicólogo organizacional desarrolló un estudio en una empresa para determinar si la


productividad en las bodegas, se veía afectada por la presencia de dos variables: tipo de trabajo
(A) (individual o grupal), y ansiedad inducida (B) (alta y baja). Para desarrollar el proyecto,
selecciona 16 trabajadores y los organiza en dos grupos de 8; un grupo trabajará
individualmente y otro lo hará de manera compartida. Se escoge un día de alto nivel de
actividad y a un grupo se le reúne una hora antes de iniciar las labores y se les indica que, por
razones económicas, serán suspendidos por espacio de dos meses; al otro grupo no se les da
ninguna información adicional. A lo largo del día experimental, se evalúa la productividad de
cada sujeto, la cual se resume a continuación:

Ansiedad inducida
Trabajo Alta Baja
9 3
7 5
Individual
5 5
8 3
12 7
10 5
Grupal
11 7
10 5

Con los datos resumidos en el cuadro anterior, desarrolle el ANOVA en dos sentidos
correspondiente. Debe determinar:
 Efectos de fila
155

 Efectos de columna
 Efectos de interacción
 En los casos en que se encuentren diferencias estadísticamente significativas,
debe aplicar la Prueba de Tukey.
APÉNDICE
157

APÉNDICE 1
Distribución normal


La primera columna muestra los incrementos de Z en décimos.


La primera fila muestra los incrementos de Z en centésimos.
La intersección de ambos muestra el área correspondiente entre el valor Z
representado y la línea central. Como la curva normal es simétrica, el valor será el
mismo tanto para el valor positivo como el valor negativo del puntaje Z.
Para encontrar el área complementaria del valor Z, reste de 0.5000 el valor del
área encontrada en la tabla.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
158

APÉNDICE 2
Valores críticos de la Distribución t de Student 𝛼⁄

-t 0 t

Niveles de significancia a dos colas


Grados de libertad
0.500 0.250 0.200 0.100 0.050 0.025 0.020 0.010 0.005
1 1.00 2.41 3.08 6.31 12.71 25.45 31.82 63.66 127.32
2 0.82 1.60 1.89 2.92 4.30 6.21 6.96 9.92 14.09
3 0.76 1.42 1.64 2.35 3.18 4.18 4.54 5.84 7.45
4 0.74 1.34 1.53 2.13 2.78 3.50 3.75 4.60 5.60
5 0.73 1.30 1.48 2.02 2.57 3.16 3.36 4.03 4.77
6 0.72 1.27 1.44 1.94 2.45 2.97 3.14 3.71 4.32
7 0.71 1.25 1.41 1.89 2.36 2.84 3.00 3.50 4.03
8 0.71 1.24 1.40 1.86 2.31 2.75 2.90 3.36 3.83
9 0.70 1.23 1.38 1.83 2.26 2.69 2.82 3.25 3.69
10 0.70 1.22 1.37 1.81 2.23 2.63 2.76 3.17 3.58
11 0.70 1.21 1.36 1.80 2.20 2.59 2.72 3.11 3.50
12 0.70 1.21 1.36 1.78 2.18 2.56 2.68 3.05 3.43
13 0.69 1.20 1.35 1.77 2.16 2.53 2.65 3.01 3.37
14 0.69 1.20 1.35 1.76 2.14 2.51 2.62 2.98 3.33
15 0.69 1.20 1.34 1.75 2.13 2.49 2.60 2.95 3.29
16 0.69 1.19 1.34 1.75 2.12 2.47 2.58 2.92 3.25
17 0.69 1.19 1.33 1.74 2.11 2.46 2.57 2.90 3.22
18 0.69 1.19 1.33 1.73 2.10 2.45 2.55 2.88 3.20
19 0.69 1.19 1.33 1.73 2.09 2.43 2.54 2.86 3.17
20 0.69 1.18 1.33 1.72 2.09 2.42 2.53 2.85 3.15
21 0.69 1.18 1.32 1.72 2.08 2.41 2.52 2.83 3.14
22 0.69 1.18 1.32 1.72 2.07 2.41 2.51 2.82 3.12
23 0.69 1.18 1.32 1.71 2.07 2.40 2.50 2.81 3.10
24 0.68 1.18 1.32 1.71 2.06 2.39 2.49 2.80 3.09
25 0.68 1.18 1.32 1.71 2.06 2.38 2.49 2.79 3.08
26 0.68 1.18 1.31 1.71 2.06 2.38 2.48 2.78 3.07
27 0.68 1.18 1.31 1.70 2.05 2.37 2.47 2.77 3.06
28 0.68 1.17 1.31 1.70 2.05 2.37 2.47 2.76 3.05
29 0.68 1.17 1.31 1.70 2.05 2.36 2.46 2.76 3.04
30 0.68 1.17 1.31 1.70 2.04 2.36 2.46 2.75 3.03
31 0.68 1.17 1.31 1.70 2.04 2.36 2.45 2.74 3.02
32 0.68 1.17 1.31 1.69 2.04 2.35 2.45 2.74 3.01
33 0.68 1.17 1.31 1.69 2.03 2.35 2.44 2.73 3.01
34 0.68 1.17 1.31 1.69 2.03 2.35 2.44 2.73 3.00
35 0.68 1.17 1.31 1.69 2.03 2.34 2.44 2.72 3.00
36 0.68 1.17 1.31 1.69 2.03 2.34 2.43 2.72 2.99
37 0.68 1.17 1.30 1.69 2.03 2.34 2.43 2.72 2.99
38 0.68 1.17 1.30 1.69 2.02 2.33 2.43 2.71 2.98
39 0.68 1.17 1.30 1.68 2.02 2.33 2.43 2.71 2.98
40 0.68 1.17 1.30 1.68 2.02 2.33 2.42 2.70 2.97
𝛼
0.250 0.125 0.100 0.050 0.025 0.013 0.010 0.005 0.003
Niveles de significancia a una cola
-t 0 t
159

APÉNDICE 3
Valores críticos de la de Distribución F de Fisher

α=0.05 (normal) y α 0 01 (negritas)


gld glentre
1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞
161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254
1
4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366
18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.49 19.49 19.49 19.50
2
98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.48 99.49 99.49 99.50 99.50
10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.71 8.69 8.66 8.64 8.62 8.59 8.58 8.56 8.55 8.54 8.53 8.53
3
34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.41 26.35 26.28 26.24 26.18 26.15 26.13
7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.87 5.84 5.80 5.77 5.75 5.72 5.70 5.68 5.66 5.65 5.64 5.63
4
21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.25 14.15 14.02 13.93 13.84 13.75 13.69 13.61 13.58 13.52 13.49 13.46
6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.41 4.39 4.37 4.37
5
16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.77 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.08 9.04 9.02
5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.73 3.71 3.69 3.68 3.67
6
13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.40 7.31 7.23 7.14 7.09 7.02 6.99 6.93 6.90 6.88
5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.53 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.27 3.25 3.24 3.23
7
12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.36 6.28 6.16 6.07 5.99 5.91 5.86 5.79 5.75 5.70 5.67 5.65
5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.24 3.20 3.15 3.12 3.08 3.04 3.02 2.99 2.97 2.95 2.94 2.93
8
11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.56 5.48 5.36 5.28 5.20 5.12 5.07 5.00 4.96 4.91 4.88 4.86
5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.03 2.99 2.94 2.90 2.86 2.83 2.80 2.77 2.76 2.73 2.72 2.71
9
10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.01 4.92 4.81 4.73 4.65 4.57 4.52 4.45 4.41 4.36 4.33 4.31
4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.86 2.83 2.77 2.74 2.70 2.66 2.64 2.60 2.59 2.56 2.55 2.54
10
10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.60 4.52 4.41 4.33 4.25 4.17 4.12 4.05 4.01 3.96 3.93 3.91
160

α=0.05 (normal) y α 0 01 (negritas)


gld glentre
1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞
4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.74 2.70 2.65 2.61 2.57 2.53 2.51 2.47 2.46 2.43 2.42 2.40
11
9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.29 4.21 4.10 4.02 3.94 3.86 3.81 3.74 3.71 3.66 3.62 3.60
4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.64 2.60 2.54 2.51 2.47 2.43 2.40 2.37 2.35 2.32 2.31 2.30
12
9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.05 3.97 3.86 3.78 3.70 3.62 3.57 3.50 3.47 3.41 3.38 3.36
4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.55 2.51 2.46 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.22 2.21
13
9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.86 3.78 3.66 3.59 3.51 3.43 3.38 3.31 3.27 3.22 3.19 3.17
4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.48 2.44 2.39 2.35 2.31 2.27 2.24 2.21 2.19 2.16 2.14 2.13
14
8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.70 3.62 3.51 3.43 3.35 3.27 3.22 3.15 3.11 3.06 3.03 3.00
4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.42 2.38 2.33 2.29 2.25 2.20 2.18 2.14 2.12 2.10 2.08 2.07
15
8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.56 3.49 3.37 3.29 3.21 3.13 3.08 3.01 2.98 2.92 2.89 2.87
4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.37 2.33 2.28 2.24 2.19 2.15 2.12 2.09 2.07 2.04 2.02 2.01
16
8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.45 3.37 3.26 3.18 3.10 3.02 2.97 2.90 2.86 2.81 2.78 2.75
4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.33 2.29 2.23 2.19 2.15 2.10 2.08 2.04 2.02 1.99 1.97 1.96
17
8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.35 3.27 3.16 3.08 3.00 2.92 2.87 2.80 2.76 2.71 2.68 2.65
4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.29 2.25 2.19 2.15 2.11 2.06 2.04 2.00 1.98 1.95 1.93 1.92
18
8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.27 3.19 3.08 3.00 2.92 2.84 2.78 2.71 2.68 2.62 2.59 2.57
4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.26 2.21 2.16 2.11 2.07 2.03 2.00 1.96 1.94 1.91 1.89 1.88
19
8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.19 3.12 3.00 2.92 2.84 2.76 2.71 2.64 2.60 2.55 2.51 2.49
4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.22 2.18 2.12 2.08 2.04 1.99 1.97 1.93 1.91 1.88 1.86 1.84
20
8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.13 3.05 2.94 2.86 2.78 2.69 2.64 2.57 2.54 2.48 2.44 2.42
4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.20 2.16 2.10 2.05 2.01 1.96 1.94 1.90 1.88 1.84 1.83 1.81
21
8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.24 3.17 3.07 2.99 2.88 2.80 2.72 2.64 2.58 2.51 2.48 2.42 2.38 2.36
4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.17 2.13 2.07 2.03 1.98 1.94 1.91 1.87 1.85 1.82 1.80 1.78
22
7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.02 2.94 2.83 2.75 2.67 2.58 2.53 2.46 2.42 2.36 2.33 2.31
4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.15 2.11 2.05 2.01 1.96 1.91 1.88 1.84 1.82 1.79 1.77 1.76
23
7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.07 2.97 2.89 2.78 2.70 2.62 2.54 2.48 2.41 2.37 2.32 2.28 2.26
4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.22 2.18 2.13 2.09 2.03 1.98 1.94 1.89 1.86 1.82 1.80 1.77 1.75 1.73
24
7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.09 3.03 2.93 2.85 2.74 2.66 2.58 2.49 2.44 2.37 2.33 2.27 2.24 2.21
4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.11 2.07 2.01 1.96 1.92 1.87 1.84 1.80 1.78 1.75 1.73 1.71
25
7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 3.06 2.99 2.89 2.81 2.70 2.62 2.54 2.45 2.40 2.33 2.29 2.23 2.19 2.17
4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.09 2.05 1.99 1.95 1.90 1.85 1.82 1.78 1.76 1.73 1.71 1.69
26
7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 3.02 2.96 2.86 2.78 2.66 2.58 2.50 2.42 2.36 2.29 2.25 2.19 2.16 2.13
4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.17 2.13 2.08 2.04 1.97 1.93 1.88 1.84 1.81 1.76 1.74 1.71 1.69 1.67
27
7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.99 2.93 2.82 2.75 2.63 2.55 2.47 2.38 2.33 2.26 2.22 2.16 2.12 2.10
4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.15 2.12 2.06 2.02 1.96 1.91 1.87 1.82 1.79 1.75 1.73 1.69 1.67 1.65
28
7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.96 2.90 2.79 2.72 2.60 2.52 2.44 2.35 2.30 2.23 2.19 2.13 2.09 2.06
161

α=0.05 (normal) y α 0 01 (negritas)


gld glentre
1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞
4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.14 2.10 2.05 2.01 1.94 1.90 1.85 1.81 1.77 1.73 1.71 1.67 1.65 1.64
29
7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.93 2.87 2.77 2.69 2.57 2.49 2.41 2.33 2.27 2.20 2.16 2.10 2.06 2.03
4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.04 1.99 1.93 1.89 1.84 1.79 1.76 1.72 1.70 1.66 1.64 1.62
30
7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.91 2.84 2.74 2.66 2.55 2.47 2.39 2.30 2.25 2.17 2.13 2.07 2.03 2.01
4.15 3.29 2.90 2.67 2.51 2.40 2.31 2.24 2.19 2.14 2.10 2.07 2.01 1.97 1.91 1.86 1.82 1.77 1.74 1.69 1.67 1.63 1.61 1.59
32
7.50 5.34 4.46 3.97 3.65 3.43 3.26 3.13 3.02 2.93 2.86 2.80 2.70 2.62 2.50 2.42 2.34 2.25 2.20 2.12 2.08 2.02 1.98 1.96
4.13 3.28 2.88 2.65 2.49 2.38 2.29 2.23 2.17 2.12 2.08 2.05 1.99 1.95 1.89 1.84 1.80 1.75 1.71 1.67 1.65 1.61 1.59 1.57
34
7.44 5.29 4.42 3.93 3.61 3.39 3.22 3.09 2.98 2.89 2.82 2.76 2.66 2.58 2.46 2.38 2.30 2.21 2.16 2.08 2.04 1.98 1.94 1.91
4.11 3.26 2.87 2.63 2.48 2.36 2.28 2.21 2.15 2.11 2.07 2.03 1.98 1.93 1.87 1.82 1.78 1.73 1.69 1.65 1.62 1.59 1.56 1.55
36
7.40 5.25 4.38 3.89 3.57 3.35 3.18 3.05 2.95 2.86 2.79 2.72 2.62 2.54 2.43 2.35 2.26 2.18 2.12 2.04 2.00 1.94 1.90 1.87
4.10 3.24 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.09 2.05 2.02 1.96 1.92 1.85 1.81 1.76 1.71 1.68 1.63 1.61 1.57 1.54 1.53
38
7.35 5.21 4.34 3.86 3.54 3.32 3.15 3.02 2.92 2.83 2.75 2.69 2.59 2.51 2.40 2.32 2.23 2.14 2.09 2.01 1.97 1.90 1.86 1.84
4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.95 1.90 1.84 1.79 1.74 1.69 1.66 1.61 1.59 1.55 1.53 1.51
40
7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 2.66 2.56 2.48 2.37 2.29 2.20 2.11 2.06 1.98 1.94 1.87 1.83 1.81
4.07 3.22 2.83 2.59 2.44 2.32 2.24 2.17 2.11 2.06 2.03 1.99 1.94 1.89 1.83 1.78 1.73 1.68 1.65 1.60 1.57 1.53 1.51 1.49
42
7.28 5.15 4.29 3.80 3.49 3.27 3.10 2.97 2.86 2.78 2.70 2.64 2.54 2.46 2.34 2.26 2.18 2.09 2.03 1.95 1.91 1.85 1.80 1.78
4.06 3.21 2.82 2.58 2.43 2.31 2.23 2.16 2.10 2.05 2.01 1.98 1.92 1.88 1.81 1.77 1.72 1.67 1.63 1.59 1.56 1.52 1.49 1.48
44
7.25 5.12 4.26 3.78 3.47 3.24 3.08 2.95 2.84 2.75 2.68 2.62 2.52 2.44 2.32 2.24 2.15 2.07 2.01 1.93 1.89 1.82 1.78 1.75
4.05 3.20 2.81 2.57 2.42 2.30 2.22 2.15 2.09 2.04 2.00 1.97 1.91 1.87 1.80 1.76 1.71 1.65 1.62 1.57 1.55 1.51 1.48 1.46
46
7.22 5.10 4.24 3.76 3.44 3.22 3.06 2.93 2.82 2.73 2.66 2.60 2.50 2.42 2.30 2.22 2.13 2.04 1.99 1.91 1.86 1.80 1.76 1.73
4.04 3.19 2.80 2.57 2.41 2.29 2.21 2.14 2.08 2.03 1.99 1.96 1.90 1.86 1.79 1.75 1.70 1.64 1.61 1.56 1.54 1.49 1.47 1.45
48
7.19 5.08 4.22 3.74 3.43 3.20 3.04 2.91 2.80 2.71 2.64 2.58 2.48 2.40 2.28 2.20 2.12 2.02 1.97 1.89 1.84 1.78 1.73 1.70
4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.99 1.95 1.89 1.85 1.78 1.74 1.69 1.63 1.60 1.55 1.52 1.48 1.46 1.44
50
7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.63 2.56 2.46 2.38 2.27 2.18 2.10 2.01 1.95 1.87 1.82 1.76 1.71 1.68
4.02 3.16 2.77 2.54 2.38 2.27 2.18 2.11 2.06 2.01 1.97 1.93 1.88 1.83 1.76 1.72 1.67 1.61 1.58 1.53 1.50 1.46 1.43 1.41
55
7.12 5.01 4.16 3.68 3.37 3.15 2.98 2.85 2.75 2.66 2.59 2.53 2.42 2.34 2.23 2.15 2.06 1.97 1.91 1.83 1.78 1.71 1.67 1.64
4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.86 1.82 1.75 1.70 1.65 1.59 1.56 1.51 1.48 1.44 1.41 1.39
60
7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.39 2.31 2.20 2.12 2.03 1.94 1.88 1.79 1.75 1.68 1.63 1.60
3.99 3.14 2.75 2.51 2.36 2.24 2.15 2.08 2.03 1.98 1.94 1.90 1.85 1.80 1.73 1.69 1.63 1.58 1.54 1.49 1.46 1.42 1.39 1.37
65
7.04 4.95 4.10 3.62 3.31 3.09 2.93 2.80 2.69 2.61 2.53 2.47 2.37 2.29 2.17 2.09 2.00 1.91 1.85 1.77 1.72 1.65 1.60 1.57
3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97 1.93 1.89 1.84 1.79 1.72 1.67 1.62 1.57 1.53 1.48 1.45 1.40 1.37 1.35
70
7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59 2.51 2.45 2.35 2.27 2.15 2.07 1.98 1.89 1.83 1.74 1.70 1.62 1.57 1.54
3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06 2.00 1.95 1.91 1.88 1.82 1.77 1.70 1.65 1.60 1.54 1.51 1.45 1.43 1.38 1.35 1.33
80
6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.48 2.42 2.31 2.23 2.12 2.03 1.94 1.85 1.79 1.70 1.65 1.58 1.53 1.50
3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.89 1.85 1.79 1.75 1.68 1.63 1.57 1.52 1.48 1.42 1.39 1.34 1.31 1.28
100
6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.43 2.37 2.27 2.19 2.07 1.98 1.89 1.80 1.74 1.65 1.60 1.52 1.47 1.43
162

α=0.05 (normal) y α 0 01 (negritas)


gld glentre
1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 ∞
3.92 3.07 2.68 2.44 2.29 2.17 2.08 2.01 1.96 1.91 1.87 1.83 1.77 1.73 1.66 1.60 1.55 1.49 1.45 1.40 1.36 1.31 1.27 1.25
125
6.84 4.78 3.94 3.47 3.17 2.95 2.79 2.66 2.55 2.47 2.39 2.33 2.23 2.15 2.03 1.94 1.85 1.76 1.69 1.60 1.55 1.47 1.41 1.37
3.90 3.06 2.66 2.43 2.27 2.16 2.07 2.00 1.94 1.89 1.85 1.82 1.76 1.71 1.64 1.59 1.54 1.48 1.44 1.38 1.34 1.29 1.25 1.22
150
6.81 4.75 3.91 3.45 3.14 2.92 2.76 2.63 2.53 2.44 2.37 2.31 2.20 2.12 2.00 1.92 1.83 1.73 1.66 1.57 1.52 1.43 1.38 1.33
3.89 3.04 2.65 2.42 2.26 2.14 2.06 1.98 1.93 1.88 1.84 1.80 1.74 1.69 1.62 1.57 1.52 1.46 1.41 1.35 1.32 1.26 1.22 1.19
200
6.76 4.71 3.88 3.41 3.11 2.89 2.73 2.60 2.50 2.41 2.34 2.27 2.17 2.09 1.97 1.89 1.79 1.69 1.63 1.53 1.48 1.39 1.33 1.28
3.86 3.02 2.63 2.39 2.24 2.12 2.03 1.96 1.90 1.85 1.81 1.78 1.72 1.67 1.60 1.54 1.49 1.42 1.38 1.32 1.28 1.22 1.17 1.13
400
6.70 4.66 3.83 3.37 3.06 2.85 2.68 2.56 2.45 2.37 2.29 2.23 2.13 2.05 1.92 1.84 1.75 1.64 1.58 1.48 1.42 1.32 1.25 1.19
3.85 3.00 2.61 2.38 2.22 2.11 2.02 1.95 1.89 1.84 1.80 1.76 1.70 1.65 1.58 1.53 1.47 1.41 1.36 1.30 1.26 1.19 1.13 1.08
1000
6.66 4.63 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.27 2.20 2.10 2.02 1.90 1.81 1.72 1.61 1.54 1.44 1.38 1.28 1.19 1.12
3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.79 1.75 1.69 1.64 1.57 1.52 1.46 1.39 1.35 1.28 1.24 1.17 1.11 1.00

6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.25 2.18 2.08 2.00 1.88 1.79 1.70 1.59 1.52 1.42 1.36 1.25 1.15 1.00
163

APÉNDICE 4
Probabilidades binomiales

p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
1 0 0.9500 0.9000 0.8500 0.8000 0.7500 0.7000 0.6500 0.6000 0.5500 0.5000
1 1 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 0.4000 0.4500 0.5000
2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500
2 1 0.0950 0.1800 0.2550 0.3200 0.3750 0.4200 0.4550 0.4800 0.4950 0.5000
2 2 0.0025 0.0100 0.0225 0.0400 0.0625 0.0900 0.1225 0.1600 0.2025 0.2500
3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250
3 1 0.1354 0.2430 0.3251 0.3840 0.4219 0.4410 0.4436 0.4320 0.4084 0.3750
3 2 0.0071 0.0270 0.0574 0.0960 0.1406 0.1890 0.2389 0.2880 0.3341 0.3750
3 3 0.0001 0.0010 0.0034 0.0080 0.0156 0.0270 0.0429 0.0640 0.0911 0.1250
4 0 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0625
4 1 0.1715 0.2916 0.3685 0.4096 0.4219 0.4116 0.3845 0.3456 0.2995 0.2500
4 2 0.0135 0.0486 0.0975 0.1536 0.2109 0.2646 0.3105 0.3456 0.3675 0.3750
4 3 0.0005 0.0036 0.0115 0.0256 0.0469 0.0756 0.1115 0.1536 0.2005 0.2500
4 4 0.0000 0.0001 0.0005 0.0016 0.0039 0.0081 0.0150 0.0256 0.0410 0.0625
5 0 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313
5 1 0.2036 0.3281 0.3915 0.4096 0.3955 0.3602 0.3124 0.2592 0.2059 0.1563
5 2 0.0214 0.0729 0.1382 0.2048 0.2637 0.3087 0.3364 0.3456 0.3369 0.3125
5 3 0.0011 0.0081 0.0244 0.0512 0.0879 0.1323 0.1811 0.2304 0.2757 0.3125
5 4 0.0000 0.0005 0.0022 0.0064 0.0146 0.0284 0.0488 0.0768 0.1128 0.1563
5 5 0.0000 0.0000 0.0001 0.0003 0.0010 0.0024 0.0053 0.0102 0.0185 0.0313
6 0 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156
6 1 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866 0.1359 0.0938
6 2 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110 0.2780 0.2344
6 3 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765 0.3032 0.3125
6 4 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382 0.1861 0.2344
6 5 0.0000 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369 0.0609 0.0938
6 6 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0018 0.0041 0.0083 0.0156
7 0 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.0078
7 1 0.2573 0.3720 0.3960 0.3670 0.3115 0.2471 0.1848 0.1306 0.0872 0.0547
7 2 0.0406 0.1240 0.2097 0.2753 0.3115 0.3177 0.2985 0.2613 0.2140 0.1641
7 3 0.0036 0.0230 0.0617 0.1147 0.1730 0.2269 0.2679 0.2903 0.2918 0.2734
7 4 0.0002 0.0026 0.0109 0.0287 0.0577 0.0972 0.1442 0.1935 0.2388 0.2734
7 5 0.0000 0.0002 0.0012 0.0043 0.0115 0.0250 0.0466 0.0774 0.1172 0.1641
7 6 0.0000 0.0000 0.0001 0.0004 0.0013 0.0036 0.0084 0.0172 0.0320 0.0547
7 7 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0016 0.0037 0.0078
8 0 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039
8 1 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896 0.0548 0.0313
8 2 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090 0.1569 0.1094
8 3 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787 0.2568 0.2188
8 4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322 0.2627 0.2734
8 5 0.0000 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239 0.1719 0.2188
8 6 0.0000 0.0000 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413 0.0703 0.1094
8 7 0.0000 0.0000 0.0000 0.0001 0.0004 0.0012 0.0033 0.0079 0.0164 0.0313
8 8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0017 0.0039
9 0 0.6302 0.3874 0.2316 0.1342 0.0751 0.0404 0.0207 0.0101 0.0046 0.0020
9 1 0.2985 0.3874 0.3679 0.3020 0.2253 0.1556 0.1004 0.0605 0.0339 0.0176
164

p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
9 2 0.0629 0.1722 0.2597 0.3020 0.3003 0.2668 0.2162 0.1612 0.1110 0.0703
9 3 0.0077 0.0446 0.1069 0.1762 0.2336 0.2668 0.2716 0.2508 0.2119 0.1641
9 4 0.0006 0.0074 0.0283 0.0661 0.1168 0.1715 0.2194 0.2508 0.2600 0.2461
9 5 0.0000 0.0008 0.0050 0.0165 0.0389 0.0735 0.1181 0.1672 0.2128 0.2461
9 6 0.0000 0.0001 0.0006 0.0028 0.0087 0.0210 0.0424 0.0743 0.1160 0.1641
9 7 0.0000 0.0000 0.0000 0.0003 0.0012 0.0039 0.0098 0.0212 0.0407 0.0703
9 8 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0013 0.0035 0.0083 0.0176
9 9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0020
10 0 0.5987 0.3487 0.1969 0.1074 0.0563 0.0282 0.0135 0.0060 0.0025 0.0010
10 1 0.3151 0.3874 0.3474 0.2684 0.1877 0.1211 0.0725 0.0403 0.0207 0.0098
10 2 0.0746 0.1937 0.2759 0.3020 0.2816 0.2335 0.1757 0.1209 0.0763 0.0439
10 3 0.0105 0.0574 0.1298 0.2013 0.2503 0.2668 0.2522 0.2150 0.1665 0.1172
10 4 0.0010 0.0112 0.0401 0.0881 0.1460 0.2001 0.2377 0.2508 0.2384 0.2051
10 5 0.0001 0.0015 0.0085 0.0264 0.0584 0.1029 0.1536 0.2007 0.2340 0.2461
10 6 0.0000 0.0001 0.0012 0.0055 0.0162 0.0368 0.0689 0.1115 0.1596 0.2051
10 7 0.0000 0.0000 0.0001 0.0008 0.0031 0.0090 0.0212 0.0425 0.0746 0.1172
10 8 0.0000 0.0000 0.0000 0.0001 0.0004 0.0014 0.0043 0.0106 0.0229 0.0439
10 9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016 0.0042 0.0098
10 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010
11 0 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014 0.0005
11 1 0.3293 0.3835 0.3248 0.2362 0.1549 0.0932 0.0518 0.0266 0.0125 0.0054
11 2 0.0867 0.2131 0.2866 0.2953 0.2581 0.1998 0.1395 0.0887 0.0513 0.0269
11 3 0.0137 0.0710 0.1517 0.2215 0.2581 0.2568 0.2254 0.1774 0.1259 0.0806
11 4 0.0014 0.0158 0.0536 0.1107 0.1721 0.2201 0.2428 0.2365 0.2060 0.1611
11 5 0.0001 0.0025 0.0132 0.0388 0.0803 0.1321 0.1830 0.2207 0.2360 0.2256
11 6 0.0000 0.0003 0.0023 0.0097 0.0268 0.0566 0.0985 0.1471 0.1931 0.2256
11 7 0.0000 0.0000 0.0003 0.0017 0.0064 0.0173 0.0379 0.0701 0.1128 0.1611
11 8 0.0000 0.0000 0.0000 0.0002 0.0011 0.0037 0.0102 0.0234 0.0462 0.0806
11 9 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018 0.0052 0.0126 0.0269
11 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0007 0.0021 0.0054
11 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0005
12 0 0.5404 0.2824 0.1422 0.0687 0.0317 0.0138 0.0057 0.0022 0.0008 0.0002
12 1 0.3413 0.3766 0.3012 0.2062 0.1267 0.0712 0.0368 0.0174 0.0075 0.0029
12 2 0.0988 0.2301 0.2924 0.2835 0.2323 0.1678 0.1088 0.0639 0.0339 0.0161
12 3 0.0173 0.0852 0.1720 0.2362 0.2581 0.2397 0.1954 0.1419 0.0923 0.0537
12 4 0.0021 0.0213 0.0683 0.1329 0.1936 0.2311 0.2367 0.2128 0.1700 0.1208
12 5 0.0002 0.0038 0.0193 0.0532 0.1032 0.1585 0.2039 0.2270 0.2225 0.1934
12 6 0.0000 0.0005 0.0040 0.0155 0.0401 0.0792 0.1281 0.1766 0.2124 0.2256
12 7 0.0000 0.0000 0.0006 0.0033 0.0115 0.0291 0.0591 0.1009 0.1489 0.1934
12 8 0.0000 0.0000 0.0001 0.0005 0.0024 0.0078 0.0199 0.0420 0.0762 0.1208
12 9 0.0000 0.0000 0.0000 0.0001 0.0004 0.0015 0.0048 0.0125 0.0277 0.0537
12 10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0025 0.0068 0.0161
12 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0029
12 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
13 0 0.5133 0.2542 0.1209 0.0550 0.0238 0.0097 0.0037 0.0013 0.0004 0.0001
13 1 0.3512 0.3672 0.2774 0.1787 0.1029 0.0540 0.0259 0.0113 0.0045 0.0016
13 2 0.1109 0.2448 0.2937 0.2680 0.2059 0.1388 0.0836 0.0453 0.0220 0.0095
13 3 0.0214 0.0997 0.1900 0.2457 0.2517 0.2181 0.1651 0.1107 0.0660 0.0349
13 4 0.0028 0.0277 0.0838 0.1535 0.2097 0.2337 0.2222 0.1845 0.1350 0.0873
13 5 0.0003 0.0055 0.0266 0.0691 0.1258 0.1803 0.2154 0.2214 0.1989 0.1571
13 6 0.0000 0.0008 0.0063 0.0230 0.0559 0.1030 0.1546 0.1968 0.2169 0.2095
13 7 0.0000 0.0001 0.0011 0.0058 0.0186 0.0442 0.0833 0.1312 0.1775 0.2095
13 8 0.0000 0.0000 0.0001 0.0011 0.0047 0.0142 0.0336 0.0656 0.1089 0.1571
165

p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
13 9 0.0000 0.0000 0.0000 0.0001 0.0009 0.0034 0.0101 0.0243 0.0495 0.0873
13 10 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0022 0.0065 0.0162 0.0349
13 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0012 0.0036 0.0095
13 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0016
13 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
14 0 0.4877 0.2288 0.1028 0.0440 0.0178 0.0068 0.0024 0.0008 0.0002 0.0001
14 1 0.3593 0.3559 0.2539 0.1539 0.0832 0.0407 0.0181 0.0073 0.0027 0.0009
14 2 0.1229 0.2570 0.2912 0.2501 0.1802 0.1134 0.0634 0.0317 0.0141 0.0056
14 3 0.0259 0.1142 0.2056 0.2501 0.2402 0.1943 0.1366 0.0845 0.0462 0.0222
14 4 0.0037 0.0349 0.0998 0.1720 0.2202 0.2290 0.2022 0.1549 0.1040 0.0611
14 5 0.0004 0.0078 0.0352 0.0860 0.1468 0.1963 0.2178 0.2066 0.1701 0.1222
14 6 0.0000 0.0013 0.0093 0.0322 0.0734 0.1262 0.1759 0.2066 0.2088 0.1833
14 7 0.0000 0.0002 0.0019 0.0092 0.0280 0.0618 0.1082 0.1574 0.1952 0.2095
14 8 0.0000 0.0000 0.0003 0.0020 0.0082 0.0232 0.0510 0.0918 0.1398 0.1833
14 9 0.0000 0.0000 0.0000 0.0003 0.0018 0.0066 0.0183 0.0408 0.0762 0.1222
14 10 0.0000 0.0000 0.0000 0.0000 0.0003 0.0014 0.0049 0.0136 0.0312 0.0611
14 11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0033 0.0093 0.0222
14 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0019 0.0056
14 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0009
14 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
15 0 0.4633 0.2059 0.0874 0.0352 0.0134 0.0047 0.0016 0.0005 0.0001 0.0000
15 1 0.3658 0.3432 0.2312 0.1319 0.0668 0.0305 0.0126 0.0047 0.0016 0.0005
15 2 0.1348 0.2669 0.2856 0.2309 0.1559 0.0916 0.0476 0.0219 0.0090 0.0032
15 3 0.0307 0.1285 0.2184 0.2501 0.2252 0.1700 0.1110 0.0634 0.0318 0.0139
15 4 0.0049 0.0428 0.1156 0.1876 0.2252 0.2186 0.1792 0.1268 0.0780 0.0417
15 5 0.0006 0.0105 0.0449 0.1032 0.1651 0.2061 0.2123 0.1859 0.1404 0.0916
15 6 0.0000 0.0019 0.0132 0.0430 0.0917 0.1472 0.1906 0.2066 0.1914 0.1527
15 7 0.0000 0.0003 0.0030 0.0138 0.0393 0.0811 0.1319 0.1771 0.2013 0.1964
15 8 0.0000 0.0000 0.0005 0.0035 0.0131 0.0348 0.0710 0.1181 0.1647 0.1964
15 9 0.0000 0.0000 0.0001 0.0007 0.0034 0.0116 0.0298 0.0612 0.1048 0.1527
15 10 0.0000 0.0000 0.0000 0.0001 0.0007 0.0030 0.0096 0.0245 0.0515 0.0916
15 11 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0074 0.0191 0.0417
15 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052 0.0139
15 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010 0.0032
15 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005
15 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
16 0 0.4401 0.1853 0.0743 0.0281 0.0100 0.0033 0.0010 0.0003 0.0001 0.0000
16 1 0.3706 0.3294 0.2097 0.1126 0.0535 0.0228 0.0087 0.0030 0.0009 0.0002
16 2 0.1463 0.2745 0.2775 0.2111 0.1336 0.0732 0.0353 0.0150 0.0056 0.0018
16 3 0.0359 0.1423 0.2285 0.2463 0.2079 0.1465 0.0888 0.0468 0.0215 0.0085
16 4 0.0061 0.0514 0.1311 0.2001 0.2252 0.2040 0.1553 0.1014 0.0572 0.0278
16 5 0.0008 0.0137 0.0555 0.1201 0.1802 0.2099 0.2008 0.1623 0.1123 0.0667
16 6 0.0001 0.0028 0.0180 0.0550 0.1101 0.1649 0.1982 0.1983 0.1684 0.1222
16 7 0.0000 0.0004 0.0045 0.0197 0.0524 0.1010 0.1524 0.1889 0.1969 0.1746
16 8 0.0000 0.0001 0.0009 0.0055 0.0197 0.0487 0.0923 0.1417 0.1812 0.1964
16 9 0.0000 0.0000 0.0001 0.0012 0.0058 0.0185 0.0442 0.0840 0.1318 0.1746
16 10 0.0000 0.0000 0.0000 0.0002 0.0014 0.0056 0.0167 0.0392 0.0755 0.1222
16 11 0.0000 0.0000 0.0000 0.0000 0.0002 0.0013 0.0049 0.0142 0.0337 0.0667
16 12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 0.0040 0.0115 0.0278
16 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0008 0.0029 0.0085
16 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018
16 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002
16 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
166

p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
17 0 0.4181 0.1668 0.0631 0.0225 0.0075 0.0023 0.0007 0.0002 0.0000 0.0000
17 1 0.3741 0.3150 0.1893 0.0957 0.0426 0.0169 0.0060 0.0019 0.0005 0.0001
17 2 0.1575 0.2800 0.2673 0.1914 0.1136 0.0581 0.0260 0.0102 0.0035 0.0010
17 3 0.0415 0.1556 0.2359 0.2393 0.1893 0.1245 0.0701 0.0341 0.0144 0.0052
17 4 0.0076 0.0605 0.1457 0.2093 0.2209 0.1868 0.1320 0.0796 0.0411 0.0182
17 5 0.0010 0.0175 0.0668 0.1361 0.1914 0.2081 0.1849 0.1379 0.0875 0.0472
17 6 0.0001 0.0039 0.0236 0.0680 0.1276 0.1784 0.1991 0.1839 0.1432 0.0944
17 7 0.0000 0.0007 0.0065 0.0267 0.0668 0.1201 0.1685 0.1927 0.1841 0.1484
17 8 0.0000 0.0001 0.0014 0.0084 0.0279 0.0644 0.1134 0.1606 0.1883 0.1855
17 9 0.0000 0.0000 0.0003 0.0021 0.0093 0.0276 0.0611 0.1070 0.1540 0.1855
17 10 0.0000 0.0000 0.0000 0.0004 0.0025 0.0095 0.0263 0.0571 0.1008 0.1484
17 11 0.0000 0.0000 0.0000 0.0001 0.0005 0.0026 0.0090 0.0242 0.0525 0.0944
17 12 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0081 0.0215 0.0472
17 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0021 0.0068 0.0182
17 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0004 0.0016 0.0052
17 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0010
17 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
17 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
18 0 0.3972 0.1501 0.0536 0.0180 0.0056 0.0016 0.0004 0.0001 0.0000 0.0000
18 1 0.3763 0.3002 0.1704 0.0811 0.0338 0.0126 0.0042 0.0012 0.0003 0.0001
18 2 0.1683 0.2835 0.2556 0.1723 0.0958 0.0458 0.0190 0.0069 0.0022 0.0006
18 3 0.0473 0.1680 0.2406 0.2297 0.1704 0.1046 0.0547 0.0246 0.0095 0.0031
18 4 0.0093 0.0700 0.1592 0.2153 0.2130 0.1681 0.1104 0.0614 0.0291 0.0117
18 5 0.0014 0.0218 0.0787 0.1507 0.1988 0.2017 0.1664 0.1146 0.0666 0.0327
18 6 0.0002 0.0052 0.0301 0.0816 0.1436 0.1873 0.1941 0.1655 0.1181 0.0708
18 7 0.0000 0.0010 0.0091 0.0350 0.0820 0.1376 0.1792 0.1892 0.1657 0.1214
18 8 0.0000 0.0002 0.0022 0.0120 0.0376 0.0811 0.1327 0.1734 0.1864 0.1669
18 9 0.0000 0.0000 0.0004 0.0033 0.0139 0.0386 0.0794 0.1284 0.1694 0.1855
18 10 0.0000 0.0000 0.0001 0.0008 0.0042 0.0149 0.0385 0.0771 0.1248 0.1669
18 11 0.0000 0.0000 0.0000 0.0001 0.0010 0.0046 0.0151 0.0374 0.0742 0.1214
18 12 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0047 0.0145 0.0354 0.0708
18 13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0045 0.0134 0.0327
18 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011 0.0039 0.0117
18 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0009 0.0031
18 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006
18 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
18 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
19 0 0.3774 0.1351 0.0456 0.0144 0.0042 0.0011 0.0003 0.0001 0.0000 0.0000
19 1 0.3774 0.2852 0.1529 0.0685 0.0268 0.0093 0.0029 0.0008 0.0002 0.0000
19 2 0.1787 0.2852 0.2428 0.1540 0.0803 0.0358 0.0138 0.0046 0.0013 0.0003
19 3 0.0533 0.1796 0.2428 0.2182 0.1517 0.0869 0.0422 0.0175 0.0062 0.0018
19 4 0.0112 0.0798 0.1714 0.2182 0.2023 0.1491 0.0909 0.0467 0.0203 0.0074
19 5 0.0018 0.0266 0.0907 0.1636 0.2023 0.1916 0.1468 0.0933 0.0497 0.0222
19 6 0.0002 0.0069 0.0374 0.0955 0.1574 0.1916 0.1844 0.1451 0.0949 0.0518
19 7 0.0000 0.0014 0.0122 0.0443 0.0974 0.1525 0.1844 0.1797 0.1443 0.0961
19 8 0.0000 0.0002 0.0032 0.0166 0.0487 0.0981 0.1489 0.1797 0.1771 0.1442
19 9 0.0000 0.0000 0.0007 0.0051 0.0198 0.0514 0.0980 0.1464 0.1771 0.1762
19 10 0.0000 0.0000 0.0001 0.0013 0.0066 0.0220 0.0528 0.0976 0.1449 0.1762
19 11 0.0000 0.0000 0.0000 0.0003 0.0018 0.0077 0.0233 0.0532 0.0970 0.1442
19 12 0.0000 0.0000 0.0000 0.0000 0.0004 0.0022 0.0083 0.0237 0.0529 0.0961
19 13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0024 0.0085 0.0233 0.0518
19 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0006 0.0024 0.0082 0.0222
167

p
n k
0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
19 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0022 0.0074
19 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0005 0.0018
19 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003
19 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
19 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
20 0 0.3585 0.1216 0.0388 0.0115 0.0032 0.0008 0.0002 0.0000 0.0000 0.0000
20 1 0.3774 0.2702 0.1368 0.0576 0.0211 0.0068 0.0020 0.0005 0.0001 0.0000
20 2 0.1887 0.2852 0.2293 0.1369 0.0669 0.0278 0.0100 0.0031 0.0008 0.0002
20 3 0.0596 0.1901 0.2428 0.2054 0.1339 0.0716 0.0323 0.0123 0.0040 0.0011
20 4 0.0133 0.0898 0.1821 0.2182 0.1897 0.1304 0.0738 0.0350 0.0139 0.0046
20 5 0.0022 0.0319 0.1028 0.1746 0.2023 0.1789 0.1272 0.0746 0.0365 0.0148
20 6 0.0003 0.0089 0.0454 0.1091 0.1686 0.1916 0.1712 0.1244 0.0746 0.0370
20 7 0.0000 0.0020 0.0160 0.0545 0.1124 0.1643 0.1844 0.1659 0.1221 0.0739
20 8 0.0000 0.0004 0.0046 0.0222 0.0609 0.1144 0.1614 0.1797 0.1623 0.1201
20 9 0.0000 0.0001 0.0011 0.0074 0.0271 0.0654 0.1158 0.1597 0.1771 0.1602
20 10 0.0000 0.0000 0.0002 0.0020 0.0099 0.0308 0.0686 0.1171 0.1593 0.1762
20 11 0.0000 0.0000 0.0000 0.0005 0.0030 0.0120 0.0336 0.0710 0.1185 0.1602
20 12 0.0000 0.0000 0.0000 0.0001 0.0008 0.0039 0.0136 0.0355 0.0727 0.1201
20 13 0.0000 0.0000 0.0000 0.0000 0.0002 0.0010 0.0045 0.0146 0.0366 0.0739
20 14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0012 0.0049 0.0150 0.0370
20 15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0003 0.0013 0.0049 0.0148
20 16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0003 0.0013 0.0046
20 17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002 0.0011
20 18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0002
20 19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
20 20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
168

APÉNDICE 5
Distribución t de Student:
Significancia de correlaciones de Pearson

Grados de libertad Niveles de significación a dos colas


gl= N-2 0.050 0.025 0.010 0.005
1 0.988 0.997 1.000 1.000
2 0.900 0.950 0.980 0.990
3 0.805 0.878 0.934 0.959
4 0.729 0.811 0.882 0.917
5 0.669 0.754 0.833 0.874
6 0.622 0.707 0.789 0.834
7 0.582 0.666 0.750 0.798
8 0.549 0.632 0.716 0.765
9 0.521 0.602 0.685 0.735
10 0.497 0.576 0.658 0.708
11 0.476 0.553 0.634 0.684
12 0.458 0.532 0.612 0.661
13 0.441 0.514 0.592 0.641
14 0.426 0.497 0.574 0.623
15 0.412 0.482 0.558 0.606
16 0.400 0.468 0.542 0.590
17 0.389 0.456 0.528 0.575
18 0.378 0.444 0.516 0.561
19 0.369 0.433 0.503 0.549
20 0.360 0.423 0.492 0.537
21 0.352 0.413 0.482 0.526
22 0.344 0.404 0.472 0.515
23 0.337 0.396 0.462 0.505
24 0.330 0.388 0.453 0.496
25 0.323 0.381 0.445 0.487
26 0.317 0.374 0.437 0.479
27 0.311 0.367 0.430 0.471
28 0.306 0.361 0.423 0.463
29 0.301 0.355 0.416 0.456
30 0.296 0.349 0.409 0.449
35 0.275 0.325 0.381 0.418
40 0.257 0.304 0.358 0.393
45 0.243 0.288 0.338 0.372
50 0.231 0.273 0.322 0.354
60 0.211 0.250 0.295 0.325
70 0.195 0.232 0.274 0.303
80 0.183 0.217 0.256 0.283
90 0.173 0.205 0.242 0.267
100 0.164 0.195 0.230 0.254
0.10 0.050 0.02 0.01
Niveles de significación a una cola
169

APÉNDICE 6
Valores críticos del estadístico de Q

α 00 ( r a ) y α 0 0 ( e r tas)
Gl K niveles de K
(N – K)
2 3 4 5 6 7 8 9 10
3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99
5 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24
3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49
6 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10
3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16
7 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37
3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92
8 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86
3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74
9 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49
3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60
10 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21
3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49
11 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99
3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39
12 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81
3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32
13 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67
3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25
14 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54
3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20
15 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44
3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15
16 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35
2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11
17 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27
2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07
18 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20
2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04
19 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14
2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01
20 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09
2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92
24 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92
2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82
30 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76
2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73
40 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60
2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65
60 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45
2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56
120 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30
2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47
∞ 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16
170

APÉNDICE 7
Tabla de números al azar

Primera serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 20 77 81 43 63 92 68 61 70 79 88 81 05 47 63 07 13 10 46 19
2 09 42 70 58 14 76 27 02 29 73 87 66 47 73 31 59 02 96 41 07
3 93 04 55 07 83 92 26 76 50 57 05 97 12 85 01 30 82 45 52 08
4 95 99 93 67 54 96 35 98 84 64 80 88 29 39 07 00 97 95 59 24
5 40 82 40 08 05 80 60 50 33 93 68 58 83 62 06 09 20 56 91 36
6 78 11 44 01 19 42 06 02 32 19 99 23 94 02 29 27 29 38 17 82
7 56 41 30 34 77 26 83 55 26 08 69 53 66 16 19 43 77 69 70 77
8 76 42 48 52 69 11 70 01 23 21 99 22 30 75 42 61 99 20 91 90
9 41 14 93 39 41 11 56 76 60 04 24 75 18 06 14 42 91 25 31 92
10 17 42 51 18 60 28 10 87 61 25 88 92 04 30 90 80 32 26 91 22
11 96 66 80 87 48 97 22 47 84 24 58 51 41 10 54 26 93 19 90 20
12 24 81 91 42 70 40 96 75 48 30 48 66 21 54 20 98 12 00 86 61
13 78 65 68 07 07 95 15 50 67 10 01 62 36 75 93 76 40 54 97 68
14 29 27 78 63 25 00 14 51 15 18 18 14 03 96 63 08 85 49 16 14
15 34 16 38 45 71 04 00 72 44 03 63 46 49 56 50 76 57 32 84 43
16 82 76 24 97 43 39 05 39 93 69 61 80 25 47 90 15 70 06 74 13
17 18 93 50 05 65 07 39 37 51 99 78 42 52 78 82 86 81 17 69 09
18 46 84 90 64 55 19 12 20 32 11 56 30 00 54 75 95 54 22 80 38
19 59 52 94 41 54 33 08 80 51 39 35 64 22 90 59 82 79 76 23 22
20 38 12 76 09 53 32 80 07 19 34 18 55 60 86 33 22 36 15 79 85
21 14 72 18 71 55 19 09 25 27 36 10 35 60 87 96 55 74 86 08 54
22 44 29 94 19 34 91 62 94 56 81 35 00 79 15 62 92 66 16 67 29
23 50 10 67 79 43 27 66 85 52 00 97 65 07 58 31 74 90 09 24 75
24 11 19 88 34 80 11 94 03 56 28 53 52 86 83 51 38 97 02 50 20
25 12 16 81 62 90 38 45 23 13 08 18 57 67 45 15 75 86 07 77 57
171

Segunda serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 83 79 21 68 54 51 23 50 78 17 73 51 94 71 91 31 29 97 13 16
2 27 98 04 97 52 48 19 33 82 16 00 34 30 67 58 00 80 80 92 26
3 75 57 42 55 59 91 72 75 66 75 39 70 55 24 09 19 70 22 42 10
4 60 73 07 27 71 94 68 70 48 81 40 91 16 24 45 24 54 03 18 03
5 27 42 15 67 94 44 48 62 37 53 83 15 90 90 60 19 78 62 44 70
6 57 27 77 75 38 18 24 32 91 53 78 91 33 38 31 95 85 11 33 87
7 22 79 42 39 32 65 83 60 74 63 56 77 47 21 88 36 43 10 19 41
8 61 94 32 42 83 81 92 40 99 00 05 66 33 61 32 10 43 15 49 25
9 24 28 53 76 13 61 73 22 50 51 75 08 10 90 71 58 22 42 46 83
10 06 75 46 13 77 68 97 05 56 73 34 86 42 22 37 75 94 87 57 72
11 83 81 98 41 67 38 97 30 12 31 87 76 81 07 32 88 42 29 94 58
12 33 66 09 91 21 26 52 57 47 14 27 75 07 84 50 96 95 12 25 01
13 63 14 10 59 10 68 27 91 00 17 36 79 01 79 65 43 13 98 52 21
14 84 43 66 38 65 72 14 55 93 78 24 57 38 10 54 53 92 41 82 56
15 36 75 92 36 76 77 89 27 06 57 37 70 36 09 99 90 66 44 91 89
16 17 23 20 39 81 03 49 79 68 20 94 45 95 92 63 06 55 29 20 82
17 57 09 57 60 40 64 00 77 31 05 83 44 96 62 56 42 42 68 46 42
18 33 49 47 96 50 21 75 68 28 12 46 25 72 64 50 72 75 16 67 00
19 80 52 82 00 02 12 67 61 43 23 14 53 10 66 16 29 06 60 23 20
20 45 29 44 64 44 70 22 10 70 26 43 49 28 51 69 52 85 95 98 58
21 16 04 54 67 60 53 51 60 82 45 56 26 08 89 42 25 93 76 69 73
22 81 09 97 91 19 60 91 96 53 66 45 33 75 09 67 42 59 02 18 97
23 20 61 83 96 58 12 64 99 78 24 94 36 99 60 07 70 27 40 97 15
24 43 17 00 05 86 39 95 58 12 35 84 31 97 75 50 52 06 88 27 79
25 27 84 00 90 41 44 05 43 36 93 01 37 91 93 24 78 00 12 04 12
172

Tercera serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 35 87 68 11 29 27 78 34 74 92 86 13 33 22 34 75 59 44 61 63
2 16 58 21 36 34 35 92 56 72 85 03 91 31 33 26 62 08 30 95 09
3 44 20 51 20 95 87 87 37 37 05 06 43 61 75 51 99 52 03 23 29
4 36 04 26 10 46 13 47 92 34 02 53 54 97 57 24 18 37 62 98 35
5 92 15 17 81 81 67 17 00 76 64 77 34 20 18 88 01 88 31 18 40
6 29 12 08 74 26 94 48 03 85 60 23 69 65 52 53 18 26 72 47 62
7 19 37 78 71 07 12 90 53 13 34 19 49 81 36 85 96 19 81 68 65
8 14 92 75 64 31 51 00 20 86 47 07 04 40 26 57 62 34 95 57 17
9 02 19 07 98 20 98 21 10 69 15 39 55 80 23 80 26 63 33 81 26
10 31 18 25 46 66 31 15 27 09 80 13 44 72 58 42 93 71 72 69 17
11 51 96 70 26 99 94 81 55 72 29 57 37 29 36 99 55 35 99 22 79
12 11 78 29 90 66 21 63 60 39 87 77 34 55 26 56 94 74 43 71 04
13 93 10 34 79 41 18 07 79 30 84 77 27 07 40 54 24 90 96 43 63
14 19 32 42 52 58 31 29 38 39 31 00 68 71 25 28 05 27 55 56 18
15 26 84 50 36 62 73 35 95 56 00 76 61 16 40 08 80 71 87 20 48
16 05 50 36 40 59 22 90 33 76 82 58 66 30 65 68 23 38 98 39 92
17 45 14 18 03 19 34 32 93 93 37 97 11 37 04 64 62 60 53 86 33
18 71 44 13 65 14 74 67 80 11 11 01 90 47 58 36 86 13 68 85 64
19 47 46 52 39 25 41 96 96 98 22 11 51 90 91 82 16 96 43 11 05
20 33 95 58 94 59 65 09 99 47 45 70 06 60 66 75 22 43 93 79 62
21 28 74 81 01 28 31 47 96 55 75 26 61 48 51 10 20 50 43 83 28
22 33 68 25 37 96 38 70 64 36 19 60 48 71 41 05 53 77 56 81 78
23 85 38 32 52 85 14 64 87 82 11 85 11 19 29 80 35 09 99 54 23
24 04 29 07 21 28 33 85 69 93 51 57 30 02 14 58 12 84 34 30 71
25 47 20 21 03 47 88 47 25 51 49 70 21 07 71 07 03 08 69 69 35
173

Cuarta serie
1-4 5-8 9 - 12 13 - 16 17 - 20 21 - 24 25 - 28 29 - 32 33 - 36 37 - 40
1 72 43 49 72 61 99 36 48 80 20 10 31 66 31 84 83 87 39 93 25
2 34 71 89 58 13 15 56 47 41 24 57 70 96 69 59 17 28 25 55 05
3 94 75 59 95 98 99 88 03 83 67 75 75 92 73 56 60 91 80 59 53
4 28 97 88 17 22 80 49 80 81 22 07 83 41 63 15 27 25 72 00 01
5 75 89 87 84 83 13 56 59 46 28 26 11 62 28 81 61 42 86 35 50
6 77 44 16 92 59 93 41 27 08 86 09 45 47 43 35 19 66 71 81 08
7 46 06 66 76 61 89 59 75 61 68 68 50 47 98 47 21 84 05 52 95
8 53 46 28 21 43 74 40 07 15 60 52 15 39 94 67 29 90 83 08 61
9 55 23 44 40 08 34 48 33 12 12 28 12 69 81 14 58 25 01 00 13
10 38 44 74 56 06 24 85 13 22 04 07 70 00 18 43 99 03 53 77 98
11 08 12 50 56 81 86 61 59 77 00 11 71 00 47 29 62 68 87 25 30
12 34 27 77 14 64 22 20 77 22 41 50 92 51 67 70 54 14 26 54 47
13 19 98 90 19 27 12 80 34 87 97 73 09 98 80 66 74 77 59 11 54
14 39 05 72 32 69 87 95 50 82 76 50 79 82 18 72 77 88 60 92 11
15 38 96 83 88 05 76 23 20 09 33 08 02 10 74 93 22 09 75 83 23
16 72 94 21 37 57 90 48 48 43 96 66 75 33 08 09 65 62 00 94 38
17 86 61 52 23 80 46 97 81 15 83 88 88 71 98 73 73 43 63 93 74
18 14 78 87 24 89 77 62 94 19 26 16 08 78 08 97 24 19 03 47 46
19 24 17 92 19 81 85 71 91 02 41 45 08 44 99 72 36 84 23 59 51
20 92 52 08 30 47 44 31 36 80 12 73 65 98 06 15 69 59 18 38 58
21 94 47 16 55 89 88 64 29 02 59 48 90 06 90 57 14 65 55 75 97
22 47 21 92 90 36 20 85 34 96 73 11 69 71 36 65 16 49 89 41 78
23 76 89 16 29 20 24 00 47 33 89 74 11 59 62 84 53 03 14 74 77
24 90 93 86 13 61 32 15 62 99 30 63 47 88 87 86 12 59 30 69 44
25 44 93 41 83 33 43 31 74 85 47 44 45 91 36 40 48 56 84 10 09
174

BIBLIOGRAFÍA

1. Aron, A., Aron E. (2001). Estadística para Psicología. Buenos Aires: Pearson Education, S.A.

2. Cohen, R., Swerdlik, M. (2001). Pruebas y Evaluación Psicológica. México: McGraw-

Hill/Interamericana de México, S.A.

3. Chow, Ya-Lun (1977). Análisis Estadístico. México: Nueva Editorial Interamericana, S.A.

4. Daniel, Wayne (1995). Estadísticas con Aplicaciones a las Ciencias Sociales y a la Educación.

México: McGraw-Hill/Interamericana de México, S.A.

5. Hopkins K., Hopkins, B.R., Glass, Gene (1997). Estadísticas Básica par a las Ciencias

Sociales y del Comportamiento. 3ª. Edición. México: Pearson Education

6. Kerlinger, F., Lee,H. (2002) Investigación del Comportamiento. Métodos de Investigación en

Ciencias Sociales. México: McGraw-Hill/Interamericana de México, S.A.

7. Pagano, Robert (2006). Estadísticas para las Ciencias del Comportamiento. 7ª. Edición.

México: Editorial Thompson.

8. Pagano, Robert (2001). Bioestadísticas. México: Editorial Thompson.

9. Pérez, César (2002). Estadística aplicada a través de Excel. México: Pearson Education, S.A.

10. Ritchey, Ferris (2008). Estadísticas para las Ciencias Sociales. 2ª. Edición. México: McGraw-

Hill/Interamericana de México, S.A.

11. Triola, Mario (2004). Estadística. 9ª. Edición. México: Pearson Education.

12. Walpole,R, Myers, R. (1992). Probabilidad y Estadística. México: Editorial McGraw-

Hill/Interamericana de México, S.A.

Potrebbero piacerti anche