Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA
CAPÍTULO 1
¿POR QUÉ ES NECESARIA LA ESTADÍSTICA?
Quien inicie sus estudios en alguna de las ciencias de la vida del individuo o de la sociedad,
puede quizá sentirse descorazonado al descubrir que ha de empezar a hacer estadística. No sería
la primera vez; es comprensible que más de un estudiante imagine que su nuevo programa de
estudios va a concentrarse totalmente en aspectos del comportamiento propio de los organismos
vivos, o de sus procesos mentales, y que no va a necesitar de ningún conocimiento matemático.
Entonces ¿por qué desgraciada circunstancia ha de empezar a estudiar estadística, justamente
cuando creía que, por fin, iba a poder dedicar toda su atención a un tema que le resultara
verdaderamente interesante? En los siguientes apartados voy a esbozar los principales usos de la
estadística en las ciencias de la vida social o individual, para acabar el capítulo con unas
consideraciones acerca de esta cuestión, justamente: por qué son tantos los estudiantes a los que
disgusta la estadística y que la encuentran difícil.
LA DESCRIPCIÓN ESTADÍSTICA
Desde luego, en el campo de las ciencias biológicas y sociales resulta satisfactorio ser
capaz de entender precisamente qué hace «funcionar» a un organismo vivo; pero, a la vez, el
objetivo global es poder comprender el mecanismo en el que se fundamenta el comportamiento
de toda una especie. En ese caso podemos utilizar nuestro conocimiento para realizar
predicciones acerca de individuos o grupos con los que antes no nos hemos tropezado, o que no
hemos estudiado previamente. Así, en cl estudio de los seres vivos y de sus actividades, nos
encontraremos a menudo trabajando con varios individuos a la vez, En los estudios de tipo
general, las cifras pueden llegar a ser de varios miles; pero normalmente, cuando se trata de
investigaciones de tipo experimental, más cuidadosamente controla-das, las cifras son más
pequeñas. Inevitablemente, nuestros esfuerzos se verán recompensados con conjuntos de datos
que, por regla gene-ml aunque no siempre, consisten en números. Cuando realmente se hace
necesaria la estadística descriptiva es para proporcionar información acerca de esos grandes
conjuntos numéricos y para tratar de interpretarlos de una manera eficiente y adecuada. Un
ejemplo lo aclarará.
Supongamos que alguien está estudiando los accidentes de carretera, con miras a formular
recomendaciones para una circulación segura. Lo primero que hay que descubrir es cuándo,
dónde y en qué circunstancias se producen los accidentes. Observemos con más de-talle el
«cuándo». Los momentos en que se producen los accidentes de carretera pueden extraerse
fácilmente de los registros policiales, con lo que nuestro investigador podrá llegar a saber
cuántos accidentes se producen cada año, cada mes, cada semana, cada día e, incluso, cada hora.
Los datos pueden disponerse en forma de tablas diarias. Pues bien, supongamos que así lo ha
hecho: tendrán un aspecto muy impresionante, pero ¡ocuparán un espacio tremendo! Y tampoco
es que vaya a resultar especialmente útil tener que tragarse ese montón de hojas llenas de tablas
de accidentes diarios, para llegar a esbozar alguna visión de conjunto o algún tipo de resumen.
Un buen punto de partida lo proporcionaría algún indicio sobre el número de accidentes que se
producen «normalmente», o «habitualmente», cada año, cada mes, cada semana, etc. Tales
cantidades se llaman promedios. Todo el mundo sabe, siquiera de una manera vaga, que es un
promedio. Nuestro investigador podría decir, «Por término medio, en Dodge City se producen
alrededor de 100 accidentes por semana», basándose en el hecho de que, durante un periodo de
dos años, se registraron 10.000 accidentes. Fijémonos en la expresión «alrededor de». Indica
que no se espera que se produzcan exactamente 100 accidentes cada semana, sino que hay que
contar con que se presentes alguna variación en torno a la cifra de 100. Podría ser que el
investigador en cuestión pasara entonces a suministrar más detalles específicos.
Por lo general, la mayoría de los accidentes en que interviene más de un vehículo tienen lugar
los viernes y los sábados, entre las 22:30 y las 24 horas. De los accidentes en que resultan
afectados niños peatones, que son unos 40 por semana, aproximadamente una octava parte se
producen de lunes a viernes, entre las 8 y las 9 de la mañana: una cuarta parte de los mismos
sobreviene en los mismos días, pero entre las 3:30 y las 6:30 de la tarde. El resto se produce los
fines de semana, durante el día.
Estas frases describen de una manera breve, pero con bastante precisión, el caudal de
información contenido en los 10.000 incidentes registrados. Con la diferencia de que a nadie le
importan un comino, ni le provocan esa pizca de pánico experimentado por el investigador al
enfrentarse con los datos originales... ¡metidos en veinte cajas de cartón! El promedio o media
es un tipo de estadístico descriptivo. Es un número que indica un valor «típico» o «central»
respecto de un grupo de números y, en términos autorizados, se le denomina una medida de
tendencia central. En el ejemplo que acabamos de dar, podrían expresarse las medias de
cualquiera de los grupos de números correspondientes a la proporción de accidentes por año,
por semana, por día o por hora.
Otro tipo de estadístico descriptivo es el que se utiliza para precisar el sentido de la expresión
«alrededor de», tal y como aparece utilizada en la frase «Se producen alrededor de 100
accidentes por semana». Es claro que existe una diferencia entre una ciudad en la que es
corriente que se produzca cualquier número de accidentes entre 50 y 150, y otra en la que nunca
ocurren menos de 98 ni más de 103 en una semana. Aunque ambas ciudades pueden tener una
media de 100 accidentes por semana, para el caso de la primera la expresión «alrededor de»
puede significar una desviación muy considerable respecto de la media; mientras que, para el
caso de la segunda, dicha desviación nunca puede ser superior a dos o tres unidades por debajo
o por encima de la media. Utilizada sin más, la expresión «alrededor de» es con mucho
demasiado imprecisa, y se hace necesario algún método para proporcionar más detalles acerca
de la variación que se produce. La solución estriba en utilizar el tipo de estadístico descriptivo
que se denomina una medida de la dispersión o también, a veces, una medida de la variación;
indica simplemente cuánto significa, en términos precisos, la expresión «alrededor de» para un
determinado conjunto de valores.
Dado que los seres vivos exhiben la más imponente variedad de atributos, de comportamientos,
y de cualquier característica que a uno le dé por mencionar, la variación es un hecho ineludible
de la vida. Por regla general, cuando más simple es un organismo, tanta menos variación
desplegará; pero a la mayoría de los lectores de este libro les interesará especialmente el estudio
de los mamíferos —los animales más complejos— y, en particular, el del hombre—¡el más
complicado de todos!—. Si los humanos fueran suficientemente parecidos en su
comportamiento y sus características, entonces no sería necesario estudiar tantos individuos para
poder hacer afirmaciones relativas a la humanidad en su conjunto. Tal y como son las cosas, los
humanos varían enormemente: y no sólo a escala mundial y por lo que hace a su apariencia y
sus diferencias culturales, sino también dentro de una misma cultura y, como todos sabemos,
dentro de una misma nación o de una misma familia. Incluso dos gemelos idénticos, que posean
la misma dotación genética, no son enteramente iguales, debido al efecto producido sobre ellos
por las distintas experiencias que han tenido a partir de su concepción. En otras palabras: los
organismos vivos son entidades únicas; y cuanto más complejo es un organismo, más
improbable resulta que se comporte de la misma manera que su vecino. De aquí que, a menudo,
resulten necesarias las estadísticas para describir adecuadamente las grandes cantidades de
personas, de otros animales, o de acontecimientos que se estudian, tanto en términos de sus
pautas típicas como de la variación que puede esperarse.
Puntuaciones del o o o o oo
grupo con ayuda
Puntuaciones del
grupo sin ayuda x x x x x x
20 30 40 50 60 70 80 90
FIGURA 1
Superposición de puntuaciones en un experimento de memorización.
Estos factores cobrarán auténtica realidad para el lector cuando este comience a llevar a
cabo experimentos: situaciones en las que alteramos alguna cosa y tratamos a continuación de
determinar si nuestra alteración ha acarreado otros cambios. Los estudios de conjunto
proporcionan otra manera de recoger información acerca de organismos o sucesos. Sin embargo,
nuestro papel en ellos es menos activo que en el caso de los experimentos, porque aquí
obtenemos a propósito de grupos determinados, datos que ya se dan de manera natural y no
provocamos efectivamente ningún cambio. No obstante, al igual que sucede con los
experimentos, cuando llega el momento analizar los resultados nos podemos encontrar con que
nuestros datos no indican la existencia de grupos claramente diferenciables, sino que estos
presentan un cierto grado de superposición. Una vez más, la estadística inductiva acude en
nuestro auxilio, ayudándonos a decir hasta qué punto difieren realmente los grupos.
Ejercicio
1. En la tabla 1 se exhiben los resultados de cuatro experimentos de memoria. Estudie las
cifras y decida qué experimentos son indicativos de que la técnica de memorización puesta a
prueba ayuda efectivamente a memorizar mejor. Las respuestas se dan al final del libro.
1. TABLA 1
Resultados obtenidos de cuatro experimentos independientes de memoria
LA ESTADÍSTICA EN LA PRÁCTICA
Utilizar la estadística se parece bastante a utilizar una caja herramientas. Hay que hacer
algún trabajo y, para ello, es preciso elegir las herramientas adecuadas. Si su dentista tuviera un
talad entre sus instrumentos, usted alimentaria sin duda la esperanza de necesitar nunca un
empaste. Igualmente, se sorprenderla un tanto viera a un carpintero tratando de cortar un tablón
con un escalpelo, a un pintor enyesando una pared con una regla. En lugar de esos pintores,
carpinteros, dentistas y quienesquiera que necesiten he mientas para un trabajo determinado,
escogerán los instrumentos apropiados para ello. La conveniencia de un instrumento habrá
decidirse basándose en los materiales concretos que intervienen y el grado de precisión que se
pretende. Hay que pensar en la estadística en los mismos términos. El «trabajo» que
acometemos es el de describir sucesos y tratar de extraer conclusiones a partir de ellos: las
«herramientas» son las diversas técnicas estadísticas de las que dispone. Para aprobar los
exámenes de estadística hay que saber al sobre determinadas técnicas (las herramientas), y,
desde luego cómo utilizarlas.
Si se pregunta a un conductor cómo funciona el motor de coche, probablemente será capaz
de describir los principios básicos como nombrar y situar las partes principales. Sin embargo, es
poco probable que, ante una avería del motor que no sea sencilla, pueda identificar sus causas o
repararla. Una cosa parecida sucede con la mayoría de las personas que utilizan motores y
herramientas. Saben cómo utilizar el instrumento, cuándo utilizarlo y cuándo no: pero sólo
tienen una idea aproximada de cómo funciona efectivamente. Lo mismo sucede con la
estadística. Lo único que se exige es poseer una idea aproximada de cómo funcionan las
técnicas; el conocimiento más detallado de las mismas y su comprensión son competencia del
estadístico matemático. Al igual que los ingenieros, los estadísticos están constantemente
ideando nuevas técnicas y modificando las ya conocidas, y su pericia al respecto es lo que
trasciende a las muchas personas que utilizan técnicas estadísticas en su trabajo cotidiano. No se
espera de los propios trabajadores que comprendan al detalle cómo funcionan las herramientas
que utilizan, ni que las modifiquen o que las mejoren.
Existe otro aspecto en el que aprender estadística es también como ser un trabajador.
Aunque uno pueda informarse acerca de los aspectos teóricos de las técnicas estadísticas —las
utilizaciones de los tests, sus puntos fuertes y sus puntos débiles, etc.—, tal conocimiento no
será del todo completo si no incluye una cierta dosis de practica en el uso de los diversos
procedimientos. Así pues, es necesario practicar utilizando las herramientas. Con ello se
consiguen vanas cosas: un mejor aprendizaje y retención mediante el uso activo de la
información; una buena comprensión de los contextos en los que resulta adecuado el uso de
determinadas técnicas; conocimiento directo de los diversos problemas suscitados por las
técnicas estadísticas y el análisis de datos, y una comprensión de los principios en que se basan
las técnicas, a través de los distintos pasos en que se realiza el cálculo. Y al final, como extra, se
empieza a comprender que ¡hasta uno mismo puede hacer estadística! Es por estas razones por
lo que el presente texto incluye una buena cantidad de ejercicios.
Lo que debe comprender es que, para familiarizarse con los símbolos y sentirse a gusto con
ellos, hace falta reflexión y paciencia y tiempo y práctica... y más práctica todavía. Es del todo
factible que se adquiera un conocimiento operativo de la estadística sin saber demasiado de los
símbolos que pueden utilizarse para describir las "diversas operaciones aritméticas que
intervienen. En los programas de operaciones incluidos en este libro explicaré con palabras
como llevar a cabo los diversos procesos estadísticos, y mostraré que hay que hacer mediante
ejemplos resueltos. La idea es que el lector adquiera los conocimientos básicos a partir del texto.
En los programas he incluido también los símbolos necesarios para las diversas técnicas o
fórmulas, y ello por dos razones. En primer lugar, para que vi lector se vaya familiarizando con
ellos, aunque sólo sea vagamente; y, en segundo lugar, porque puede llegar el momento en que
encuentre realmente más cómodo trabajar a partir de los pasos estadísticos resumidos en una
única fórmula, en lugar de hacerlo a partir de una descripción verbal que puede suponer muchos
pasos intermedios. Por el momento, puede muy bien ser que el lector piense que su capacidad
nunca alcanzará alturas tan vertiginosas, pero todo lo que puedo decirle es que se sabe de una
supuesta «infinidad» de personas que han acabado por preferir los símbolos a las palabras.
Difícilmente puede decirse que la aritmética necesaria para la estadística sea como para
causar sobresaltos. Fundamentalmente, se necesita sumar, restar, multiplicar, utilizar paréntesis,
comprender qué significa elevar al cuadrado y saber qué es una raíz cuadrada. Por general, las
primeras páginas de los textos de introducción a la aritmética explican esas operaciones. Por
supuesto, las calculadoras pueden realizar todas esas operaciones en lugar de uno mismo, pero y
dos cosas a las que no pueden hacer frente. Las calculadoras no pueden pensar por uno, ni
tampoco pueden contar. La estadística implica tanto pensar como contar una y otra vez. ¡Lo
siento!
Sin duda el lector habrá cogido alguna vez un libro impreso en una lengua extranjera,
dándose en seguida cuenta de que no estaba escrito en una lengua que le fuera familiar, para
luego devolverlo a su estante y seguir buscando un libro que pudiera entender. Al mirar al
primer libro, ¿le entraron serias dudas acerca de su capacidad intelectual? ¿Y si vio escrito
?ٶٵ ڞ ۺ ݓ ۼۍ ڜ ڦ ٶ ٵ
¿Verdad que esos símbolos no le hacen sentirse inepto ni tampoco inculto? Inmediatamente se
da cuenta de que no entiende qué significan tales jeroglíficos (a no ser que últimamente haya
asistido a un curso nocturno de árabe): no le preocupan en absoluto. Consideremos ahora otro
lenguaje:
∑ 𝑑 2 −(∑ 𝑑)2 /𝑛
𝑡 =𝑑÷√
𝑛(𝑛−1)
Los símbolos matemáticos son como los que se utilizan en cualquier lenguaje. Representan
otra cosa – en este caso, operaciones con números – y, desde luego, si no se está familiarizado
con lo que representan, es imposible traducirlos. La pega está en que el dominio de otro idioma
requiere tiempo y esfuerzo y práctica continua; no obstante, eso es todo lo que se necesita para
dominar la notación matemática. No existe técnicas o intuiciones místicas que solo estén de
unos cuántos genios afortunados, mientras que a usted le son negadas. Las matemáticas son
como cualquier otra lengua; con trabajo y práctica, cualquiera puede adquirir un dominio
moderado de las mismas. Por desgracia, muchos profesores de matemáticas no valoran
adecuadamente el hecho de que están utilizando un idioma extranjero. Van hablando a una
velocidad más que regular y dejan perdido al alumno medio, simplemente porque el que enseña
(que habla el idioma desde hace años, si no son décadas) no se da cuenta de que el que aprende
necesita más tiempo para interpretar los símbolos. Cuanto más tiempo necesita el alumno o la
alumna para traducir más rezagado queda; y cuanto más rezagado, mayor es la cantidad de
nueva información que se le escapa y mayor el tiempo extra que necesita para traducir y pensar.
Por lo general, no se dispone de ese tiempo extra. Estoy segura de que se imaginan la situación.
Los pobres alumnos se van hundiendo lentamente en el lodo de la incomprensión, la frustración,
el miedo y, por fin, el odio a las matemáticas. El círculo se cierra cuando la persona se esfuerza
por evitar entrar en contacto con el tema y nos hacemos responsables de un nuevo caso de
incompetencia autorreconocida para las matemáticas. Es muy triste que tales «fracasados»
tiendan a culparse a sí mismos, en lugar de darse cuenta de que son personas suficientemente
inteligentes y competentes que han padecido, simplemente, un método de enseñanza desastroso.
¿Qué enseñanzas cabe, por tanto, extraer de este análisis de una situación por desgracia muy
corriente?
La primera es ésta: no se culpe usted mismo de las experiencias desagradables que haya
podido tener con las matemáticas en el pasado y trate, por el contrario, de olvidarlas y empezar
ahora de nuevo.
En otras palabras, deje de preocuparse y de pensar que es «negado» para las matemáticas. Si se
esfuerza y pone atención, también usted aprobará los exámenes de estadística.
En segundo lugar, si quiere tener éxito, ha de considerar las matemáticas como un lenguaje
y estar dispuesto a ejercitarse en ellas con continuidad. ¿Pretendería usted hacer progresos en
francés yendo a clase una vez por semana, dejando de hacer sus deberes y no hablando ni
oyendo hablar en ese idioma entre una clase y otra? Lo dudo. Sabe usted tan bien como yo que,
a media semana, seguramente habrá olvidado casi todo lo que aprendió en la clase anterior y
que, al inicio de la siguiente, estará luchando para volver a coger el ritmo. Lo mismo sucede con
las matemáticas. Si no práctica con suficiente regularidad, olvidara rápidamente de qué va todo
y siempre necesitará tiempo extra para traducir y pensar. Así que, por favor, trate de hacer
trabajos de estadística, la rama de las matemáticas central para este libro, con frecuencia.
Incluimos una buena cantidad de ejercicios que le ayudarán en este sentido. No los pase por alto
ni se conforme con echarles una mirada sin hacer ningún esfuerzo por resolverlos. No sólo le
proporcionarán una oportunidad para pensar acerca de nuevas técnicas y para aplicarlas, sino
que también le permitirán adquirir un mayor dominio de la nueva lengua.
Haría usted bien, asimismo, en seguir el consejo que, hace más de un siglo, daba el viejo
maestro de escuela Bartle Massey, en la novela de George Eliot Adam Rede. Cuando enseñaba a
hacer cuentas, instaba a sus alumnos a que, siempre que estuvieran ocupados en un trabajo
Pero aprender estadística no es exactamente lo mismo que aprender un idioma. Existe una
diferencia importarte a la que hay que prestar atención desde el principio Y es que la estadística
y las matemáticas hay que aprenderlas siguiendo un orden lógico. Si no puede asistir a una clase
de lengua porque está enfermo, y se pierde veinte palabras nuevas, no hay duda de que
experimentará alguna dificultad cuando, después, se encuentre con alguna de esas palabras o
necesite usarla. Con todo, esa pequeña laguna podrá llenarse con facilidad. Con los temas
matemáticos, las cosas sin embargo son algo distintas. Dado que están montados de manera
lógica, sucede que la posibilidad de aprender algo depende, por lo general, en gran medida o por
completo, de que se haya comprendido bien lo que le precede. No se pueden omitir trocitos y
confiar en seguir manteniéndose a flote, ni siquiera suponer que más adelante los aprenderá
rápidamente con facilidad. He aquí otra razón por la que muchos colegiales fracasan en
matemáticas. Luego de un periodo de inasistencia a clase —no necesariamente prolongado,
como en el caso de enfermedad, sino incluso breve—, el alumno debería recibir una enseñanza
suplementaria que reparase la pérdida. Es bien sabido que en la típica clase de hoy en día tal
atención a las necesidades individuales es imposible, y las consecuencias son el enorme número
de alumnos que acaban fracasando en matemáticas, y odiándolas incluso.
Así pues, cuando trabaje con este libro o reciba clases de estadística, por favor, asegúrese de que
comprende toda la información pertinente de un determinado nivel antes de seguir adelante con
temas más avanzados. Si no entiende alguna cosa, no se limite a pensar que ya empezará a
entenderlo con sólo prestar un poco más de la atención acostumbrada a lo que seguirá.
Invariablemente, lo que viene después le parecerá todavía peor, y así sucesivamente. Si se
encuentra con que tiene problemas de comprensión, intente descubrir en qué punto concreto se
ha dejado algo sin entender, vuelva a él y avance de nuevo desde allí, paso a paso y
asegurándose de que efectivamente lo entiende todo. Y acuérdese del dicho: «En caso de duda,
¡pregunte!».
He dicho que las matemáticas y la estadística son materias estructuradas de acuerdo con un
orden; quisiera ahora introducir una pequeña reserva y añadir que, en estadística, determinados
principios fundamentales sirven de base a casi todas las técnicas. Una vez establecidos dichos
principios, el orden que se siga al tratar los temas particulares no es demasiado importante. Al
principio de cada capítulo indicaré si algunos de los elementos expuestos previamente son
necesarios para una buena comprensión del nuevo tema, o bien si el capítulo puede leerse como
una unidad independiente. Por lo que se refiere a los símbolos, acostúmbrese a estudiarlos y
trate de utilizarlos siempre que pueda. De esta forma perderá poco a poco el miedo a la notación
matemática. En verdad, tengo la esperanza de que incluso lleguen a gustarle los aspectos
matemáticos de la materia incluida en este libro. Tenga cuidado, sin embargo, ante quien
confiesa tal gusto, porque disfrutar con la estadística es algo así como comer ortigas: da fama de
ser un bicho raro.
Ejercicio
2. Decidir qué clase de estadística, descriptiva o inductiva, es más adecuada en las
situaciones siguientes:
a) Un hombre decide comprarle un coche a un amigo, pero se da cuenta de que el precio está
por encima de su valor. Para convencer a su mujer de que la compra no es una completa locura,
investiga los precios de modelos similares en establecimientos locales que son caros. Consigue
los precios de diez coches que cree que le ayudarán en su argumentación. ¿Cómo presentará esta
«evidencia» a su mujer?
b) Unos niños están indecisos acerca de cuál de dos caminos es el más rápido para llegar a la
playa. Unas veces parece más rápido ir por uno, y otras veces por el otro. ¿Qué tipo de
estadística se necesita para decidir?
c) Entre semana hago régimen, y el final de semana me doy un atracón. El cambio total
semanal de mi peso es cero, pero se debe a que las pérdidas de cinco días se contrarrestan con el
incremento de dos días. ¿Cómo pueden resumirse los cambios de peso para que se haga
perceptible esta pauta?
d) Trato la mitad de mis tomateras con fertilizante <<Exhalación>>, y la otra mitad con
<<Brotepronto>>. Cuando han madurado, cuento el número de tomates que obtengo de cada
una. ¿Qué clase de estadística se necesitará para determinar si existe alguna diferencia entre
ambos tratamientos?
e) Romualdo Pastas posee una colección de libros de cierto valor, y decide asegurarla. Para
ello, necesita conocer el precio total de los libros. Como resulta demasiado engorroso valorar
cada libro por separado y calcular así el total, en lugar de ello calcula el valor de seis estantes
<<muestra>>, a partir de los cuales espera valorar los restantes libros. Sin embargo, desea que
la valoración sea la más correcta posible para que el seguro la cubra suficientemente. ¿Qué
estadística utilizará?