Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes
arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones,
ingresos, deudas, crditos y dems. Al instante de escuchar esa palabra, son estas las imgenes
que llegan a nuestra imaginacin.
La estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con
tanta antigedad como la escritura, y es por s misma auxiliar de todas las ciencias medicina,
ingeniera, sociologa, psicologa, economa, etctera, as como de los gobiernos, mercados y
otras actividades humanas.
La estadstica que conocemos hoy da debe gran parte de sus logros a los trabajos matemticos
de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri la
estadstica a las ciencias formales.
Desde los comienzos de la civilizacin han existido formas sencillas de estadsticas, pues ya se
utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes
de cuevas para contar el nmero de personas, animales y otras cosas.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron
emplear los recursos de la estadstica. Cada cinco aos llevaban a cabo un censo de la
trpoblacin, y los funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las
riquezas contenidas en las tierras conquistadas. En la poca del nacimiento de Cristo
suceda uno de estos empadronamientos de la poblacin bajo la autoridad del Imperio.
Durante los mil aos posteriores a la cada del Imperio Romano se hicieron muy pocas
operaciones estadsticas, con la notable excepcin de las relaciones de tierras pertenecientes
a la Iglesia, compiladas por Pipino el Breve y por Carlomagno en los aos 758 y 762,
respectivamente. En Francia se realizaron algunos censos parciales de siervos durante el
siglo IX.
Debido al temor que Enrique VII tena de la peste, en el ao 1532 empezaron a registrarse
en Inglaterra las defunciones causadas por esta enfermedad. En Francia, ms o menos por la
misma poca, la ley exiga a los clrigos registrar los bautismos, fallecimientos y
matrimonios.
Durante un brote de peste que apareci a fines del siglo XVI, el gobierno ingls comenz a
publicar estadsticas semanales de los decesos. Esa costumbre continu muchos aos, y en
1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenan datos sobre los
nacimientos y fallecimientos por sexo. En 1662, el capitn John Graunt compil
documentos que abarcaban treinta aos, mediante los cuales efectu predicciones sobre el
nmero de personas que moriran de diversas enfermedades, as como de las proporciones
de nacimientos de hombres y mujeres que caba esperar. El trabajo de Graunt, condensado
en su obra Natural and polit ical observations made upon the Bi lls of Mortality
(Observaciones polticas y naturaleshechas a partir de las Cuentas de Mortalidad), fue un
esfuerzo de inferencia y teora estadstica.
Alrededor del ao 1540, el alemn Sebastin Muster realiz una compilacin estadstica de
los recursos nacionales, que comprenda datos acerca de la organizacin poltica,
instrucciones sociales, comercio y podero militar. Durante el siglo XVII se aportaron
indicaciones ms concretas sobre los mtodos de observacin y anlisis cuantitativo y se
ampliaron los campos de la inferencia y la teora estadstica.
Los eruditos del siglo XVII demostraron especial inters por la estadstica demogrfica
como resultado de la especulacin sobre si la poblacin aumentaba, disminua o
permaneca esttica.
En los tiempos modernos, tales mtodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
pases. El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau.
Este investigador se propuso destruir la antigua creencia popular de que en los aos
terminados en 7 mora ms gente que en los restantes, y para lograrlo hurg pacientemente
en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin, pudo demostrar que en tales aos no fallecan
ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el
astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al
estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que
hoy utilizan todas las compaas de seguros.
Uno de los primeros trabajos sobre las probabilidades corresponde al matemtico italiano
del siglo XVI Girolano Cardano, aunque fue publicado 86 aos despus de su
fallecimiento. En el siglo XVII encontramos correspondencia relativa a la probabilidad en
los juegos de azar entre los matemticos franceses Blaise Pascal y Pierre de Fermat,
fundamentos sobre los que Chri stian Huygens, fsico, matemt ico y astrnomo dans,
publicara un libro en 1656. Durante ese mismo siglo y principios del XVIII, matemticos
como Bernoulli, Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No
obstante, durante cierto tiempo la teora de las probabilidades limit su aplicacin a los
juegos de azar, y no fue sino hasta el siglo siguiente que comenz a aplicarse a los grandes
problemas cientficos.
Jacques Qutelect es quien aplica la estadstica a las ciencias sociales. Interpret la teora
de la probabilidad para su uso en esas ciencias y aplic el principio de promedios y de la
variabi l idad a los fenmenos sociales. Qutelect fue el primero en efectuar la aplicacin
prctica de todo el mtodo estadstico entonces conocido a las diversas ramas de la ciencia.
Una vez sentadas las bases de la teora de probabilidades, podemos situar el nacimiento de
la estadstica moderna y su empleo en el anlisis de experimentos en los trabajos de Francis
Galton y Kurt Pearson. Este ltimo public en 1892 el libro The Grammar of Science (La
gramtica de la ciencia), un clsico en la filosofa de la ciencia, y fue l quien ide el
conocido test de Chi -cuadrado. El hijo de Pearson, Egon, y el matemt ico nacido en
Polonia Jerzy Neyman pueden considerarse los fundadores de las pruebas modernas de
contraste de hiptesis.
Pero es sin lugar a dudas Ronald Arnold Fisher la figura ms influyente de la estadstica,
pues la situ como una poderosa herramienta para la planeacin y anlisis de experimentos.
Contemporneo de Pearson, desarroll el anlisis de varianza y fue pionero en el desarrollo
de numerosas tcnicas de anlisis multivariante y en la introduccin del mtodo de mxima
verosimilitud para la estimacin de parmetros. Su libro Statistical Methods for Research
Workers (Mtodos estadsticos para los investigadores), publicado en 1925, ha sido
probablemente el libro de estadstica ms utilizado a lo largo de muchos aos.
Mientras tanto, en Rusia, una activa y fructfera escuela de matemticas y estadstica aport
asimismo como no poda ser de otro modo su considerable influencia. Desde finales del
siglo XVIII y comienzos del XIX cabe destacar las figuras de Pafnuty Chebichev y Andrei
Harkov, y posteriormente las de Alexander Khinchin y Andrey Kolmogorov.
En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los
fenmenos de las ciencias naturales y sociales, los investigadores vieron la necesidad de
reducir la informacin a valores numricos para evitar la ambigedad de las descripciones
verbales.
A continuacin se presenta una relacin cronolgica de diferentes sucesos que nos permiten
tener una idea general de la evolucin de la estadstica.
La estadstica y el nazismo
Tal y como qued dicho, R. A. Fisher constituye una figura capital en el desarrollo de la
estadstica moderna, y se puede incluso decir que es quizs
la ms importante e influyente; sin embargo, tambin existen zonas de sombra en su
importante trabajo. A raz de los descubrimientos de Charles Darwin sobre el mecanismo
hereditario de evolucin de las especies, surgi una nueva teora cientfica (?) denominada
e u g e n e s i a, trmino acuado por Francis Galton en 1883, quien era por cierto sobrino
de Darwin y descubridor de las huellas digitales.
Podramos definir la eugenesia como la ciencia que estudia cmo mejorar la raza humana,
proporcionando los mecanismos para que las caractersticas que se consideran como
mejores se desarrollen ms rpidamente que las inadecuadas. Se trata por tanto de dirigir de
forma cont rolada la seleccin natural . En cuanto escuchamos esta definicin, enseguida
nos viene a la mente el nazismo y sus teoras de superioridad de la raza aria, limpieza tnica
y dems.
Si efectuamos los clculos, el odds ratio es de 9.1, y dado que las tasas de cncer de pulmn
en la poblacin son bajas, puede interpretarse como un riesgo relativo de padecer cncer de
pulmn de los fumadores f rente a los no fumadores. El resultado es estadsticamente
significativo, con un nivel de confianza inferior a 0.001.
Sin embargo, estos trabajos recibieron numerosas y fuertes crticas de personalidades tan
respetadas como Joseph Berkson, estadstico principal de la Clnica Mayo. Incluso Jersy
Neyman puso objecciones. Pero quizs el principal paladn de esas crticas fue nada menos
que el gran R. A. Fisher, quien en 1958 public un ar tculo ti tulado Cigaret tes, cancer
and statistics en el Centennial Review, y dos artculos en la prestigiosa revista Nature
titulados Lung cancer and cigarettes y Cancer and smoking.
A medida que la evidencia se fue acumulando, tanto Berkson como Neyman fueron
cambiando de opinin, aunque Fisher permaneci irreductible en su posicin. Otro gran
estadstico, Jerome Cornfield, y cinco expertos ms del Nacional Cancer Institute, de la
American Cancer Sociaty y del Sloan-Kettering Institute, escribieron un artculo en 1959 en
el que se revisaban los diferentes trabajos publicados al respecto, as como las objeciones
que haban sido planteadas tanto por Fisher como por Berkson y Neyman y el propio
Tobacco Institute, demostrando la abrumadora evidencia a favor de la tesis de que el hbito
de fumar es una causa importante del aumento en la incidencia de
cncer de pulmn.
Historia de la Estadstica
La estadstica es una rama de las matemticas que se ocupa de reunir, organizar y analizar
datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la
toma de decisiones.
Historia
Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya
se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y
paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao
3000 a.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en
tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante
trueque.
Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de
construir las pirmides en el siglo XXXI a.C. Los libros bblicos de Nmeros y Crnicas
incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la
poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas.
En China existan registros numricos similares con anterioridad al ao 2000 a.C. Los
griegos clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a.C. para
cobrar impuestos.
El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la
poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media
slo se realizaron algunos censos exhaustivos en Europa.
Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios minuciosos
de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la
conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un
censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el
Domesday Book.
Mtodos estadsticos
Los estadsticos se enfrentan a un complejo problema cuando, por ejemplo, toman una
muestra para un sondeo de opinin o una encuesta electoral. El seleccionar una muestra
capaz de representar con exactitud las preferencias del total de la poblacin no es tarea
fcil.
Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un
conjunto de datos y modificarlo basndose en la experiencia. Por ejemplo, en los primeros
estudios sobre crecimiento de la poblacin los cambios en el nmero de habitantes se
predecan calculando la diferencia entre el nmero de nacimientos y el de fallecimientos en
un determinado lapso.
Debido a que el nmero de posibles nacimientos depende del nmero de mujeres, y no del
total de la poblacin, y debido a que las mujeres slo tienen hijos durante parte de su vida,
el dato ms importante que se ha de utilizar para predecir la poblacin es el nmero de
nios nacidos vivos por cada 1.000 mujeres en edad de procrear.
El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de
mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos slo es
til para indicar el crecimiento de poblacin en un determinado periodo de tiempo del
pasado, el nmero de nacimientos por cada 1.000 habitantes slo expresa la tasa de
crecimiento en el mismo periodo, y slo el nmero de nacimientos por cada 1.000 mujeres
en edad de procrear sirve para predecir el nmero de habitantes en el futuro.
Tipos de estadsticas
Estadstica Descriptiva
Cuando los estados nacionalistas empezaron a surgir durante ese perodo, fue necesario
obtener informacin acerca de los territorios bajo la jurisdiccin de cada nacin. Esta
necesidad de informacin numrica acerca de los ciudadanos y recursos lleva al desarrollo
de tcnicas para obtener y organizar datos numricos.
Hacia fines del siglo XVII, ya existan investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compaas de seguros empezaban a recopilar tablas de
mortalidad para determinar las primas de seguros de vida.
En definitiva, comprende aquellas tcnicas que se usan para resumir la informacin (largas
listas de valores) para proporcionar ndices simples y comprensibles y, por lo tanto, para
facilitar descripciones y comparaciones, hacindolo de la forma ms exacta posible.
Utilidad en variados
campos.
Por lo tanto, la estadstica descriptiva hace referencia, o se utiliza en las etapas 3, 4 y 5 del
mtodo cientfico (observacin, clasificacin y descripcin), y nicamente se limita a
realizar deducciones directamente a partir de los datos y parmetros obtenidos.
Estadstica Inferencial
Como resulta imposible examinar la poblacin entera de los fenmenos que estudiamos, la
construccin de leyes y teoras se tiene que apoyar en datos muestrales . A partir de unos
pocos datos conocidos (los de la muestra), se trata de obtener informacin de la poblacin
total, y esto lo hace apoyndose en el clculo de probabilidades, como hemos mencionado
anteriormente.
Fuentes Internet:
http://titulaciongeografia-
sevilla.es/web/contenidos/profesores/materiales/archivos/T1Variables.pdf
http://www.csi-
csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.p
df
http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin1/edin
1_f1.pdf
Medidas Estadsticas
En otras palabras, para que una calificacin tenga significado hay que contar con elementos
de referencia generalmente relacionados con ciertos criterios estadsticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo
el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se
ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos,
entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del
promedio de la clase.
Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el
puntaje central o tpico.
Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms
grupos.
La moda : que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se
representa Mo .
La media es considerada como la mejor medida de tendencia central, por las siguientes
razones:
Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que
las medianas y las modas de las distribuciones no se promedian.
Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable
por la frecuencia total . En palabras ms simples, corresponde a la suma de un conjunto de
datos dividida por el nmero total de dichos datos.
Ejemplo 1:
La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el
promedio .
Ejemplo 2:
Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor, por
lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia absoluta es
10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o
sea, cual se repite ms.
Ejemplo 1:
5, 7, 3, 3 , 7, 8, 3 , 5, 9, 5, 3 , 4, 3
Ejemplo 2:
En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto
de valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor
o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde
al nmero del caso que representa la mediana de la distribucin.
Ejemplo 1:
Ejemplo 3 :
lo cual significa que la mediana se ubica en la posicin intermedia entre los alumnos 25 y
26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:
puntaje alumnos
62 1
62 2
62 3
62 4
62 5
67 6
67 7
67 8
67 9
67 10
72 11
72 12
72 13
72 14
72 15
72 16
72 17
72 18
77 19
77 20
77 21
77 22
77 23
77 24
77 25
77 26
77 27
77 28
77 29
77 30
82 31
82 32
82 33
82 34
82 35
82 36
82 37
82 38
82 39
82 40
82 41
82 42
82 43
82 44
82 45
82 46
87 47
87 48
87 49
87 50
La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo
(alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron puntaje de 77 hacia arriba
(alumnos 26 hasta el 50 en el cuadro).
Pregunta 01_2005
Dados los pesos de 10 nios: 42 kg, 38 kg, 46 kg, 40 kg, 43 kg, 48 kg, 45 kg, 43 kg, 41 kg
y 39 kg. Cul(es) de las afirmaciones siguientes es(son) verdadera(s) ?
Alternativas
A) Slo I
B) Slo I y II
C) Slo I y III
D) Slo II y III
E) I, II y III
Comentario
Para determinar el valor de verdad de la primera afirmacin se debe recordar que la moda
de un conjunto de nmeros es el valor que ocurre con mayor frecuencia. En este caso, se
observa que el 43 es el valor que se repite dos veces y pasa a ser
el ms frecuente, por lo tanto, la afirmacin es verdadera.
Finalmente, la tercera afirmacin dice relacin con la mediana y la moda. Se sabe que la
mediana es el valor central de los datos, una vez ordenados de menor a mayor. Si el
nmero de datos es par, se toma el valor medio de los dos centrales. En este ejercicio hay
10 datos donde los valores centrales son 42 kg y 43 kg, luego la mediana es
Pregunta 03_2005
I) La mediana es 5.
II) La moda es 5.
Alternativas
A) Slo I
B) Slo II
C) Slo III
D) Slo II y III
E) I, II y III
Comentario:
Para responderla correctamente, el alumno debe tener claro el procedimiento para calcular
las medidas de tendencia central .
Para este problema, la mediana es el valor que se encuentra en la mitad de los datos una
vez ordenados de menor a mayor.
Para visualizar mejor este concepto, interpretamos los datos del grfico de la siguiente
manera:
Notas: 1, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7
En este caso el nmero total de nios es 15, por lo tanto, el valor de la mediana debe
corresponder a la octava nota que es el 5.
La moda es el valor que ms se repite en una distribucin, en este caso, es la nota 5,0,
porque la obtuvieron un mayor nmero de nios, que fue 4.
Luego la clave es E .
Esta pregunta result difcil para el grupo que rindi esta prueba y la omiti la tercera parte
de ellos.
Pregunta 05_2005
Veinte nmeros tienen un promedio de 20; doce de los nmeros tienen un promedio de 8.
Cul es el promedio de los otros ocho nmeros?
A) 12
B) 38
C) 62
D) 28
Comentario:
Esta pregunta result muy difcil y la omiti casi la mitad de los alumnos que la abordaron.
El distractor A fue elegido por aquellos alumnos que dicen que, como el promedio de los
doce nmeros restantes es 8, el promedio de los ocho nmeros que se piden debe ser la
diferencia que es de 12, sin realizar clculo alguno.
Pregunta 03_2006
La tabla adjunta
muestra las edades de 220 alumnos de un colegio. Cul(es) de las siguientes afirmaciones
es(son) verdadera(s)?
I) La moda es 17 aos.
Alternativas
A) Slo I
B) Slo II
C) Slo I y III
D) Slo II y III
E) I, II y III
Comentario
Debe recordar que la moda es la medida de mayor frecuencia (el valor que ms se repite),
en este caso, segn la tabla, la mayor frecuencia de alumnos es 60 y corresponde a los de 17
aos, por lo tanto I) es verdadera .
La mediana es el valor de la variable que queda en el punto medio de una serie, despus de
que las medidas o puntajes que la integran han sido colocados en orden segn su magnitud.
En otros trminos, la mediana es el valor por encima y por debajo del cual queda el 50 por
ciento de los casos.
Luego, la mediana es mayor que el promedio (17 es mayor que 16,8), por lo que II) es
verdadera .
Los alumnos son 220 y los que tienen 17 18 aos corresponden a la suma de los alumnos
de estas edades; es decir, 110, que corresponde a la mitad del total, por lo que la III) es
verdadera.
El 46 por ciento de las personas abordaron la pregunta en forma correcta y la omiti casi la
cuarta parte (24 por ciento).
Pregunta 04_2006
El grfico siguiente
Alternativas
A) 4 y 5
B) 5 y 5
C) 4,1 y 4
D) 4,1 y 5
E) 4 y 4,5
Comentario
Para su resolucin, el estudiante debe tener claro el concepto de mediana y moda , que son
medidas de tendencia central y luego comprender la informacin entregada en el grfico
de la figura y hacer un reordenamiento de la informacin.
Por el grfico, la frecuencia mayor de estudiantes es 15, que est asociada a la nota 5, por
lo tanto, esa es la moda .
Para determinar la mediana , podemos proceder igual que en el ejercicio anterior; es decir,
confeccionamos una tabla de la siguiente manera:
La contest correctamente el 32,3 por ciento de la poblacin y la omisin fue alta: 44,8 por
ciento.
Pregunta 05_2006
Alternativas
A) Slo I
B) Slo II
C) Slo I y II
D) Slo II y III
E) I, II y III
Comentario
La frecuencia relativa del grupo de ftbol es, por lo tanto, , la que expresada
en porcentaje es 40% , por lo que I) es verdadera .
La frecuencia relativa del grupo de bsquetbol es , que corresponde a 30%,
luego se confirma la veracidad de la afirmacin II).
Como la mitad del grupo total es 15 y 15 de ellos no eligieron ni ftbol ni tenis, pues
eligieron o bsquetbol o atletismo, la III) tambin es verdadera.
La pregunta result de mediana dificultad, pues la contest bien el 45 por ciento de los
alumnos y la omisin fue del 26,8 por ciento, lo cual indica que un nmero apreciable de
alumnos no conoce el trmino frecuencia relativa o no se ha familiarizado con el grfico
circular.
http://www.profesorenlinea.cl/PSU/Matematica/Estadistica/Pregunta%2005_2006.html