Sei sulla pagina 1di 29

Historia de la estadstica

La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes
arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones,
ingresos, deudas, crditos y dems. Al instante de escuchar esa palabra, son estas las imgenes
que llegan a nuestra imaginacin.

La estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con
tanta antigedad como la escritura, y es por s misma auxiliar de todas las ciencias medicina,
ingeniera, sociologa, psicologa, economa, etctera, as como de los gobiernos, mercados y
otras actividades humanas.

En la actualidad, la estadstica ocupa un lugar de gran importancia en la investigacin y en la


prctica mdica. En los estudios de medicina de cualquier pas se incluyen varias asignaturas
dedicadas a la estadstica; es difcil, por no decir imposible, que un trabajo de investigacin sea
aceptado por una revista mdica sin que sus autores hayan utilizado tcnicas y conceptos
estadsticos en su planteamiento y en el anlisis de los datos.

La estadstica que conocemos hoy da debe gran parte de sus logros a los trabajos matemticos
de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri la
estadstica a las ciencias formales.

Desde los comienzos de la civilizacin han existido formas sencillas de estadsticas, pues ya se
utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes
de cuevas para contar el nmero de personas, animales y otras cosas.

Hacia el ao 3000 a. de C. los babilonios utilizaban ya pequeas tablillas de arcilla para


recopilar datos sobre la produccin agrcola y los gneros vendidos o cambiados mediante
trueque. En el antiguo Egipto, los faraones
lograron recopilar, alrededor del ao 3050 a. de C., prolijos datos relativos a la poblacin y
la riqueza del pas; de acuerdo con el historiador
griego Herdoto, dicho registro de la riqueza y la poblacin se hizo con el propsito de
preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de
las tierras con el objeto de verificar un nuevo reparto.

En el antiguo Israel, la Biblia da referencia, en el libro de los N m e r o s, de los datos


estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey David, por otra parte,
orden a Joab, general del ejrcito, hacer un censo de Israel con la finalidad de conocer el
nmero de habitantes, y el l ibro C r n i c a s describe el bienestar material de las diversas
tribus judas.

En China ya haba registros numricos similares con anterioridad al ao 2000 a. de C. Los


griegos, hacia el ao 594 a. de C., efectuaron censos peridicamente con fines tributarios,
sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La
investigacin histrica revela que se realizaron 69 censos para calcular los impuestos,
determinar los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron
emplear los recursos de la estadstica. Cada cinco aos llevaban a cabo un censo de la
trpoblacin, y los funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las
riquezas contenidas en las tierras conquistadas. En la poca del nacimiento de Cristo
suceda uno de estos empadronamientos de la poblacin bajo la autoridad del Imperio.

Durante los mil aos posteriores a la cada del Imperio Romano se hicieron muy pocas
operaciones estadsticas, con la notable excepcin de las relaciones de tierras pertenecientes
a la Iglesia, compiladas por Pipino el Breve y por Carlomagno en los aos 758 y 762,
respectivamente. En Francia se realizaron algunos censos parciales de siervos durante el
siglo IX.

Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I encarg un


censo en el ao 1086. La informacin en l obtenida se recoge en el Domesday Book, o
Libro del Gran Catastro, que es un documento acerca de la propiedad, la extensin y el
valor de las tierras en Inglaterra. Esta obra fue el primer compendio estadstico de ese pas.

Aunque Car lomagno en Francia y Guillermo el Conquistador en Inglaterra trataron de


revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la
Edad Media. Durante los siglos XV, XVI y XVII, hombres como Leonardo de Vinci,
Nicols Coprnico, Galileo Galilei, William Harvey, Francis Bacon y Ren Descartes
hicieron grandes operaciones con base en el mtodo cientfico, de tal forma que cuando se
crearon los Estados nacionales y surgi como fuerza el comercio
internacional, haba ya un mtodo capaz de aplicarse a los datos econmicos.

Debido al temor que Enrique VII tena de la peste, en el ao 1532 empezaron a registrarse
en Inglaterra las defunciones causadas por esta enfermedad. En Francia, ms o menos por la
misma poca, la ley exiga a los clrigos registrar los bautismos, fallecimientos y
matrimonios.

Durante un brote de peste que apareci a fines del siglo XVI, el gobierno ingls comenz a
publicar estadsticas semanales de los decesos. Esa costumbre continu muchos aos, y en
1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenan datos sobre los
nacimientos y fallecimientos por sexo. En 1662, el capitn John Graunt compil
documentos que abarcaban treinta aos, mediante los cuales efectu predicciones sobre el
nmero de personas que moriran de diversas enfermedades, as como de las proporciones
de nacimientos de hombres y mujeres que caba esperar. El trabajo de Graunt, condensado
en su obra Natural and polit ical observations made upon the Bi lls of Mortality
(Observaciones polticas y naturaleshechas a partir de las Cuentas de Mortalidad), fue un
esfuerzo de inferencia y teora estadstica.

Alrededor del ao 1540, el alemn Sebastin Muster realiz una compilacin estadstica de
los recursos nacionales, que comprenda datos acerca de la organizacin poltica,
instrucciones sociales, comercio y podero militar. Durante el siglo XVII se aportaron
indicaciones ms concretas sobre los mtodos de observacin y anlisis cuantitativo y se
ampliaron los campos de la inferencia y la teora estadstica.
Los eruditos del siglo XVII demostraron especial inters por la estadstica demogrfica
como resultado de la especulacin sobre si la poblacin aumentaba, disminua o
permaneca esttica.

En los tiempos modernos, tales mtodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
pases. El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau.
Este investigador se propuso destruir la antigua creencia popular de que en los aos
terminados en 7 mora ms gente que en los restantes, y para lograrlo hurg pacientemente
en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin, pudo demostrar que en tales aos no fallecan
ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el
astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al
estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que
hoy utilizan todas las compaas de seguros.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra


estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn,
que los datos de la nueva ciencia
seran el aliado ms eficaz del gobernante consciente. La raz remota de la palabra se halla
en el trmino latino s t a t u s, que significa estado osituacin. Esta etimologa aumenta
el valor intrnseco de la palabra por cuanto que la estadstica revela el sentido cuantitativo
de las ms variadas situaciones.

Uno de los primeros trabajos sobre las probabilidades corresponde al matemtico italiano
del siglo XVI Girolano Cardano, aunque fue publicado 86 aos despus de su
fallecimiento. En el siglo XVII encontramos correspondencia relativa a la probabilidad en
los juegos de azar entre los matemticos franceses Blaise Pascal y Pierre de Fermat,
fundamentos sobre los que Chri stian Huygens, fsico, matemt ico y astrnomo dans,
publicara un libro en 1656. Durante ese mismo siglo y principios del XVIII, matemticos
como Bernoulli, Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No
obstante, durante cierto tiempo la teora de las probabilidades limit su aplicacin a los
juegos de azar, y no fue sino hasta el siglo siguiente que comenz a aplicarse a los grandes
problemas cientficos.

Durante el sigo XVIII empieza el auge de la estadstica descriptiva en asuntos sociales y


econmicos, y es a finales de ese siglo y comienzos del XIX cuando se comienzan a asentar
verdaderamente las bases tericas de la teora de probabilidades con los trabajos de Joseph
Louis Lagrange y Pierre Simon de Laplace, del brillantsimo y ubicuo matemtico y
astrnomo alemn Carl Friedrich Gauss, y de Simen-Denis Poisson. Previamente, cabe
destacar el descubrimiento de la distribucin normal por Abraham de Moivre, distribucin
que ser posteriormente redescubierta por Gauss y Poisson.

Jacques Qutelect es quien aplica la estadstica a las ciencias sociales. Interpret la teora
de la probabilidad para su uso en esas ciencias y aplic el principio de promedios y de la
variabi l idad a los fenmenos sociales. Qutelect fue el primero en efectuar la aplicacin
prctica de todo el mtodo estadstico entonces conocido a las diversas ramas de la ciencia.

En el periodo de 1800 a 1820 se desarrollaron dos conceptos matemticos fundamentales


para la teora estadstica: la teora de los errores de observacin, aportada por Laplace y
Gauss, y la teora de los mnimos cuadrados, realizada por Laplace, Gauss y Legendre. A
finales del siglo XIX, Sir Francis Galton ide el mtodo conocido como c o r r e l a c i n,
que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu
parti el desarrollo del coeficiente de correlacin creado por Karl Pearson y otros
cultivadores de la ciencia biomtrica, tales como J. Pease Norton, R. H. Hooker y G. Udny
Yule, que efectuaron amplios estudios sobre la medida de las relaciones.

Una vez sentadas las bases de la teora de probabilidades, podemos situar el nacimiento de
la estadstica moderna y su empleo en el anlisis de experimentos en los trabajos de Francis
Galton y Kurt Pearson. Este ltimo public en 1892 el libro The Grammar of Science (La
gramtica de la ciencia), un clsico en la filosofa de la ciencia, y fue l quien ide el
conocido test de Chi -cuadrado. El hijo de Pearson, Egon, y el matemt ico nacido en
Polonia Jerzy Neyman pueden considerarse los fundadores de las pruebas modernas de
contraste de hiptesis.

Pero es sin lugar a dudas Ronald Arnold Fisher la figura ms influyente de la estadstica,
pues la situ como una poderosa herramienta para la planeacin y anlisis de experimentos.
Contemporneo de Pearson, desarroll el anlisis de varianza y fue pionero en el desarrollo
de numerosas tcnicas de anlisis multivariante y en la introduccin del mtodo de mxima
verosimilitud para la estimacin de parmetros. Su libro Statistical Methods for Research
Workers (Mtodos estadsticos para los investigadores), publicado en 1925, ha sido
probablemente el libro de estadstica ms utilizado a lo largo de muchos aos.

Mientras tanto, en Rusia, una activa y fructfera escuela de matemticas y estadstica aport
asimismo como no poda ser de otro modo su considerable influencia. Desde finales del
siglo XVIII y comienzos del XIX cabe destacar las figuras de Pafnuty Chebichev y Andrei
Harkov, y posteriormente las de Alexander Khinchin y Andrey Kolmogorov.

En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los
fenmenos de las ciencias naturales y sociales, los investigadores vieron la necesidad de
reducir la informacin a valores numricos para evitar la ambigedad de las descripciones
verbales.

En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con


exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y
fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en
interpretar esa informacin.

El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de


la estadstica. Muchos conjuntos de datos se pueden estudiar con gran exactitud utilizando
determinadas distribuciones probabilsticas. La probabilidad es til para comprobar la
fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos
necesarios en un determinado estudio estadstico.

Sucesos de inters en el desarrollo de la estadstica

A continuacin se presenta una relacin cronolgica de diferentes sucesos que nos permiten
tener una idea general de la evolucin de la estadstica.

Dos hechos contradictorios en la historia de la estadstica

La estadstica y el nazismo
Tal y como qued dicho, R. A. Fisher constituye una figura capital en el desarrollo de la
estadstica moderna, y se puede incluso decir que es quizs
la ms importante e influyente; sin embargo, tambin existen zonas de sombra en su
importante trabajo. A raz de los descubrimientos de Charles Darwin sobre el mecanismo
hereditario de evolucin de las especies, surgi una nueva teora cientfica (?) denominada
e u g e n e s i a, trmino acuado por Francis Galton en 1883, quien era por cierto sobrino
de Darwin y descubridor de las huellas digitales.

Podramos definir la eugenesia como la ciencia que estudia cmo mejorar la raza humana,
proporcionando los mecanismos para que las caractersticas que se consideran como
mejores se desarrollen ms rpidamente que las inadecuadas. Se trata por tanto de dirigir de
forma cont rolada la seleccin natural . En cuanto escuchamos esta definicin, enseguida
nos viene a la mente el nazismo y sus teoras de superioridad de la raza aria, limpieza tnica
y dems.

Desgraciadamente, no slo muchos matemticos sino tambin un gran nmero de


cientficos de otras especialidades fueron defensores de las teoras eugensicas. La lista de
los cientficos que, al menos inicialmente, prestaron su apoyo a dicha teor a es
lamentablemente muy grande. Ent re los estadsticos hallamos a Galton, a Pearson y sobre
todo a Fisher.

En 1933, el gobierno alemn, presidido por Hitler, promulg la ley de esterilizacin


eugensica, que puede considerar se ya como el antec edente de los ex terminios
perpetrados en los campos de concentracin y de las atrocidades cometidas en nombre de
una supuesta experimentacin mdica en dichos campos.

Aunque en 1930 Huxley, Haldane, Hogben, Jennings y otros bilogos renombrados


comenzaron a reaccionar en contra de lo descabellado de muchas ideas propugnadas por la
eugenesia, ya era demasiado tarde puesto que dichas ideas haban logrado difusin e
importancia, y no slo en los regmenes fascistas europeos: un importante bilogo
americano, Charles Davenport, financiado por la Carnegie Foundation, cre el Eugenics
Record Office en 1910, y miles de americanos llenaron un registro de rasgos familiares,
que era una especie de pedi-greefamiliar.

Y fumar, produce cncer?

Hacia 1920 se observ un gran incremento de los fallecimientos debidos al cncer


pulmonar. Aunque haba trabajos previos sobre la posible relacin entre el hbito de fumar
y el cncer de pulmn, como los de Lombard y Doering (1928) y Mller (1939), no ser
sino hasta la dcada de los cincuenta con los trabajos de Wynder y Graham (1950) y sobre
todo de Doll y Hill (1952 y 1959) que la cuestin cobrar verdadero inters e incluso
propiciar agrios debates en la opinin pblica. Este ltimo trabajo, publicado en el British
Medical Journal, es un estudio de casoscontroles, donde los casos eran los pacientes que
haban ingresado en ciertos hospi tales con diagnstico de cncer de pulmn, mientras que
los controles eran pacientes cuyo ingreso se deba a otras causas. A ambos tipos de
pacientes se le interrogaba sobre sus hbitos de fumar tabaco, de inhalar otros gases y otros
posibles agentes etiolgicos. Las encuestas fueron efectuadas por personal ciego, en el
sentido de que desconoca el propsito del trabajo. El resultado fue que los casos y los
controles tenan una exposicin similar a todos los posibles factores de riesgo, salvo el
tabaco, con los siguientes resultados:

Si efectuamos los clculos, el odds ratio es de 9.1, y dado que las tasas de cncer de pulmn
en la poblacin son bajas, puede interpretarse como un riesgo relativo de padecer cncer de
pulmn de los fumadores f rente a los no fumadores. El resultado es estadsticamente
significativo, con un nivel de confianza inferior a 0.001.

Sin embargo, estos trabajos recibieron numerosas y fuertes crticas de personalidades tan
respetadas como Joseph Berkson, estadstico principal de la Clnica Mayo. Incluso Jersy
Neyman puso objecciones. Pero quizs el principal paladn de esas crticas fue nada menos
que el gran R. A. Fisher, quien en 1958 public un ar tculo ti tulado Cigaret tes, cancer
and statistics en el Centennial Review, y dos artculos en la prestigiosa revista Nature
titulados Lung cancer and cigarettes y Cancer and smoking.

En 1954, Doll y Hill comenzaron un estudio prospectivo, de cohortes, en el que se


efectuaba un seguimiento de mdicos britnicos y se estudiaba la posible asociacin entre
las tasas de mortalidad y el hbito de fumar tabaco, que corrobor no slo los resultados
anteriores sino tambin una mortalidad ms rpida debida tambin a ot ras causas
fundamentalmente enfermedades coronarias entre los fumadores.

A medida que la evidencia se fue acumulando, tanto Berkson como Neyman fueron
cambiando de opinin, aunque Fisher permaneci irreductible en su posicin. Otro gran
estadstico, Jerome Cornfield, y cinco expertos ms del Nacional Cancer Institute, de la
American Cancer Sociaty y del Sloan-Kettering Institute, escribieron un artculo en 1959 en
el que se revisaban los diferentes trabajos publicados al respecto, as como las objeciones
que haban sido planteadas tanto por Fisher como por Berkson y Neyman y el propio
Tobacco Institute, demostrando la abrumadora evidencia a favor de la tesis de que el hbito
de fumar es una causa importante del aumento en la incidencia de
cncer de pulmn.

Para el lector interesado

Freedman, D. (1999). From association to causation: some remarks on the


history of statistics. Berkeley, CA: University of California Press.
Hacking, I. (1990). The taming of chance. Cambridge, MA: Cambridge
University Press.
Salsburg, D. (2002). The Lady Tasting Tea. How statistics revolutionized
science in the twentieth century ( 2n d rev. ed.). New York: Owl
Books.
Stigler, S. M. (2002). Statistics on the table: The history of statistical con -
cepts and methods. Cambridge, MA: Harvard University Press.

Historia de la Estadstica

La estadstica es una rama de las matemticas que se ocupa de reunir, organizar y analizar
datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la
toma de decisiones.

Historia

Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya
se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y
paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao
3000 a.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en
tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante
trueque.

Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de
construir las pirmides en el siglo XXXI a.C. Los libros bblicos de Nmeros y Crnicas
incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la
poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas.
En China existan registros numricos similares con anterioridad al ao 2000 a.C. Los
griegos clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a.C. para
cobrar impuestos.

El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la
poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media
slo se realizaron algunos censos exhaustivos en Europa.

Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios minuciosos
de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la
conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un
censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el
Domesday Book.

El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI,


y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations
on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania,
realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la
primera tabla de mortalidad
En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los
fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de
reducir la informacin a valores numricos para evitar la ambigedad de las descripciones
verbales.

En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con


exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y
fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el
proceso de interpretacin de esa informacin.

El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de


la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden
utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad
de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadstico.

Mtodos estadsticos

La materia prima de la estadstica consiste en conjuntos de nmeros obtenidos al contar o


medir cosas. Al recopilar datos estadsticos se ha de tener especial cuidado para garantizar
que la informacin sea completa y correcta.

El primer problema para los estadsticos reside en determinar qu informacin y cunta se


ha de reunir. En realidad, la dificultad al compilar un censo est en obtener el nmero de
habitantes de forma completa y exacta; de la misma manera que un fsico que quiere contar
el nmero de colisiones por segundo entre las molculas de un gas debe empezar
determinando con precisin la naturaleza de los objetos a contar.

Los estadsticos se enfrentan a un complejo problema cuando, por ejemplo, toman una
muestra para un sondeo de opinin o una encuesta electoral. El seleccionar una muestra
capaz de representar con exactitud las preferencias del total de la poblacin no es tarea
fcil.

Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un
conjunto de datos y modificarlo basndose en la experiencia. Por ejemplo, en los primeros
estudios sobre crecimiento de la poblacin los cambios en el nmero de habitantes se
predecan calculando la diferencia entre el nmero de nacimientos y el de fallecimientos en
un determinado lapso.

Los expertos en estudios de poblacin comprobaron que la tasa de crecimiento depende


slo del nmero de nacimientos, sin que el nmero de defunciones tenga importancia. Por
tanto, el futuro crecimiento de la poblacin se empez a calcular basndose en el nmero
anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta de
que las predicciones obtenidas utilizando este mtodo no daban resultados correctos. Los
estadsticos comprobaron que hay otros factores que limitan el crecimiento de la poblacin.

Debido a que el nmero de posibles nacimientos depende del nmero de mujeres, y no del
total de la poblacin, y debido a que las mujeres slo tienen hijos durante parte de su vida,
el dato ms importante que se ha de utilizar para predecir la poblacin es el nmero de
nios nacidos vivos por cada 1.000 mujeres en edad de procrear.

El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de
mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos slo es
til para indicar el crecimiento de poblacin en un determinado periodo de tiempo del
pasado, el nmero de nacimientos por cada 1.000 habitantes slo expresa la tasa de
crecimiento en el mismo periodo, y slo el nmero de nacimientos por cada 1.000 mujeres
en edad de procrear sirve para predecir el nmero de habitantes en el futuro.
Tipos de estadsticas

De modo simple, la Estadstica es una coleccin de datos numricos que, referidos a un


colectivo, permiten la representacin y anlisis del mismo.

Representado y analizado un colectivo es posible inferir generalizaciones acerca de este.

Como se desprende de la definicin anterior, la Estadstica como disciplina o rea de


estudio comprende tanto tcnicas descriptivas como inferenciales. Incluye la observacin y
tratamiento de datos numricos y el empleo de los datos estadsticos con fines inferenciales.

Por estas caractersticas, para su estudio se clasifica de la siguiente forma: Estadstica


Descriptiva y Estadstica Inferencial

Estadstica Descriptiva

El origen de la Estadstica descriptiva puede relacionarse con el inters por mantener


registros gubernamentales hacia fines de la Edad Media .

Cuando los estados nacionalistas empezaron a surgir durante ese perodo, fue necesario
obtener informacin acerca de los territorios bajo la jurisdiccin de cada nacin. Esta
necesidad de informacin numrica acerca de los ciudadanos y recursos lleva al desarrollo
de tcnicas para obtener y organizar datos numricos.

Hacia fines del siglo XVII, ya existan investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compaas de seguros empezaban a recopilar tablas de
mortalidad para determinar las primas de seguros de vida.

En las primeras etapas de desarrollo, la estadstica inclua poco ms que la obtencin,


clasificacin y presentacin de datos numricos. An hoy en da, estas actividades siguen
siendo una parte importante de la Estadstica.

(Ver: Historia de la estadstica ).

La estadstica descriptiva o deductiva trata del recuento, ordenacin y clasificacin de los


datos obtenidos en las observaciones. Para que la mente pueda interpretar datos muy
numerosos, es preciso resumirlos o reducirlos. La estadstica descriptiva sirve como
herramienta o instrumento para describir, resumir o reducir las propiedades de un conjunto
de datos para que se puedan manejar.

En definitiva, comprende aquellas tcnicas que se usan para resumir la informacin (largas
listas de valores) para proporcionar ndices simples y comprensibles y, por lo tanto, para
facilitar descripciones y comparaciones, hacindolo de la forma ms exacta posible.
Utilidad en variados
campos.

Para reducir la informacin se construyen tablas, se representan grficos y se calculan


parmetros estadsticos que caracterizan la distribucin, de esta forma se simplifica la
complejidad de todos los datos que intervienen en la distribucin.

Por lo tanto, la estadstica descriptiva hace referencia, o se utiliza en las etapas 3, 4 y 5 del
mtodo cientfico (observacin, clasificacin y descripcin), y nicamente se limita a
realizar deducciones directamente a partir de los datos y parmetros obtenidos.

La Estadstica Descriptiva es el estudio que incluye la obtencin, organizacin,


presentacin y descripcin de informacin numrica.

Estadstica Inferencial

Por su parte, la estadstica inferencial o inductiva trata de llegar a conclusiones que


sobrepasan el alcance de los datos analizados; es decir, se trata de tcnicas que se emplean
para inferir o deducir caractersticas desconocidas a partir de un conjunto de datos
conocidos, apoyndose fundamentalmente en el clculo de probabilidades.
La cuantificacin permite inferir informacin
adicional.

Como resulta imposible examinar la poblacin entera de los fenmenos que estudiamos, la
construccin de leyes y teoras se tiene que apoyar en datos muestrales . A partir de unos
pocos datos conocidos (los de la muestra), se trata de obtener informacin de la poblacin
total, y esto lo hace apoyndose en el clculo de probabilidades, como hemos mencionado
anteriormente.

Uno de los principales objetivos de la estadstica inferencial es estimar las propiedades de


una poblacin a partir del conocimiento de slo una muestra de ella.

La estadstica inferencial se basa por lo tanto en la estadstica descriptiva, ya que la


inferencia o deduccin de las propiedades de la poblacin entera se deriva de las
caractersticas de la muestra que es analizada con las tcnicas de la estadstica descriptiva
. En realidad su campo de accin es ms amplio.

La inferencia estadstica es una tcnica mediante la cual se obtienen generalizaciones


o se toman decisiones en base a una informacin parcial o completa obtenida
mediante tcnicas descriptivas.

Fuentes Internet:

http://titulaciongeografia-
sevilla.es/web/contenidos/profesores/materiales/archivos/T1Variables.pdf

http://www.csi-
csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.p
df

http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin1/edin
1_f1.pdf
Medidas Estadsticas

Medidas de tendencia central: Media, Mediana, Moda

Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica.


Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el
total de puntos que obtiene una persona promedio al participar en esa prueba, saber cul es
la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones.

En otras palabras, para que una calificacin tenga significado hay que contar con elementos
de referencia generalmente relacionados con ciertos criterios estadsticos.

El promedio de notas es muy


importante.

Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.

Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo
el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se
ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos,
entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del
promedio de la clase.

En resumen, el propsito de las medidas de tendencia central es:

Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.

Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el
puntaje central o tpico.

Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms
grupos.

Las medidas de tendencia central ms comunes son:

La media aritmtica : comnmente conocida como media o promedio . Se representa por


medio de una letra M o por una X con una lnea en la parte superior.

La mediana : la cual es el puntaje que se ubica en el centro de una distribucin. Se


representa como Md .

La moda : que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se
representa Mo .

La media, el mejor dato.

De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms


til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy
bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la
moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores
extremos).

La media es considerada como la mejor medida de tendencia central, por las siguientes
razones:

Los puntajes contribuyen de manera proporcional al hacer el cmputo de la media.

Es la medida de tendencia central ms conocida y utilizada.

Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que
las medianas y las modas de las distribuciones no se promedian.

La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la


mediana y la moda en muy pocos casos.

Cmo calcular, la media, la moda y la mediana


Media aritmtica o promedio

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable
por la frecuencia total . En palabras ms simples, corresponde a la suma de un conjunto de
datos dividida por el nmero total de dichos datos.

Ejemplo 1:

En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3

n = 6 (nmero total de datos)

La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el
promedio .

Ejemplo 2:

Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de frecuencias


y luego calcular la media aritmtica. El siguiente cuadro con las medidas de 63 varas de
pino lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta


5 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54
Frecuencia total = 63 430

Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor, por
lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia absoluta es
10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o
sea, cual se repite ms.

Ejemplo 1:

Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de


nias de un Jardn Infantil.

5, 7, 3, 3 , 7, 8, 3 , 5, 9, 5, 3 , 4, 3

La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 2:

20, 12, 14, 23, 78, 56, 96

En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto
de valores no tiene moda.

Mediana (Med)

Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor
o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde
al nmero del caso que representa la mediana de la distribucin.

Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente.


Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de valores
antes y despus de l en un conjunto de datos agrupados.

Segn el nmero de valores que se tengan se pueden presentar dos casos:

Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho


conjunto de datos.

Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores


centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:

Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5 , 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.


Ejemplo 2:

El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a menor, y


corresponde a un conjunto de valores pares, por lo tanto, la Med ser el promedio de los
valores centrales.

21, 19, 18, 15, 13, 11 , 10, 9, 5, 3

Ejemplo 3 :

Interpretando el grfico de barras podemos deducir que:

5 alumnos obtienen puntaje de 62

5 alumnos obtienen puntaje de 67

8 alumnos obtienen puntaje de 72

12 alumnos obtienen puntaje de 77

16 alumnos obtienen puntaje de 82

4 alumnos obtienen puntaje de 87


lo que hace un total de 50 alumnos

Sabemos que la mediana se obtiene haciendo

lo cual significa que la mediana se ubica en la posicin intermedia entre los alumnos 25 y
26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:

puntaje alumnos
62 1
62 2
62 3
62 4
62 5
67 6
67 7
67 8
67 9
67 10
72 11
72 12
72 13
72 14
72 15
72 16
72 17
72 18
77 19
77 20
77 21
77 22
77 23
77 24
77 25
77 26
77 27
77 28
77 29
77 30
82 31
82 32
82 33
82 34
82 35
82 36
82 37
82 38
82 39
82 40
82 41
82 42
82 43
82 44
82 45
82 46
87 47
87 48
87 49
87 50

El alumno 25 obtuvo puntaje de 77

El alumno 26 obtuvo puntaje de 77

Entonces, como el total de alumnos es par debemos promediar esos puntajes:

La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo
(alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron puntaje de 77 hacia arriba
(alumnos 26 hasta el 50 en el cuadro).

PSU: Estadstica y Probabilidades

Pregunta 01_2005

Dados los pesos de 10 nios: 42 kg, 38 kg, 46 kg, 40 kg, 43 kg, 48 kg, 45 kg, 43 kg, 41 kg
y 39 kg. Cul(es) de las afirmaciones siguientes es(son) verdadera(s) ?

I) La moda de la distribucin es 43 kg.

II) El promedio es menor que 43 kg.


III) La mediana coincide con la moda.

Alternativas

A) Slo I

B) Slo I y II

C) Slo I y III

D) Slo II y III

E) I, II y III

Tema: Medidas de tendencia central

Comentario

Para determinar el valor de verdad de la primera afirmacin se debe recordar que la moda
de un conjunto de nmeros es el valor que ocurre con mayor frecuencia. En este caso, se
observa que el 43 es el valor que se repite dos veces y pasa a ser
el ms frecuente, por lo tanto, la afirmacin es verdadera.

Para determinar el valor de verdad de la segunda afirmacin se debe recordar que el


promedio de un conjunto N de nmero x 1 , x 2 , x 3 , ..., x n se denota por x (con guin
arriba) y se define por

Al calcular el promedio, esta afirmacin es verdadera, ya que

Finalmente, la tercera afirmacin dice relacin con la mediana y la moda. Se sabe que la
mediana es el valor central de los datos, una vez ordenados de menor a mayor. Si el
nmero de datos es par, se toma el valor medio de los dos centrales. En este ejercicio hay
10 datos donde los valores centrales son 42 kg y 43 kg, luego la mediana es

Por lo tanto, la afirmacin III) es falsa.


La contest correctamente el 32 por ciento y un cuarto de la poblacin la omiti. El 18 por
ciento del grupo que abord el tem considera que las tres afirmaciones son verdaderas.

Pregunta 03_2005

El grfico de la figura representa las notas obtenidas


por 15 nios en una prueba. Cul(es) de las
siguientes aseveraciones es(son) verdadera(s)?

I) La mediana es 5.

II) La moda es 5.

III) La media aritmtica (promedio) es 4,7.

Alternativas

A) Slo I

B) Slo II

C) Slo III

D) Slo II y III

E) I, II y III

Curso: Segundo Medio

Tema: Graficacin e interpretacin de datos estadsticos provenientes de diversos


contextos

Comentario:

Para responderla correctamente, el alumno debe tener claro el procedimiento para calcular
las medidas de tendencia central .

Para este problema, la mediana es el valor que se encuentra en la mitad de los datos una
vez ordenados de menor a mayor.

Para visualizar mejor este concepto, interpretamos los datos del grfico de la siguiente
manera:

Notas: 1, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7
En este caso el nmero total de nios es 15, por lo tanto, el valor de la mediana debe
corresponder a la octava nota que es el 5.

La moda es el valor que ms se repite en una distribucin, en este caso, es la nota 5,0,
porque la obtuvieron un mayor nmero de nios, que fue 4.

En este tem para determinar el promedio o media aritmtica , se debe realizar la


siguiente operacin:

Por lo que el promedio es la nota 4,7 , considerndola con un solo decimal.

Luego la clave es E .

Esta pregunta result difcil para el grupo que rindi esta prueba y la omiti la tercera parte
de ellos.

Pregunta 05_2005

Veinte nmeros tienen un promedio de 20; doce de los nmeros tienen un promedio de 8.
Cul es el promedio de los otros ocho nmeros?

A) 12

B) 38

C) 62

D) 28

E) Ninguno de los anteriores

Curso: Segundo Medio

Tema: Medidas de tendencia central

Comentario:

Si llamamos y a la suma de los 12 nmeros, entonces , de donde y = 96 .


Sea x la suma de los otros 8 nmeros, entonces se tiene:
(x + y es la suma de los 20 nmeros)

304 (suma de los 8 nmeros).

Luego el promedio de estos 8 nmeros es:

Por lo que la clave es B .

Esta pregunta result muy difcil y la omiti casi la mitad de los alumnos que la abordaron.

El distractor A fue elegido por aquellos alumnos que dicen que, como el promedio de los
doce nmeros restantes es 8, el promedio de los ocho nmeros que se piden debe ser la
diferencia que es de 12, sin realizar clculo alguno.

Pregunta 03_2006

La tabla adjunta

Edad (en aos) 15 16 17 18 19


Alumnos 50 40 60 50 20

muestra las edades de 220 alumnos de un colegio. Cul(es) de las siguientes afirmaciones
es(son) verdadera(s)?

I) La moda es 17 aos.

II) La mediana es mayor que la media (promedio).

III) La mitad de los alumnos del colegio tiene 17 18 aos.

Alternativas

A) Slo I

B) Slo II
C) Slo I y III

D) Slo II y III

E) I, II y III

Contenido: Medidas de tendencia central , como son la media aritmtica (promedio),


la mediana y la moda.

Comentario

Debe recordar que la moda es la medida de mayor frecuencia (el valor que ms se repite),
en este caso, segn la tabla, la mayor frecuencia de alumnos es 60 y corresponde a los de 17
aos, por lo tanto I) es verdadera .

Para analizar II), debe determinar el promedio y compararlo con la mediana .

En este caso, es el promedio para datos agrupados y se resuelve de la siguiente forma:

La mediana es el valor de la variable que queda en el punto medio de una serie, despus de
que las medidas o puntajes que la integran han sido colocados en orden segn su magnitud.
En otros trminos, la mediana es el valor por encima y por debajo del cual queda el 50 por
ciento de los casos.

Al calcular la frecuencia acumulada de la tabla se tiene:

Edad Alumnos Frecuencia


acumulada
15 50 50
16 40 90
17 60 150
18 50 200
19 20 220

Buscamos la mitad del nmero total de casos, que corresponde a .


As la mediana es 17 , pues es el primer valor de la variable cuya frecuencia acumulada es
mayor que la mitad del nmero de datos (150 es mayor que 110).

Luego, la mediana es mayor que el promedio (17 es mayor que 16,8), por lo que II) es
verdadera .

Los alumnos son 220 y los que tienen 17 18 aos corresponden a la suma de los alumnos
de estas edades; es decir, 110, que corresponde a la mitad del total, por lo que la III) es
verdadera.

Luego la opcin correcta es E) .

El 46 por ciento de las personas abordaron la pregunta en forma correcta y la omiti casi la
cuarta parte (24 por ciento).

Pregunta 04_2006

El grfico siguiente

muestra la distribucin de las notas de matemtica de un grupo de 46 estudiantes.

Cul de las siguientes opciones corresponde a los valores de la mediana y la moda ,


respectivamente?

Alternativas

A) 4 y 5

B) 5 y 5

C) 4,1 y 4
D) 4,1 y 5

E) 4 y 4,5

Contenido: Graficacin e interpretacin de datos estadsticos provenientes de diversos


contextos.

Comentario

Para su resolucin, el estudiante debe tener claro el concepto de mediana y moda , que son
medidas de tendencia central y luego comprender la informacin entregada en el grfico
de la figura y hacer un reordenamiento de la informacin.

Por el grfico, la frecuencia mayor de estudiantes es 15, que est asociada a la nota 5, por
lo tanto, esa es la moda .

Para determinar la mediana , podemos proceder igual que en el ejercicio anterior; es decir,
confeccionamos una tabla de la siguiente manera:

Notas Frecuencias Frecuencia acumulada


1 3 3
2 3 6
3 8 14
4 12 26
5 15 41
6 3 44
7 2 46

Buscamos la mitad del nmero total de casos, que corresponde a .

As, la mediana es 4, pues es el primer valor de la variable cuya frecuencia acumulada es


mayor que la mitad del nmero de datos (26 es mayor que 23).

Por lo tanto, la clave es la opcin A) .

La contest correctamente el 32,3 por ciento de la poblacin y la omisin fue alta: 44,8 por
ciento.

Pregunta 05_2006

El grfico circular de esta figura


muestra las preferencias de 30 alumnos en actividades deportivas. Cul(es) de las
siguientes afirmaciones es(son)
correcta(s)?

I) La frecuencia relativa, expresada en %, del grupo de ftbol es de 40%.

II) La frecuencia relativa, expresada en %, del grupo de bsquetbol es de 30%.

III) La mitad del grupo no prefiri ftbol ni tenis.

Alternativas

A) Slo I

B) Slo II

C) Slo I y II

D) Slo II y III

E) I, II y III

Contenido: el alumno debe conocer el concepto de frecuencia relativa , que se calcula


como la frecuencia absoluta de cada actividad deportiva, dividida por el total de
frecuencias de todos los grupos (30 alumnos).

Comentario

La frecuencia relativa se puede expresar en tanto por ciento.

La frecuencia relativa del grupo de ftbol es, por lo tanto, , la que expresada
en porcentaje es 40% , por lo que I) es verdadera .
La frecuencia relativa del grupo de bsquetbol es , que corresponde a 30%,
luego se confirma la veracidad de la afirmacin II).

Como la mitad del grupo total es 15 y 15 de ellos no eligieron ni ftbol ni tenis, pues
eligieron o bsquetbol o atletismo, la III) tambin es verdadera.

Por lo tanto, la opcin correcta es la E) .

La pregunta result de mediana dificultad, pues la contest bien el 45 por ciento de los
alumnos y la omisin fue del 26,8 por ciento, lo cual indica que un nmero apreciable de
alumnos no conoce el trmino frecuencia relativa o no se ha familiarizado con el grfico
circular.

http://www.profesorenlinea.cl/PSU/Matematica/Estadistica/Pregunta%2005_2006.html