Sei sulla pagina 1di 7

Tema 1

Introducci
on a la Estadstica
1.1.

Qu
e significa la palabra Estadstica?

Si buscamos la palabra Estadstica en el Diccionario de la Lengua Espa


nola a traves
de la pagina web de la Real Academia Espa
nola (http://www.rae.es) son tres las definiciones que encontramos:
1. Estudio de los datos cuantitativos de la poblacion, de los recursos naturales e industriales, del trafico o de cualquier otra manifestacion de las sociedades humanas.
2. Conjunto de estos datos.
3. Rama de la matematica que utiliza grandes conjuntos de datos numericos para obtener inferencias basadas en el calculo de probabilidades.
De estos significados, quizas el que mas familiar nos resulte sea el segundo, puesto
que los medios de comunicacion denominan estadstica o estadsticas a cualquier simple
recopilacion de datos o cifras referentes a alg
un estudio.
Sin embargo, la Estadstica como rama del saber cientfico esta mas relacionada con las
otras dos definiciones. Concretamente, la primera de ellas se corresponde con la Estadstica
Descriptiva, objeto de los dos primeros temas de este curso, y que emplearemos para
resumir, describir y explorar datos; la tercera definicion esta relacionada con la Inferencia
Estadstica, que trata de generalizar conclusiones obtenidas a partir del estudio de un
conjunto reducido de datos, a todo el conjunto completo (este sera el objetivo de los
Temas 7-10). Como herramienta de la Inferencia Estadstica se encuentra el C
alculo de
Probabilidades, que tambien forma parte de los contenidos de este curso (Temas 3-6) y
que nos permitira establecer el concepto de probabilidad, asociado a la aleatoriedad de un
fenomeno, y los modelos mas frecuentes en los que esta se presenta.
La definicion mas aceptada y extendida de Estadstica es la Ciencia cuya finalidad
es estudiar los procedimientos destinados a la recogida, resumen, analisis e interpretacion
de un conjunto de datos, as como los conducentes a la obtencion de inferencias cientficas
a partir de ellos.
1

1.2.

Tema 1. Introduccion a la Estadstica

Un poco de historia

La Estadstica, tal y como se concibe hoy en da, debe su existencia a la confluencia


producida en el siglo XIX entre la Estadstica Descriptiva y el Calculo de Probabilidades.
Por tanto, aunque su historia se remonta al citado siglo, sus orgenes coinciden con los
de la Estadstica Descriptiva y los del Calculo de Probabilidades y, en cierto sentido, su
evolucion historica estara determinada por la evolucion de estos.
En sus orgenes, el concepto de Estadstica (vocablo que parece derivado del latn
Status=Estado) aparece estrechamente ligado en la actividad gubernamental, y el termino
estadstico, con el de estadista o poltico. Esto se debe a que las primeras estadsticas
de las que se tiene noticia fueron realizadas por gobernantes interesados en conocer la
extension de sus dominios, la poblacion residente en ellos, la recaudacion de impuestos,
las riquezas, etc. La cantidad de datos recogidos para tal fin crece progresivamente, lo
que obliga a su presentacion en forma de cuadros o tablas. Es entonces cuando la palabra
Estadstica comienza a tener un significado que se refiere al material numerico obtenido de
la observacion del mundo real. Precisamente esto justifica la primera parte de la definicion
que anteriormente hemos aportado.
El desarrollo que ha adquirido hasta nuestra fecha la Estadstica nos permite concluir
que en la actualidad la aplicabilidad y potencia de esta Ciencia es enorme, hasta el punto
de no saber vivir sin las acostumbradas estadsticas que aparecen publicadas en la prensa
y enarboladas por dirigentes polticos utilizadas, en muchos casos incorrectamente, para la
defensa de argumentos particulares. Esto puede dar lugar a que se dude de la aplicabilidad
y eficacia de la Estadstica, lo que ha de ser tenido en cuenta.
Durante el siglo XVIII y la mayor parte del siglo XIX, la Estadstica evoluciona como
ciencia separada del Calculo de Probabilidades y la Teora de Errores. Aunque A. De Moivre y Deparcieux, entre otros, aplican el calculo de probabilidades a datos demograficos, y
Condorcet y Laplace a problemas de aritmetica poltica, existe durante este perodo una
escasa comunicacion entre ambas disciplinas.
Por su parte, el Calculo de Probabilidades evoluciona independientemente de la Estadstica Descriptiva. Los orgenes de la teora de la probabilidad estan en los juegos de
azar. La abundante presencia del hueso astragalo de oveja o ciervo (que constituye el antecedente inmediato del dado), en las excavaciones arqueologicas mas antiguas, parecen
confirmar que los juegos de azar tienen una antig
uedad de mas de 40.000 a
nos, y la utilizacion del astragalo en culturas mas recientes, Grecia, Egipto y posteriormente Roma, ha
sido ampliamente documentada. En las piramides de Egipto se han encontrado pinturas
que muestran juegos de azar que provienen de la primera dinasta (3500 a.C.) y Herodoto
se refiere a la popularidad y difusion en su epoca de los juegos de azar, especialmente
mediante la tirada de astralagos y dados. Los dados mas antiguos que se han encontrado
se remontan a unos 3000 a
nos antes de Cristo y se utilizaron tanto en juegos como en
ceremonias religiosas.
La imposibilidad de encontrar una causa o conjunto de causas que permitieran predecir
el resultado, por ejemplo, al tirar un dado, hizo que las culturas antiguas atribuyeran los
resultados de fenomenos aleatorios a la voluntad divina. No es sino hasta el Renacimiento,
donde con un nuevo enfoque, se abandonan las interpretaciones teologicas del azar y se
produce una reconsideracion de los fenomenos aleatorios, haciendo que los matematicos
Olmo Jimenez, M. J.

Universidad de Jaen

1.2 Un poco de historia

italianos de principios del siglo XVI comenzaran a interpretar los resultados de experimentos aleatorios simples. Por ejemplo, Cardano, en 1526, establece, por condiciones de
simetra la equiprobabilidad de aparicion de las caras de un dado a largo plazo, y Galileo
(1564-1642), respondiendo a un jugador que le pregunto por que es mas difcil obtener
un 9 tirando 3 dados que obtener un 10, razono que de las 216 combinaciones posibles
equiprobables, 25 conducen a 9 y 27 a 10.
El desarrollo de la Teora de la Probabilidad esta estrechamente ligado a los juegos de
azar no siendo de tanto interes, para los matematicos de la epoca, la evolucion de esta
teora como la preocupacion por dar razonamientos combinatorios que resuelvan los problemas planteados. A mediados del siglo XVII, aparecen los primeros avances teoricos del
Calculo de Probabilidades con Huygens (1629-1695), quien generaliza la media aritmetica introduciendo el concepto de Esperanza Matematica y con la aparicion de una de las
principales obras de la Teora de la Probabilidad en 1713, Ars Cojectandi, donde se
recoge la mayor parte del trabajo realizado por Jacques Bernoulli por ejemplo se presenta
el conocido Teorema de Bernoulli en el que por primera vez se generalizan las soluciones
de problemas particulares que se dieron anteriormente.
A finales del siglo XVIII, Thomas Bayes, aporta un resultado conocido como el Teorema de Bayes donde hace uso de la probabilidad inversa, introduciendo la probabilidad
a priori. Estas innovaciones, desarrolladas por P. S. Laplace, han desembocado en la
Inferencia Bayesiana. En este periodo, en la obra de Pierre Simon, Marques de Laplace
(1749-1827), se da tambien una primera definicion explcita de probabilidad de un suceso
como el cociente entre el n
umero de casos favorables y el de casos posibles, siembre que
todos los resultados tengan igual probabilidad. Ademas Karl Friedrich Gauss (1777-1855)
junto con Laplace, estudiaron las aplicaciones de la Teora de la probabilidad al analisis
numerico de los errores de medida en las observaciones fsicas y astronomicas, dando lugar
a la Teora de los Errores.
Posterior a esto, se produce un estancamiento en cuanto a nuevas ideas en la Teora
de la Probabilidad, sin embargo, se amplan los campos de aplicacion del Calculo de
Probabilidades y la Estadstica Descriptiva que hace que estas empiecen a usarse de forma
complementaria. Una contribucion importante hacia dicha sntesis es debida a A. Quetelet
(1846), que sostuvo la importancia del Calculo de Probabilidades para el estudio de datos
humanos. Quetelet demostro que la estatura de los reclutas de un reemplazo segua una
distribucion normal, e introdujo el concepto de hombre medio.
Los estudios sobre la evolucion de poblaciones animales realizados por Darwin llevaron
a Francis Galton (1822-1911) a resaltar la necesidad de acudir a metodos estadsticos para
contrastar tal teora. Galton estudio exhaustivamente la distribucion normal e introdujo el
concepto de lnea de regresion comparando las estaturas de padres e hijos. La importancia
de Galton radica no solamente en el nuevo enfoque que introduce en el problema de la
dependencia estadstica, sino tambien en su influencia directa sobre Weldon, K. Pearson,
R. A. Fisher y Edgeworth entre otros. El primer departamento de Estadstica, en el sentido
actual de la palabra, fue patrocinado por el y llevo su nombre.
El enfoque estadstico propugnado por Galton para el estudio de la evolucion, es aceptado con entusiasmo por W. R. F. Weldon (1860-1906), entonces catedratico de Zoologa
en la Universidad de Londres. Weldon abandona el camino de los estudios embriologicos
y morfologicos como medio de contrastar las hipotesis de Darwin y comienza a investigar
Olmo Jimenez, M. J.

Universidad de Jaen

Tema 1. Introduccion a la Estadstica

en la aplicacion de los metodos estadsticos a la Biologa animal.


La resolucion de nuevos problemas enunciados por Weldon le obliga a buscar la colaboracion de un filosofo y matematico: K. Pearson (1857-1936). El laboratorio de K. Pearson
se convierte en un polo de atraccion para las personas interesadas en el analisis emprico de
datos. W. S. Gosset (1876-1937), que trabajaba en la firma cervecera Guinness de Dubln,
fue una de las personas que acudieron a Londres a estudiar bajo el patrocinio de Pearson.
Los trabajos de Gosset, encaminados al estudio de muestras peque
nas, dieron lugar a la
distribucion t, resultado que publico bajo el seudonimo de Student, ya que Guinness no
permita divulgar las investigaciones de sus empleados.
Los fundamentos de la estadstica actual y muchos de los metodos de inferencia, son
debidos a R. A. Fisher (1890-1962). Fisher se intereso primeramente en la Eugenesia1 , lo
que le conduce, siguiendo los pasos de Galton, a la investigacion estadstica. En sus trabajos
aparece ya claramente el cuerpo metodologico basico que constituye la Estadstica actual:
el problema de elegir un modelo a partir de datos empricos, la deduccion matematica de
las propiedades del mismo (Calculo de Probabilidades), la estimacion de los parametros
condicionados a la bondad del modelo y la validacion final del mismo mediante un test de
significacion.
La mas reciente historia de la Estadstica nos sit
ua entre 1920 y finales de la Segunda
Guerra Mundial, donde la aparicion de m
ultiples tecnicas estadsticas surge por la aplicacion de la Estadstica a areas tan diversas como la Ingeniera, la Fsica, la Antropologa,
la Psicologa o la Medicina.
A partir de 1950 podemos considerar que comienza la epoca moderna de la Estadstica
que esta claramente diferenciada por la aparicion del ordenador, que revoluciona la metodologa estadstica y abre enormes posibilidades para la construccion de modelos mas
complejos, y, estrechamente ligado a lo anterior, la creciente importancia de los modelos
dinamicos y multivariantes.
Resumiendo, historicamente, la Estadstica comenzo siendo esencialmente descriptiva.
Ha sido necesario acumular informacion, criticarla, analizarla y sintetizarla. Posteriormente, gracias al Calculo de Probabilidades, la Estadstica ha pasado a ser explicativa,
proporcionando potentes herramientas para la toma de decisiones, cuando estas se adoptan en un ambiente de incertidumbre, siempre que esta incertidumbre pueda ser medida
en terminos de probabilidad.

1.3.

Una reflexi
on interesante

El desarrollo que ha adquirido hasta nuestra fecha la Estadstica nos permite concluir
que, en la actualidad, la aplicabilidad y potencia de esta Ciencia es enorme hasta el punto
no solo de no concebir hoy da un trabajo de caracter cientfico sin el apoyo de alg
un metodo
o tecnica estadstica que corrobore las hipotesis en el planteadas, sino que estamos llegando
a no saber vivir sin la acostumbradas estadsticas p
ublicas publicadas en la prensa y
utilizadas, en muchos casos incorrectamente, para la defensa de argumentos particulares.
Por u
ltimo, y con el fin de advertir de las consecuencias que conlleva el uso incorrecto de
1
Eugenesia es la ciencia que estudia la mejora, desde un punto de vista biol
ogico, de los individuos de
una especie vegetal o animal.

Olmo Jimenez, M. J.

Universidad de Jaen

1.4 Definiciones basicas

la Estadstica, reproducimos un texto de G. U. Yule y M. G. Kendall sobre la actitud del


p
ublico ante la Estadstica:
La actitud del profano con respecto a las estadsticas se resume admirablemente en
la observaci
on de que la humanidad puede dividirse en dos grupos: los que dicen que los
n
umeros pueden probarlo todo y los que aseguran que no pueden probar nada. Hay que
reconocer que esta actitud no est
a exenta de raz
on. [...] A veces, tales n
umeros sirven para
dar una imagen enga
nosa de la realidad que puede ser debida a ignorancia o distracci
on,
pero tambien a un deliberado deseo de extraviar o seducir. El profano sabe todo esto, y su
actitud de desconfianza ante los argumentos basados en n
umeros es la del hombre que no
est
a preparado para distinguir por s mismo lo verdadero de lo falso y tiende, por ello, a
sospechar de todo.
No sera pertinente defender aqu la Estadstica ante la opini
on p
ublica. Hemos aludido
a esta cuesti
on para advertir que los metodos estadsticos son instrumentos muy peligrosos
en manos inexpertas. Pocas disciplinas tienen aplicaci
on m
as amplia, y ninguna requiere
tanto cuidado al aplicarla. La Estadstica es una de esas ciencias cuyos cultivadores deben
ejercitarse en la autolimitaci
on, como los artistas.

1.4.

Definiciones b
asicas

A continuacion definimos una serie de conceptos que aparecen habitualmente en Estadstica.


Poblaci
on: Es el conjunto de elementos o individuos objeto de estudio con alguna
caracterstica com
un. Debe estar perfectamente determinada, sin ambig
uedades ni
confusion, de modo que claramente pueda discernirse si un elemento o individuo
pertenece o no a dicha poblacion. Atendiendo al n
umero de elementos o individuos
que componen la poblacion, esta se clasifica en finita o infinita. Lo mas com
un es
que la poblacion sea finita.
Individuo o unidad estadstica: Es cada uno de los elementos que componen la
poblacion.
Tama
no de la poblaci
on: Es el n
umero total de elementos o individuos que integran la poblacion.
Muestra: Es un subconjunto de la poblacion que debe ser representativo de toda
ella, de modo que las conclusiones que se extraigan a partir de la muestra, tengan
validez para toda la poblacion. Por que se utiliza una muestra y no se estudia la
poblacion completa? Son varias las razones: en primer lugar, porque supondra un
coste excesivo (economica y temporalmente hablando) y, en segundo lugar, porque
podra tratarse del estudio de un procedimiento destructivo (resistencia de materiales, eficacia de un tratamiento medico, etc.). Ademas, si la poblacion es infinita,
necesariamente habra que extraer una muestra.
Car
acter: Es una cualidad, propiedad o rasgo com
un que se desea estudiar en los
elementos de una poblacion. Un caracter puede presentar distintas modalidades
Olmo Jimenez, M. J.

Universidad de Jaen

Tema 1. Introduccion a la Estadstica

que deben ser excluyentes y exhaustivas, es decir, cada individuo de la poblacion


debe presentar una y solo una de dichas modalidades.
A su vez, los caracteres se clasifican en:
Cualitativos, que son aquellos cuyas modalidades no son medibles, es decir, no
se pueden representar mediante un n
umero y, por tanto, se consideran atributos.
Cuantitativos, que son aquellos cuyas modalidades s son medibles, es decir,
susceptibles de asignar un n
umero.
Variable estadstica: Una variable, en general, es un smbolo, habitualmente X,
que toma distintos valores numericos. Cuando estos valores numericos son el resultado de una medicion o valoracion estadstica se habla de variable estadstica. Este
concepto esta asociado a la medicion realizada sobre un caracter cuantitativo.
Hay dos tipos de variable estadstica:
Discreta, cuando toma valores aislados, en general n
umeros enteros.
Continua, cuando puede tomar todos los posibles valores de un intervalo, es
decir, todos los valores comprendidos entre dos n
umeros.
No obstante, la distincion entre estos dos tipos de variable estadstica es mas teorica
que practica, debido a la precision de los aparatos de medida. Por ello, muchas
variables continuas se trataran como discretas y viceversa.

1.4.1.

Ejemplo

En una encuesta sobre la utilizacion de Internet realizada a los habitantes de la provincia de Jaen, dos de los tems de interes fueron:
1. Si hace uso de Internet, en que lugar se conecta preferiblemente? Con cuatro
posibles respuestas:
En casa
En el trabajo/centro de estudio
En un ciber
En otro lugar
2. Aproximadamente, cuantas horas al da se conecta?
La encuesta se realizo en todos los municipios de la provincia de Jaen, de modo que el
n
umero de encuestados en cada municipio fue proporcional al n
umero de habitantes del
mismo y estos fueron seleccionados aleatoriamente.
Puede deducirse que:
La poblaci
on esta formada por todos los habitantes de la provincia de Jaen.
El tama
no de la poblacion es el n
umero total de habitantes de la provincia de Jaen.
Olmo Jimenez, M. J.

Universidad de Jaen

1.4 Definiciones basicas

La unidad estadstica es cada uno de los habitantes de la provincia de Jaen.


Se extrajeron muestras en cada municipio para evitar costes excesivos, de manera
que cada muestra es representativa del municipio.
Se estudiaron, entre otros, dos caracteres:
Lugar de conexion, de tipo cualitativo, con 4 modalidades (casa, trabajo,
ciber, otros) que son excluyentes y exhaustivas (se asume que el encuestado
prefiere uno y solo uno de estos lugares para conectarse).
Tiempo de conexion, de tipo cuantitativo, al que se asocia una variable
estadstica, X: No de horas diarias de conexion, continua, ya que puede
tomar cualquier valor del intervalo [0, 24].

Olmo Jimenez, M. J.

Universidad de Jaen

Potrebbero piacerti anche