Sei sulla pagina 1di 10

Estadstica

La estadstica es una ciencia formal y una herramienta que estudia el uso y los anlisis provenientes
de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un
fenmeno fsico o natural, de ocurrencia en forma aleatoria o condicional.
Sin embargo, la estadstica es ms que eso, es decir, es la herramienta fundamental que permite
llevar a cabo el proceso relacionado con la investigacin cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde
las ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos originados
a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente.
Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos
ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros.
La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones
asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones.
Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de
hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras
observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre
variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de
tiempo y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada.
Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la
materia.
La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un
conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros.
Medidas de tendencia central
Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un
solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos
se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace
referencia nicamente a la posicin de estos parmetros dentro de la distribucin,
independientemente de que sta est ms o menos centrada, se habla de estas medidas
como medidas de posicin.
1
En este caso se incluyen tambin los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
Media
Media ponderada
Media geomtrica
Media armnica
Mediana
Moda
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que
las medidas de posicin omedidas de tendencia se usan de acuerdo al tipo de variable que se est
observando, en este caso se observanvariables cuantitativas.
La media aritmtica
La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero
de sumadores.
Por ejemplo, las notas de 5 alumnos en una prueba:
nio nota
1 6,0 Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1
La media aritmtica en este ejemplo es 5,52
La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos.
2
Se le
llama tambinpromedio o, simplemente, media.
Definicin formal
Dado un conjunto numrico de datos, x
1
, x
2
, ..., x
n
, se define su media aritmtica como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
tambin puede calcularse para variables agrupadas en intervalos.
Propiedades
Las principales propiedades de la media aritmtica son:
3

Su clculo es muy sencillo y en l intervienen todos los datos.
Su valor es nico para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de
una medida de dispersin.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que
tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado,
esto es, el valor de es mnimo cuando . Este resultado se conoce
como Teorema de Knig. Esta propiedad permite interpretar uno de los parmetros de
dispersin ms importantes: la varianza.
Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si
entonces , donde es la media aritmtica de los , para i = 1,
..., n y a y bnmeros reales.
Es poco sensible a fluctuaciones muestrales, por lo que es un parmetro muy til
en inferencia estadstica.
Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos
homogneos sean los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy
distintas en su composicin pueden tener la misma media.
4
Por ejemplo, un equipo de baloncesto
con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media de 1,95 m,
valor que representa fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de
estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin,
como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de
sus componentes.
En el clculo de la media no todos los valores contribuyen de la misma manera. Los valores altos
tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo del salario medio de un
empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de diez
empleados "normales" que ganen 1.000 . En otras palabras, se ve muy afectada por valores
extremos.
No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.
Media aritmtica ponderada
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para
determinado estudio. En esos casos se puede utilizar una media ponderada.
Si son nuestros datos y son sus "pesos" respectivos, la media
ponderada se define de la siguiente forma:

Media muestral
Esencialmente, la media muestral es el mismo parmetro que el anterior, aunque el adjetivo
"muestral" se aplica a aquellas situaciones en las que la media aritmtica se calcula para
un subconjunto de la poblacin objeto de estudio.
La media muestral es un parmetro de extrema importancia en la inferencia estadstica, siendo de
gran utilidad para laestimacin de la media poblacional, entre otros usos.
Moda
La moda es el dato ms repetido de la encuesta, el valor de la variable con mayor frecuencia
absoluta.
5
En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda",
esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas,
expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario
obtener un valor concreto de la variable, se recurre a la interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-5-3-7.
El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos
datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se
encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la
misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el
intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en dos partes
de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal y y las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.
Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene dada por la
siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Nmero de alumnos 2 2 4 5 8 9 3 4 2
Propiedades[
Sus principales propiedades son:
Clculo sencillo. Interpretacin muy clara. Al depender slo de las frecuencias, puede calcularse
para variables cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin
no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las
caractersticas ms frecuentes de determinado sector social. Esto se conoce informalmente como
"retrato robot".
6

Mediana
La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que
stos estn ordenados de menor a mayor.
7
Por ejemplo, la mediana del nmero de hijos de un
conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto
que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es
2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por
lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por
ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana
Existen mtodos de clculo ms rpidos para datos ms nmerosos (vase el artculo
principal dedicado a este parmetro). Del mismo modo, para valores agrupados en intervalos, se
halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto por interpolacin.
Clculo de la mediana para datos agrupados
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).
As, aplicando la frmula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y
basndonos en la frmula que hace referencia a las frecuencias absolutas:
N
i
-1< n/2 <
i
= N19 < 19.5 < N20
Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro ejemplo, 21
(frecuencia absoluta acumulada para X
i
= 5) > 19.5 con lo que M
e
= 5 puntos (es aconsejable no
olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.

VARIABLES ESTADISTICAS
Las variables estadsticas son las distintas caractersticas que se analizan y se estudian para los
elementos que componen la muestra o la poblacin objeto del estudio. Por ejemplo, la Encuesta de
condiciones de vida de las familias es una operacin estadstica que va dirigida a los hogares
privados. De las personas que forman parte de los hogares seleccionados en la muestra se recoge
gran cantidad de informacin socioeconmica: sexo, edad, nivel de estudios, estado civil, nmero de
hijos, nacionalidad, ingresos (especificando si proceden de prestaciones, trabajo, rentas u otra
tipologa), etc. Adems tambin se recoge informacin del hogar, como por ejemplo el gasto en
alquiler e hipoteca y el grado de dificultad para llegar a fin de mes. Todas estas caractersticas que se
recogen en el cuestionario son variables estadsticas.
CLASIFICACION
-Variables cuantitativas: son las variables que se pueden cuantificar o medir. A su vez, las
variables cuantitativas pueden ser de dos tipos
o Continuas: son aquellas que pueden tomar cualquier valor dentro de un rango determinado. Por
ejemplo, los ingresos procedentes del trabajo que recibe una persona.
o Discretas: a diferencia de las continuas no pueden tomar cualquier valor del rango. Normalmente
toman valores enteros. Son variables cuantitativas discretas el nmero de hijos de una persona, el
nmero miembros de un hogar mayores de 65 aos.
-Variables cualitativas: representan una cualidad o atributo no medible numricamente. Son
ejemplos habituales de variables cuantitativas: el sexo, el estado civil, la nacionalidad, etc.
o Nominales: la variable puede tomar valores que no mantienen una relacin de orden entre s. Por
ejemplo la nacionalidad de una persona: espaola o extranjera.
o Ordinales: las variables cualitativas ordinales a pesar de no poder cuantificarse numricamente s
pueden ordenarse. Es decir, existe cierta jerarqua entre los distintos valores que puede tomar la
variable. Por ejemplo, el grado de dificultad que tiene un hogar para llegar a fin de mes: con mucha
facilidad, con facilidad, con dificultad o con mucha dificultad.
POBLACION Y MUESTRA
POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas
caractersticas comunes observables en un lugar y en un momento determinado. Cuando se vaya a
llevar a cabo alguna investigacin debe de tenerse en cuenta algunas caractersticas esenciales al
seleccionarse la poblacin bajo estudio.

Entre stas tenemos:
1. Homogeneidad - que todos los miembros de la poblacin tengan las mismas
caractersticas segn las variables que se vayan a considerar en el estudio o investigacin.
2. Tiempo - se refiere al perodo de tiempo donde se ubicara la poblacin de inters.
Determinar si el estudio es del momento presente o si se va a estudiar a una poblacin de
cinco aos atrs o si se van a entrevistar personas de diferentes generaciones.
3. Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un estudio no
puede ser muy abarcador y por falta de tiempo y recursos hay que limitarlo a un rea o
comunidad en especfico.
4. Cantidad - se refiere al tamao de la poblacin. El tamao de la poblacin es
sumamente importante porque ello determina o afecta al tamao de la muestra que se vaya a
seleccionar, adems que la falta de recursos y tiempo tambin nos limita la extensin de la
poblacin que se vaya a investigar.
MUESTRA
- la muestra es un subconjunto fielmente representativo de la poblacin.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione depender de la calidad y
cun representativo se quiera sea el estudio de la poblacin.
1. ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad
de ser incluido.
2. ESTRATIFICADA - cuando se subdivide en estratos o subgrupos segn las variables
o caractersticas que se pretenden investigar. Cada estrato debe corresponder
proporcionalmente a la poblacin.
3. SISTEMTICA - cuando se establece un patrn o criterio al seleccionar la muestra.
Ejemplo: se entrevistar una familia por cada diez que se detecten

ORGANIZACIN DE DATOS:
Al fenmeno que se estudia se le denomina variable estadstica. Ejemplo: intencin de voto en una
elecciones, frutas preferidas por el alumnado de un colegio, alturas de las personas de una
poblacin...
el nmero de alumnos que tienen el pelo rubio (3), el pelo castao (4), el pelo negro (5)...
Los datos de una variable los podemos organizar en tablas donde se expresan mediante frecuencias.

FRECUENCIA ABSOLUTA.
FRECUENCIA ABSOLUTA: de un valor es el nmero de veces que ese valor se repite. En
nuestro ejemplo anterior; pelo rubio (3), el pelo castao (4), el pelo negro (5)...


- REPRESENTACIN GRFICA DE DATOS:
Principalmente lo podemos hacer de tres formas, mediante:
Histogamas.
En ellos cada dato se representa por una barra pegada a las dems cuya altura es equivalente a
la frecuencia del dato.


Grficas de lnea.
Cada dato se representa por un punto. El diagrama de lineas se construye uniendo esos puntos.


Diagrama de sectores.
Los datos se representan segn su frecuencia en la parte correspondiente a un crculo (360, sector
circular).

Potrebbero piacerti anche