Sei sulla pagina 1di 6

ESTADSTICA

Estadstica es un grupo de tcnicas o metodologas que se desarrollaron para recopilacin,


presentacin y anlisis de datos. Con el objetivo de proporcionar a los organismos pblicos y
privados informacin cuantitativa bsica de inters general, necesaria para investigacin,
formulacin de polticas y programas y toma de decisiones relativas al desarrollo social,
econmico, medio ambiental, cientfico y tecnolgico del pas. Las estadsticas son como la
biquini ocultan lo ms importante. Es una ciencia que sirve para demostrar que dos personas
han comido medio pollo cada una, cuando en realidad una se ha comido uno y otra, ninguno.
La Estadstica se ocupa de recolectar, organizar y analizar la informacin extrada de una
poblacin o de una muestra representativa de la misma. Se clasifica en:
Estadstica descriptiva: es una coleccin de mtodos para la organizacin, resumen y
presentacin de datos.
Estadstica inferencial: consiste de un conjunto de tcnicas para obtener, con determinado
grado de confianza, informacin de una poblacin con base en la informacin de una muestra.
La poblacin y la muestra:
Una poblacin es un conjunto de todos los individuos que se desea estudiar. Estos individuos
pueden ser: personas, animales, plantas, artculos elaborados, consumidores, bacterias,
estudiantes, votantes, niveles de ventas, etc.
La muestra es una parte de la poblacin que se selecciona para realizar el estudio, debido a la
imposibilidad o no conveniencia de tener informacin de todos y cada uno de los elementos de
la poblacin. Una muestra debe ser representativa, es decir, debe reflejar las caractersticas
esenciales de la poblacin que se desea estudiar. El estudio de muestras es ms sencillo que el
estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Una muestra
representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones
que estn incluidas en tal poblacin.
Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.
Variables y tipos de variables:
Variables: son las caractersticas de un elemento en una poblacin en estudio. Por ejemplo si la
poblacin consta de personas, las siguientes son variables que podran ser de inters: sexo, edad,
peso y estatura (por edad) y trastornos de salud.
Las variables se pueden clasificar, en:
Cualitativas: se refieren a caractersticas no medibles o atributos. Por ejemplo, el sexo, los
trastornos de salud, el estado civil, el color de piel, de cabello, etc.
Cuantitativas: cuando se realiza una medicin y el resultado es un nmero. Por ejemplo, el
peso, la estatura y la edad.
Entre estas variables se distinguan, a su vez, dos categoras diferentes:
Las variables cuantitativas discretas, que toman valores pertenecientes a conjuntos numricos
discretos, por ejemplo, la edad. Se obtienen mediante conteo.
Las variables cuantitativas continuas, que toman valores pertenecientes a conjuntos
numricos continuos, como la estatura y el peso. Se obtienen mediante mediciones.

ORGANIZACIN Y PRESENTACIN DE DATOS


Los datos obtenidos a travs de un relevamiento se ordenan en forma de tablas y grficos. Las
tablas se llaman de distribucin de frecuencias. La primera columna de una tabla est formada
por los valores o atributos que toma la variable, y la segunda columna, por la cantidad de veces
que se registr cada uno de los datos obtenidos. La cantidad de veces que se repite una
observacin se denomina frecuencia absoluta correspondiente a dicho valor. En tercer lugar las
frecuencias relativas que se obtienen dividiendo la frecuencia absoluta por el total de
observaciones realizadas:

Estadsticas Grficos y tablas Pgina 1


Los grficos permiten visualizar el comportamiento de la distribucin de frecuencias. Estos
grficos pueden ser:
Diagrama de barras: Los grficos de barras sirven para comparar los distintos valores de la
variable en cuestin mirando solamente cul de las barras es ms larga (la de mayor frecuencia)
y cul es ms corta (la de menor frecuencia). En el eje horizontal del grfico, en la base de la
barra, se colocan los atributos que adquiere la variable cualitativa. En el eje vertical, se pueden
indicar las frecuencias absolutas o las frecuencias relativas. La altura de cada barra
representa la frecuencia de la categora correspondiente.
Ejemplo: Se efecta un anlisis de la preferencia de la tonalidad de las prendas, con el propsito
de redisear modelos, teniendo en cuenta el gusto del pblico al cual va dirigido el producto.
Los datos obtenidos fueron:

Grfico circular o grficos de sectores: La manera de determinar el ngulo central


correspondiente a cada sector circular es:

La variable tonalidades de jean se presenta en tres categoras diferentes. En la tabla de
frecuencias figuran la frecuencia absoluta Fi y la relativa fi
Ejemplo: a) Realizar la tabla de frecuencias, el grfico de barras y el de sectores, para las preferencias de
las mujeres: b) A los estudiantes de un curso se les pregunta por el tipo de carrera
que van a estudiar. Estas son las respuestas:

Un pictograma es un grfico en el que se utilizan figuras alusivas al fenmeno que se estudia. En ste
el nmero de figuras es proporcional a la frecuencia. Resolver:

a) En qu nivel se encuentra el mayor nmero de alumnos?


b) Por qu crees que el alumnado en el nivel primario es mayor que en el secundario?
c) Si la muestra anterior fue hecha en 5000 personas
Cuntas concurren al preescolar o jardn de infantes?
Cuntas a la Universidad o al nivel terciario?
Cuntas al secundario?
d) Podras decir que el nmero de alumnos est en funcin del nivel de estudio? Por qu?
Los pictogramas son diagramas poco precisos y, por tanto, escasamente utilizados por los expertos, pero
son de muy sencilla interpretacin para los menos entendidos.
Estadsticas Grficos y tablas Pgina 2
CONFECCIN DE TABLAS ESTADSTICAS:
1) Variable cuantitativa discreta: Ejemplo: cantidad de prendas de jean compradas por cada
consumidor el ltimo ao Con la finalidad de poder estimar el volumen de compras de esta
clase de prendas se le pregunt a los encuestados cuntas prendas de este tipo haban adquirido
el ltimo ao. Los resultados obtenidos se presentan en la siguiente tabla de distribucin de
frecuencias:

Con la informacin ordenada en la tabla, se confeccionan los grficos de barras, que tambin se
utilizan para representar distribuciones de variables cuantitativas discreta, como en este caso.
2) Variable cuantitativa continua: Cuando el nmero de observaciones es muy grande, es
conveniente agrupar los datos por categoras, denominadas intervalos de clase; la distribucin
que se obtiene es llamada distribucin de frecuencias por intervalos de clases.
Ejemplo: Se tomo la altura a todos los alumnos de un curso. Estas son las estaturas en
centmetros. Como las estaturas son muy distintas (casi no coinciden unas con otras) las
agrupamos en intervalos.
Ejemplo: Las edades de los socios de un club deportivo son las siguientes.

a) Elabora la tabla de frecuencias absolutas y el histograma correspondiente.


b) Calcula la media, la mediana y la moda de la distribucin.

MEDIDAS ESTADSTICAS:
Son datos que resumen el estudio realizado en la poblacin. Pueden ser de dos tipos:
Medidas de tendencia central: Permiten conocer cmo se concentran los datos de una
distribucin alrededor de ciertos valores: Media, Moda y Mediana.
Medidas de dispersin o de variabilidad: Permiten analizar cmo se encuentran esparcidos los
datos respecto a los parmetros de centralizacin. Nos van a dar una idea sobre la
representatividad de las medidas centrales, a mayor dispersin menor representatividad:
Varianza y Desviacin estndar
Medidas de tendencia central
1) La Media o media aritmtica: Es el promedio de las observaciones. Si queremos calcular la
cantidad promedio de prendas compradas por consumidor el ltimo ao y la estatura promedio
de los alumnos del curso.
a) Para calcular la cantidad promedio de prendas compradas se pueden sumar todos los valores de la
distribucin y dividir el resultado por el nmero total de observaciones. Pero el clculo resulta ms
sencillo si se utilizan las frecuencias absolutas que figuran en la tabla; agregamos una nueva columna
donde multiplicamos xi . Fi y obtenemos la suma de esta cantidad y hacemos:

Se puede concluir que la cantidad promedio de artculos comprados este ltimo ao es 3 (como la
variable es discreta, el resultado debe ser entero).

Estadsticas Grficos y tablas Pgina 3


b) Para calcular la edad promedio de socios, como se trata de una distribucin agrupamos por
intervalos de clase, se identifica cada intervalo por su punto medio y se calcula el promedio de
estos valores previamente multiplicados por la frecuencia absoluta correspondiente. En la tabla
se agregan las columnas xmi y xmi . Fi

- Para distribuciones de variable discreta, donde n es el nmero de observaciones, xi cada uno


de los distintos valores que toma la variable y k, la cantidad de distintos valores de la variable:

- Para distribuciones de variable continua separada en intervalos de clase o por datos


agrupados. En primer lugar, se calculan los puntos medios de cada uno de los intervalos. Estos
valores reciben el nombre de marcas de clase. Luego, se calcula el promedio de marcas de la
clase, previamente multiplicadas por las frecuencias absolutas correspondientes:
Donde xmi es la marca de clase; Fi la frecuencia absoluta del intervalo, k la cantidad de
intervalos de la distribucin y n, el total de observaciones.
2) La moda: Es el dato observado mayor cantidad de veces. Se simboliza Mo. Para la
distribucin de variable discreta es el valor de la variable al cual le corresponde mayor
frecuencia absoluta. Para una distribucin de variable continua o con datos agrupados, la moda
es la marca de clase correspondiente al intervalo de mayor frecuencia absoluta. El intervalo
al cual pertenece la moda, se denomina intervalo modal o clase modal. La clase moda para la
distribucin de socios es [30, 40)
3) La mediana: Es el valor de la variable correspondiente a la posicin central de la
distribucin, cuyos datos estn ordenados en forma creciente. Es el valor que divide a la
distribucin en dos partes de igual cantidad de observaciones. Se simboliza con Me. La mediana
para la distribucin de socios es [30, 40)
Medidas de variabilidad
Para conocer el comportamiento general de una distribucin de frecuencias no alcanza con
determinar su valor central. Es necesario, adems analizar la variabilidad de los datos, lo que
implica estudiar cmo se encuentran esparcidos dentro de la distribucin, que permiten
completar la informacin que proporciona la media. Las medidas que se usan son: el rango, la
varianza y la desviacin estndar.
a) El rango: El rango o recorrido de un conjunto de nmeros es la diferencia entre el mayor y el
menor de todos ellos; es una medida de dispersin que no se utiliza mucho. R = xmax xmin
b) La varianza: La varianza es el promedio de los cuadrados de los desvos. Cuando la varianza
se calcula a partir de los datos de una muestra, se denomina varianza muestral y se simboliza s2
Cuando se calcula a partir de los datos de una poblacin, se denomina varianza poblacional y
se simboliza

N es el tamao de la poblacin y n es el tamao de la muestra.


Para una distribucin con intervalos de clase, las expresiones correspondientes a la varianza son:

La frmula vara porque el valor xi de la variable es reemplazado por la marca de la clase del
intervalo xmi y k es la cantidad de intervalos.
c) La desviacin estndar: La desviacin estndar muestral es la de la varianza muestral y se
simboliza s, la desviacin estndar poblacin es la de la varianza poblacin.
Desviacin estndar muestral: Desviacin estndar poblacional
En la calculadora: las teclas y la tecla .
Estadsticas Grficos y tablas Pgina 4
La estadstica tiene gran aplicacin para el anlisis de los datos proveniente de un experimento.
Un cientfico ha repetido una experiencia y ha recogido una gran cantidad de datos Qu hacer
con ellos? Lo primero es buscar una cifra que se pueda tomar como representativa de todos los
datos. Se suelen usar la media para las variables cuantitativas y la moda para las cualitativas.
Viene bien saber cunto se separan de la medida central los datos que han resultado del
experimento, es decir hace falta medir de algn modo la variabilidad. Se suelen usar la
desviacin estndar y a veces el recorrido, que es la diferencia entre el valor mayor y el menor.
Ejemplo1: Se han pesado 200 paquetes de un producto qumico y los pesos en gramos, se
muestran en la tabla de frecuencias. La media es gramos
Peso
Fi xi . Fi ( ) ( )2 ( )2.Fi
xi
298 8 2384 1,8 3,24 25,92
299 60 17940 0,8 0,64 38,4
300 102 30600 0,2 0,04 4,08
301 24 7224 1,2 1,44 34,56
302 6 1812 2,2 4,84 29,04
Total 200 59960 132,00

La varianza es
La desviacin
Ejemplo 2: Calcular la varianza y la desviacin estndar de la distribucin que se presenta en la
tabla. Esta corresponde a una muestra de 96 nios de 4 aos cuyos pesos son:
Peso (kg) Fi xmi xmi.Fi ( ) ( )2 ( )2.Fi
xi
12 13,5 10 12,75 127,5 2,921875 8,5373535 85,373535
13,5 15 20 14,25 285 1,421875 2,0217285 40,43457
15 16,5 36 15,75 567 0,078125 0,0061035 0,2197265
16,5 18 25 17,25 431,25 1,578125 2,4904785 62,261963
18 19,5 5 18,75 93,75 3,078125 9,4748535 47,374268
Totales 96 1504,5 235,664
La media de la muestra es

La varianza es: y la desviacin:


Ejemplo 3: El nmero de libros ledos por los miembros de un crculo de lectores en un mes se resume
en esta tabla.

a) Halla la media de libros ledos a lo largo de un mes.

b) Hallar la moda de la distribucin: Mo= 3


c) Hallar los cuartiles: Se realiza una tabla con las frecuencias absolutas acumuladas Fi

La cuarta parte del nmero de datos es 58/4 = 14,5. El primer cuartil es el primer valor cuya frecuencia
acumulada supera ese valor: Q1 = 2 libros
La mitad del nmero de datos es 58/2 = 29. El segundo cuartil es el primer valor cuya frecuencia
acumulada supera ese valor: Q2 = 3 libros
Estadsticas Grficos y tablas Pgina 5
Tres cuartos del nmero de datos es 3* 58/4 = 43,5. El tercer cuartil es el primer valor cuya
frecuencia acumulada supera ese valor: Q3 = 4 libros.
d) Determina el rango de esta distribucin: rango =7 1 = 6 libros.
e) Calcula la varianza y la desviacin tpica de esta distribucin.

libros libros
Ejemplo 4: a) Estas son las edades de los nios que acuden al servicio de Urgencias de un
hospital peditrico. Halla la moda

b) Halla los cuartiles: Se realiza una tabla con las frecuencias absolutas acumuladas Fi

35/4 = 8,75. Q1 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [0, 2):
Q1 = 1 ao.
35/2 = 17,5. Q2 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es [2, 4):
Q2 = 3 aos.
* 35 = 26,25. Q3 es la marca de la primera clase cuya frecuencia acumulada supera ese valor, que es
[6, 8): Q3 = 7 aos.
Ejemplo 5: a) Determina la mediana de la distribucin.

Se realiza una tabla con las frecuencias absolutas acumuladas Fi:


La mitad del nmero de datos es 20/2 = 10, luego la clase mediana es [10, 15), ya que es la primera cuya
frecuencia acumulada supera ese valor. La mediana es la marca de esta clase: M e = 12,5
b) Halla el coeficiente de variacin de la distribucin: Utilizamos las marcas de clase

Ejemplo 6: Calcula la media y la varianza de esta distribucin

Ejemplo 7: Halla la media y la desviacin tpica de la distribucin

Ejemplo 8: Observa el siguiente diagrama de barras.


Halla la media, la mediana y la moda de la distribucin

Ejemplo 9: El siguiente diagrama de barras muestra el nmero


de horas que dedica diariamente a practicar deporte un grupo de 25 estudiantes.
a) Calcula la media, la mediana y la moda de la distribucin.
b) Halla el rango, la desviacin tpica y el coeficiente de variacin.

Estadsticas Grficos y tablas Pgina 6

Potrebbero piacerti anche