Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadística descriptiva.
Introducción a la estadística.
Recolección, tabulación y representación de datos.
Medidas de posición y dispersión.
Estimación, Población y muestra.
Estimadores y parámetros.
Estimación puntual y por intervalo.
Inferencia estadística.
Relación entre Parámetros de posición (Modo, Media, Mediana, Cuartiles) y de dispersión (Varianza,
Desviación intercuartil).
ESTADÍSTICA DESCRIPTIVA
Estadística es la ciencia que utilizando las matemáticas y de modo particular el cálculo estudia las
leyes de comportamiento de aquellos fenómenos que no estando sometidos a leyes rígidas dependen
del azar y basándose en ella, se predicen resultados.
- Población son todos y cada uno de los elementos que se quieren analizar. Puede ser finita
o infinita( en realidad las poblaciones infinitas no existen, pero cuando se trata de un número grande
se trata como si lo fuera).
Ejemplo: Población Estudiantes de Económicas de Mar del Plata, Característica Edad de ellos, la
característica se designa con letras mayúsculas X, Y, Z,...., los valores de esas edades son numéricos
entonces es una variable cuantitativa y los valores que toman se denotarían X={x1, x2, x3,........xn }.
- Recorrido (o rango) de la variable es la diferencia entre el valor mayor y el menor de los que
toma la variable.
- Variable Discreta cuando toma un número finito de valores o bien cuando toma infinitos y
son numerables es decir entre dos no hay otro intermedio. Ejemplo: la edad, las notas,
- Variable continua cuando entre dos valores cualesquiera siempre puede haber otro.
Ejemplo: Talla, peso,......
En Economía son muchos más importantes las variables (toman valor numérico))
que los atributos.
1) Recogida de Datos
2) Ordenación de los mismos en tablas
3) Resumen de la información recogida a través de las medidas(Descriptiva)
4) Analizar los datos provenientes de una muestra para sacar conclusiones sobre la población de
la que proviene la muestra ( Inferencial).
ESCALAS DE MEDIDA
- Escala ordinal el carácter medido no es numérico pero puede establecerse algún tipo de orden.
Ejemplo estudios de una persona.
- Distribución unidimensional está formada por los valores que toma la variable que se estudia
acompañados de sus respectivas frecuencias.
- Frecuencia relativa ( fr) es el cociente entre la frecuencia absoluta y el número total de observaciones,
por tanto la frecuencia relativa está siempre entre cero y uno.
i
- Frecuencia absoluta acumulada F (a) f
j 01
j es decir se suman las frecuencias anteriores a un valor
- Distribución por datos no agrupados es cuando se especifican todos y cada uno de los valores de la
variable.
- Distribución por datos agrupados los valores de la variable se miden en intervalos , la amplitud del
intervalo es la diferencia entre el extremo superior e inferior del intervalo y la suma de las amplitudes
de todos los intervalos es igual al recorrido ( diferencia entre el valor mayor y el menor de la
distribución).
- Marca de clase de un intervalo es la semisuma de los extremos del intervalo y es el valor que sustituye
l li
x
i 1
a todo el intervalo i siendo el intervalo [li-1 , li ].
2
Las representaciones gráficas tienen que estar hechas para que el simple impacto visual nos dé
información de la distribución
Diagrama de barras Datos sin agrupar y las barras proporcionales a las frecuencias.
En datos agrupados el Histograma pone en el eje vertical las densidades de frecuencia de cada
intervalo de forma que el área de cada rectángulo es la frecuencia absoluta del intervalo.
Diagrama en escalera para datos no agrupados se utiliza para las frecuencias acumuladas , son
histogramas en los que en el eje vertical se acumulan las frecuencias absolutas, por eso se llaman en
escalera.
El área de cada rectángulo nos da la frecuencia del intervalo, por tanto la base es la amplitud y
la altura la densidad de frecuencia de dada uno di
MEDIDAS DE POSICIÓN
Se trata de resumir la información en un único número. Las medidas de posición pueden ser:
1. Media
2. Mediana
3. Moda
De tendencia no central
1. Cuartiles.
Las medidas de posición tienen que cumplir que intervengan todos los valores de la variable, que
se puedan calcular y que su valor sea único para cada distribución de frecuencias.
1.- MEDIA
Se suman de todos los valores de la variable ponderados por sus frecuencias absolutas y dividido todo
ello por el número total de observaciones
x f i i
x fi
i 1
La media aritmética es siempre el centro de gravedad de la distribución y es siempre un valor que entra
dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada intervalo para su cálculo.
La media aritmética se puede hacer siempre con variables cuantitativas y es perfecta, pero tiene un
inconveniente que es que si los valores son muy extremos ( desviados del resto), puede desvirtuarse
la situación y hacerla poco representativa, debido a este problema, a veces se hace la media truncada
que es quitar los extremos y hacer la media de los que quedan.
Pero dado que la media aritmética simple el medida mas usada en estadística, por el momento nos
concentraremos en ella.
2.- MEDIANA
Es el valor de la variable que ocupa el lugar central de la distribución, es decir el valor de la variable
que deja el 50% de observaciones hacia la izquierda y el 50% a la derecha.
Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la variable de
forma creciente, y escribir los valores de las frecuencias acumuladas Fi.
Distinguiremos tres casos, datos no agrupados, datos agrupados en tablas de frecuencias y datos
agrupados en series de intervalos.
Se calcula primero el 50% de la población N/2, se lleva ese valor a la columna de frecuencias
absolutas acumuladas. (Fa)
Se calcula como antes la mitad de la población, y se lleva ese valor a la columna de frecuencias
absolutas acumuladas.
3.- MODA
Es el valor de la variable que más veces se repite. En algunos casos existen varias modas, pero
normalmente es una, si son dos se llama bimodal.
Si los intervalos tienen todos, la misma amplitud, el intervalo modal es el de mayor frecuencia
absoluta.
CUANTILES
Son medidas de posición que no tiene porqué ser central. Hay varios tipos de cuantiles:
1.- Cuartiles Son valores de la variable que dividen a la distribución en cuatro partes iguales, por lo
tanto los cuartiles son tres C1 que deja por detrás de él al 25% de la población, C2 que divide a la
población en dos partes iguales y C3 que deja dtrás de él al 75% de la población.
2.- Deciles Son valores e la variable que dividen a la distribución en diez partes iguales, por lo tanto
los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente hasta D9 que deja al
90% antes y al 10% después de él.
3.- Percentiles.- Son valores de la variable que dividen a la distribución en cien partes iguales, por lo
tanto los percentiles son 99.
Para calcular cualquiera de ellos se utiliza por lo tanto el mismo procedimiento que el descrito en el
cálculo de la Mediana.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos indican el mayor o menor alejamiento de los valores de una variable
respecto a un promedio. Casi siempre acompañando a un promedio debe ir una medida de
dispersión que nos indica la mayor o menor representatividad del promedio.
Rango (o recorrido)
Rango o Recorrido Intercuartílico
Desviación Media Absoluta
Varianza
Desviación Típica
RECORRIDO o RANGO
DESVIACIÓN MEDIA
Es la suma de los valores en valor absoluto de la diferencia entre cada valor de la variable y la media
aritmética (en series simples) y lo mismo multiplicado por su frecuencia (en tablas de frecuencia) y
dividido por el número de datos.
x x f
i n
i n
x x
D i
i i
i 1 i i 1
D (series simples)
(series de frecuencia)
x N x N
VARIANZA
2X
(x i x) 2
i
(series simples) 2 X
( xi x ) 2 i i (series agrupadas en tablas de
N N
frecuencia)
Siempre es positiva (por estar al cuadrado). Como la varianza es siempre positiva, a mayor varianza
mayor será la dispersión.
Propiedades:
1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y es cuando
todos los valores de la variable son iguales.
DESVIACIÓN TÍPICA ( x)
x
CVx
Obviamente para el cálculo de las medidas de dispersión en una serie de intervalos se
x
considera el Valor representativo del intervalo. Es decir el valor de Xim (marca de clase).
Algunos ejercicios
1) Se relevaron las notas de Educación Física en una escuela y los resultados fueron los siguientes: 4, 6, 5, 2, 2,
2, 8, 8, 2, 3, 4, 5, 6, 6, 6, 2, 6, 7, 8, 2, 2, 5.
a) Confeccione una tabla. b) Indique modo, mediana, rango y media aritmética.
c) Grafique en modo de barra. d) Si se aprueba con cuatro ¿Qué porcentaje de los alumnos aprobaron?
2) La altura de los jugadores de un equipo de fútbol son las siguientes: Entre 1,61 y 1,65 hay dos jugadores;
entre 1,66 y 1,70 hay cuatro jugadores, entre 1,71 y 1,75 hay cinco jugadores, entre 1,76 y 1,80 hay dos
jugadores, entre 1,81 y 1,85 hay tres jugadores, entre 1,86 y 1,90 hay un jugador.
a) Confeccione una tabla. b) Indique modo, mediana y media aritmética. c) Grafique en modo de barra.
3) Dada la siguiente cantidad de abdominales por minuto por alumno (de un mismo sexo):
40, 50, 45, 25, 51, 60, 55, 40, 22, 31, 55, 47, 52, 37, 44, 56, 33, 18, 58, 40, 38.
a) Agrúpelos en la forma que usted crea conveniente y halle todos los parámetros estadísticos.
b) Infiera con todos los datos ¿Cuántas abdominales deberá realizar un alumno para aprobar?
4) Los alumnos de un colegio han recorrido los 100 metros llanos en: 11.7s – 12.5s – 13.2s – 12.8s – 11.8s –
13.6s – 14.8 – 17.5s – 16.4s – 15.8s – 14.9s – 15.6s – 16.1s – 18.7s – 16.6s
a) Indique cuál es el tiempo promedio de los alumnos en recorrer los 100 metros.
b) Indique cuál es la velocidad (en Km/h) media de los alumnos.
c) Indique cuál es la velocidad (en Km/h) del alumno más rápido del grupo.
d) Indique cuál es la velocidad (en Km/h) del alumno más lento del grupo.
5) En una pileta de natación, los doscientos metros estilo pecho, fueron realizados por alumnos varones según
muestra la tabla:
ALUMNO A B C D E F G H I J K
TIEMPO 4m05s 4m10s 4m18s 4m25s 5m12s 4m54s 5m26s 6m03s 4m28s 4m33s 4m58s
6) En una competencia de salto en largo, entre alumnas de 16 años de un colegio del conurbano bonaerense,
se relevaron los siguientes datos según muestra la tabla:
ALUMNO A B C D E F G H I J K
TIEMPO 2.5m 2.8m 3.3m 2.7m 3.0m 2.6m 2.6m 2.7m 2.8m 2.7m 2.7m
7) La siguiente tabla indica la cantidad de kilos con que se faenan los novillos.
a) Se pide hallar el modo interpolado, la mediana interpolada, la media aritmética, y el desvío estándar.
b) Además se pide graficar el Histograma correspondiente y en modo de torta.
xi fi
120-140 317
140-160 416
160-180 1013
180-210 1135
210-240 2048
240-270 1916
270-300 1164
300-320 1152
320-340 613
340-360 114
Totales