Sei sulla pagina 1di 7

NÚCLEO TEMÁTICO Nº 6 MUESTRA Y POBLACIÓN

Parámetros de Posición y dispersión

Estadística descriptiva.
Introducción a la estadística.
Recolección, tabulación y representación de datos.
Medidas de posición y dispersión.
Estimación, Población y muestra.
Estimadores y parámetros.
Estimación puntual y por intervalo.
Inferencia estadística.
Relación entre Parámetros de posición (Modo, Media, Mediana, Cuartiles) y de dispersión (Varianza,
Desviación intercuartil).

ESTADÍSTICA DESCRIPTIVA

Estadística es la ciencia que utilizando las matemáticas y de modo particular el cálculo estudia las
leyes de comportamiento de aquellos fenómenos que no estando sometidos a leyes rígidas dependen
del azar y basándose en ella, se predicen resultados.

La estadística tiene dos grandes ramas: Descriptiva e Inferencial.

- Estadística Descriptiva analiza las características de una población o muestra definiéndose


unas propiedades acerca de su estructura y composición.

- Estadística Inferencial basándose en los resultados obtenidos de una muestra induce o


estima las leyes reales de comportamiento de la población de la que proviene dicha muestra.

- Población son todos y cada uno de los elementos que se quieren analizar. Puede ser finita
o infinita( en realidad las poblaciones infinitas no existen, pero cuando se trata de un número grande
se trata como si lo fuera).

- Muestra es un subconjunto de la población o parte de la población que se observa.

- Característica de una población es la propiedad que se estudia.

- Variables es cualquier característica cuantitativa ( tome valor numérico) de una población .

Ejemplo: Población Estudiantes de Económicas de Mar del Plata, Característica Edad de ellos, la
característica se designa con letras mayúsculas X, Y, Z,...., los valores de esas edades son numéricos
entonces es una variable cuantitativa y los valores que toman se denotarían X={x1, x2, x3,........xn }.

- Dominio de la variable son los valores que toma

- Recorrido (o rango) de la variable es la diferencia entre el valor mayor y el menor de los que
toma la variable.

- Variable Discreta cuando toma un número finito de valores o bien cuando toma infinitos y
son numerables es decir entre dos no hay otro intermedio. Ejemplo: la edad, las notas,

- Variable continua cuando entre dos valores cualesquiera siempre puede haber otro.
Ejemplo: Talla, peso,......

- Variable unidimensional Estudia solo una característica de la población. Ejemplo: Estudiar


el peso (X)
- Variable bidimensional Estudia dos características de una población. Ejemplo Estatura(X) y
peso (Y)

- Variable infidimensional estudiaría infinitas características

- Atributos son características de la población no susceptibles de cuantificación numérica.


Ejemplo.: Color del pelo, los atributos se designan con letras A, B, C, .......y sus valores A={a 1, a2,
.............., an}.

En Economía son muchos más importantes las variables (toman valor numérico))
que los atributos.

ETAPAS DEL ANÁLISIS ESTADÍSTICO

1) Recogida de Datos
2) Ordenación de los mismos en tablas
3) Resumen de la información recogida a través de las medidas(Descriptiva)
4) Analizar los datos provenientes de una muestra para sacar conclusiones sobre la población de
la que proviene la muestra ( Inferencial).

ESCALAS DE MEDIDA

- Escala nominal la característica estudiada se clasifica en una serie de características no numéricas


y mutuamente excluyentes y no se puede establecer ningún orden entre ellos.

- Escala ordinal el carácter medido no es numérico pero puede establecerse algún tipo de orden.
Ejemplo estudios de una persona.

- Escala de intervalos la característica puede cuantificarse numéricamente, estableciéndose


intervalos entre dos operaciones. Ejemplo: Renta mensual que percibe una persona.

ANÁLISIS ESTADÍSTICO DE DISTRIBUCIONES UNIDIMENSIONALES

- Distribución unidimensional está formada por los valores que toma la variable que se estudia
acompañados de sus respectivas frecuencias.

- Frecuencia absoluta (fi ) es el número de veces que se repite un determinado valor.

- Frecuencia relativa ( fr) es el cociente entre la frecuencia absoluta y el número total de observaciones,
por tanto la frecuencia relativa está siempre entre cero y uno.
i
- Frecuencia absoluta acumulada F (a)  f
j 01
j es decir se suman las frecuencias anteriores a un valor

dado, por tanto la acumulada al final coincide con la población N.

- Distribución por datos no agrupados es cuando se especifican todos y cada uno de los valores de la
variable.

- Distribución por datos agrupados los valores de la variable se miden en intervalos , la amplitud del
intervalo es la diferencia entre el extremo superior e inferior del intervalo y la suma de las amplitudes
de todos los intervalos es igual al recorrido ( diferencia entre el valor mayor y el menor de la
distribución).

- Marca de clase de un intervalo es la semisuma de los extremos del intervalo y es el valor que sustituye
l  li
x
i 1
a todo el intervalo i siendo el intervalo [li-1 , li ].
2
Las representaciones gráficas tienen que estar hechas para que el simple impacto visual nos dé
información de la distribución

En distribuciones cuantitativas si los datos no están agrupados, se emplea el diagrama de barras, si


están agrupados el histograma., si la distribución es cualitativa se suele emplear el diagrama de
sectores.

Diagrama de barras Datos sin agrupar y las barras proporcionales a las frecuencias.

En datos agrupados el Histograma pone en el eje vertical las densidades de frecuencia de cada
intervalo de forma que el área de cada rectángulo es la frecuencia absoluta del intervalo.

Densidad de frecuencia di = fi/ai

Diagrama en escalera para datos no agrupados se utiliza para las frecuencias acumuladas , son
histogramas en los que en el eje vertical se acumulan las frecuencias absolutas, por eso se llaman en
escalera.

Diagrama de barras acumulado para datos agrupados

Histograma para datos agrupados en intervalos

El área de cada rectángulo nos da la frecuencia del intervalo, por tanto la base es la amplitud y
la altura la densidad de frecuencia de dada uno di

MEDIDAS DE POSICIÓN

Se trata de resumir la información en un único número. Las medidas de posición pueden ser:

 De tendencia central o promedios

1. Media
2. Mediana
3. Moda

 De tendencia no central

1. Cuartiles.

Las medidas de posición tienen que cumplir que intervengan todos los valores de la variable, que
se puedan calcular y que su valor sea único para cada distribución de frecuencias.

1.- MEDIA

La media puede ser: Aritmética simple o ponderada

Media aritmética simple

Se suman de todos los valores de la variable ponderados por sus frecuencias absolutas y dividido todo
ello por el número total de observaciones

 x f i i

x   fi
i 1

La media aritmética es siempre el centro de gravedad de la distribución y es siempre un valor que entra
dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada intervalo para su cálculo.
La media aritmética se puede hacer siempre con variables cuantitativas y es perfecta, pero tiene un
inconveniente que es que si los valores son muy extremos ( desviados del resto), puede desvirtuarse
la situación y hacerla poco representativa, debido a este problema, a veces se hace la media truncada
que es quitar los extremos y hacer la media de los que quedan.

 Existen otras medidas como :


 Media Cuadrática
 Media Geométrica
 Media Armónica

Pero dado que la media aritmética simple el medida mas usada en estadística, por el momento nos
concentraremos en ella.

2.- MEDIANA

Es el valor de la variable que ocupa el lugar central de la distribución, es decir el valor de la variable
que deja el 50% de observaciones hacia la izquierda y el 50% a la derecha.

Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la variable de
forma creciente, y escribir los valores de las frecuencias acumuladas Fi.

Distinguiremos tres casos, datos no agrupados, datos agrupados en tablas de frecuencias y datos
agrupados en series de intervalos.

Para datos no agrupados

 Para serie de datos impares (N=31):


Se toma (N+1)/2 = (31+1) /2 = 16. Es decir que la Me será aquel valor de variable que, ordenada la
serie de menor a mayor ocupe la posición 16 (en este ejemplo), es decir que esté en la posición
(N+1)/2 (en general)
 Para serie de datos impares (N=30) , por ejemplo:
Se calcula tambien (N+1)/2, en el ejemplo: 15,5 y la mediana será el promedio de los valores de
variable que se encuentran en la posición 15 y 16, para el ejemplo.

Para datos agrupados en tablas de frecuencias:

Se calcula primero el 50% de la población N/2, se lleva ese valor a la columna de frecuencias
absolutas acumuladas. (Fa)

 Si el valor no está en la columna de acumuladas, se toma como valor de la mediana el de la


variable correspondiente al siguiente.

 Si el valor si está en la columna de acumuladas, se toma como mediana la media aritmética


del valor de la variable y el siguiente.

Para datos agrupados en intervalos

Se calcula como antes la mitad de la población, y se lleva ese valor a la columna de frecuencias
absolutas acumuladas.

 Si el valor no está en la columna, se toma como intervalo al que pertenece la Mediana el


siguiente al valor de N/2, y después de situarnos en el intervalo por la hipótesis de uniformidad
hacemos una proporción entre la amplitud del intervalo, los elementos que tiene y la amplitud que
correspondería a la diferencia entre N/2 y la frecuencia acumulada anterior valor que añadiríamos al
extremo inferior del intervalo.

 Si el valor sí está en la columna de frecuencias acumuladas, se toma como Mediana el


extremo superior del intervalo correspondiente.
También se puede hallar gráficamente con el diagrama correspondiente a las frecuencias absolutas
acumuladas.

3.- MODA

Es el valor de la variable que más veces se repite. En algunos casos existen varias modas, pero
normalmente es una, si son dos se llama bimodal.

Para datos no agrupados

La moda es el valor de la variable correspondiente a la mayor frecuencia absoluta.

Para datos agrupados en intervalos

Si los intervalos tienen todos, la misma amplitud, el intervalo modal es el de mayor frecuencia
absoluta.

CUANTILES

Son medidas de posición que no tiene porqué ser central. Hay varios tipos de cuantiles:

1.- Cuartiles Son valores de la variable que dividen a la distribución en cuatro partes iguales, por lo
tanto los cuartiles son tres C1 que deja por detrás de él al 25% de la población, C2 que divide a la
población en dos partes iguales y C3 que deja dtrás de él al 75% de la población.

2.- Deciles Son valores e la variable que dividen a la distribución en diez partes iguales, por lo tanto
los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente hasta D9 que deja al
90% antes y al 10% después de él.

3.- Percentiles.- Son valores de la variable que dividen a la distribución en cien partes iguales, por lo
tanto los percentiles son 99.

En realidad tanto cuartiles como deciles se calculan con el correspondiente percentil.

D1= P10 D9 = P90 C1 = P25 C2 = D5 = P50 = ME .

Para calcular cualquiera de ellos se utiliza por lo tanto el mismo procedimiento que el descrito en el
cálculo de la Mediana.

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión nos indican el mayor o menor alejamiento de los valores de una variable
respecto a un promedio. Casi siempre acompañando a un promedio debe ir una medida de
dispersión que nos indica la mayor o menor representatividad del promedio.

Las medidas de dispersión absoluta más utilizadas son:

 Rango (o recorrido)
 Rango o Recorrido Intercuartílico
 Desviación Media Absoluta
 Varianza
 Desviación Típica

RECORRIDO o RANGO

Es la diferencia entre el mayor y el menor valor de la variable


R = xn – x1
RECORRIDO INTERCUARTÍLICO

Es la diferencia entre el tercer cuartil y el primer cuartil


RI = Q3 – Q1

DESVIACIÓN MEDIA

Es la suma de los valores en valor absoluto de la diferencia entre cada valor de la variable y la media
aritmética (en series simples) y lo mismo multiplicado por su frecuencia (en tablas de frecuencia) y
dividido por el número de datos.
 x  x  f
i n 
i n
  

  x  x 
D    i
i i
i 1  i i 1
D  (series simples) 
(series de frecuencia)
x N x N
VARIANZA
 

 2X 
 (x i  x) 2
i
(series simples)  2 X 
 ( xi  x ) 2 i  i (series agrupadas en tablas de
N N
frecuencia)

Siempre es positiva (por estar al cuadrado). Como la varianza es siempre positiva, a mayor varianza
mayor será la dispersión.

Propiedades:

1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y es cuando
todos los valores de la variable son iguales.

DESVIACIÓN TÍPICA (  x)

Es la raíz cuadrada positiva de la varianza y es la medida de dispersión más utilizada.

Clases de medidas de dispersión relativas

Se caracterizan por ser adimensionales, la más importante es el coeficiente de variación de Pearson,


nos indica la mayor o menor homogeneidad de los datos respecto de la media y por lo tanto nos da la
representatividad de la media en la distribución.

x
CVx  
Obviamente para el cálculo de las medidas de dispersión en una serie de intervalos se
x
considera el Valor representativo del intervalo. Es decir el valor de Xim (marca de clase).

Algunos ejercicios

1) Se relevaron las notas de Educación Física en una escuela y los resultados fueron los siguientes: 4, 6, 5, 2, 2,
2, 8, 8, 2, 3, 4, 5, 6, 6, 6, 2, 6, 7, 8, 2, 2, 5.
a) Confeccione una tabla. b) Indique modo, mediana, rango y media aritmética.
c) Grafique en modo de barra. d) Si se aprueba con cuatro ¿Qué porcentaje de los alumnos aprobaron?

2) La altura de los jugadores de un equipo de fútbol son las siguientes: Entre 1,61 y 1,65 hay dos jugadores;
entre 1,66 y 1,70 hay cuatro jugadores, entre 1,71 y 1,75 hay cinco jugadores, entre 1,76 y 1,80 hay dos
jugadores, entre 1,81 y 1,85 hay tres jugadores, entre 1,86 y 1,90 hay un jugador.
a) Confeccione una tabla. b) Indique modo, mediana y media aritmética. c) Grafique en modo de barra.
3) Dada la siguiente cantidad de abdominales por minuto por alumno (de un mismo sexo):
40, 50, 45, 25, 51, 60, 55, 40, 22, 31, 55, 47, 52, 37, 44, 56, 33, 18, 58, 40, 38.
a) Agrúpelos en la forma que usted crea conveniente y halle todos los parámetros estadísticos.
b) Infiera con todos los datos ¿Cuántas abdominales deberá realizar un alumno para aprobar?

4) Los alumnos de un colegio han recorrido los 100 metros llanos en: 11.7s – 12.5s – 13.2s – 12.8s – 11.8s –
13.6s – 14.8 – 17.5s – 16.4s – 15.8s – 14.9s – 15.6s – 16.1s – 18.7s – 16.6s
a) Indique cuál es el tiempo promedio de los alumnos en recorrer los 100 metros.
b) Indique cuál es la velocidad (en Km/h) media de los alumnos.
c) Indique cuál es la velocidad (en Km/h) del alumno más rápido del grupo.
d) Indique cuál es la velocidad (en Km/h) del alumno más lento del grupo.

5) En una pileta de natación, los doscientos metros estilo pecho, fueron realizados por alumnos varones según
muestra la tabla:

ALUMNO A B C D E F G H I J K
TIEMPO 4m05s 4m10s 4m18s 4m25s 5m12s 4m54s 5m26s 6m03s 4m28s 4m33s 4m58s

a) Indique el tiempo promedio en realizar la prueba.


b) Si en 15 metros el alumno realiza 4 movimientos completos ¿Cuántos movimientos completos necesita un
alumno para culminar la prueba?
c) Infiera con todos los datos ¿Cuál es el tiempo que deberá realizar un alumno para aprobar?

6) En una competencia de salto en largo, entre alumnas de 16 años de un colegio del conurbano bonaerense,
se relevaron los siguientes datos según muestra la tabla:

ALUMNO A B C D E F G H I J K
TIEMPO 2.5m 2.8m 3.3m 2.7m 3.0m 2.6m 2.6m 2.7m 2.8m 2.7m 2.7m

a) Indique el salto promedio de la prueba.


b) Infiera con todos los datos ¿Cuál es el salto que deberá realizar un alumno para aprobar?
c) Grafique la situación en modo de torta.
d) ¿Es posible desaprobar a algún alumno según los datos? Explique.

7) La siguiente tabla indica la cantidad de kilos con que se faenan los novillos.
a) Se pide hallar el modo interpolado, la mediana interpolada, la media aritmética, y el desvío estándar.
b) Además se pide graficar el Histograma correspondiente y en modo de torta.

xi fi
120-140 317

140-160 416

160-180 1013

180-210 1135

210-240 2048

240-270 1916

270-300 1164

300-320 1152

320-340 613

340-360 114

Totales

Potrebbero piacerti anche