Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TEMA 03
MEDIDAS ESTADISTICAS
Estadístico:
Es una cantidad numérica calculada sobre una
muestra. Ejm.:
El Rendimiento Académico medio de los alumnos de esta aula.
Estadística U.N.C. 4
Un brevísimo resumen sobre estadísticos
Localización o Posición no central.- Dividen un conjunto
ordenado de datos en grupos con la misma cantidad de
individuos.
Cuartiles, deciles, percentiles,...
Tendencia Central ó Centralización.- Indican valores con
respecto a los que los datos parecen agruparse.
Media, mediana y moda
Dispersión.- Indican la mayor o menor concentración de
los datos con respecto a las medidas de centralización.
Desviación típica, coeficiente de variación, rango,
varianza
Forma : Asimetría y Apuntamiento o curtosis
Exclusivo para variables
cuantitativas
MEDIDAS DE POSICIÓN
Tendencia Central: Son aquellos que tienden a
ocupar posiciones centrales o intermedias entre el
menor o mayor valor del conjunto de datos. (media,
mediana, moda)
Posición no central o localización: Son aquellos
que indican o señalan la localización de los valores
más frecuentes o valores extremos. (cuartiles,
deciles, percentiles)
MEDIDAS DE POSICIÓN - TENDENCIA CENTRAL
1. Media o Promedio
Es aquella que representa el promedio aritmético de un
conjunto de observaciones, la misma actúa como punto
de equilibrio, de manera que las observaciones menores
equilibran a las mayores.
MEDIA ARITMETICA MEDIA ARITMETICA
PARA DATOS NO PARA DATOS
AGRUPADOS
n AGRUPADOS
k
X i X i fi
X i 1
X i 1
n n
Donde: Donde:
Xi = Diferentes valores Xi = Valor de la variable
de la variable en o
estudio. Marcas de clase.
n = tamaño de la fi = Frecuencias
muestra absolutas
simples.
n = tamaño de muestra.
MEDIDAS DE POSICIÓN - TENDENCIA
CENTRAL OBTENCION DE LA MEDIA
MEDIA - Datos No Agrupados n
X i
19 21 23 30
Ejemplo 01: X i 1
n 4
Se tiene los montos facturados de
venta en millones de soles de El monto promedio de las
Cementos Pacasmayo en el facturaciones de cemento Pacasmayo,
periodo de 2011 y 2014. del periodo 2011 a 2014, es de 23.3
millones de soles.
Año 2011 2012 2013 2014
Monto 19 21 23 30
facturado
X i fi
0(2) 1(6) 2(10) 3(9) 4(3) 65
X i 1
2.17 faltas / día
n 30 30
En promedio se tiene que aproximadamente existen 2 faltas en un día
laborable.
Ejm 03: Datos Agrupados (intervalos de clase)
Montos en nuevos soles correspondientes a las compras de 40
clientes de Sodimac, año 2009.
Montos Nº Nº Clientes % % Clientes Marcas
S/. Clientes Acumulado Clientes Acumulado de Xi*fi
fi s hi% s clase
Fi Hi% Xi
300-350 8 8 20 20 325 8(325)=2600
350-400 9 17 23 43 375 9(375)=3375
400-450 6 23 15 58 425 6(425)=2550
450-500 7 30 17 75 475 7(475)=3325
500-550 4 34 10 85 525 4(525)=2100
550-600 6 40 15 100 575 6(575)=3450
Total n = 40 100 ∑Xi*fi=1740
0
k
X f i i
17400
El promedio de los montos en compras de los
clientes evaluados es de S/. 435 nuevos
X i 1
435 soles.
n 40
MEDIA
PROPIEDADES:
• La media de un valor constante es igual a dicho
valor constante.
M(k) = k
• Si se suma una misma cantidad a cada dato, la
media aritmética queda sumada en esa misma
cantidad.
M(x+k) = M(x) + M(k) = M(x)+ k
• Si cada dato se multiplica por un mismo número ,
la media
aritmética queda multiplicada por ese mismo
número.
M(k.x) = M(k) . M(x) = k . M(x)
Medidas de Posición - Tendencia Central
2.- MODA
• Se denota por Mo
• Se define como el valor que más repite en un conjunto de
datos.
• Un conjunto de datos puede presentar los siguientes
casos:
Medidas de Posición - Tendencia Central
Ejemplo 02:
La siguiente información corresponde al tipo de crédito que
solicitan un grupo de clientes en el BCP. Determinar la Moda:
CP CC CP PYME CC CP CP PYME
CP CC CC PYME CP CC CC
Luego de Ordenar:15 16 17 18 18 18 19 19 19 19 20
Calcular: PQ1 = 1(11+1) / 4 = 3; PQ3 = 3 (11+1)/4 = 9 ,
Tomar los valores en la posición 3 y 9.
Q1 = 17 : “El 25 porciento de las calificaciones de T1 se
encuentran bajo la nota 17”
Q3 = 19: “El 75 porciento de las calificaciones de T1 se
encuentran bajo la nota 19”
MEDIDAS DE LOCALIZACION
CUARTILES - Datos No Agrupados
• Ordenar los datos en forma ascendente (de menor a mayor).
• Si k(n+1)/4 NO es un entero, entonces hacemos una interpolación
lineal entre los dos valores correspondientes a las dos observaciones
entre las cuales se encuentra la fracción.
Ejemplo 02: La siguiente información son las calificaciones de la
primera evaluación continua. Determinar el Q1 y Q3:
17 19 19 19 18 16 18 18 19 15
Luego de Ordenar: 15 16 17 18 18 18 19 19 19 19
Calcular: PQ1 = 1(10+1) / 4 = 2.75; PQ3 = 3 (10+1)/4 = 8.25
Tomar los valores en donde se encuentre la fracción e interpolar:
DECILES
• Se denotan por D1, D2 …y D9
• Son los valores que dividen a un
conjunto de datos ordenados en forma
ascendente en diez partes iguales.
MEDIDAS DE LOCALIZACIÓN
DECILES - Datos No Agrupados
• Ordenar los datos en forma ascendente.
• Se localiza el punto de posición del valor
correspondiente a la: k(n+1)/10
( Para Pk ) observación realizada.
• Si k(n+1)/100 NO es un entero, entonces
hacemos una interpolación lineal entre los
dos valores correspondientes a las dos
observaciones entre las cuales se encuentra
la fracción.
MEDIDAS DE LOCALIZACION
20 17
D5 400 50 425 “El 50% de los montos en soles, de los
6 clientes evaluados, se encuentran bajo los
S/. 425 nuevos soles”.
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los
datos, independientemente de su causa.
Amplitud o Rango:
0.05
Mín. P25 P50 P75 Máx.
Diferencia entre observaciones extremas.
2,1,4,3,8,4. El rango es 8-1=7
0.04
Es muy sensible a los valores extremos.
0.03
Rango intercuartílico:
25% 25% 25% 25%
Esla distancia entre primer y tercer
0.02
cuartil. Rango intercuartílico
Rango intercuartílico = Q3 – Q1
0.01
Rango
Parecida al rango, pero eliminando las
0.00
observaciones más extremas inferiores 150 160 170 180 190
y superiores.
No es tan sensible a valores extremos.
Varianza(S2 ): Mide el promedio de las desviaciones (al cuadrado) de las
observaciones con respecto a la media.
n
Xi X 2
S2 i 1
Datos No agrupados
n 1
Xi X 2
fi
S2 i 1
Datos agrupados
n 1
gaussiana) quedará
completamente determinada 20
“más de la mitad”.
Peso recién nacidos en partos gemelares
Coeficiente de variación (C.V.):
Es la razón entre la desviación estándar y la media.
Mide la desviación estándar en forma de “qué tamaño tiene con
respecto a la media”
También se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviación típica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa).
Esuna cantidad adimensional. Interesante para comparar
la variabilidad de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura.
3 x Me S : Desviación estándar
As x : Media aritmética
s Me : Mediana
43
ANALIZAMOS E INTERPRETAMOS
RESULTADOS