Sei sulla pagina 1di 44

UNIVERSIDAD PRIVADA ANTENOR ORREGO

ESCUELA DE INGENIERIA CIVIL


CURSO: ESTADISTICA APLICADA

TEMA 03
MEDIDAS ESTADISTICAS

Docente: Msc. Selene Yengle Del Castillo


Correo Electronico: syengled@upao.edu.pe
Parámetros y estadísticos
 Parámetro: Es una cantidad numérica calculada sobre una
población. Ejm.:
Rendimiento académico promedio de los alumnos de las
universidades de un país.
La idea es resumir toda la información que hay en la población
en unos pocos números (parámetros).

 Estadístico:
Es una cantidad numérica calculada sobre una
muestra. Ejm.:
El Rendimiento Académico medio de los alumnos de esta aula.

Si un estadístico se usa para aproximar un parámetro también


se le suele llamar estimador.
Normalmente nos interesa conocer un
parámetro, pero por la dificultad que
conlleva estudiar a *TODA* la población,
calculamos un estimador sobre una
muestra y “confiamos” en que sean
próximos. Más adelante veremos como3
elegir muestras para que el error sea
“confiablemente” pequeño.
CLASES DE MEDIDAS DE RESUMEN:

Estadística U.N.C. 4
Un brevísimo resumen sobre estadísticos
 Localización o Posición no central.- Dividen un conjunto
ordenado de datos en grupos con la misma cantidad de
individuos.
 Cuartiles, deciles, percentiles,...
 Tendencia Central ó Centralización.- Indican valores con
respecto a los que los datos parecen agruparse.
 Media, mediana y moda
 Dispersión.- Indican la mayor o menor concentración de
los datos con respecto a las medidas de centralización.
 Desviación típica, coeficiente de variación, rango,
varianza
 Forma : Asimetría y Apuntamiento o curtosis
Exclusivo para variables
cuantitativas
MEDIDAS DE POSICIÓN
 Tendencia Central: Son aquellos que tienden a
ocupar posiciones centrales o intermedias entre el
menor o mayor valor del conjunto de datos. (media,
mediana, moda)
 Posición no central o localización: Son aquellos
que indican o señalan la localización de los valores
más frecuentes o valores extremos. (cuartiles,
deciles, percentiles)
MEDIDAS DE POSICIÓN - TENDENCIA CENTRAL

1. Media o Promedio
Es aquella que representa el promedio aritmético de un
conjunto de observaciones, la misma actúa como punto
de equilibrio, de manera que las observaciones menores
equilibran a las mayores.
MEDIA ARITMETICA MEDIA ARITMETICA
PARA DATOS NO PARA DATOS
AGRUPADOS
n AGRUPADOS
k

X i X i fi
X  i 1
X  i 1

n n
Donde: Donde:
Xi = Diferentes valores Xi = Valor de la variable
de la variable en o
estudio. Marcas de clase.
n = tamaño de la fi = Frecuencias
muestra absolutas
simples.
n = tamaño de muestra.
MEDIDAS DE POSICIÓN - TENDENCIA
CENTRAL OBTENCION DE LA MEDIA
MEDIA - Datos No Agrupados n

X i
19  21  23  30
Ejemplo 01: X  i 1

n 4
Se tiene los montos facturados de
venta en millones de soles de El monto promedio de las
Cementos Pacasmayo en el facturaciones de cemento Pacasmayo,
periodo de 2011 y 2014. del periodo 2011 a 2014, es de 23.3
millones de soles.
Año 2011 2012 2013 2014
Monto 19 21 23 30
facturado

Determine: El Monto promedio


facturado entre los años 2011-
2014 en millones de soles.
Ejemplo 02: Datos Agrupados (no intervalos de clase)

El siguiente cuadro muestra el numero de faltas que ocurren


diariamente a una fabrica durante 30 dias laborables.
Faltas (Xi) Número de Xi*fi Fi
días (fi)
0 2 0(2)=0 2
1 6 1(6)=6 8
2 10 2(10)=20 18
3 9 3(9)=27 27
4 3 4(3)=12 30
Total 30 65
k

X i fi
0(2)  1(6)  2(10)  3(9)  4(3) 65
X  i 1
   2.17 faltas / día
n 30 30
En promedio se tiene que aproximadamente existen 2 faltas en un día
laborable.
Ejm 03: Datos Agrupados (intervalos de clase)
Montos en nuevos soles correspondientes a las compras de 40
clientes de Sodimac, año 2009.
Montos Nº Nº Clientes % % Clientes Marcas
S/. Clientes Acumulado Clientes Acumulado de Xi*fi
fi s hi% s clase
Fi Hi% Xi
300-350 8 8 20 20 325 8(325)=2600
350-400 9 17 23 43 375 9(375)=3375
400-450 6 23 15 58 425 6(425)=2550
450-500 7 30 17 75 475 7(475)=3325
500-550 4 34 10 85 525 4(525)=2100
550-600 6 40 15 100 575 6(575)=3450
Total n = 40 100 ∑Xi*fi=1740
0
k

X f i i
17400
El promedio de los montos en compras de los
clientes evaluados es de S/. 435 nuevos
X i 1
  435 soles.
n 40
MEDIA
PROPIEDADES:
• La media de un valor constante es igual a dicho
valor constante.
M(k) = k
• Si se suma una misma cantidad a cada dato, la
media aritmética queda sumada en esa misma
cantidad.
M(x+k) = M(x) + M(k) = M(x)+ k
• Si cada dato se multiplica por un mismo número ,
la media
aritmética queda multiplicada por ese mismo
número.
M(k.x) = M(k) . M(x) = k . M(x)
Medidas de Posición - Tendencia Central

2.- MODA
• Se denota por Mo
• Se define como el valor que más repite en un conjunto de
datos.
• Un conjunto de datos puede presentar los siguientes
casos:
Medidas de Posición - Tendencia Central

MODA - Datos No Agrupados


Simplemente observar en el conjunto de
datos el valor o dato que más se repite.

MODA - Datos Agrupados (no intervalos de clase)


Simplemente observar en el conjunto de datos
agrupados, el valor de la variable de la mayor
frecuencia absoluta simple.
EJEMPLOS DATOS NO
AGRUPADOS
Ejemplo 01:
La siguiente información son las calificaciones de la primera
evaluación continua. Determinar la Moda:
17 19 19 19 18 16 18 18 19 15
El valor que más se repite es la calificación 19. Por lo tanto,
la moda de
las calificaciones de la primera evaluación continua es 19.

Ejemplo 02:
La siguiente información corresponde al tipo de crédito que
solicitan un grupo de clientes en el BCP. Determinar la Moda:
CP CC CP PYME CC CP CP PYME
CP CC CC PYME CP CC CC

Los tipos de créditos mas frecuente solicitado por los


clientes del BCP es el crédito personal (CP) y crédito en
convenio (CC).
MODA – Datos Agrupados (intervalos de clase)
Determinar el Donde:
intervalo modal, LRI = Limite real inferior del
este intervalo modal intervalo modal.
será aquel donde se A = Amplitud interválica
encuentra la mayor modal
fi (frecuencia fi = F.A.S. del intervalo
absoluta simple). modal
f i-1 = F.A.S. anterior del
Fórmula:
intervalo modal.
 1  f i+1 = F.A.S. siguiente del
M o  LRI  A  intervalo modal.
 1   2  1  f i  f i 1
 2  f i  f i 1
Ejemplo 03: Datos Agrupados en intervalos de clase
Montos en nuevos soles correspondientes a las compras de 40
clientes de Sodimac, año 2009. Determine el monto de compra mas
frecuente de los clientes.
Fórmula:
Montos Nº Nº Clientes % % Clientes  1 
S/. Clientes Acumulado Cliente Acumulado M o  LRI  A 
fi s s s  1   2 
Fi hi% Hi% 1  f i  f i 1
300-350 fi-1=8 8 20 20
 2  f i  f i 1
350-400 fi = 9 17 23 43
Identificamos la mayor
400-450 fi+1=6 23 15 58 F.A.S.:
 (9  8) 
450-500 7 30 17 75 M o  350  50 
500-550 4 34 10 85  (9  8)  (9  6) 
550-600 6 40 15 100 M o  362.50
Total n = 40 100

El monto mas frecuente en compras de los


clientes evaluados es de S/. 362.5 nuevos
soles.
Medidas de Posición - Tendencia Central
3. MEDIANA
• Se denota por Me.
• Es el valor que divide al conjunto de datos en dos
partes iguales. La mitad de ellos son menores a Me y
la otra mitad son mayores a Me.
Medidas de Posición - Tendencia Central
MEDIANA - Datos No Agrupados
Cuando n es impar:
1. Se ordena los números en forma ascendente, es decir de menor a
mayor.
2. Se calcula el valor (n + 1)/2 y el valor mediano será el Nº que
ocupa el lugar (n + 1)/2
Cuando n es par:
1. Se ordena la serie en forma ascendente, es decir de menor a mayor.
2. El valor mediano será el promedio de los valores centrales
correspondientes a la serie ordenada.
Ejemplo 01: La siguiente información son las calificaciones de la
primera evaluación continua. Determinar la Mediana:
17 19 19 19 18 16 18 18 19 15 20
Luego de Ordenar: 15 16 17 18 18 18 19 19 19 19 20
Como n es impar, Calcular: (11+1) /2 = 6, Buscar en datos
ordenados el lugar 6.
Me = 18
“El 50% de las calificaciones de la 1era evaluación continua se
encuentran sobre la nota 18”
Medidas de Posición - Tendencia Central
Formula datos agrupados en
MEDIANA - Datos intervalos de clase:
Formula:
Agrupados n 
• Calcular el elemento   Fi 1 
Me  LRI  A 2 
determinante: n/2,  fi 
 
donde : n = número de  
datos. Donde:
LRI = Limite real inferior del
• Ubicar este elemento en intervalo de mediano
la columna de las Fi A = Amplitud interválica del
(frecuencias absolutas intervalo mediano
n = número de datos
acumuladas). i = intervalo de interés o mediano
• Determinar el intervalo i-1 = intervalo anterior al intervalo
de interés o mediano.
mediano, este intervalo es fi= frecuencia absoluta simple
aquel donde se encuentre Fi-1= frecuencia absoluta acumulada
la Fi inmediatamente anterior al intervalo mediano.
mayor o igual a n/2.
Ejemplo 02: Datos Agrupados en intervalos de clase
Montos en nuevos soles correspondientes a las compras de 40
clientes de Sodimac, año 2009. Determine la Mediana.
Fórmula:
Montos Nº Nº Clientes % % Clientes n 
  Fi 1 
S/. Clientes Acumulado Cliente Acumulado Me  LRI  A 2 
fi s s s  fi 
 
Fi hi% Hi%  
300-350 8 8 20 20 Identificamos el intervalo
mediano, calculando el
350-400 9 Fi-1=17 23 43 elemento determinante:
400-450 fi=6 Fi= 23 15 58 n/2= 40/2=20
450-500 7 30 17 75 Se busca en la F.A.A (Fi)
500-550 4 34 10 85  20  17 
M e  400  50 
550-600 6 40 15 100  6 
Total n = 40 100
M o  425

El 50% de los montos mas frecuente en


compras de los clientes evaluados supera
los S/.425 soles.
RELACION ENTRE MEDIA –
MEDIANA Y MODA
SIMETRIA
Si las tres medidas coinciden entonces se
dice que la distribución de frecuencias es
simétrica.
ASIMETRÍA POSITIVA
Si la distribución de frecuencias es
asimétrica de cola a la derecha entonces,
la moda es menor que la mediana y esta a
su vez es menor que la media.
ASIMETRÍA NEGATIVA
Si la distribución de frecuencias es
asimétrica de cola a la izquierda entonces,
la media es menor que la mediana y esta a
su vez es menor que la moda.
MEDIDAS DE LOCALIZACION
CUARTILES
• Se denotan por Q1, Q2 y Q3
• Son los valores que dividen a un
conjunto de datos ordenados en forma
ascendente en cuatro partes iguales.
MEDIDAS DE LOCALIZACIÓN
CUARTILES - Datos No Agrupados
• Ordenar los datos en forma ascendente (menor a mayor).
• Se localiza el punto de posición k (PQk) del valor
correspondiente a: k(n+1)/4 (Para Qk) observación realizada.
Ejemplo 01: La siguiente información son las calificaciones de
la primera evaluación continua. Determinar el Q1 y Q3:
17 19 19 19 18 16 18 18 19 15 20

Luego de Ordenar:15 16 17 18 18 18 19 19 19 19 20
Calcular: PQ1 = 1(11+1) / 4 = 3; PQ3 = 3 (11+1)/4 = 9 ,
Tomar los valores en la posición 3 y 9.
Q1 = 17 : “El 25 porciento de las calificaciones de T1 se
encuentran bajo la nota 17”
Q3 = 19: “El 75 porciento de las calificaciones de T1 se
encuentran bajo la nota 19”
MEDIDAS DE LOCALIZACION
CUARTILES - Datos No Agrupados
• Ordenar los datos en forma ascendente (de menor a mayor).
• Si k(n+1)/4 NO es un entero, entonces hacemos una interpolación
lineal entre los dos valores correspondientes a las dos observaciones
entre las cuales se encuentra la fracción.
Ejemplo 02: La siguiente información son las calificaciones de la
primera evaluación continua. Determinar el Q1 y Q3:
17 19 19 19 18 16 18 18 19 15
Luego de Ordenar: 15 16 17 18 18 18 19 19 19 19
Calcular: PQ1 = 1(10+1) / 4 = 2.75; PQ3 = 3 (10+1)/4 = 8.25
Tomar los valores en donde se encuentre la fracción e interpolar:

Q1 = 16 + 0.25 (17-16) = 16.25 : “El 25 % de las notas de T1 se


encuentran bajo 16.25”

Q3 = 19 + 0.75 (19-19) = 19 : “El 75 % de las notas de T1 se encuentran


bajo 19”
MEDIDAS DE LOCALIZACION
CUARTILES: Datos
Formula:  n 
Agrupados (intervalos  k    Fi 1 
4
de clase) Qk  LRI  A   
 fi 
 
Determinar el intervalo  
cuartil, identificando la Donde:
clase que contiene a Qk LRI = Limite real inferior del
intervalo del cuartil k.
determinando la A = Amplitud interválica del
menor de las intervalo del cuartil k.
frecuencias absolutas n = número de datos
acumuladas Fi que k= número del cuartil.
fi= frecuencia absoluta simple
supera a: del intervalo del cuartil k.
k(n/4) Fi-1= frecuencia absoluta
acumulada anterior al intervalo
del cuartil k.
Ejemplo 03: Datos Agrupados en intervalos de clase
Montos en soles correspondientes a las compras de 40 clientes de
Sodimac, año 2009. Obtenga los cuartiles Q1 y Q3.
Montos Nº Nº Clientes % % Clientes Fórmula:  n 
S/. Clientes Acumulado Cliente Acumulado  k    Fi 1 
4
fi s s s Qk  LRI  A   
Fi hi% Hi%  fi 
 
300-350 8 Fi-1= 8 20 20  

350-400 fi= 9 Fi = 17 23 43 Buscar los intervalos del


400-450 6 Fi-1=23 15 58 cuartil 1 y 3, haciendo uso
de los puntos de posición:
450-500 fi= 7 Fi = 30 17 75 PQ1=k(n/4)= 1(40/4)=10
500-550 4 34 10 85 PQ3=k(n/4)= 3(40/4)=30
550-600 6 40 15 100 Se buscan en las F.A.A.
(Fi)
Total n = 40 100
 10  8  “El 25% de los montos en soles, de los clientes
Q1  350  50   361.1
 9  evaluados, se encuentran bajo los S/. 361.1 soles”.

 30  23  “El 75% de los montos en soles, de los clientes


Q3  450  50   500 evaluados, se encuentran bajo los S/. 500 soles”.
 7 
MEDIDAS DE LOCALIZACIÓN
PERCENTILES
• Se denotan por P1, P2 …y P99
• Son los valores que dividen a un
conjunto de datos ordenados en forma
ascendente en cien partes iguales.
MEDIDAS DE LOCALIZACIÓN
PERCENTILES - Datos No Agrupados
• Ordenar los datos en forma ascendente.
• Se localiza el punto de posición del valor
correspondiente a la: k(n+1)/100
( Para Pk ) observación realizada.
• Si k(n+1)/100 NO es un entero, entonces
hacemos una interpolación lineal entre los
dos valores correspondientes a las dos
observaciones entre las cuales se encuentra
la fracción.
MEDIDAS DE LOCALIZACION

PERCENTILES: Datos Formula:   n  


 k   Fi 1 
100 
Agrupados (intervalos Pk  LRI  A  
 fi 
de clase) 



Identificar la clase que Donde:
contiene a Pk LRI = Limite real inferior del
determinando intervalo del percentil k.
A = Amplitud interválica del
la menor de las intervalo del percentil k.
frecuencias n = número de datos
absolutas acumuladas Fi k= número del percentil.
que supera a k(n/100). fi= frecuencia absoluta simple
del intervalo del percentil k.
Fi-1= frecuencia absoluta
acumulada anterior al intervalo
del percentil k.
Ejemplo: Datos Agrupados en intervalos de clase
Montos en nuevos soles correspondientes a las compras de 40
clientes de Sodimac, año 2009. Obtenga el percentil 85 (P85).
Fórmula:
  n  
Montos Nº Nº Clientes % % Clientes  k   Fi 1 
100 
S/. Cliente Acumulado Cliente Acumulado Pk  LRI  A  
s fi s s s  fi 
Fi hi% Hi%  
 
300-350 8 8 20 20
350-400 9 17 23 43 Buscar el intervalo del
400-450 6 23 15 58 percentil 85, haciendo uso
450-500 7 Fi-1= 30 17 75 de los puntos de posición:
PP85=k(n/100)=
500-550 fi= 4 Fi = 34 10 85 85(40/100)=34
550-600 6 40 15 100 Se buscan en las F.A.A. (Fi)
Total n = 40 100

 34  30  “El 85% de los montos en soles, de los


P85  500  50   550 clientes evaluados, se encuentran bajo los
 4  S/. 550 soles”.
MEDIDAS DE LOCALIZACIÓN

DECILES
• Se denotan por D1, D2 …y D9
• Son los valores que dividen a un
conjunto de datos ordenados en forma
ascendente en diez partes iguales.
MEDIDAS DE LOCALIZACIÓN
DECILES - Datos No Agrupados
• Ordenar los datos en forma ascendente.
• Se localiza el punto de posición del valor
correspondiente a la: k(n+1)/10
( Para Pk ) observación realizada.
• Si k(n+1)/100 NO es un entero, entonces
hacemos una interpolación lineal entre los
dos valores correspondientes a las dos
observaciones entre las cuales se encuentra
la fracción.
MEDIDAS DE LOCALIZACION

DECILES: Datos Formula:   n  


 k   Fi 1 
10 
Agrupados (intervalos de Dk  LRI  A  
 fi 
clase) 



Identificar la clase que Donde:
contiene a Dk LRI = Limite real inferior del
determinando intervalo del decil k.
A = Amplitud interválica del
la menor de las intervalo del decil k.
frecuencias n = número de datos
absolutas acumuladas Fi k= número del decil.
que supera a k(n/10). fi= frecuencia absoluta simple
del intervalo del decil k.
Fi-1= frecuencia absoluta
acumulada anterior al intervalo
del decil k.
Ejemplo: Datos Agrupados en intervalos de clase
Montos en nuevos soles correspondientes a las compras de 40
clientes de Sodimac, año 2009. Obtenga el Decil 5 (D5).
Fórmula:

Montos Nº Nº Clientes % % Clientes   n  


S/. Cliente Acumulado Cliente Acumulado   
k  Fi 1 
10
s fi s s s
Dk  LRI  A   
Fi hi% Hi%  fi 
300-350 8 8 20 20  
 
350-400 9 Fi-1= 17 23 43
Buscar el intervalo del decil
400-450 fi= 6 Fi = 23 15 58
5, haciendo uso de los
450-500 7 30 17 75 puntos de posición:
500-550 4 34 10 85 PD5=k(n/10)= 5(40/10)=20
Se buscan en las F.A.A. (Fi)
550-600 6 40 15 100
Total n = 40 100

 20  17 
D5  400  50   425 “El 50% de los montos en soles, de los
 6  clientes evaluados, se encuentran bajo los
S/. 425 nuevos soles”.
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los
datos, independientemente de su causa.
Amplitud o Rango:

0.05
Mín. P25 P50 P75 Máx.
Diferencia entre observaciones extremas.
 2,1,4,3,8,4. El rango es 8-1=7

0.04
 Es muy sensible a los valores extremos.

0.03
Rango intercuartílico:
25% 25% 25% 25%
 Esla distancia entre primer y tercer

0.02
cuartil. Rango intercuartílico

 Rango intercuartílico = Q3 – Q1

0.01
Rango
 Parecida al rango, pero eliminando las

0.00
observaciones más extremas inferiores 150 160 170 180 190

y superiores.
 No es tan sensible a valores extremos.
 Varianza(S2 ): Mide el promedio de las desviaciones (al cuadrado) de las
observaciones con respecto a la media.
n

  Xi  X  2

S2  i 1
Datos No agrupados
n 1

  Xi  X  2
fi
S2  i 1
Datos agrupados
n 1

 Es sensible a valores extremos (alejados de la media).


 Sus unidades son el cuadrado de las de la variable. De interpretación difícil para
un principiante.
 Contiene la información geométrica relevante en muchas situaciones donde la
energía interna de un sistema depende de la posición de sus partículas.
 Energía de rotación (vía el coeficiente de inercia): patinadores con brazos
extendidos (dispersos) o recogidos (poco dispersos)
 Energía elástica: Muelles ‘estirados’ con respecto a su posición de equilibrio
(dispersos) frente a muelles en posición cercana a su posición de equilibrio
(poco dispersos)
Desviación Estándar(s):
Es la raíz cuadrada de la
varianza. S S 2

Tiene la misma dimensionalidad 50

(unidades) que la variable. 40


Cierta distribución que veremos
más adelante (normal o 30

gaussiana) quedará
completamente determinada 20

por la media y la desviación


estándar. 10
Desv. típ. = 568,43
A una distancia de una desv. Media = 2023

estándar de la media hay más de la 0 N = 407,00

“más de la mitad”.
Peso recién nacidos en partos gemelares
Coeficiente de variación (C.V.):
Es la razón entre la desviación estándar y la media.
 Mide la desviación estándar en forma de “qué tamaño tiene con
respecto a la media”
 También se la denomina variabilidad relativa.
 Es frecuente mostrarla en porcentajes
 Si la media es 80 y la desviación típica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa).
 Esuna cantidad adimensional. Interesante para comparar
la variabilidad de diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura.

 EstaMedida de Dispersión es útil para comparar la


dispersión entre dos o más distribuciones de variables
con diferentes unidades de medida. Donde :
S
CV  100%  S : Desviación estándar
x x : media aritmética
SI EL COEFICIENTE DE VARIACION ES MENOR AL 33%
ENTONCES LOS DATOS PRESENTAN UNA DISTRIBUCION
HOMOGENEA, ES DECIR MENOS DISPERSA MAS
CERCANA UNAS A OTRAS.

SI EL COEFICIENTE DE VARIACION ES MAYOR AL 33%


ENTONCES LOS DATOS PRESENTAN UNA DISTRIBUCION
HETEROGENEA, ES DECIR MAS DISPERSA.
MEDIDAS
Asimetría o Sesgo:
DE FORMA
 Se utilizan para medir el grado de deformación de una
distribución de frecuencias tomando como referencia la
Distribución Normal.
 En las distribuciones SIMÉTRICAS media y mediana
coinciden. Si sólo hay una moda también coincide.
M(x)=Me=Mo y As=O
 La asimetría es positiva o negativa en función de a qué
lado se encuentra la cola de la distribución.
Distrib. Asimétrica positiva: M(x)>Me>Mo y As > O
Distrib. Asimétrica Negativa: M(x)<Me<Mo y As < O
 La media tiende a desplazarse hacia las valores extremos
(colas).
 Las discrepancias entre las medidas de centralización son
indicación de asimetría.
 La fórmula del Coeficiente de Asimetría (As) es: Donde :

3 x  Me  S : Desviación estándar
As  x : Media aritmética
s Me : Mediana
43
ANALIZAMOS E INTERPRETAMOS
RESULTADOS

Potrebbero piacerti anche