Sei sulla pagina 1di 74

ESTADISTICA APLICADA A

LA EMPRESA I

Profesor: Joaquin Aranda Gallego


Catedrático de Universidad

Tutoría electrónica: joaquin@um.es

Curso académico 2018-2019


LA ESTADISTICA EN EL PLAN DE
ESTUDIOS

ESTADISTICA ESTADISTICA
PARA LA ADE PARA LA ADE ECONOMETRÍA
EMPRESA I EMPRESA II

MATEMATICAS PARA
LA EMPRESA
CONTENIDO

INFERENCIA
ESTADISTICA

TEORÍA DE LA
PROBABILIDAD
ESTADISTICA
PARA LA
EMPRESA I
ESTADISTICA
DESCRIPTIVA
CONTENIDO

ESTADISTICA TEORÍA DE LA INFERENCIA


DESCRIPTIVA PROBABILIDAD ESTADISTICA

Estudio de los
Análisis y fenómenos aleatorios Estudio de una
descripción de un frente a los propios parte de la
conjunto de datos. del mundo población total
Extracción de determinable. (muestra) para
información, Herramientas para inferir a partir de
indicadores y conocer y analizar el ella el
relaciones comportamiento comportamiento de
aleatorio. la población total
CONTENIDO

ESTADISTICA TEORÍA DE LA
DESCRIPTIVA PROBABILIDAD

Introducción y
conceptos básicos 1.Fundamentos de
1.Distribuciones de probabilidad.
frecuencias 2.Variables aleatorias
unidimensionales unidimensionales
2.Distribuciones de 3.Variables aleatorias
frecuencias bidimensionales.
bidimensionales 4.Modelos de vvaa.
3.Números índices
ENFOQUE

COMPRESIVO (perspectiva global)

CONSTRUCTIVO (relaciones verticales entre temas)

CONCEPTUAL (lo importante es el concepto)

INTUITIVO (visualizar el por qué frente a las


demostraciones rigurosas)

RIGUROSO (todo tiene su por qué, nada se da


porque si y el relativismo no tiene cabida)
EVALUACION
BASADA EN LOS ELEMENTOS ANTERIORES.

CONFORMADA POR EXÁMENES CORTOS DE BASE


CONCEPTUAL Y/0 PRÁCTICA (CONTROLES
PARCIALES) (15%)

EXAMEN DE EJERCICIOS CON EXCEL (15%)

UN EXAMEN FINAL TEÓRICO-PRACTICO (70%)

LAS CALIFICACIONES DE LAS EVALUACIONES


PARCIALES SE TENDRAN EN CUENTA EN LAS
CONVOCATORIAS DE JUNIO Y JULIO DEL ACTUAL
CURSO ACADEMICO Y ENERO DE 2017.
CONOCIMIENTOS PREVIOS

Herramientas matemáticas:
Logaritmos, sumatorios, progresiones aritméticas y
geométricas, derivadas, integrales simples y múltiples

Herramientas informáticas:
Internet y hoja de cálculo Excel
ESTADISTICA APLICADA A
LA EMPRESA I

TEMA 1
DISTRIBUCIONES DE FRECUENCIAS
UNIDIMENSIONALES
ESTADISTICA DESCRIPTIVA

INTRODUCCION Y CONCEPTOS BASICOS

Población y muestra
Variables estadísticas
Tipos de variables
ED.01 POBLACION Y MUESTRA

OBJETIVO DE LA E.D.: Analizar un conjunto de


datos que se corresponde con alguna característica
o características de un grupo de individuos

¿Son todos los individuos


posibles?

POBLACION MUESTRA O PARTE

NO
REPRESENTATIVA
REPRESENTATIVA
ED.01 VARIABLES ESTADISTICAS

Es algo que nos interesa conocer de un grupo de


individuos. La indicaremos por X

Pueden ser cuantificables o


Edad no
Sexo
Municipio de nacimiento
Enseñanza de No cuantificable Cuantificable
procedencia
Municipio de residencia
Profesión de los padres (Atributo)
Variable
Orientación profesional Variable
cuantitativa.
cualitativa
ED.01 VARIABLES ESTADISTICAS

Variable cualitativa (atributo). Las distintas opciones


que puede tomar se denominan modalidades

Variable cuantitativa. Las distintas opciones que


puede tomar se denominan valores

X x1, … ,xr

r = nº de modalidades o valores distintos


que puede tomar la variable
ED.01 VARIABLES ESTADISTICAS

X = sexo x1 = Varón, x2 = Hembra r=2

X = nº de asignaturas matriculado

x1=1, …. , x12=12 r=12

X= edad ¿CON QUÉ MEDIDA?


ED.01 VARIABLES ESTADISTICAS

X= edad ¿CON QUÉ MEDIDA?

Variable discreta
Años cumplidos r = finito y pequeño

Meses cumplidos r = finito y mediano

Variable continua
Días cumplidos r = finito y grande

Horas cumplidas r = finito y muygrande


ED.01 VARIABLES ESTADISTICAS

Las variables cuantitativas se considerarán


discretas cuando pueden tomar solo un número
pequeño (manejable) de valores. Serán continuas
cuando su número de valores sea grande
(teóricamente infinito), si bien el concepto formal
es el considerar a una v.e. como continua cuando
dados dos valores cualesquiera de ella se puede
encontrar otro valor comprendido entre ellos
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Dada una v.e. cada uno de sus valores puede


aparecer un determinado número de veces.

Al número de veces que aparece el valor xi se le


llama frecuencia absoluta y se indicará por ni.

Distribución de frecuencias {(xi,ni)}, i=1,…,r,


El conjunto formado por todos los valores que
puede tomar la variable estadística junto con el
número de veces (frecuencia), que aparece cada
uno de ellos.
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Concretando:
xi = valor (o cualidad) de la característica observada.
Se ordenan de menor a mayor, i=1,…,r

ni = número de veces que aparece xi

N = número total de observaciones realizadas


(individuos) = ∑ ni, i=1,…,r

fi = frecuencia relativa de aparición de xi; no es más que la


proporción de veces que aparece xi y por tanto es ni/N.

pi = % de veces que aparece xi; no es más que la fix100


ED.01 DISTRIBUCIONES DE FRECUENCIAS

Igualdades i=1,…,r
r

r r
ni
ni 1 N
fi 1
1 1 N N N

r r r
pi f i x100 100 f1 100 .1 100
1 1 1
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Varon Hembra Hembra


Hembra Varon Hembra
Hembra Hembra Varon
Hembra Varon Hembra
Hembra Varon Hembra
Varon Hembra Varon
Hembra Hembra Hembra
Hembra Varon Hembra

Característica: SEXO
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Tipo de variable: cualitativa (atributo)

X1 = Varón ; n1= 8
Valores (modalidades)
X2 = Hembra; n2= 16

Distribución de frecuencias: {(Varón,8); (Hembra,16)}


ED.01 DISTRIBUCIONES DE FRECUENCIAS

Tabla de frecuencias

Xi ni fi p
Varón 8 0,33 33,3
Hembra 16 0,67 66,7
Total 24 1 100
ED.01 DISTRIBUCIONES DE FRECUENCIAS

1 4 5
2 3 4
5 3 2
2 6 2
3 2 4
2 2 5
1 4 3
5 2 4

Característica: Nº de miembros de la unidad


familiar
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Tipo de variable: cuantitativa discreta

Valores 1,2,3,4,5,6,

Distribución de frecuencias: {(1,2);…, (6,1)}

xi ni
1 2
2 8
3 4
4 5
5 4
6 1
ED.01 DISTRIBUCIONES DE FRECUENCIAS

xi ni fi pi
1 2 0,083 8,3
2 8 0,333 33,3
3 4 0,167 16,7
4 5 0,208 20,8
5 4 0,167 16,7
6 1 0,042 4,2
24 1 100

Al ser una v.e. cuantitativa cabe hablar de


cuántos valores y también de…
ED.01 DISTRIBUCIONES DE FRECUENCIAS

•Ni = nº de observaciones ≤ xi

•Fi = proporción de observaciones ≤ xi

•Pi = % de observaciones ≤ xi

Esto nos lleva a los conceptos de frecuencias


acumuladas

Que se denominan, respectivamente, frecuencia


absoluta acumulada, frecuencia relativa acumulada y
porcentaje acumulado
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Su cálculo es inmediato y corresponde a:

i
Ni nj n1 n2 ... ni
1

r
Fi fj f1 f 2 ... fi
1

r
Pi pj p1 p2 ... pi
1
ED.01 DISTRIBUCIONES DE FRECUENCIAS

xi n fi pi Ni Fi P
1 2 0,083 8,3 2 0,083 8,3
2 8 0,333 33,3 10 0,417 41,7
3 4 0,167 16,7 14 0,583 58,3
4 5 0,208 20,8 19 0,792 79,2
5 4 0,167 16,7 23 0,958 95,8
6 1 0,042 4,2 24 1 100
24 1 100
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Tipo de variable: cuantitativa y continua

Valores: muchos y diferentes

Se clasifican en intervalos para poder manejarlos.


Pero los intervalos han de formar un sistema
exclusivo y excluyente:
•Intervalos disjuntos (excluyentes)
•Que cubran todas las opciones (exclusivo)

L0 L1 L2 Li-1 Li-1 Lr-1 Lr

Mínimo Máximo
Rango
ED.01 DISTRIBUCIONES DE FRECUENCIAS

L0 L1 L2 Li-1 Li-1 Lr-1 Lr

Máximo
Rango

El siguiente paso es “contar” cuántos valores hay


en cada intervalo (frecuencia absoluta) y con ello
queda definida la distribución de frecuencias, pero
ahora como: {(Li-1,Li; ni)}
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Calificaciones de 120 exámenes


4,34 7,19 2,85 6,55 3,49 8,93 7,62 3,63
7,53 2,22 1,59 2,74 4,74 3,28 4,16 7,05
9,39 5,59 7,23 6,08 5,63 3,43 4,29 2,33
5,49 3,85 6,76 5,95 6,15 9,73 8,39 3,18
4,96 9,42 4,95 8,01 7,16 3,24 1,98 9,70
9,87 1,48 9,44 7,66 3,88 1,34 6,33 2,52
3,24 1,20 1,49 0,30 9,41 7,05 7,56 9,74
5,59 9,07 9,51 8,53 2,57 4,62 8,07 4,66
0,52 9,68 1,66 5,21 9,64 7,57 6,85 4,06
4,88 3,51 6,64 3,19 1,96 1,23 7,35 2,85
0,98 4,71 4,96 6,29 9,42 1,40 6,65 3,72
0,88 9,15 8,21 5,84 3,33 8,58 3,63 0,13
3,65 8,50 0,78 1,87 9,30 6,30 2,37 9,30
5,37 3,58 1,47 7,05 0,08 7,90 6,11 8,00
7,61 6,52 7,73 7,98 9,43 5,55 5,59 6,87
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Li-1 - Li ni fi pi
0-1 7 0,0583 5,83
1-2 12 0,10 10,00
2-3 8 0,0667 6,67
3-4 16 0,133 13,33
4-5 12 0,10 10,00
5-6 10 0,0833 8,33
6 -7 13 0,1083 10,83
7-8 16 0,1333 13,33
8-9 9 0,0750 7,50
9 - 10 17 0,141 14,17
Sumas 120 1 100
Consideremos los intervalos cerrados por la derecha y
abiertos por la izquierda, excepto el primero que es cerrado
por ambos lados
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Tabla de frecuencias completa

Li-1-Li n fi pi Ni Fi P
0-1 7 0,058 5,83 7 0,058 5,8
1-2 12 0,10 10,00 19 0,158 15,8
2-3 8 0,066 6,67 27 0,225 22,5
3-4 16 0,13 13,33 43 0,358 35,8
4-5 12 0,10 10,00 55 0,458 45,8
5-6 10 0,083 8,33 65 0,542 54,2
6 -7 13 0,108 10,83 78 0,650 65,0
7-8 16 0,13 13,33 94 0,783 78,3
8-9 9 0,075 7,50 103 0,858 85,8
9 - 10 17 0,14 14,17 120 1 100
120 1 100
ED.01 DISTRIBUCIONES DE FRECUENCIAS

La introducción de los intervalos no permite realizar


cálculos con los valores de la variable. Se hace
preciso “discretizar” la variable continua para poder
trabajar con ella. Para eso se introduce el concepto
de marca de clase, que no es más que sustituir cada
intervalo por su centro.

De este modo sustituiremos, a efectos de posteriores


cálculos y cuando sea preciso, cada intervalo Li-1-Li
por su “representante” Xi

Li 1 Li En cuanto a la diferencia Li-Li-1 = ai


xi la denominaremos amplitud del
2 intervalo i-ésimo
ED.01 DISTRIBUCIONES DE FRECUENCIAS

Con lo cual la tabla de frecuencias anterior, quedaría como


sigue y en su tratamiento posterior la variable se va a tratar,
a efectos dé cálculo, como discreta.

Li-1-Li xi n fi pi Ni Fi P
0-1 0,5 7 0,05 5,8 7 0,05 5,8
1-2 1,5 12 0,10 10,0 19 0,15 15,8
2-3 2,5 8 0,06 6,7 27 0,22 22,5
3-4 3,5 16 0,13 13,3 43 0,35 35,8
4-5 4,5 12 0,10 10,0 55 0,45 45,8
5-6 5,5 10 0,08 8,3 65 0,54 54,2
6 -7 6,5 13 0,10 10,8 78 0,65 65,0
7-8 7,5 16 0,13 13,3 94 0,78 78,3
8-9 8,5 9 0,07 7,5 103 0,85 85,8
9 - 10 9,5 17 0,14 14,2 120 1 100
120 1 100
ED.01 REPRESENTACIONES GRAFICAS

DIAGRAMAS DE RECTANGULOS Y/O SECTORES

Diagrama de rectángulos (barras). Nº de Diagrama de sectores. Nº de


miembros por familia. (representación de %)
33,3
miembros por familia. (%)
4,2 8,3

16,7 1
20,8
16,7 16,7 2
3
33,3
8,3 4
20,8
4,2 5
6
16,7
1 2 3 4 5 6

Válidos para variables cualitativas y cuantitativas discretas


ED.01 DISTRIBUCIONES DE FRECUENCIAS

Histograma: calificaciones de examen

17
16 16

13
12 12
10
9
8
7

0-1 1-2 2-3 3-4 4-5 5-6 6 -7 7-8 8-9 9 - 10

Caso de variables cuantitativas continuas


ED.01 REPRESENTACIONES GRAFICAS

CURVAS ACUMULATIVAS. Para frecuencias acumuladas

% Acumulado del nº de miembros por


familia
100 100
90 95,8
80
70 79,2
60
50 58,3
40
41,7
30
20
10 8,3
0
1 2 3 4 5 6

Solo tiene sentido para v.e. cuantitativas discretas


ED.01 DISTRIBUCIONES DE FRECUENCIAS

HISTOGRAMA ACUMULATIVO. Para frecuencias


acumuladas

Histograma acumulado. Nº de
Calificaciones examen 120
120 miembros por familia
103
100 94
78
80
65
60 55
43
40
27
19
20
7
0
N
ED.01 DISTRIBUCIONES DE FRECUENCIAS

CURVA ACUMULATIVA. Para frecuencias acumuladas

Frecuencias absolutas acumuladas.


Calificaciones.
120

100

80

60

40

20

0
0-1 1-2 2-3 3-4 4-5 5-6 6 -7 7-8 8-9 9 - 10
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

OBJETIVO: Buscar indicadores que representen y sinteticen el conjunto


de datos.

Sintetizar: refundir toda la información en un solo indicador


Representar: conocer hasta qué punto ese indicador representa al
conjunto de datos

Hacen falta dos clases de indicadores:

•De posición, es decir indicadores que informen y representen al


conjunto de datos

•De dispersión: que informen o bien de la representatividad de los


anteriores, o bien nos informe del grado de acumulación o dispersión de
los datos y por tanto de su grado de variabilidad.
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIDAS DE POSICIÓN: Buscan el “centro” o indicadores


relevantes de los aspectos más resaltables del conjunto de dato

MEDIA ARITMÉTICA: Es el promedio de todos los datos obtenidos.


Al producirse repeticiones de valores (frecuencias), su cálculo se
realiza como:

r
xi ni r
1
X xi f i
N 1

La frecuencia puede interpretarse como la “importancia” que tiene


cada valor, dentro del conjunto de datos
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

La ordenación de cálculos para la media es muy simple, basta


construir lo siguiente sobre la tabla de frecuencias:

xi ni xini
1 2 2
2 8 16
3 4 12
4 5 20
5 4 20
6 1 6
r
Sumas 24 76 xi ni
1 76
X 3,17
MEDIA 3,17 N 24
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIA ARITMÉTICA: Al ser un promedio que combina valores con


frecuencias, la resultante del cálculo puede interpretarse como el
centro de la distribución de frecuencias. Y de hecho es el
equivalente a su centro de gravedad, hablando en términos físicos.

Diagrama de rectángulos (barras). Nº de


miembros por familia. (representación de %)
33,3

20,8
16,7 16,7

8,3
4,2

1 2 3 4 5 6

Media = 3,17
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Una cuestión a tener siempre en cuenta es hasta qué punto la media


representa adecuadamente el conjunto de datos, además de ser su
centro. Dicho de otro modo, para ser un buen indicador debe estar
suficientemente cerca de todos los valores de la variable. Esto
supone introducir un concepto adicional: la representatividad de la
media aritmética

Si 5 personas tienen un salario de 800 euros y una sexta persona


tiene un salario de 5.000 euros mensuales. El salario medio del
conjunto es de 1.500 euros. ¿Es un buen indicador de la distribución
de los salarios de esa pyme?

Si por el contrario las primeras 5 personas mantuvieran su salario


de 800 euros y la sexta lo tuviera de 1.200 la media sería de 866,6
euros. ¿Es mejor representante que en el caso anterior?
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Una propiedad útil de la media. ¿Qué ocurre si hacemos un cambio


de variable?.
Por ejemplo si tenemos una distribución de salarios en euros y
queremos convertirla a dólares. ¿Qué ocurre con la media? ¿Hay
que calcularla de nuevo?

Y a bX Y a bX
r r r r r r
yi ni (a bxi )ni ani bxi ni a ni b xi ni
1 1 1 1 1 1
Y
N N N N N N
aN
bX a bX
N
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIA PONDERADA: Es análoga a la media aritmética excepto que


ahora se pondera cada valor por su “importancia”, obtenida a partir
de información externa o bien introducida de forma subjetiva.

r
xi wi
1
Xw r
wi
1

Precio medio del kg de carne consumido por una familia durante un


periodo de tiempo. (El precio de cada tipo de carne se pondera por
el número de kgs consumidos)..
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIA GEOMETRICA: Medida del “centro” de una distribución pero


utilizable solo en casos concretos en los que se producen
comportamientos multiplicativos o específicamente complejos.

N n1 n2 nr
G x .x ...x
1 2 r

Tipo medio de interés aplicado a una operación financiera durante


varios periodos de tiempo.

Puede utilizarse también la media geométrica ponderada,


sustituyendo las frecuencias n por las ponderaciones w.
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MODA: Es el valor que más se repite o que más veces aparece. Puede
utilizarse tanto para variables cualitativas como cuantitativas.

En el caso de v.e. cualitativas o de cuantitativas discretas es


simplemente el valor que presente mayor frecuencia. Esto supone que
una distribución de frecuencias no tiene por qué tener solo una moda o
valor modal (distribución unimodal), sino que puede ocurrir que tenga
varias modas (distribución multimodal)

Cuando se trata de v.e. cuantitativas continuas se hablará de intervalo


modal, que será aquel que presente mayor frecuencia.
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN
Diagrama de rectángulos (barras). Nº de
miembros por familia. (representación de %)
33,3

20,8
16,7 16,7
MODA: Mo=2
8,3
4,2

1 2 3 4 5 6

17
16 16

13
12 12
10 INTERVALO MODAL
9
8
7

0-1 1-2 2-3 3-4 4-5 5-6 6 -7 7-8 8-9 9 - 10


ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIANA: Es aquel valor que es superado por al menos el 50% de las


observaciones y que, a la vez, supera al menos al 50% de las
observaciones. A efectos prácticos es el valor que se corresponde con
una frecuencia acumulada del 50% cuando ese valor existe.

En el caso discreto se puede obtener ordenando todos los valores de


menor a mayor, tantas veces como frecuencia tengan, y designando
como mediana el que ocupe el lugar central (o la media de los dos
valores centrales, en su caso)

En el caso continuo hay que calcular en primer lugar el intervalo


mediano, que es primero en que el valor de la frecuencia acumulada es
al menos del 50%. Dentro de él estará la mediana y su expresión se
obtiene mediante un cálculo geométrico.
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIANA: Me=3

xi n fi pi Ni Fi P
1 2 0,1 8,3 2 0,1 8,3
2 8 0,3 33,3 10 0,4 41,7
3 4 0,2 16,7 14 0,6 58,3
4 5 0,2 20,8 19 0,8 79,2
5 4 0,2 16,7 23 1,0 95,8
6 1 0,0 4,2 24 1 100
24 1 100
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Li-1-Li Ni Fi Pi
0-1 7 0,058 5,8
1-2 19 0,158 15,8
2-3 27 0,225 22,5
3-4 43 0,358 35,8
4-5 55 0,458 45,8
5-6 65 0,542 54,2
6 -7 78 0,65 65,0
7-8 94 0,783 78,3
8-9 103 0,858 85,8
9 - 10 120 1 100

Intervalo mediano: 5-6


ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Ni

N/2 N/2

Ni-1
x

Li-1 Me Li

Intervalo mediano Mediana Me=Li-1+x


ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

N N
Ni 1 Ni 1
x 2 ( Li Li 1 ) 2 ai
Ni Ni 1 ni

60 55 5
x 1 1 0,5
10 10

Mediana Me= 5 + 0,5 = 5,5


ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

CUANTILES O PERCENTILES: Aquellos valores que dejan por debajo


de ellos el q% de la distribución.

Es una extensión del caso de la mediana, la cual no es más que un caso


particular en el que q=50%

Su cálculo es similar en el caso discreto, de tal modo que, por ejemplo, el


cuantil del 20% se obtendría ordenando los valores de la variable de
menor a mayor, tantas veces como frecuencia tengan, y designando
como cuantil del 20% al valor que ocupe el lugar correspondiente al 20%
de la frecuencia total

En el caso continuo hay que calcular en primer lugar el intervalo en el


que se intregra el cuantil, que es primero en que el valor de la frecuencia
acumulada es al menos del 20%. Dentro de él se encontrará el cuantil y
se obtendrá por métodos geométricos
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

N N
q Ni 1 q Ni 1
x 100 ( Li Li 1 ) 100 ai
Ni Ni 1 ni
Cq= Li-1+x, siendo Li-1 el extremo inferior del
intervalo en el que está el cuantil

24 19 5
x 1 1 0,833
6 6
C20= 2 + 0,833 = 2,833
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN
Los cuantiles son una medida de dispersión, puesto que su
ubicación concreta viene a expresar cómo se encuentra de
dispersa la distribución. O, considerando solo algunos de
ellos, cuál es el grado de dispersión que existe en un tramo
concreto.

Por ejemplo si se consideran los cuantiles C25 y C75


tendremos una medida de entre qué valores se concentra la
mitad central de la distribución. Y de ahí derivar una medida
de su densidad en ese tramo frente a la que, por ejemplo,
pueda darse en las colas o zonas más extremas

C25 C75
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Otras medidas de dispersión más específicas:

Recorrido o rango Re: medida del campo de variación de la


variable (máximo valor – mínimo valor)

Varianza S2: Distancia media (ponderada) a la que se


encuentran todos los valores de la variable de su centro,
considerando como tal a la media aritmética

Desviación típica S: raíz cuadrada positiva de la varianza

Coeficiente de variación CV: cociente entre la desviación


típica y la media aritmética
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

VARIANZA S2 :expresión general y expresión


reducida
r r r r r
S2 ( xi x ) 2 f i ( xi2 x 2 2 xi x ) f i xi2 f i x 2 fi 2 xi xf i
1 1 1 1 1
r r r r r
2 2 2 2 2 2 2
x f x
i i fi 2 x xi f x f x
i i 2x x f x
i i
1 1 1 1 1

Mide la dispersión en torno a la media. Qué tan


cerca o lejos se encuentran, en promedio, todos los
valores de la variable de su media.
Cuanto menor sea su valor más representa la media
al conjunto de datos
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Cambio de variable

2 2 2
Y a bX S ( y) b S ( X )

r r
S 2 ( y) ( yi y)2 fi [(a bxi ) (a bx )]2 f i
1 1
r r
2 2 2 2 2
[(bxi bx )] f i b (xi x ) fi b S (X )
1 1
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Desviación típica S: se introduce como medida de


dispersión, con un significado similar al de la
varianza, pero para resolver el probleme de unidad
de medida. La varianza está en unidades al
cuadrado, en tanto que la desviación típica, al
definirse como su raíz cuadrada positiva, está en las
mismas unidades que la variable

2
S S

Y a bX S ( y) bS ( X )
ED.01 MEDIDAS DE POSICIÓN Y DISPERSIÓN

Coeficiente de variación CV: Medida que combina variabilidad


con la media. Se define como el cociente entre S y la media y
tiene como característica principal que es una medida
adimensional. Al carecer de unidad de medida, permite
compara el CV de distribuciones de frecuencias con unidades
de medida diferentes. Es asimismo una forma de medir la
representatividad de la media en cuanto que nos da qué tan
grande es la dispersión (S), tomando como referencia el valor
de la media

S
CV
X
A veces suele expresarse en %; es decir multiplicado por 100
ED.01 MEDIDAS DE CONCENTRACIÓN

Objetivo: Conocer si los individuos (datos) se encuentran muy


repartidos entre todos los valores de la variable o, por el
contrario, se concentran en pocos valores.

En este contexto se producirá una concentración máxima


cuando todos los individuos posean el mismo valor y, por
tanto, a dicho valor le corresponda toda la frecuencia N.

El caso contrario, mínima concentración, es el que se


produce cuando la frecuencia se distribuye uniformemente
entre todos los valores.
ED.01 MEDIDAS DE CONCENTRACIÓN

La aplicación más usual del concepto de concentración se


realiza en el contexto de la distribución de rentas o salarios.
Aquí, si se calcula la masa salarial total percibida,
potencialmente, por un conjunto de inviduos, se dirá que hay
concentración total cuando uno de ellos recibe todo el dinero
y el resto no recibe nada. Por el contrario se hablará de
concentración mínima (equidistribución) cuando todos
perciben el mismo salario o la misma parte de la masa
monetaria total.

En este contexto notaremos por xi el nivel salario o salario i-


esimo
ED.01 MEDIDAS DE CONCENTRACIÓN

En este contexto vamos a considerar un conjunto de N


individuos que reciben unos salarios x1,x2,…,xr siendo ni el
número de individuos que perciben el salario xi, i=1,…,r.

La masa salarial total será:

r
M xi ni
1

Y el salario total percibido por los individuos que ganan xi


unidades monetarias, será la cantidad mi= xini
ED.01 MEDIDAS DE CONCENTRACIÓN

xi ni mi=xini Ni Mi
x1 n1 m1=x1n1 N1 M1
x2 n2 m2=x2n2 N2 M2

xr nr mr=xrnr Nr Mr
Podemos exponer esta tabla de frecuencias en la que
incluimos la masa salarial en cada nivel de salarios y la masa
salarial Mi acumulada hasta el i-ésimo salario. Es decir la
cantidad de dinero total percibido por los individuos que
ganan a lo sumo xi unidades monetarias. Estamos ante el
equivalente formal de la frecuencia acumulada pero
asociada, ahora, a los valores mi
ED.01 MEDIDAS DE CONCENTRACIÓN

Introducimos ahora los % acumulados correspondientes a las


frecuencias absolutas Ni y a las masas salariales acumuladas
Mi

Ni Mi
Pi x100 Qi x100
N M

Donde Pi es el % de individuos que ganan a los sumo xi


unidades monetarias y Qi es el % de la masa salarial total
que reciben los individuos que ganan a los sumo xi unidades
monetarias
ED.01 MEDIDAS DE CONCENTRACIÓN

Todo lo anterior puede resumirse en la siguiente tabla:

xi ni mi=xini Ni Mi Pi Qi
x1 n1 m1=x1n1 N1 M1 P1 Q1
x2 n2 m2=x2n2 N2 M2 P2 Q2

xr nr mr=xrnr Nr Mr Pr Qr
ED.01 MEDIDAS DE CONCENTRACIÓN

Con esa información estamos ya en disposición de conocer


cuál la concentración de salarios:
Extrema, en la que toda la masa salarial se concentra en un
solo nivel salarial, o :equidistribuida, si la masa salarial se
reparte uniformemente en cada nivel.

Diremos entonces que se produce equidistribución si los % Pi


y Qi coinciden ∀i, i=1,…,r. Es decir, por ejemplo, el 10% de
los menos cobran perciben el 10% de la masa salarial; el
20% de los que menos cobran perciben el 20% de la masa
salarial, … y así sucesivamente, para cualquier % que
consideremos.

Gráficamente, este hecho, en unos ejes PxQ daría lugar la


diagonal principal de un cuadrado de lado 100.
ED.01 MEDIDAS DE CONCENTRACIÓN

Ri

100

Equidistribuciòn

P1 P2 P3 Pr 100 Pi
ED.01 MEDIDAS DE CONCENTRACIÓN

Si, por el contrario toda la masa salarial se concentra


en el nivel xr entonces el valor Pi=0 para todo valor
distinto de r y la masa salarial total M se concentra
Ri
(se posiciona) en el valor xr
100

Concentración máxima

P1 P2 P3 Pr 100 Pi
ED.01 MEDIDAS DE CONCENTRACIÓN

Ri
Situación intermedia
100

Curva de Lorenz

P1 P2 P3 Pr 100 Pi

El área rayada es una medida del grado de


concentración
ED.01 MEDIDAS DE CONCENTRACIÓN

Una medida de la concentración es el denominado INDICE DE


GINI, que da una aproximación de que parte supone el área
encerrada entre la curva de Lorenz y la diagonal principal y el área
total del triángulo en el que se encuentra.

r 1
( Pi Qi )
1
IG r 1
Pi
1

Concentración máxima ⟹ Q1=Q2=…=Qr-1=0 ⟹ IG=1

Concentración mínima⟹ Qi=Pi i=1…r ⟹ IG=0

Potrebbero piacerti anche