Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PROGRAMA DE ESPECIALIZACIN
EN FINANZAS
SEUPROS-2016
ESTADSTICA PARA FINANZAS
. mediciones,
. observaciones,
. valores
No agrupada
Univariada Agrupada
No Agrupada
Bivariada Agrupada
Multivariada
Glosario de trminos
Datos
Estadstica
Estadstica descriptiva
Inferencia Estadstica
Probabilidad
Censo
Muestreo
Unidad de Estudio
Poblacin
Tamao de la poblacin
Muestra
Parmetro
Estadstico
Conceptos
DATOS
Estadstica Descriptiva,
Inferencia Estadstica y
Probabilidad
ESTADSTICA DESCRIPTIVA
ESTADSTICA DESCRIPTIVA
En resumen, se busca entender La Distribucin del
conjunto de los valores de los datos.
Varianza
Desviacin estndar
Proporcin
Total
Medidas de tendencia central
y de posicin
Datos No agrupados
Medidas de Tendencia Central
Definicin general:
Media Aritmtica
Mediana
Moda
Media Geomtrica
Media Armnica
Media Aritmtica
n
x i
45 41 ... 45 37
MX i 1
43.5
n 20
k
x wi xi w1 x1 w2 x2 .... wn xn
i 1
n
w
i 1
i 1
n x i i
n1 x1 n2 x2 ... nk xk
xT i 1
k
n1 n2 ... nk
n
i 1
i
Ejemplo:
En una central telefnica se recibieron,
entre las 9 a.m. y las 10 a.m. 70 llamadas con una
duracin menor a 3 minutos, cuyo tiempo promedio fue de
2.4 minutos;
50 llamadas con una duracin de 3 minutos o ms pero
menor a 10 minutos, cuyo tiempo promedio de duracin
fue de 6.4 minutos;
30 llamadas con una duracin superior a loa 10 minutos
con un tiempo promedio de 15.3 minutos.
Si Y X b M (Y ) M ( X ) b
Propiedades de la media:
Si Y aX M (Y ) aM ( X )
Si Y aX b M (Y ) aM ( X ) b
Caracterstica de la media aritmtica
(x x) 0
i 1
i a, , b
Mediana (Me)
Es aquel punto o posicin en la escala de la variable que divide a
los datos en dos grupos con igual nmero de observaciones
Se tienen los siguientes datos: X 1 , X 2 ,, X n
entonces:
X n 1 si n es impar
2
Me
1
X n X n si n es par
2 2 2
1
Mediana (Me)
n
X i Me es minima a, , b
i 1
Moda (Mo)
Es el valor que se presenta con mayor frecuencia en un conjunto
de observaciones.
Una distribucin puede tener una moda (unimodal), ms de una
moda (bimodal, trimodal, etc.), o ninguna.
En distribuciones continuas, se puede hallar un intervalo modal (o
ms de uno).
Es la nica medida de tendencia central que puede utilizarse con
datos en escala nominal.
0,5000 Moda
0,4500
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000
0 1 2 3 4 5 6 7
Rango
Media armnica ( Xa ) n
xa n
1
i 1 xi
Se emplea cuando lo que se quiere promediar son razones,
donde los numeradores son los mismos para todas las razones
pero los denominadores son diferentes.
Razones: son ratios que muestran comparaciones o indican una
divisin:
Se utiliza para algunos clculos como el costo promedio de las
acciones adquiridas a lo largo del tiempo.
Ejemplo:
Poblacin por kilmetro cuadrado, ingreso per-capita, unidades
producidas por hora, etc.
Percentiles Cuantiles
Son medidas descriptivas que permiten dividir, distribuir o sub-
clasificar los datos, a uno y otro lado en porcentajes dados, una
vez ordenados y clasificados.
Pk X k n 1 Percentil k
100 2
Percentiles Cuantiles
Percentiles con que ocasionan divisiones particulares
Q1 X 1n 1
primer cuartil de un total de 3
4 2
D3 X 3n 1 tercer decil de un total de 9
10 2
y
Ly (n 1)
100
Cmo determinar la posicin de un percentil
Py es el valor por debajo del cual cae el y% de la distribucin, o el y-
simo percentil. Para n observaciones ordenadas ascendentemente, la
posicin Ly del y-simo percentil Py es:
y
Ly (n 1)
100
Si Ly = entero, la localizacin corresponde a una observacin.
xg n X 1 X 2 ... X n
FORMULA 1: Factor de crecimiento promedio
(Cuando slo se tienen los factores de crecimiento)
Rg n 1 R1 1 R2 ... 1 Rn 1
Las aplicaciones ms comunes de esta medida estn
cuando se tienen variables que cambian a travs del
tiempo.
Xt
FCt
X t 1
Xt :Valor de la variable en el periodo t
X
xg t
f
X0
t : Nmero de periodos
Tasa de Crecimiento (TC)
Cuantifica la variacin de una variable a travs del
tiempo. Las tasas de crecimiento pueden ser anuales,
mensuales, semanales, etc.
r xg 1
Es decir si tengo una media geomtrica de 1.65 ( 165%),
significar que la Tasa promedio de crecimiento fue de
0.65 ( 65%)
A mayor dispersin de los datos, mayor diferencia entre estas dos medidas.
Slo son iguales cuando todas las observaciones son iguales.
Para valores diferentes,
Datos No agrupados
Medidas de dispersin
R X max X min
Rango intercuartlico
Es una medida que mantiene la idea del rango pero no es influenciado por
los valores extremos. El Rango Intercuartil mide la dispersin de la mitad
(50%) de los datos. La idea es dividir los datos ordenados en cuatro partes
iguales y ver cuan alejadas estn las dos partes extremas. Para
distribuciones sesgadas o con datos discordantes, RI tiende a ser la mejor
Medida de la dispersin
RI Q3 Q1
Desviacin absoluta media
(Mean Absolute Deviation - MAD)
X i X
DAM i 1
n
Varianza y desviacin estndar
Es el promedio de las desviaciones al cuadrado respecto de la media
aritmtica.
N
Poblacional:
iX 2
2 i 1
N
n
Muestral:
iX X 2
s2 i 1
n
Al calcular la varianza muestral se utiliza n-1 como denominador
debido a que se mejoran las propiedades estadsticas de s 2.
En trminos estadsticos, s 2 es un estimador insesgado de 2 .
La cantidad n-1 representa los grados de libertad al estimar la
varianza poblacional ya que cuando se calcul la media, solo quedaron
n-1 desviaciones independientes respecto de la media.
Semivarianza y semidesviacin
Estas mediciones nacen de la preocupacin de los inversionistas por
medir el riesgo de los retornos que se encuentran por debajo de la
media.
Se calculan considerando solo las observaciones que son menores
que la media.
Coeficiente de variacin
Mide cunta dispersin respecto de la media existe en una distribucin.
Permite la comparar de forma directa diferentes conjuntos de datos.
En inversiones el CV mide el riesgo por unidad de retorno esperado
(media).
SX
CV
X
Ratio de Sharpe
Mide el exceso de retorno por unidad de riesgo.
Es utilizado para medir la performance de inversiones.
Basado en informacin histrica de los retornos, el ratio Sharpe
de un portafolio se define como:
rp rf
Ratio de Sharpe
p
donde:
Limitaciones:
n
(X i X)
SK
( n 1)( n 2) s3
Para n muy grandes la expresin se reduce a:
1
(X i X)
SK
n s3
P Z k 2
1
k
P Z k 1 2
1
k
P k X k 1 2
1
Donde: k
( X )
Z
Desigualdad de Chebyshev
Ejemplo:
Obtener cul es la probabilidad mxima de que una variable aleatoria
difiera de su media en al menos 2,3,4 y 5 veces la desviacin tpica
Se expresa:
CovRi , R j E Ri E ( Ri )R j E ( R j )
Ri Retorno de la inversin i
Rj Retorno de la inversin j
Covarianza
Poblacin
( X i )(Yi )
N
Cov( X , Y ) X , Y i 1
N
Muestra
n
( X i X )(Yi X )
Cov( X , Y ) S X , Y i 1
n 1
Covarianza
PROPIEDADES
5.Cov(Ri, Rj) < 0 -- Cuando el retorno de una inversin est por encima de su
valor esperado, el retorno de la otra inversin tender a estar por debajo de su
valor esperado (relacin inversa).
6.Cov(Ri, Rj) = 0
No existe relacin entre los resultados de las variables (inversiones).
Correlacin
Mide el movimiento conjunto (relacin lineal) entre dos variables
aleatorias.
Se expresa:
CovRi R j
Ri , R j i j
( Ri ) ( R j )
Correlacin
PROPIEDADES
1.Mide la fuerza de la relacin lineal entre variables aleatorias
n
E RP w1E R1 w2 E R2 wn E Rn wi E Ri
i 1
w w CovR , R
n
Var RP i j i j
i 1
Aplicacin
Medidas de posicin
Datos A-grupados
Media
k
x f
k
i i
o
x xi hi
x i 1 i 1
n xi
n
Usaremos la frmula siguiente
2 F i 1
Me Li c
fi
donde:
Li : Lmite inferior del intervalo mediano
c : amplitud de clase del intervalo mediano
Fi 1 : Frecuencia absoluta acumulada anterior al
intervalo mediano
fi : Frecuencia absoluta simple del intervalo mediano
Cuando no se tienen las frecuencias absolutas, se puede utilizar
la siguiente frmula, con frecuencias relativas:
0.5 H i 1
Me Li c
hi
Donde:
n
Fi H i 0.5
2
Moda (Mo)
Intervalo modal
Es aquel intervalo cuya frecuencia absoluta simple es mayor, o es
aquel intervalo cuya frecuencia relativa simple es mayor.
Moda
d1 d1 f i f i 1
Mo Li c donde :
d1 d 2 d 2 f i f i 1
a, , b
Relaciones entre la media, la mediana y la moda
x Me Mo
Si en una distribucin unimodal se cumple que:
x Me Mo
Entonces la distribucin ser asimtrica negativa
(tiene sesgo o cola hacia la izquierda)
x Mo 3( x Me)
Media armnica datos agrupados
n
xa k
fi
i 1 xi
Percentiles (Pk)
nk
100 Fk 1
Pk Li c k 1,2,...99
fi
k
100 H k 1
Pk Li c k 1,2,...99
hi
Diagrama de Barras
Diagrama de Bastones
Diagrama de Frecuencia
Histogramas
Diagramas temporales
MTODOS GRAFICOS PARA ANALIZAR DATOS
6/36
P 5/36 5/36
4/36 4/36
3/36 3/36
2/36 2/36
1/36 1/36
2 3 4 5 6 7 8 9 10 11 12
X
Grficos de dispersin
RIQ = Q3 Q1
Considerado
como un
histograma,
tiene longitud
de intervalos
igual a 10.
Ejemplo:
La data de ozono es asimtrica.
Truncar la data
Transformar la data
Z es el nmero de
desviaciones estndar
respecto de la media
Distribucin t-Student
Inferencia
Inferencia
Muestreo
Intervalos de confianza
Intervalos de confianza
Intervalos de confianza
Modelo de Regresin Lineal
Se desea analizar la relacin entre las notas del exmen parcial y las
notas del examen final de un curso.
Podra utilizarse un modelo que podra para predecir la nota del
Examen final para un estudiante de quien ya se conoce su
calificacin del Examen parcial.
Y a bX
Ejemplo: tabla de datos o variables
Notas Notas Y= variable respuesta
Estudiante N examen examen
final parcial
1 39 62
2 44 69
3 32 68 X= variable explicativa
4 40 86
5 45 88,5
6 46 88,5
7 33 76
8 39 66,5
9 32,5 75
10 21 38
11 30 71 Modelo lineal entre las dos variables
12 39 88
Y a bX
13 44 96,5
14 28,5 71,5
15 38 96
16 43 82,5
17 42 85
18 25,5 28
19 47 95
20 36 39
21 31,5 58
22 32 49
23 42 62
24 21 59
25 41 90
Ejemplo: Diagrama dispersin de los datos
Notas Notas
Estudiante N examen examen
final parcial Scatterplot
1 39 62 100
Y= variable respuesta
2 44 69
3 32 68
4 40 86 80
5 45 88,5
6 46 88,5
Examen Final
7 33 76 60
8 39 66,5
9 32,5 75
10 21 38 40
11 30 71
12 39 88
13 44 96,5 20
14 28,5 71,5
15 38 96
16 43 82,5 0
17 42 85 10 20 30 40 50
18 25,5 28
19 47 95
Examen Parcial
20 36 39
21 31,5 58 X= variable explicativa
22 32 49
23 42 62
24 21 59
25 41 90
Ejemplo: Anlisis del Diagrama de puntos y de la
asociacin entre las variables Examen Parcial (X)
y Examen Final (Y)
Se observa que las
Diagrama de puntos del Examen Final vs Examen Parcial observaciones estn
asociadas positivamente,
de una forma lineal es decir
que cuanto ms alta tiende a
100 ser la nota de un alumno en el
Parcial, en el Final tender a
80 tener una nota alta tambin.
Examen Final
100
80
Examen Final
60
40
20
0
10 20 30 40 50
Examen Parcial
Definiciones bsicas:
50
45
40
35
30
25 Serie1
20
15
10
5
0
0 50 100 150 200 250 300 350
Definiciones bsicas:
Asociacin negativa.- Si cuando aumentan los valores , los
valores de tienden a disminuir.
1,2
0,8
0,6 Serie1
0,4
0,2
0
0 10 20 30 40 50
Direccin-Forma-Fuerza :
Direccin.- Se observa un comportamiento de direccin cuando
las variables estn positivamente asociadas, negativamente
asociadas o asociadas de una forma lineal.
Y
Y Y .. . ..
. .. . . .. . . ..
..
. . . .. . . . . . ..
. .. . . .. . . .
.. . . . ..
.
0
.. .
. .
X
..
X X
Y
. .. ..
Y
.. .. .
. ..
. .. . . ..
.. . .. . . . Cuadrtica
.. Encorvada .. .
.. . . . . . .. .
. . ..
X
.
X
.. .. .. . .
Y Y
. . . . . . . .. .
. .. . .
.. . . . .
. . . . . . . Cuadrtica
. . . ... .. Cclica .. . .
.. . .. . .. .
X
X
Direccin-Forma-Fuerza:
Forma.- Cuando se observa que la relacin entre las variables
podra ser lineal, encorvada, cuadrtica, estacional, cclica o
quizs no existe ninguna forma definida de asociacin entre esas
variables.
Y
.. .. . . .
.. .
... . . .. . . . . .. .
Y
. .. . . . .. .. .. ..
.. .. . ..
.. .. . . .. ... .
Lineal Ninguna
.. .. . . . . . .. . . . .
.. . . .
X X
.
. .... .. .. . . .. . .. . ... .. . ... Estacional
. .. .. .... ... . . . . . ..
. . . .
X
Direccin-Forma-Fuerza :
Fuerza.- Cuando se observa que firmemente los puntos estn
rodeando la forma observada. En este caso es necesario ser muy
cuidadosos porque un cambio en la escala de los ejes puede
ofrecer otra visin diferente de la realidad.
.. . . . .
Y
. . ..
Y
.. . . ..
. .. . .
.
.. . .
.. .. . .
. . .
.
.. Asociacin fuerte . .. . Asociacin dbil
. . . .
.
X X
. . .
. .. . .
.. . .
. . . . ..
.. . . . ...
.. . Asociacin ligeramente fuerte
X
Regresin Lineal Simple
Lnea 1
Lnea 2
100
80
Examen Final
60
40
20
0
10 20 30 40 50
Examen Parcial
Se necesita un criterio para hallar esa lnea
Cmo se puede ver, sin un critrio se pueden encontrar
ms de una lnea que se acerque a todos los puntos.
Lnea 1
Lnea 2
100
80
Examen Final
60
40
20
0
10 20 30 40 50
Examen Parcial
Definiciones: Ecuacin de una lnea recta
y a bx
a: pendiente, cantidad que cambia cuando x aumenta en una unidad
El problema se reduce a
calcular los valores de x
y y con lo cual queda
definida la recta.
Definiciones: Residuo
Residuo: Un residuo es la diferencia entre la respuesta
observada y la respuesta predicha usando la lnea de la
regresin. Cada par de observaciones , es decir, cada punto en
el scatterplot produce un residuo.
Definiciones: Residuo
Residuo:
Esas diferencias verticales son llamadas residuos
y
residuos= (valor observado
- valor predictado)y
Re siduo : e yi yi
y representan los errores en la prediccin.
y a bx
y a bx
n n n
n( xi yi ) ( xi )( yi )
b i 1
n
i 1
n
i 1
n( x ) ( xi ) 2
2
i
i 1 i 1
y
n
a y bx xi y i 1
i
x i 1
n
n
Interpretacin de los estimadores:
b
Es el valor en que se incrementa o
disminuye la variable Y cuando la variable
X aumenta en una unidad.
y a bx
Evaluacin del modelo:
Coeficiente de correlacin: Denotado por r y obtenido de la
muestra, mide la fuerza de la relacin lineal entre dos variables
cuantitativas.
Describe la direccin de la asociacin lineal e indica en un
escatterplot qu tan ajustados estn los puntos en la lnea de
regresin de mnimos cuadrados.
r
x y
n xi yi i i
n x x n y y
2 2 2 2
i i i i
Evaluacin del modelo:
Propiedades del coeficiente de correlacin:
Rango:
1 r 1
Signo: El signo del coeficiente de correlacin indica la direccin
de asociacin (negativa si r est entre [1,0 o positiva
0,siest
1} entre ).
R
( yi yi )
2
(y y )
i i
2
Evaluacin del modelo:
Error estndar de estimacin: Es una medida de variabilidad
como la desviacin estndar, pero esta desviacin es con
respecto al valor ajustado de la regresin, no con la media.
y y
2
SCE
s i i
n2 n2
Prediccin Puntual:
Con los estimadores a y b, se pueden hacer predicciones
y 7.5 1.75x
Cul sera el valor de la respuesta y si fuera igual a 2.72 ?.
Cul sera el valor de la respuesta y si fuera igual a 12.1 ?.
Cul sera el valor de la respuesta y para cualquier valor de x ?.
Qu significa que el valor de la pendiente b en una lnea de regresin es 0 ?.
fin