Sei sulla pagina 1di 176

Universidad Nacional de Ingeniera

Facultad de Ingeniera Econmica, Estadstica y Ciencias Sociales


Seccin de Extensin Universitaria y Proyeccin Social

PROGRAMA DE ESPECIALIZACIN
EN FINANZAS

SEUPROS-2016
ESTADSTICA PARA FINANZAS

Docente: MAGEN INFANTE


magen.infante@gmail.com
IMPORTANCIA

En el pasado, tratar gran volumen de datos era una


tarea costosa y tediosa que exiga muchas horas de
trabajo.

Hace como dos dcadas, ya es posible estudiar, analizar


y obtener conclusiones de gran cantidad de datos con un
programa informtico en un computador personal.

El computador contribuye grandemente en la difusin y


uso de los mtodos estadsticos.
NECESIDAD

Los programas informticos pueden conducir a una


automatizacin que orienten a un individuo no preparado
a utilizar tcnicas de forma inadecuada para resolver un
problema.

Es necesario as, una mnima comprensin de los


conceptos de la estadstica as como suposiciones para
su uso con criterio.
OBJETIVO

En el anlisis de datos cuando se dispone de un conjunto


de datos que son

. mediciones,
. observaciones,
. valores

Se busca conocer al menos las caractersticas bsicas


de esa coleccin de datos.
Cmo se puede hacer?
Analizando datos y su conclusiones
ESTADSTICA ESTADSTICA
DESCRIPTIVA INFERENCIAL
Organizar y presentar datos Conjunto de mtodos utilizados para
en resmenes numricos, tablas, establecer afirmaciones
cuadros y grficos. probabilsticas acerca de una
poblacin a partir de una muestra

Describe las principales Analiza e interpreta los valores


caractersticas de un conjunto de estadsticos para extraer conclusiones
datos. sobre la poblacin.

(en la poblacin o en la muestra) (slo en la muestra)


Produciendo datos
Censo Muestreo Registro de datos Registro de datos
secundarios secundarios
Poblacin Muestra
Proceso por el Proceso por el Proceso por el Proceso por el
cual se registran cual se registran cual toman cual toman
observaciones de observaciones de observaciones ya observaciones ya
inters de toda inters de una registradas de registradas de
la poblacin en parte de la bases de datos bases de datos
estudio. poblacin en disponibles y que disponibles y que
estudio llamada son apropiadas son apropiadas
muestra y que para estudiar la para estudiar la
debera ser poblacin. poblacin.
representativa.
Registros de toda Registros de
la poblacin. apenas una
muestra.
ESTADSTICA DESCRITIVA

No agrupada
Univariada Agrupada
No Agrupada
Bivariada Agrupada

Multivariada
Glosario de trminos
Datos
Estadstica
Estadstica descriptiva
Inferencia Estadstica
Probabilidad

Censo
Muestreo

Unidad de Estudio
Poblacin
Tamao de la poblacin
Muestra

Parmetro
Estadstico
Conceptos
DATOS

Existen varias definiciones de data, dos ejemplos a continuacin:

Hechos, conceptos o derivados de forma que puedan ser


comunicados e interpretados. (p. 57), Galland (1982).

Hechos en bruto que pueden ser modelados y formados para


crear informacin (p.14), Laudon and Laudon (1991).

Aunque las definiciones no son iguales, la mayora coincide en que


son un paso previo para la obtencin de informacin.
ESTADSTICA

Se la conoce como una ciencia o disciplina que incluye un conjunto


de tcnicas que permite, de forma sistemtica o no, organizar,
resumir, modelar, describir, analizar e interpretar datos originales de
estudios o experimentos, realizados en cualquier rea del
conocimiento.
ESTADSTICA BSICA

Se puede dividir en tres reas:

Estadstica Descriptiva,

Inferencia Estadstica y

Probabilidad
ESTADSTICA DESCRIPTIVA
ESTADSTICA DESCRIPTIVA
En resumen, se busca entender La Distribucin del
conjunto de los valores de los datos.

Dnde caen a lo largo del eje de medicin?

Qu clase de patrn forman?

Cules son los cuartiles de la distribucin ? (a lo largo


de la escala de observacin)

Alguna de esas observaciones son discrepantes del


resto? (caen muy lejos de la mayora)

Se repiten esos valores?


Cul es la densidad o concentracin relativa de las
observaciones en diversos intervalos a lo largo de la
escala de medida?

La data se acumula al medio de su rango?

La data se acumula en uno de los trminos?

La data se acumula en varios lugares?

La data est simtricamente distribuida?


POR EJEMPLO:

Para todos los estados de USA, acerca del Producto


Nacional Bruto, se deseara preguntar:

. Cul es un valor promedio, central o tpico del


conjunto total?

. Cun dispersa est la data alrededor del centro?

. Cun lejos del valor tpico estn los valores ms


extremos, tanto los altos como los bajos?

. Qu fraccin de los nmeros son menores que el


valor de para un Estado en particular?
Notacin poblacional vs muestral

Medida Poblacional Muestral


Media

Varianza

Desviacin estndar

Proporcin

Total
Medidas de tendencia central
y de posicin
Datos No agrupados
Medidas de Tendencia Central

Definicin general:

Son aquellas medidas que ubican el centro de una distribucin


o de un grupo de datos y reciben el nombre de medidas de
tendencia central.

Se utilizan cuando se est interesado en estadgrafos que


representen valores centrales en torno a los cuales se agrupan
las observaciones o datos.
Medidas de tendencia central

Media Aritmtica
Mediana
Moda
Media Geomtrica
Media Armnica
Media Aritmtica
n

xi xi : Valores que toma la variable X


n : Nmero de observaciones
x i 1
n
Propiedades:

a) Todos los valores de la data estn considerados e incluidos en el clculo


de la media aritmtica.
b) Existe una nica media aritmtica para un conjunto de datos.
c) La suma de las desviaciones alrededor de la media es igual a cero.
d) Es sensible a los valores extremos.
e) Usa toda la informacin disponible sobre las observaciones.
f) Matemticamente es fcil trabajar con ella.
Ejemplo:

Promedio de la edad de las 20 personas


n

x i
45 41 ... 45 37
MX i 1
43.5
n 20

xi : valores que toma una variable X


n : nmero de observaciones
Media ponderada:
Para superar la influencia de los valores extremos en el clculo
de la media se utiliza la media ponderada.

k
x wi xi w1 x1 w2 x2 .... wn xn
i 1
n

w
i 1
i 1

x1 , x2 , ,...., xn valores observados

w1 , w2 ,...., wn pesos asociados a cada observacin


Ejemplo:

En una empresa de produccin se tienen los siguientes


datos: el sueldo promedio de

los empleados es de S/.2500 mensuales,


los operarios es de S/. 1850 mensuales y
de los ejecutivos es de S/. 3800 mensuales

Cul ser el sueldo promedio en esta empresa si se


sabe que el 10% son ejecutivos, el 30% son empleados y
el resto son operarios?
Media total:

Es un promedio ponderado en el cual la ponderacin est determinada


por el nmero de elementos de cada grupo. Se utiliza cuando se desea
hallar un promedio de promedios cuando se tienen k grupos diferentes.

n x i i
n1 x1 n2 x2 ... nk xk
xT i 1

k
n1 n2 ... nk
n
i 1
i
Ejemplo:
En una central telefnica se recibieron,
entre las 9 a.m. y las 10 a.m. 70 llamadas con una
duracin menor a 3 minutos, cuyo tiempo promedio fue de
2.4 minutos;
50 llamadas con una duracin de 3 minutos o ms pero
menor a 10 minutos, cuyo tiempo promedio de duracin
fue de 6.4 minutos;
30 llamadas con una duracin superior a loa 10 minutos
con un tiempo promedio de 15.3 minutos.

Cul ser el tiempo promedio por llamada en esta central


telefnica en ese periodo de tiempo?
Propiedades de la media:

1) El promedio de una constante es la misma constante:

M (b) b, b es una cons tan te

2) Si a todos los valores de una conjunto de datos se le


suma o resta una constante C, entonces la media
quedar sumada o restada por esa misma constante:

Si Y X b M (Y ) M ( X ) b
Propiedades de la media:

3) Si a todos los valores de una conjunto de datos los


multiplicamos por una constante a, entonces el promedio
quedar multiplicado por ese mismo valor.

Si Y aX M (Y ) aM ( X )

4) Si consideramos las dos ltimas caractersticas


tendremos que: (a y C son constante numricas)

Si Y aX b M (Y ) aM ( X ) b
Caracterstica de la media aritmtica

1) Es la medida de tendencia central ms conocida y utilizada.

2) Se calcula tomando en cuenta la magnitud de todos y cada uno


de los datos.

3) Es sensible a valores extremos, tienden a sesgarla o desplazarla


hacia esos extremos, Por lo que no es representativa para datos
con estas caractersticas.

4) Es una medida nica, es decir para una grupo de datos, existe


una sola media.
5) Permite calcular el promedio de los valores transformados, utilizando
las propiedades algebraicas.

6) No puede calcularse cuando la tabla de distribucin de frecuencias


tiene intervalos de clase abiertos indefinidos.

7) La suma de las desviaciones (diferencias) entre los valores de la


variable X y su media aritmtica es cero:

(x x) 0
i 1
i a, , b
Mediana (Me)
Es aquel punto o posicin en la escala de la variable que divide a
los datos en dos grupos con igual nmero de observaciones
Se tienen los siguientes datos: X 1 , X 2 ,, X n

Ordenados del siguiente modo: X 1 X 2 X n

entonces:

X n 1 si n es impar
2

Me
1
X n X n si n es par
2 2 2
1

Mediana (Me)

a) Una distribucin tiene una nica mediana.

b) La mediana no est afectada por valores extremos.

c) No usa toda la informacin sobre el tamao y magnitud de las


observaciones, tan solo su posicin relativa en las observaciones
ordenadas.

d) Su clculo es ms complejo, pues requiere ordenar previamente las


observaciones de menor a mayor y determinar si el tamao de la muestra
es par o impar (es menos manejable matemticamente).
Caracterstica de la Mediana
Le sigue en importancia a la media aritmtica, como medida de
tendencia central.
No es sensible a valores extremos, por eso se recomienda usarla
en distribuciones asimtricas
Es una medida nica, es decir, para una grupo de datos, existe solo
una mediana.
La mediana puede ser calculada en cuadros de distribucin con
intervalos
La suma de las desviaciones absolutas de las observaciones con
relacin a la mediana es mnima:
El clculo de la mediana es independiente de la magnitud de las
observaciones.


n
X i Me es minima a, , b
i 1
Moda (Mo)
Es el valor que se presenta con mayor frecuencia en un conjunto
de observaciones.
Una distribucin puede tener una moda (unimodal), ms de una
moda (bimodal, trimodal, etc.), o ninguna.
En distribuciones continuas, se puede hallar un intervalo modal (o
ms de uno).
Es la nica medida de tendencia central que puede utilizarse con
datos en escala nominal.
0,5000 Moda

0,4500

0,4000

0,3500

0,3000

0,2500

0,2000

0,1500

0,1000

0,0500

0,0000
0 1 2 3 4 5 6 7

Rango
Media armnica ( Xa ) n
xa n
1

i 1 xi
Se emplea cuando lo que se quiere promediar son razones,
donde los numeradores son los mismos para todas las razones
pero los denominadores son diferentes.
Razones: son ratios que muestran comparaciones o indican una
divisin:
Se utiliza para algunos clculos como el costo promedio de las
acciones adquiridas a lo largo del tiempo.

Ejemplo:
Poblacin por kilmetro cuadrado, ingreso per-capita, unidades
producidas por hora, etc.
Percentiles Cuantiles
Son medidas descriptivas que permiten dividir, distribuir o sub-
clasificar los datos, a uno y otro lado en porcentajes dados, una
vez ordenados y clasificados.

Pk X k n 1 Percentil k

100 2

Percentiles Cuantiles
Percentiles con que ocasionan divisiones particulares

Qk X k n 1 k-simo cuartil de un total de 3



4 2

Dk X k n 1 k-simo cuartil de un total de 9



10 2

Pk X k n 1 k-simo cuartil de un total de 99



100 2

Percentiles Cuantiles
Ejemplos:

Q1 X 1n 1
primer cuartil de un total de 3

4 2

D3 X 3n 1 tercer decil de un total de 9

10 2

P70 X 70n 1 percentil 70 de un total de 99



100 2

La mediana divide la distribucin en la mitad.


Los cuartiles dividen la distribucin en cuartos.
Los quintiles dividen la distribucin en quintos.
Los deciles dividen la distribucin en dcimos.
Los percentiles dividen la distribucin en centsimos.
Percentiles Cuantiles

Para determinar la posicin de una observacin en un percentil y


donde n datos son ordenados ascendentemente, se utiliza la
siguiente frmula:

y
Ly (n 1)
100
Cmo determinar la posicin de un percentil
Py es el valor por debajo del cual cae el y% de la distribucin, o el y-
simo percentil. Para n observaciones ordenadas ascendentemente, la
posicin Ly del y-simo percentil Py es:

y
Ly (n 1)
100
Si Ly = entero, la localizacin corresponde a una observacin.

Si Ly entero, la localizacin cae entre los dos enteros ms cercanos


(por encima y por debajo), y se debe utilizar la interpolacin lineal para
hallar Py.
Media Geomtrica ( X g )
La media Geomtrica de los nmeros X 1 , X 2 ,..., X n
se calcula mediante la siguiente frmula:

xg n X 1 X 2 ... X n
FORMULA 1: Factor de crecimiento promedio
(Cuando slo se tienen los factores de crecimiento)

xg t FC1 FC2 ... FCt


t : Nmero de periodos transcurridos
FCt : Factor de Crecimiento en el periodo t con respecto al periodo t-1
FORMULA 1: Factor de crecimiento promedio

Se utiliza con frecuencia para calcular el retorno de una inversin


en mltiples periodos o cuando se miden ratios de crecimiento
compuesto.

Para calcular la media geomtrica de una serie de retornos se


debe sumar 1 a cada valor, y luego restarle 1 al resultado:

Rg n 1 R1 1 R2 ... 1 Rn 1
Las aplicaciones ms comunes de esta medida estn
cuando se tienen variables que cambian a travs del
tiempo.

Considerando esto tendremos las siguientes frmulas


para calcular la media geomtrica:
FORMULA 2: Factor de crecimiento
Se calcula a partir de la siguiente expresin:

Xt
FCt
X t 1
Xt :Valor de la variable en el periodo t

X t 1 : Valor de la variable en el periodo t-1


Nota:
Si FC>1, quiere decir que el valor de la variable se
incremento.

Si FC<1, quiere decir que el valor de la variable


disminuy.

Si multiplicamos el Factor de Crecimiento por 100,


entonces este quedar expresado en porcentaje.

La media geomtrica en el factor de crecimiento


promedio, de la variable en estudio, a travs del
tiempo.
FORMULA 3: Factor de crecimiento promedio
(Cuando solo se tiene la cantidad del periodo inicial y la
cantidad del periodo final)

X
xg t
f

X0

X 0 : Valor de la variable del periodo inicial

X f : Valor de la variable del periodo final

t : Nmero de periodos
Tasa de Crecimiento (TC)
Cuantifica la variacin de una variable a travs del
tiempo. Las tasas de crecimiento pueden ser anuales,
mensuales, semanales, etc.

Se calcula a partir del FC del siguiente modo:


TC t FC t 1

TCt % FCt % 100%


Por ejemplo si el FC=1.36, entonces la TC=0.36, es decir
la variable se increment en 0.36 (o la variable se
increment en un 36%)
Como la media geomtrica es el Factor de Crecimiento
promedio, entonces Tasa de crecimiento promedio , que
la denotaremos como r ser:

r xg 1
Es decir si tengo una media geomtrica de 1.65 ( 165%),
significar que la Tasa promedio de crecimiento fue de
0.65 ( 65%)

Cmo interpretara se FC=3.45?


Medidas de tendencia central

La media geomtrica representa la tasa de crecimiento o tasa de retorno


compuesta de una inversin. Es til en el anlisis de rentabilidad de una
inversin en un horizonte de varios perodos.
La media aritmtica es de inters para medir el desempeo promedio en un
solo perodo.

Media geomtrica Media aritmtica

A mayor dispersin de los datos, mayor diferencia entre estas dos medidas.
Slo son iguales cuando todas las observaciones son iguales.
Para valores diferentes,

Media harmnica Media geomtrica Media aritmtica

La media harmnica es apropiada para promediar ratios cuando stos son


aplicados repetidamente a una monto fijo para producir una cantidad variable
de unidades. Por ejemplo, el beneficio de invertir cada mes o cada semana el
mismo monto de dlares para la compra de cuotas de un fondo mutuo (costo
promedio).
Medidas de dispersin

Datos No agrupados
Medidas de dispersin

Dispersin es la variabilidad alrededor de la tendencia central.

La dispersin es una medida del riesgo.

Dispersin absoluta.- Es el monto de variabilidad observada sin


compararlo con ningn punto de referencia.

Las medidas de dispersin absoluta ms comunes son: el rango,


desviacin absoluta de la media, varianza y desviacin estndar.

Dispersin relativa.- Es el monto de variabilidad con relacin a


un punto de referencia .

Las medidas de dispersin relativa ms comunes son: el


coeficiente de variacin y el ratio de Sharpe.
Medidas de dispersin
Rango
Rango intercuartlico
Desviacin absoluta de la media
Varianza
Desviacin estndar
Semivarianza y semidesviacin
Coeficiente de variacin
Ratio de Sharpe
Asimetra
Curtosis
Desigualdad de Chebyshev
Rango
El Rango es una medida de variabilidad o Dispersin. Es la diferencia
entre el Valor Mximo y el Valor Mnimo de las observaciones. Puede
resultar una informacin distorsionada del comportamiento de la variacin.

R X max X min

Rango intercuartlico
Es una medida que mantiene la idea del rango pero no es influenciado por
los valores extremos. El Rango Intercuartil mide la dispersin de la mitad
(50%) de los datos. La idea es dividir los datos ordenados en cuatro partes
iguales y ver cuan alejadas estn las dos partes extremas. Para
distribuciones sesgadas o con datos discordantes, RI tiende a ser la mejor
Medida de la dispersin

RI Q3 Q1
Desviacin absoluta media
(Mean Absolute Deviation - MAD)

Es el promedio de los valores absolutos de las desviaciones de


observaciones individuales respecto de la media aritmtica.

X i X
DAM i 1
n
Varianza y desviacin estndar
Es el promedio de las desviaciones al cuadrado respecto de la media
aritmtica.
N
Poblacional:

iX 2

2 i 1
N
n
Muestral:
iX X 2

s2 i 1
n
Al calcular la varianza muestral se utiliza n-1 como denominador
debido a que se mejoran las propiedades estadsticas de s 2.
En trminos estadsticos, s 2 es un estimador insesgado de 2 .
La cantidad n-1 representa los grados de libertad al estimar la
varianza poblacional ya que cuando se calcul la media, solo quedaron
n-1 desviaciones independientes respecto de la media.
Semivarianza y semidesviacin
Estas mediciones nacen de la preocupacin de los inversionistas por
medir el riesgo de los retornos que se encuentran por debajo de la
media.
Se calculan considerando solo las observaciones que son menores
que la media.

Coeficiente de variacin
Mide cunta dispersin respecto de la media existe en una distribucin.
Permite la comparar de forma directa diferentes conjuntos de datos.
En inversiones el CV mide el riesgo por unidad de retorno esperado
(media).

SX
CV
X
Ratio de Sharpe
Mide el exceso de retorno por unidad de riesgo.
Es utilizado para medir la performance de inversiones.
Basado en informacin histrica de los retornos, el ratio Sharpe
de un portafolio se define como:

rp rf
Ratio de Sharpe
p
donde:

rp = retorno del portafolio

rf = retorno libre de riesgo

p = desviacin estndar de los retornos del portafolio


Ratio de Sharpe

Los inversionistas adversos al riesgo que toman


decisiones basados en el retorno promedio y su
desviacin estndar prefererirn portafolios con ratios
de Sharpe mayores.

Limitaciones:

Interpretacin de ratios de Sharpe negativos.

Solo considera solo un aspecto del riesgo: la


desviacin estndar.
Asimetra
Una distribucin simtrica es aquella que mantiene la misma
forma a ambos lados de la media.
El sesgo describe el grado de asimetra de una distribucin con
relacin a su media.

n
(X i X)
SK
( n 1)( n 2) s3
Para n muy grandes la expresin se reduce a:

1
(X i X)
SK
n s3

Como referencia, para un muestra de 100 observaciones a ms, un


sesgo de 0.5 es alto.
Asimetra
Distribucin simtrica --> SK = 0
Distribucin con sesgo positivo (hacia la derecha) --> SK > 0
Moda < Mediana < Media
Distribucin con sesgo negativo (hacia la izquierda) --> SK < 0
Moda > Mediana > Media
Curtosis
Mide si una distribucin es ms o menos puntiaguda que una
distribucin normal y provee de informacin sobre la probabilidad de
resultados extremos.
Leptocrtica.- Distribucin ms puntiaguda (y con colas ms
gordas) que una distribucin normal.
Platicrtica.- Distribucin menos puntiaguda que una distribucin
normal.
Mesocrtica.- Distribucin idntica (en curtosis) a la normal.

La curtosis de una distribucin normal es igual a 3.

El exceso de curtosis se mide como: curtosis - 3.

Un exceso de curtosis > 1 en valor absoluto se considera grande.


Curtosis
El exceso de curtosis en una muestra es:
n
4
X X
n(n 1) i
(n 1) 2
KE i 1
3
(n 1)(n 2)(n 3) (n 2)(n 3)
4
s

Para n muy grandes la expresin se reduce a:


n
4
1
iX X
KE i 1
4

n s

Leptocrtica --> KE > 0

Platicrtica --> KE < 0

Mesocrtica o Normal --> KE = 0


Desigualdad de Chebyshev
La desigualdad de Chebyshev declara que la proporcin de las
observaciones dentro de k desviaciones estndar de la media es al
menos 1 1/k2 para todo k > 1.

Segn esto, para cualquier distribucin se cumple:


36% de las observaciones caen en un intervalo de 1.25 desviaciones
estndar.
56% de las observaciones caen en un intervalo de 1.50 desviaciones
estndar.
75% de las observaciones caen en un intervalo de 2 desviaciones
estndar.
89% de las observaciones caen en un intervalo de 3 desviaciones
estndar.
94% de las observaciones caen en un intervalo de 4 desviaciones
estndar.

La importancia de esta regla es su generalidad. Se cumple para


cualquier conjunto de datos ya sea de una muestra o de una
poblacin y sin importar la forma de la distribucin.
Desigualdad de Chebyshev
Sea X una variable aleatoria con media y varianza 2 finita.
Para cualquier k>0 (positiva) se verifica:

P Z k 2
1
k

P Z k 1 2
1
k

P k X k 1 2
1
Donde: k
( X )
Z

Desigualdad de Chebyshev
Ejemplo:
Obtener cul es la probabilidad mxima de que una variable aleatoria
difiera de su media en al menos 2,3,4 y 5 veces la desviacin tpica

Si k=2 P[ X- 2 ] 1 /22 P[ X- 2 ] 1-1 /22


Si k=3 P[ X- 3 ] 1 /32 P[ X- 3 ] 1-1 /32
Si k=4 P[ X- 4 ] 1 /42 P[ X- 4 ] 1-1 /42
Si k=5 P[ X- 5 ] 1 /52 P[ X- 5 ] 1-1 /52
Desigualdad de Chebyshev

Si k=2 P[ X- 2 ] 1-1 /22 al menos el 75 %


Si k=3 P[ X- 3 ] 1-1 /32 al menos el 89 %
Covarianza
La varianza y la desviacin estndar son medidas de dispersin o volatilidad
de una variable.
En finanzas, interesa conocer cmo dos variables aleatorias se comportan
con relacin a la otra, por ejemplo en el caso de los retornos de dos
inversiones.
La covarianza y la correlacin son medidas que proveen de informacin
muy til.
Mide cmo una variable aleatoria se mueve respecto de otra variable
aleatoria.
Es el valor esperado del producto de las desviaciones estndar de las dos
variables aleatorias respecto de sus valores esperados.

Se expresa:


CovRi , R j E Ri E ( Ri )R j E ( R j )
Ri Retorno de la inversin i

Rj Retorno de la inversin j
Covarianza

Poblacin

( X i )(Yi )
N

Cov( X , Y ) X , Y i 1
N
Muestra


n
( X i X )(Yi X )
Cov( X , Y ) S X , Y i 1
n 1
Covarianza
PROPIEDADES

1.Representa el mismo concepto que la varianza.

2.La covarianza de una variable aleatoria consigo misma es su propia varianza.

3.El rango de la covarianza puede extenderse desde - hasta +.

4.Cov(Ri, Rj) > 0 -- El retorno de ambas inversiones tiende a ir en el mismo


sentido (por encima o debajo) de sus valores esperados.

5.Cov(Ri, Rj) < 0 -- Cuando el retorno de una inversin est por encima de su
valor esperado, el retorno de la otra inversin tender a estar por debajo de su
valor esperado (relacin inversa).

6.Cov(Ri, Rj) = 0
No existe relacin entre los resultados de las variables (inversiones).
Correlacin
Mide el movimiento conjunto (relacin lineal) entre dos variables
aleatorias.

Esta medida hace ms fcil la interpretacin de la covarianza.

Se expresa:

CovRi R j
Ri , R j i j
( Ri ) ( R j )
Correlacin
PROPIEDADES
1.Mide la fuerza de la relacin lineal entre variables aleatorias

2.No tiene unidades

3.Su rango es -1 (Ri, Rj) 1

4.Si (Ri, Rj) = 1 -- las variables tienen correlacin positiva perfecta, es


decir, el movimiento de una variable resulta en un movimiento de la otra
en el mismo sentido y en la misma magnitud respecto de su media.

5.Si (Ri, Rj) = -1 -- las variables tienen correlacin negativa perfecta.


El movimiento de una variable en un sentido har que la otra lo haga en
el sentido opuesto.

6.Si (Ri, Rj) = 0 -- no existe relacin lineal entre las variables.


Correlacin
APLICACIN

Para un portafolio de n activos donde wi es el peso de cada activo en


el portafolio.
El valor esperado de los retornos puede determinarse como:

n
E RP w1E R1 w2 E R2 wn E Rn wi E Ri
i 1

La varianza de dichos retornos se determina mediante:

w w CovR , R
n
Var RP i j i j
i 1
Aplicacin
Medidas de posicin

Datos A-grupados
Media
k

x f
k
i i
o
x xi hi
x i 1 i 1
n xi

k : nmero de intervalos de clase


xi : marca de clase k

f i : Frecuencia absoluta simple (x x) f


i 1
i i 0
hi : Frecuencia relativa simple
n : Nmero de datos
Mediana

n
Usaremos la frmula siguiente

2 F i 1
Me Li c
fi
donde:

Li : Lmite inferior del intervalo mediano
c : amplitud de clase del intervalo mediano
Fi 1 : Frecuencia absoluta acumulada anterior al
intervalo mediano
fi : Frecuencia absoluta simple del intervalo mediano
Cuando no se tienen las frecuencias absolutas, se puede utilizar
la siguiente frmula, con frecuencias relativas:

0.5 H i 1
Me Li c
hi
Donde:

H i 1 : Frecuencia relativa acumulada anterior al intervalo mediano

hi : Frecuencia relativa simple del intervalo mediano


Cmo ubicar el Intervalo Mediano?

El intervalo mediano (o clase mediana) es el primer intervalo


cuya frecuencia absoluta acumulada sea igual o mayor a la
mitad de observaciones; o tambin es el primer intervalo cuya
frecuencia relativa acumulada sea igual o mayor al valor 0.5
(50% de los datos)

Es decir, ubicar el primer intervalo donde:

n
Fi H i 0.5
2
Moda (Mo)

La Moda es el valor obtenido de la tabla de frecuencias, que se repite


ms frecuentemente en un conjunto de datos agrupados, se encuentra
en el intervalo con mayor frecuencia.

Intervalo modal
Es aquel intervalo cuya frecuencia absoluta simple es mayor, o es
aquel intervalo cuya frecuencia relativa simple es mayor.
Moda

d1 d1 f i f i 1
Mo Li c donde :
d1 d 2 d 2 f i f i 1

Li : Lmite inferior de la clase modal


c : Amplitud de la clase modal
f i 1 : Frecuencia absoluta simple anterior a la
clase modal ( Frecuencia pre-modal)
f i : Frecuencia absoluta simple de la clase
modal
f i 1 : Frecuencia absoluta simple posterior a la
clase modal (frecuencia postmodal)
Caractersticas de la Moda:
En una curva de distribucin de frecuencias representa el punto
ms alto de esta.
No es afectada por valores extremos.
El clculo de la moda es independiente de la magnitud de las
observaciones.
No es nica, para un grupo de datos la moda puede no existir,
existir y ser nica o existir y no ser nica (distribuciones
multimodales)
En datos agrupados, puede calcularse cuando existen intervalos
de clase de la forma:

a, , b
Relaciones entre la media, la mediana y la moda

En una distribucin simtrica:

x Me Mo
Si en una distribucin unimodal se cumple que:
x Me Mo
Entonces la distribucin ser asimtrica negativa
(tiene sesgo o cola hacia la izquierda)

Si en un distribucin unimodal se cumple que:


x Me Mo
Entonces la distribucin ser asimtrica positiva
(tiene un sesgo o cola hacia la derecha)
Para distribuciones unimodales asimtricas se tiene la siguiente
relacin emprica:

x Mo 3( x Me)
Media armnica datos agrupados

n
xa k
fi

i 1 xi
Percentiles (Pk)
nk
100 Fk 1
Pk Li c k 1,2,...99
fi

Li : Lmite inferior de la clase percentlica


Fi-1 : Frecuencia absoluta acumulada del Intervalo pre-percentlico
fi : Frecuencia absoluta simple del intervalo percentlico
c : Amplitud de clase del intervalo percentlico
n : Nmero de datos
Frmula alternativa (con frecuencias relativas)

k
100 H k 1
Pk Li c k 1,2,...99
hi

Hi-1 : Frecuencia relativa acumulada anterior al


intervalo percentlico.
hi : Frecuencia relativa simple del
intervalo percentlico
Graficos
Diagrama de Pastel

Diagrama de Barras

Diagrama de Bastones

Diagrama de Frecuencia

Diagrama de Cajas (Box Plot)

Diagrama de Tallos y Hojas

Histogramas

Diagramas temporales
MTODOS GRAFICOS PARA ANALIZAR DATOS

Muchas respuestas pueden ser obtenidas de un estudio


minucioso al presentar la data en una tabla, sin
embargo, muchas preguntas distribucionales son
difciles de responder desde una tabla.

Hay mtodos grficos nuevos y mtodos grficos


conocidos antiguos.

Algunos mtodos grficos pueden ser elaborados a


mano y otros necesitarn un programa de computadora.

En diversas situaciones, un conjunto de datos grande o


pequeo puede analizarse slo a travs de mtodos
grficos que pueden ser ms reveladores.
MOTIVOS PARA ANALIZAR DATOS CON GRAFICOS

Existen diversos motivos para la Visualizacin grfica:

1.- Registrar y guardar data en forma compacta.

2.- Comunicar informacin a otros.

3.- Analizar un conjunto de datos para conocer ms


acerca de su estructura.
Diagrama de Pastel
Para variables cualitativas o categricas
y a veces cuantitativa categorizada

El Pastel o Torta representa la totalidad de las unidades y


cada divisin de la torta es la frecuencia, proporcin o
porcentaje de una categora o valor de una variable cualitativa
o cuantitativa respectivamente.

Trazo de pastel con de los tems


teniendo la misma propiedad

Trazo de pastel con 7/8 de los tems


teniendo la misma propiedad
Diagrama de Barras

variables cualitativas o categricas

a veces cuantitativas categorizadas

Son grficos en barras de porcentajes, proporciones o


frecuencias de cada categora de los tems.

La altura de cada barra es el porcentaje, proporcin o


frecuencia de tems en cada categora.

El ancho de las barras no tiene significado pero debe ser


el mismo para todas las categoras.
Diagrama de Barras

De una muestra de 20 personas, en


un estudio mdico de presin
sangunea, se analiza la proporcin
del gnero objeto del estudio.

Se observ que 8 de los pacientes,


40% de los analizados, eran
mujeres mientras que 12 de ellos,
es decir, 60% eran hombres.
Diagrama de bastones

variables cuantitativas discretas

6/36
P 5/36 5/36

4/36 4/36

3/36 3/36

2/36 2/36

1/36 1/36

2 3 4 5 6 7 8 9 10 11 12
X
Grficos de dispersin

variable cuantitativa continua


Diagrama de Cajas
o
Box Plots
variables cuantitativas continua

Cuando el anlisis exige conocer medidas


estadsticas, el box Plot es un mtodo de
resumen grfico de estas medidas.

El Box Plot ofrece una rpida impresin de


ciertos detalles prominentes de la
distribucin de la variable.
Box Plot:
La mediana, muestra el centro o localizacin de la
distribucin.

La dispersin del grueso de la data (del 50% central) es visto


como la longitud de la caja (del Box).

La longitud de las lneas punteadas relacionadas con la caja,


muestran cuan estrechas estn las colas de la distribucin.

Los valores individuales fuera de las lneas, proporcionan al


espectador la oportunidad de considerar la existencia de
outliers que son medidas insualmente o implausiblemente
grandes o pequeas.
Box Plot:
Los valores fuera de las lneas punteadas, no
necesariamente son outliers.

Cualquier outlier siempre caer fuera de las lneas


punteadas del Box Plot.
Box Plot:
El Box Plot permite una evaluacin parcial de la
simetra de la distribucin.

Si la distribucin es simtrica, el Box Plot es


simtrico respecto de la mediana,

La mediana corta la caja por la mitad.

Las lneas punteadas superior e inferior son


aproximadamente de la misma longitud.

Los puntos fuera de las lneas punteadas son


iguales en nmero y simtricamente colocados.
La distribucin es simtrica ?

Podra existir asimetra en la data y el Box Plot no


llegue a revelarla.

En general, el Box Plot ofrece una buena indicacin


aproximada.
Box Plot:

La primera parte de la caja a (Q1, Q2),

La segunda parte de la caja a (Q2, Q3)

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1)

El bigote de la derecha viene dado por (Q3, Xmx).


Box Plot:

El rango intercuartlico es la distancia entre Q3 y Q1

RIQ = Q3 Q1

Valores atpicos inferiores a Q1 - 1.5 * RIQ

Valores atpicos superiores a Q3 - 1.5 * RIQ


Box Plot:
Grfico en resumen
Ejercicio

Buscar un conjunto de datos cuantitativos para una variable

Calcular todos los estadsticos del Diagrama de Cajas

Interpretar los estadsticos de acuerdo a la naturaleza de la


data
Histograma:

Para variables cuantitativas discretas o continuas

Es el diagrama ms utilizado por tcnicos y no tcnicos.

Es la particin del rango de los datos en varios intervalos


de igual longitud.

Contar el nmero de observaciones en cada intervalo y


graficar los conteos como longitudes de barras en un
histograma.
Histograma:
Histograma:
Histograma:
Tallos y Hojas:

Para variables cuantitativas discretas o continuas

El Diagrama de Tallos y Hojas es un diagrama hbrido entre una tabla y


un grfico.

Muestra nmeros apilados y a la vez se muestra como una figura.

Es una forma compacta de registrar la data. Podra reducir la


representacin a por ejemplo la mitad de dgitos.

Es como un histograma apoyado de lado.


Ejemplo:
En la presente base de datos de
Mximas Concentraciones de
Ozono Diarias en Stanford
Connecticut, hay 319 dgitos.

Con el diagrama de Tallos y


Hojas se puede representar con
tan solo 175 dgitos.

Adems, se puede apreciar


visualmente un comportamiento
grfico.
Ejemplo:

Considerado
como un
histograma,
tiene longitud
de intervalos
igual a 10.
Ejemplo:
La data de ozono es asimtrica.

La mayor parte de los das en


Stanford, tuvieron concentraciones
mximas de ozono entre 30 y 90
ppb.

Existe una leva contraccin de


ocurrencia alrededor de los 50 ppb,
que sera difcil apreciar en un
grfico quantil-quantil por ejemplo.
Podra haber una explicacin o es
talvez un simple accidente de los
datos.

Los dos valores de 14ppb se notan


menos excepcionales en este
diagrama que en un grfico quantil
lo haran.
Alternativas:
En ocasiones, la data es tan abundante que podra graficarse en dos o
ms tallos, para que las grficas muestren mayores detalles.
En estos casos, se puede alterar la longitud de los intervalos.
Considerar slo los datos de ozono entre 60 y 89 ppb

Primera forma.- Hay muy pocas


filas como para que el diagrama
sea informativo.

Segunda forma.- Cada tallo tiene dos filas.


La primera es para las hojas del 0 al 4.
La segunda es para las hojas del 5 al 9.
La longitud del intervalo es 5.
Alternativas:

Tercera forma.- Cada tallo tiene cinco filas.

Los parntesis son para recordar qu hojas


(dgitos) irn en cada tallo.

La primera fila es para las hojas del 0 al 1.

La segunda es para las hojas del 2 al 3.

La longitud del intervalo es 2.


Tallos y Hojas:
Es posible, segn la necesidad:

Multiplicar por alguna potencia de 10 para facilitar la


elaboracin del diagrama.

Truncar la data

Transformar la data

Cambiar la longitud de los intervalos

Las hojas pueden ser de un dgito, de dos dgitos, etc.

Se pueden elaborar diagramas de Tallos y Hojas con


data no ordenada (las hojas no sern ordenadas dentro
de los tallos).
Formas Distribucionales

variables cuantitativas discretas o continuas


FORMAS DISTRIBUCIONALES:
FORMAS DISTRIBUCIONALES:
FORMAS DISTRIBUCIONALES:
Distribucin Normal
Distribucin Normal
Distribucin Normal
Distribucin Normal

Z es el nmero de
desviaciones estndar
respecto de la media
Distribucin t-Student
Inferencia
Inferencia
Muestreo
Intervalos de confianza
Intervalos de confianza
Intervalos de confianza
Modelo de Regresin Lineal

Docente: MAGEN INFANTE


magen.infante@gmail.com
Relacin entre dos variables

Este estudio est dirigido a descubrir las


relaciones entre dos variables o entre dos
conjuntos de observaciones.

Los datos usados para describir la relacin


entre dos variables son llamados bivariantes.
Relacin entre dos variables

Seguir los siguientes pasos:


Registrar n observaciones de 2 variables, una dependiente
de la otra.
Construir el grfico Diagrama de Dispersin de los Datos
(Scatterplot).
Analizar y decidir si es posible resumir la relacin de las dos
variables con un modelo simple.
Desarrollar un Modelo de Regresin Lineal para predecir el
valor de una variable a partir del valor de la otra variable.
Discutir la correlacin que mide la fuerza (validez,
intensidad) y direccin de la relacin lineal entre las dos
variables.
Algunas variables con asociacin

Variable respuesta Variable explicatoria

Altura de una persona Altura de uno de los padres o la edad


Peso Edad, Peso promedio de los padres, etc.
Presin sangunea Edad, Peso, etc.
Examen semestral (nota) Examen anterior semestre (nota)
Demanda de un producto Demanda anterior, precio, peso, nro de competidores, etc.
Ejemplo:
Sean dos variables cuantitativas: Examen Parcial y Examen Final.

Se desea analizar la relacin entre las notas del exmen parcial y las
notas del examen final de un curso.
Podra utilizarse un modelo que podra para predecir la nota del
Examen final para un estudiante de quien ya se conoce su
calificacin del Examen parcial.

stas dos notas son las variables cuantitativas.

y : Notas del Examen Final (variable respuesta)

x : Notas del Examen Parcial (variable explicativa)


Queremos responder:

Cmo saber si la variable Y se


puede escribir como una funcin
lineal de la variable X? o

Modelo de Regresin Simple:

Y a bX
Ejemplo: tabla de datos o variables
Notas Notas Y= variable respuesta
Estudiante N examen examen
final parcial
1 39 62
2 44 69
3 32 68 X= variable explicativa
4 40 86
5 45 88,5
6 46 88,5
7 33 76
8 39 66,5
9 32,5 75
10 21 38
11 30 71 Modelo lineal entre las dos variables
12 39 88

Y a bX
13 44 96,5
14 28,5 71,5
15 38 96
16 43 82,5
17 42 85
18 25,5 28
19 47 95
20 36 39
21 31,5 58
22 32 49
23 42 62
24 21 59
25 41 90
Ejemplo: Diagrama dispersin de los datos

Notas Notas
Estudiante N examen examen
final parcial Scatterplot
1 39 62 100

Y= variable respuesta
2 44 69
3 32 68
4 40 86 80
5 45 88,5
6 46 88,5

Examen Final
7 33 76 60
8 39 66,5
9 32,5 75
10 21 38 40
11 30 71
12 39 88
13 44 96,5 20
14 28,5 71,5
15 38 96
16 43 82,5 0
17 42 85 10 20 30 40 50
18 25,5 28
19 47 95
Examen Parcial
20 36 39
21 31,5 58 X= variable explicativa
22 32 49
23 42 62
24 21 59
25 41 90
Ejemplo: Anlisis del Diagrama de puntos y de la
asociacin entre las variables Examen Parcial (X)
y Examen Final (Y)
Se observa que las
Diagrama de puntos del Examen Final vs Examen Parcial observaciones estn
asociadas positivamente,
de una forma lineal es decir
que cuanto ms alta tiende a
100 ser la nota de un alumno en el
Parcial, en el Final tender a
80 tener una nota alta tambin.
Examen Final

Aunque la asociacin entre


60
las variables es ligeramente
40 fuerte, hay indicios que se
puede modelar a travs de
20 una Regresin Simple.
0
10 20 30 40 50 No se observan
Examen Parcial comportamientos
discrepantes.
Diagrama de dispersin
En un diagrama de puntos, generalmente, los valores de la variable
respuesta son colocados en el eje vertical y los valores de la variable
explicativa son colocados en el eje horizontal.
Diagrama de puntos del Examen Final vs Examen Parcial

100

80
Examen Final

60

40

20

0
10 20 30 40 50
Examen Parcial
Definiciones bsicas:

Asociacin positiva.- Existe si cuando aumentan los valores de ,


los valores de tienden a aumentar.

Asociacin negativa.- Si cuando aumentan los valores , los


valores de tienden a disminuir.

Asociacin lineal.- Cuando sucede cualquiera de los dos casos


anteriores de una forma aproximadamente lineal.
Definiciones bsicas:

Asociacin positiva.- Existe si cuando aumentan los valores de ,


los valores de tienden a aumentar.

50
45
40
35
30
25 Serie1
20
15
10
5
0
0 50 100 150 200 250 300 350
Definiciones bsicas:
Asociacin negativa.- Si cuando aumentan los valores , los
valores de tienden a disminuir.

1,2

0,8

0,6 Serie1

0,4

0,2

0
0 10 20 30 40 50
Direccin-Forma-Fuerza :
Direccin.- Se observa un comportamiento de direccin cuando
las variables estn positivamente asociadas, negativamente
asociadas o asociadas de una forma lineal.

Y
Y Y .. . ..
. .. . . .. . . ..
..
. . . .. . . . . . ..
. .. . . .. . . .
.. . . . ..
.
0
.. .
. .
X

..
X X

Asociacin Asociacin Asociacin


Negativa Positiva Negativa
(lineal) (lineal) (lineal)
Direccin-Forma-Fuerza :
Forma.- Cuando se observa que la relacin entre las variables
podra ser lineal, encorvada, cuadrtica, estacional, cclica o
quizs no existe ninguna forma definida de asociacin entre esas
variables.

Y
. .. ..
Y
.. .. .
. ..
. .. . . ..
.. . .. . . . Cuadrtica
.. Encorvada .. .
.. . . . . . .. .
. . ..
X
.
X

.. .. .. . .
Y Y

. . . . . . . .. .
. .. . .
.. . . . .
. . . . . . . Cuadrtica
. . . ... .. Cclica .. . .
.. . .. . .. .
X
X
Direccin-Forma-Fuerza:
Forma.- Cuando se observa que la relacin entre las variables
podra ser lineal, encorvada, cuadrtica, estacional, cclica o
quizs no existe ninguna forma definida de asociacin entre esas
variables.
Y
.. .. . . .
.. .
... . . .. . . . . .. .
Y

. .. . . . .. .. .. ..
.. .. . ..
.. .. . . .. ... .
Lineal Ninguna
.. .. . . . . . .. . . . .
.. . . .
X X

.
. .... .. .. . . .. . .. . ... .. . ... Estacional
. .. .. .... ... . . . . . ..
. . . .
X
Direccin-Forma-Fuerza :
Fuerza.- Cuando se observa que firmemente los puntos estn
rodeando la forma observada. En este caso es necesario ser muy
cuidadosos porque un cambio en la escala de los ejes puede
ofrecer otra visin diferente de la realidad.

.. . . . .
Y

. . ..
Y
.. . . ..
. .. . .
.
.. . .
.. .. . .
. . .
.
.. Asociacin fuerte . .. . Asociacin dbil
. . . .
.
X X

. . .
. .. . .
.. . .
. . . . ..
.. . . . ...
.. . Asociacin ligeramente fuerte

X
Regresin Lineal Simple

En el ejemplo de los exmenes se mostr que existe


asociacin positiva, de una forma lineal, ligeramente
fuerte, entre las variables Examen Parcial (X) y Examen
Final (Y).

Esto justifica proponer un modelo o ecuacin lineal para esa


relacin (Modelo de Regresin Simple).
Objetivos de una Regresin Lineal Simple

Ese modelo servir como un RESUMEN de la


relacin entre esas dos variables.

Sirve para predecir la calificacin futura del


examen de un estudiante basado en la
calificacin del examen parcial.
Qu se debe hacer?
Encontrar una lnea recta lo ms cercana posible a
todos los puntos.

Del ejemplo anterior:


Diagrama de puntos del Examen Final vs Examen Parcial

Lnea 1

Lnea 2
100

80
Examen Final

60

40

20

0
10 20 30 40 50
Examen Parcial
Se necesita un criterio para hallar esa lnea
Cmo se puede ver, sin un critrio se pueden encontrar
ms de una lnea que se acerque a todos los puntos.

Diagrama de puntos del Examen Final vs Examen Parcial

Lnea 1

Lnea 2
100

80
Examen Final

60

40

20

0
10 20 30 40 50
Examen Parcial
Definiciones: Ecuacin de una lnea recta

y a bx
a: pendiente, cantidad que cambia cuando x aumenta en una unidad

b: intercepto-, el valor que toma cuando es cero.

En regresin lineal simple,


y es la variable respuesta,
x es la variable explicativa.

El problema se reduce a
calcular los valores de x
y y con lo cual queda
definida la recta.
Definiciones: Residuo
Residuo: Un residuo es la diferencia entre la respuesta
observada y la respuesta predicha usando la lnea de la
regresin. Cada par de observaciones , es decir, cada punto en
el scatterplot produce un residuo.
Definiciones: Residuo
Residuo:
Esas diferencias verticales son llamadas residuos

y
residuos= (valor observado
- valor predictado)y

Re siduo : e yi yi
y representan los errores en la prediccin.

Para cada punto en el scatterplot hay un residuo


correspondiente.

Necesitamos entonces construir una recta de tal forma que


estos errores sean tan pequeos como sea posible.
Definiciones: Lnea de Regresin de Mnimos Cuadrados

Lnea de Regresin de Mnimos Cuadrados: Es la lnea que


hace que la suma de las desviaciones verticales cuadradas de los
puntos a la recta sea lo ms pequea posible. Con frecuencia se
denota como la Regresin de Y en X.

y a bx

Es la lnea de Regresin Lineal Simple buscada


Clculo de los estimadores:
Lnea de Regresin de Mnimos Cuadrados: es lo mismo que
hallar a y b para el modelo

y a bx
n n n
n( xi yi ) ( xi )( yi )
b i 1
n
i 1
n
i 1

n( x ) ( xi ) 2
2
i
i 1 i 1

y
n

a y bx xi y i 1
i

x i 1
n
n
Interpretacin de los estimadores:

Interpretacin es lo mismo que hallar a y b para el modelo

a Es el que toma la variable Y


Cuando la variable X es cero.

b
Es el valor en que se incrementa o
disminuye la variable Y cuando la variable
X aumenta en una unidad.

y a bx
Evaluacin del modelo:
Coeficiente de correlacin: Denotado por r y obtenido de la
muestra, mide la fuerza de la relacin lineal entre dos variables
cuantitativas.
Describe la direccin de la asociacin lineal e indica en un
escatterplot qu tan ajustados estn los puntos en la lnea de
regresin de mnimos cuadrados.

r
x y
n xi yi i i

n x x n y y
2 2 2 2
i i i i
Evaluacin del modelo:
Propiedades del coeficiente de correlacin:

Rango:
1 r 1
Signo: El signo del coeficiente de correlacin indica la direccin
de asociacin (negativa si r est entre [1,0 o positiva
0,siest
1} entre ).

Magnitud: La magnitud del coeficiente de correlacin indica


la fuerza de la asociacin lineal.
r 1 indica que la pendiente es positiva
r 1 indica que la pendiente es negativa
r 0 indica que no hay ninguna asociacin lineal
Evaluacin del modelo:
Propiedades del coeficiente de correlacin:
El coeficiente de correlacin se calcula usando los resultados
de las dos variables. No vara al cambiar las unidades de
medida de x y.
Evaluacin del modelo:
Coeficiente de determinacin: Mide la proporcin de
variabilidad total de la variable dependiente respecto a su media
que es explicada por el modelo de regresin.

Es usual expresar esta medida en tanto por ciento,


multiplicndola por cien.

R
( yi yi )
2

(y y )
i i
2
Evaluacin del modelo:
Error estndar de estimacin: Es una medida de variabilidad
como la desviacin estndar, pero esta desviacin es con
respecto al valor ajustado de la regresin, no con la media.

Error Estndar de Estimacin

y y
2
SCE
s i i

n2 n2
Prediccin Puntual:
Con los estimadores a y b, se pueden hacer predicciones

y 7.5 1.75x
Cul sera el valor de la respuesta y si fuera igual a 2.72 ?.
Cul sera el valor de la respuesta y si fuera igual a 12.1 ?.
Cul sera el valor de la respuesta y para cualquier valor de x ?.
Qu significa que el valor de la pendiente b en una lnea de regresin es 0 ?.
fin

Docente: MAGEN INFANTE

Potrebbero piacerti anche