Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
com
Grecia y Roma efectuaron recuentos peridicos sobre riqueza con fines tributarios
Edad Media = No se tienen noticias sobre operaciones estadsticas mas que sobre
los bienes de la Iglesia
s. XVI = Nace la escuela mercantilista francesa con Colbert, Bufn y Condorcet
De ella nacen la escuela Inglesa con Graunt, Petty, Halley, Davenant y King y la
Alemana con Seckendorf, Coring y Achenwall
s XVII (finales) = Petty efecta estudios sobre demografa, Renta y Trfico Mercantil
1.3
EL CLCULO DE PROBABILIDADES
Es la rama de las matemticas que se basa en el razonamiento deductivo
S. XVI = Cardano (1501 1576) y Galileo (1564 1642) son pioneros en esta rama
S. XVII = Pascal (1623 1622) y Pierre de FermaT (1601 1665) comienzan con la
formalizacin del clculo de probabilidades sobre los juegos de azar
propuesto por un jugador (Mer)
www.uned-ade.com
La escuela Inglesa destaca por sus estudios biolgicos = Pearson, Gosset, Fisher y
Neyman
Teora de la Decisin =
De Wald, aprovecha la influencia Bayesiana y aporta el
concepto de Funcin de prdida
Sociedad de Econometra =Fundada por Irwing Fisher, junto con Roos y Frish en
1930 aplican los conocimientos de inferencia estadstica
sobre fsica, astronoma y ciencias naturales a la Economa.
www.uned-ade.com
Seleccin de objetivo
Recogida de datos
Estimaciones
Medidas de Posicin
Media
Mediana
Moda
Cuartiles
Medidas de dispersin
Recorrido
Intervalos intercuartlicos
Varianza y Desviacin tpica
Coeficiente de apertura
Coeficiente de variacin
Relativo
Semi-intercuartlico
Medidas de forma
Asimetra
Curtosis
Medidas de concentracin o de desigualdad
ndice de Gini
Curva de Lorentz
2.-
CONCEPTOS FUNDAMENTALES
Poblacin
www.uned-ade.com
Muestra
Da lugar a modalidades
Definicin de la poblacin
Recogida de datos
Tratamiento de datos
3 Etapa.- Estimacin y Descripcin
www.uned-ade.com
1 ETAPA No hay nada que decir est bien claro lo que hay que hacer
2 ETAPA.- RECOGIDA DE DATOS ESTADSTICOS
Diseo del cuestionario
Tipos de preguntas
Abiertas = La respuesta es totalmente libre
Cerradas = la respuesta se especifica y el entrevistado debe escoger una opcin
Dicotmicas = Dos alternativas de respuesta
Mltiples = Varias respuestas predefinidas
Directas e Indirectas
Diseo Muestral
Muestreo sistemtico
Partes de incidencias
Recogida de datos (Es la parte esencial)
Entrevistas personales
www.uned-ade.com
Programa de validacin
Listado de inconsistencias
Distribucin de frecuencias
Su representacin grfica
De muestreo = a priori
Validaciones inadecuadas
Anlisis especiales multivariables
Anlisis factoriales
Componentes principales
Correlaciones cannicas
Modelos causales
Regresiones
Anlisis de la varianza
Estocsticos
No estocsticos
Modelizacin estadstica
Validacin
Resultados finales.
CONSTRUCCIN NUMRICA Y GRFICA
DISTRIBUCIN DE FRECUENCIAS UNIDIMENSIONALES
Tipos:
Datos no agrupados
Tabulacin
de datos
www.uned-ade.com
x
0
1
2
3
4
se repite
cada Valor
de x
Frecuencia total
N = n = 20
Frecuencia relativa
f = n / N f0 = n0 / N = 4/20=0,2 f1 = n1 / N = 10/20 = 0,5
* La suma de las frecuencias relativas = 1
Frecuencia absoluta acumulada ascendente Ni un determinado valor ordenado de
menor a mayor xi al numero de datos que son menores o iguales a l
Se representa:
n
N i = nj
J=1
Fi = fj
Fi = fj
j = i+ 1
j=1
Ejemplo
xi
150
175
200
250
300
ni
1
1
1
1
1
fi
1/5
1/5
1/5
1/5
1/5
Ni
Ni
Fi
1 (slo hay 1 valor igual o menor)
5
2 (hay 2 valores ig. o men. a l)
4
3 (hay 3 valores ------- ------)3
3/5**
4 (hay 3 valores ------- ------)2
4/5**
5 (hay 3 valores ------- ------) 1
1**
Fi
1/5** 4/5***
2/5** 3/5***
2/5***
1/5***
0***
www.uned-ade.com
Otro ejemplo
xi
ni
fi
Ni
Ni
0
4
4/20
4*
16**
1
10
10/20
14*
6**
2
4
4/20
18*
2**
3
1
1/20
19*
1**
4
1
1/20
20*
0**
N = 20
* y ** deben sumar siempre N
*** y *** deben sumar siempre 1
Fi
1/5***
2/5***
3/5***
4/5***
1***
Fi
4/5****
3/5****
2/5****
1/5****
0****
Conceptos:
Recorrido o Rango
R = xr xi = max xi - min xi
Clases:
Constante
c = R / k siendo k el nmero de clase o
agrupamientos
Variable
www.uned-ade.com
Frecuencia Absoluta
3 (5000,7280,7325)
4 (10050,12320,11900,10000)
7 (las buscais en los datos)
5 (idem anterior)
6 (idem anterior)
www.uned-ade.com
Ejemplo:
Una sociedad adquiere troncos de madera y decide clasificarlos en tramos de m3 por
unidad
resultado de esta operacin ha sido recogido en la Siguiente tabla agrupada de
frecuencias:
Metros cbicos (en m3)
absolutas
[0,
0,25]
(0,25 ,
0,50]
(0,50 ,
1]
(1,
2]
(2,
5]
N
1.235
1.422
1.472
1.490
1.500
Frecuencias
1.235
0,375 187
0,75 50
18
10
1.500
c3 = 1 - 0,50 = 0,50
N
F
F
265 1.235/1.500 265/1.500
78 1.422/1.500 78/1.500
28 1.472/1.500 28/1.500
10 1.490/1.500 10/1.500
0
1
0
REPRESENTACIONES GRFICAS
Distribucin de frecuencias de datos cualitativos
Las representaciones grficas tienen la ventaja del impacto visual nos proporciona
de forma instantnea una visin global del reparto de los datos observados
diagrama de rectngulos
Pictogramas
cartogramas
www.uned-ade.com
ni
50
40
30
20
10
CasadoViudo Divorciado
o
Otros Mi
Viudos
Solteros
Otros
Casados
Casados
Solteros
Viudos
Otros
Diagramas de barras
www.uned-ade.com
La altura de cada peldao viene dada por los valores de las frecuencias
absoluta o relativa y en el eje x se representan los valores de la variable, en las
ordenadas las frecuencias acumuladas.
Ejemplo Ascendente:
20
xi
Ni
Fi
19
0
4
4/20 = 0,2 18
1
14
14/20 = 0,7 14
2
18
18/20 = 0,9
3
19 19/20 = 0,95 4
4
20
20/20 = 1
1
2
3
4
Ejemplo Descendente:
xi
Ni
Fi
0
16
16/20 = 0,8
1
6
6/20 = 0,3
2
2
2/20= 0,1
3
1
1/20 = 0,05
4
0
0
Diagramas de frecuencias agrupadas en intervalos de clase
Histogramas de frecuencias
Se representan mediante rectngulos cuya base es la amplitud del intervalo
La altura de cada rectngulo ni / ci se llama densidad de frecuencia
Intervalo ni
[5000-9000] 3
(9000-13000] 4
(13000-17000]
(17000-21000]
(21000-25000]
7
6
7 5
5 4
6
3
0
5000 900013000170002100025000
www.uned-ade.com
18
19
20
N = 20
La media de los valores de N sera N/2 , luego 20/2 = 10
Otro
2
3
4
4
1
1
Salarios
100000
125000
200000
300000
ni
50
30
15
5
Ni
50
80
95
100
N = 100
N/2 = 50
n
7
8
15
17
10
3
MdeC
10
14
18
22
26
30
N
7
15
30
47
57
60
Nanterior
n Me
30 - 15
Me = 16 +
15
*4
= 20
n
10
20
N
10
30
Nanterior
n Me
www.uned-ade.com
(200, 500]
(500,1000]
15
5
45
50
Otro
x
0
1
2
3
4
n
4
10
4
1
1
x
2
6
7
8
n
15
40
40
5
Moda absoluta = 1
Moda bimodal = 6
Moda bimodal = 7
Moda relativa
Es aqul valor de x cuya frecuencia absoluta no es superada por los valores contiguos
www.uned-ade.com
Ejemplo
x
1
3
4
5
8
n
20
30
20
40
5
Moda relativa = 3
Moda absoluta = 5
Clculo de la Moda
** Los que habeis visto mi mail en las news reclamando una diferencia de formulas, me
inclino a pensar que no tendr respuesta y al fin y al cabo nos vamos a examinar del libro,
as que desarrollar las formulas del libro y que Dios nos pille confesados.
* Intervalos de amplitud (c) constante
Formula Mo = Linferior +
ni+1
*c
n i -1 + ni + 1
x
7
8
15 ni-1 valor anterior
17 Moda Mn. = 20
10 ni+1 valor siguiente
3
15
Mo = 20 +
4 = 22,8
15 + 10
Otro,
del
libro:
Los
salarios
de
200
50
x 50 = 158,33
Mo = 125 +
25 + 50
* Intervalos de amplitud variable (h), utiliza la misma formula pero en vez de n se calcula
hi = ni/ci
MEDIDAS DE POSICIN NO CENTRALES - CUANTILES
Deciles D:
Dividen la serie en 10 partes iguales. Hay 9 Deciles
www.uned-ade.com
Empezaremos, como lo hicimos con la Me, por calcular el Cuartil, Decil o percentil que
nos piden
Q1 = 1 * N / 4
Q2 = 2 * N / 4
Q3 = 2 * N / 4
D1 = 1 * N / 10
D3 = 3 * N / 10
D7 = 7 * N / 10
P11 = 11 * N / 100 P35 = 35 * N / 100 P76 = 76 * N / 10
Ese valor nos dar el intervalo o el valor de x sobre el que trabajar, para los clculos
posteriores aplicamos la formula de la mediana como ya hemos visto.
Ejemplo, del libro, datos no agrupados:
Dada la distribucin, calcular los 3Q, el 7 D y el 99P
xi
ni
N
1
20
20
3
30
50
4
20
70
5
40
110
D7
7
7
117
9
3
120
P99
Los Q, N/4 = 30, luego Q1 = 30, Q2 = 60 y Q3 = 90
El 7 D, N/10 = 120/10 = 12, por lo tanto 7*12 = 84 y el D7 = 5
El 99 P, N/100 = 120/100 = 1.2, por lo tanto 1,2 * 99 = 118,8 , luego P99 = 9
Otro, del libro:
a) Calcular el nivel salarial que no es superado por el 25% de la poblacin
b) El nivel salarial mnimo que perciben el 15% de los trabajadores que ms cobran.
Intervalo
n
N
[75 - 200]
50 50
Q1
(200 - 250]
40 90
P85
(250 300]
7
97
(300 400]
3 100
El 25% corresponde al Q1 luego Q1 = Linf + (N/4 - Nant)/nQ1 * c
Q1 = 75 + (25 0) / 50 * 125 = 137,5
b) Necesitamos conocer el percentil 85 ya que es el punto en que los salarios por debajo
es igual a los salarios por encima de l.
P85 = 85N / 100 = 85
Aplicamos la formula = 200 + (85 50)/40 * 50 = 243,5
MOMENTOS
Existen:
www.uned-ade.com
10/20 =
6*0,5 = 3
62*0,5 = 18 63*0,5 = 108
0,5
7
4/20 = 0,2 7*0,2 = 0,14
72*0,2 = 9,8 73*0,2 =68,6
8
1/20
= 8*0,05 = 0,4
82*0,05 =
83*0,05 =
0,05
3,2
25,6
2
3
9
1 1/20
= 9*0,05 = 0,45
9 *0,05 =
9 *0,05 =
0,05
4,05
36,45
1
1
N 2
h = x fi =
=
0
6,25 =
Media
aritmtica
1
Donde x fi es el momento a1, x2fi es el momento a2 y x3fi sera el momento a3
1
0
4
1
x
5
6
7
8
9
ni ni/N xifi (x x)
4 0,2
1
-1,25
10 0,5
3
-0,25
4 0,2 1,4
0,75
1 0,05 0,4
1,75
1 0,05 0,45 2,75
6,25 3,75
(x x ) 1 * fi
-1,251* 0,2 = -0,25
-0,251* 0,5 = 0,125
0,751* 0,2 = 1,5
1,751* 0,05 = 0,0875
2,751* 0,05 = 0,1375
Intervalos intercuantlicos
2
Intervalo intercuartlico
I = Q3 Q1
3
Intervalo semiintercuartlico
(Q3 Q1 ) / 2
4
Intervalo intercuartlico relativo
Q3 Q1 / Me
5
Intervalo 10 90 por cien
D9 D1
6
Intervalo 7 93 por cien
P93 P7
Desviacin absoluta
da =
N
s2 =
2 =
xi x 2 * n i
N
x * ni
2
i
- x2
Desviacin tpica
= Varianza
Siempre es positiva
10
14
18
22
26
30
7
15
30
47
57
60
www.uned-ade.com
Mode
3(SD) Shift
n - Comprobamos que hemos introducido todos los datos, debe ser N (60)
Shift
Ahora ha sacar resultados: la media aritmtica
La desviacin tpicaShift
Pearson
La varianza
Shift
xn
Shift
Shift
xy
xn
x=
=2
0,2768
29,44
Mde
C
7000
1100
0
1500
0
1900
0
2300
0
3(SD) Shift
n N
3 3
4 7
7 1
4
5 1
9
6 2
5
KAC
n - Comprobamos que hemos introducido todos los datos, debe ser N (25)
Shift
Ahora ha sacar resultados: la media aritmtica
La desviacin tpicaShift
www.uned-ade.com
Pearson
La varianza
Shift
xn
Shift
Shift
x=
xy
xn
0,3255
=2
27545600
Me
Mo x
Me
Mo
CURTOSIS
La curtosis o apuntamiento surge al comparar la forma de una variable respecto a
la distribucin llamada normal (campana de Gauss)
Se mide por el coeficiente de curtosis de Fisher
Se calcula mediante la formula g2 = m4 / s4 siendo s = Varianza 2 = 4
Si g2 > 0 la curva tiene ms apuntamiento = Leptocrtica
Si g2 = 0 la curva tiene apuntamiento normal = Mesocrtica
Si g2 < 0 la curva tiene menos apuntamiento = Platicrtica
Leptocrtica
Normal o Mesocrtica
Platicrtica
www.uned-ade.com
MEDIDAS DE CONCENTRACIN
(p - q )
i
Ig =
i=1
r-1
i=1
xi
0
1
2
3
4
5
6
ni
3
8
9
10
7
2
1
N=40
fi
0,075
0,2
0,225
0,25
0,175
0,05
0,025
F
xini qi =xini/xini
0,075 0
0
0,275 8
0,08
0,500 18
0,18
0,750 30
0,3
0,925 28
0,1
0,975 10
0,06
6
3,475 100
Qi
0
0,08
0,26
0,56
0,84
0,94
Fi - Qi
0,075
0,195
0,24
0,19
0,085
0,035
Resolucin prctica
0,82
qi
Qi
Fi - Qi
0,409
8
0,327
8
0,196
7
0,409
8
0,736
7
0,933
4
0,215
2
0,138
3
0,041
6
0,395
www.uned-ade.com
Curva de Lorentz
100
93,440
73,670
40,980
62,5
100
83,75
97,5
www.uned-ade.com
TABLAS DE CONTINGENCIA
Se aplican en estudios socioeconmicos y trabajan sobre variables cualitativas
La dependencia de las variables se puede conocer aplicando las frecuencias
relativas expresadas arriba.
Ejemplo:
De 100 conductores 40 estn casados y 60 solteros
De los 40 casados, 5 han tenido algn tipo de accidente en el ltimo ao
De los 6 solteros, 15 han tenido algn tipo de accidente en el ltimo ao
Obtener
a)Tabla de contingencia y sus modas
b) Distribuciones marginales y sus modas
c) Distribucin condicionada a que sean solteros los que tienen accidente y su moda
d) Independencia de los atributos
Accidente
s
E. civil
Casados
Solteros
Accidente
C
S
ni
40
60
Accidente No accidente
5
15
20
Moda
35
45
80
SI
NO
20
80
ni
40
60
100
a)
b)
E. Civil
Moda
ni
15
45
60
d) Independencia estadstica
Accidente
s
E. civil
Casados
Solteros
nj/N
Accidente No accidente
fi
fi
ni /N
5/100
15/100
0,2
35/100
45/100
0,8
0,4
0,6
1
ni
www.uned-ade.com
Funcional: Cuando existe una relacin matemtica exacta entre las variables. Por
ejemplo la recta x = f(y)
Relacin causa-efecto: Son las que tienen una base terica y las que se estudian
en los fenmenos socio-econmicos
x x
x x
x
x
x
x
x
Nube de datos
x
x
Lnea de regresin
Regresin por Distribuciones de frecuencias por el mtodo de las Medias Aritmticas
condicionadas
Se trata de situar los puntos que formaran, en el caso de la Y sobre X , o sea y=f(x),
siguiendo la siguiente formula:
P1= (x1, Y/x1) P2 = (x2, Y/x2) y as sucesivamente (ojo, la formula no es la media de y
dividida por x1 sino la media de y sobre x1)
En el caso de querer obtener la otra variable X sobre Y, es decir x= f(y), cambiaramos en
la de arriba las x por las y
y
x
2
3
4
ny
Ejemplo:
1
nx
1
2
1
4
4
4
2
10
1
2
1
4
6
8
4
18
www.uned-ade.com
2 [(---
1 x 1 DATA
2 [(---
2 x 4 DATA
[(---
3x
[(---
1 x 1 DATA
[(---
2 x 4 DATA
1 DATA
n , debe daros 18
Si hacemos ahoraShift r da 0
Si pulsamos Shift
A dar 2 siShift
pulsamos
B os debe dar 0 si
sustituimos estos valores en la formula de la recta y = a + bx y siempre dar resultado 2
para cualquier valor de x por lo tanto es paralela a x, en consecuencia independiente.
Calculemos ahora por la formula de la recta x sobre y
(x x) = (Covx y/ Varianzay )* (y y)
x = Shift x os dar 2,88 Shift
y=
y os dar 2
x
Shift n
Para la CovarianzaxyKout
xy aparecer
Kout104 y
y debe daros 3,77
La Varianzax la obtendremos a partir de la desviacin tipica (2)
Shift xn
2 y debe daros 0,5432
xy
=
Shift
=
x
www.uned-ade.com
ni
fi
15
18
0,18
10
30
32
0,32
12
30
46
0,46
0,04
38
54
Nij=10
0
0,38
0,54
0,08
x
Intervalo
s
100-150
MdeC
125
150-200
MdeC
175
200-300
MdeC
250
300-350
MdeC
325
nj
fj
Fij=1
Tabla de correlacin de mi amantsima, para los que no tengan calculadora para 2 Tablas
Mode 2 LR
x
1-3
MdeC
2
3-7
MdeC
5
nj
y
njyj
Y2
njy2
0
2
2
3
0
0
0
0
2
0
0
0
0
4
1
6
5
0
3
1
3
1
3
4
10
10
2
2
4
4
8
nix
x2 nix2 nijxiyj
6
0
ni x
2 12
24
10
0
15
2
30
2
9
3
6
13
9
18
29
15
25 75
40
27
99
50
0 = MdeC
* y = 2*0 =0
0 = 0 * x = 0*2 = 0
12 =
10 =
www.uned-ade.com
y sobre x (y y) =
(x - x )
(y - y )
2 (LR) Shift
KAC
[(---
0 X
2 DATA 5
[(---
0 DATA
[(---
1 X
3 DATA 5
[(---
0 DATA
[(---
2 X
1 DATA 5
[(---
0 X
1 DATA
[(---
3 DATA 5
[(---
2 DATA
Koutn
A partir de aqu slo hay que ir apretando teclitas y sacando los valores.
x = Shift
x y =
Varianza x = Kout
Shift
x2
Shift
y
Shift
- n
Kout
x
Shift
=
x
x
2
=
www.uned-ade.com
Tambin se calcula
2
Varianza y = Kout
x
y
125
175
250
400
xn
y2
1
15
10
12
1
38
2
2
20
30
2
54
3
1
2
4
1
8
nx
18
32
46
4
Kout
2
Shift
- n
Covarianza Kout
xy
x
y
yn
y
=
Kout
2
n
-
Shift
Frecuencias marginales de x
Frecuencias marginales de y
Moy = 2
x = xi ni / N = (125*18 + 175*32 + 250*46 + 400 * 4)/ 100 = 209,5
La x con la calculadora
Mode
3(SD) Shift
n - Comprobamos que hemos introducido todos los datos, debe ser N (100)
x = 209,5
Shift
www.uned-ade.com
Tabla X = 125, 175, 250, 400, si queda condicionada a que x = 175, la nueva tabla tomar
la siguiente forma
X = Yj X = x=175 n
10
2
20
3
2
N = 32
Mo = 2 x = (1*10 + 20*2 + 2*3) / 32 = 1,75
Varianza = x2 x2 = (108/32) 1,752= 0,3125, luego = 0,56
Coef. de Pearson = / x = 0,56 / 1,75 0,32
Con la calculadora
x
N
1
2
3
10
20
2
3(SD) Shift
KAC
Introducimos los datos de la tabla: x 1 10 DATA
2 x 20 DATA
3 x 2 DATA
Mode
Kout
Shift
Shift
Como en las unidimensionales reducen los datos de las variables para tener una
idea general de la distribucin
Hay de 2 tipos:
Kout
j=1r
2
x
Kout
2
Kout
y
xy
Kout
n
=
www.uned-ade.com
www.uned-ade.com
Dicho esto, en la formula S2y = S2yt + S2ry, conocemos S2y, que es la Varianza de y,
desconocemos S2ry y S2yt
S2ry = m02 m211 / m20 = m02 bm11
S2yt = bm11
Ejemplo:
Calcular la varianza explicada por la regresin, la residual y explicar ambas.
0 3 6
x
1
2
1 5 2 8
4 4 1 9
5 9 3 17
www.uned-ade.com
Si r=1 implica que S2ry = 0 y los valore estimados coinciden con los observados,
existiendo una dependencia exacta o funcional positiva. La funcin explica
plenamente la distribucin
Si r=0 implica que S2ry= S2y no existiendo ninguna dependencia lineal entre las
variables pero puede haber una relacin parablica o exponencial. Las rectas son
paralelas.
Si Cov xy es negativa entonces r tambin lo es y toma los valores 1<=R<=0
Si R = -1 la correlacin es perfecta y existe dependencia exacta funcional negativa.
Coeficiente de Determinacin
La formula que utiliza el libro es R2 = m211 / m20 * m02
Lo mismo en castellano R2 = Cov2 xy / Vx * Vy = Cov2 xy/x2*y2
Coeficiente de Correlacin
R = m11/ m20 * m02
R = Cov xy / x*y
www.uned-ade.com
Con la calculadora
Una vez introducida la tabla
Shift r 0,338 que es el coeficiente de correlacin R
Shift r x2 = 0,11458 , que el de determinacin R2
En este caso, como el coeficiente de determinacin es 11,45% que no llega al 75% nos
indica que la funcin lineal no representa la dependencia de las variables y el modelo no
es bueno.
Otro ejemplo, con calculadora
x 2 3 4 5 6 7 8 8 9 10
y 2 3 3 4 4 5 6 5 7 9
Como siempre Mode 2 (LR) y Shift KAC
Introducimos la tabla, datos no agrupados es decir despus de cada valor de x [(--- y el
valor de y
Comprobar con Kout n
Shift r nos dar 0,9445, que es R, el coeficiente de correlacin
Shift r x2 = 0,892, que el de determinacin R 2, luego como es superior al 75%,
quiere decir que el modelo es fiable en un 89,2 %, por lo tanto bueno para hacer
predicciones.
www.uned-ade.com
Utiliza la formula y = b0 + b1x1 + b2x2 que se transforma al dividir las variables por N
en
y = b0 + b1x1 + b2x2
Para facilitar el clculo cambiamos las variables medias por sus respectivas desviaciones
a sus correspondientes medias aritmticas, luego
y = y1 y
x1i = x1i x1 x2i = x2i x2
luego la formula del plano que pasa por el origen es: y ti = b1x1i b2x2i Siendo
b 1=
b 2=
Sy
Sx1
Sy
Sx2
(Ry2 Ry1R12)2
(1 R212)(1 R2y1)
R y1.2 =
(Ry1 Ry2R12)2
(1 R212)(1 R2y2)
De correlacin parcial
La raz cuadrada de R2y
Ejemplo del libro
Se observa en 5 individuos, sus gastos totales anuales, sus niveles de ingresos y el
nmero de habitantes de las ciudades donde viven.
yi = Gastos
x1i = Ingresos
x2i = Habitantes.
Se pide;
Estimar el plano de regresin, comentar el problema de la multicoliniedad
Descomponer la V marginal de los gastos en Varianza explicada por la regresin y
la varianza no explicada
Obtener los Coef. de determinacin y correlacin mltiple
www.uned-ade.com
Construimos la tabla
yi X1i x2i Y2i
1 1 1 1
2 3 1 4
3 4 2 9
2 4 3 4
4 5 4 16
12 17 11 34
x2 = 11/5 = 2,2
Sy
Sx1
Sy
Sy
Sx1
Sy
Sx2
*
1,36
1,02
www.uned-ade.com
b2 que representa la variable y (el gasto) indica que por cada unidad de variacin de x2
permaneciendo constante x1, slo vara en 0,084, es decir que la variable x2 apenas tiene
relevancia en la determinacin del gasto.
b) Determinar la Vexplicada y la Vresidual
Tenemos que resolver la igualdad S2y = S2yt12 + S2ry12 en la que la expresin
S2ry12 = S2y b1Sy1 b2Sy2 = 0,14 0,61 * 1,24 0,084 * 0,92 = 0,2 , luego
S2yt12 = S2y - S2ry12 = 1,04 0,2 = 0,84
c) Determinar el Coef. de determinacin y el de correlacin simples
Determinacin
R2y12 = 1 S2ry/S2y = 1 0,2/1,04 = 0,8
Correlacin = R2y12 = 0,8 = 0,9
d) Coeficientes de Determinacin y Correlacin parcial
R2y2.1 =
(Ry2 Ry1R12)2
(1 R212)(1 R2y1)
(0,89 0,77*0,83)2
(1 0,832)(1 0,772)
R y1.2 =
(Ry1 Ry2R12)2
(1 R212)(1 R2y2)
De correlacin Ry1.2 =
(0,77 0,89*0,77)2
(1 0,832)(1 0,89)2
0,1
= 0,31 Ry2.1 =
0,5 = 0,7
y1 = Na0 + a
1 xi
2xi2
+a
N
y1 x = a0 x2i + a1xi3
2
i
+
ax2 3i
N
+ax2i4
Hiprbola equiltera
Hay que resolver la funcin y = a0 + a11/x
www.uned-ade.com
Pn Pn2 Pn
Pn4
P1
10
D1
6
P1*D 60
11
9 5
63 55
60
0
351
340 3360
3
3
8
28
92 P1*D1 250
=
64 P12*D1 2294
8
=
P12*
D1
37
44 60
1 5
y1 = Na0 + a
1 xi
N
2xi2
+a
N
y1 xi= a0xi + a1 xi
N
y1 x = a0 x
2
i
+
ax2 3i
+ a1x
3
i
+ax2i4
20 = 4a0 + 37b + 351c 250 = 37a + 351b + 3403c 2294 = 351a +3403b +33603c
Resolviendo es sistema, D = 2,43638 + 2,2188 P + 0,1818P2
Hiprbola equiltera
Hay que resolver la funcin y = a0 + a11/x
Construimos la tabla
x y Z= 1/
x
1 5
1
2 3 1/2
3 2 1/3
y = a0 + z resolviendo entonces la ecuacin de la recta
Siendo a0 = Y m11 / m20 * Z
Siendo a1 = m11 / m20
a1 = 4,3846
a0 = 0,6538, luego y = 0,6538 + 4,3846 1/x
Con la calculadora sale directo cambiando los datos de Z como x
www.uned-ade.com
Mj
Mi
M1
M2
M1 M2
8
12
32
48
(1
)
Casados
con 5
35
45
80
(2)
ni
40
60
100
(4)
(5)
E. civil Accident
(1) (3)2 (4) /(2)
e
(2)
40
CC*CS/N =
-3
9 1,125
www.uned-ade.com
acc.
Solteros
acc.
Casados
acc.
Solteros
acc.
con 1
5
sin 3
5
sin 4
5
(CC)
60
(SC)
20 (CS)
80 (SS)
8
SC*CS/N =
12
CC*SS/N =
32
SC*SS/N =
48
0,75
-3
0,2812
5
0,1875
2 = (5 2,3437
)
5
Como ya sabeis C =
www.uned-ade.com
Aplicacin
Existe un gran nmero de fenmenos econmicos cuyo significado y estudio alcanza
distintos niveles de complejidad (son los que se conocen como coyuntura econmica,
nivel de inflaccin, nivel de desarrollo, etc.).
Los nmeros ndice constituyen el instrumental ms adecuado para estudiar la evolucin
de una serie de magnitudes econmicas que nos den respuesta a cuestiones tales
como:
Es la coyuntura econmica positiva o negativa? Es el nivel de inflaccin el adecuado
o no? etc.
Definicin
Un nmero ndice puede definirse como una medida estadstica que nos proporciona la
variacin relativa de una magnitud (simple o cmpleja) a lo largo del tiempo o el espacio.
Sea X una variable estadstica cuya evolucin se pretende estudiar.
Llamaremos:
Periodo inicial o base, es aquel momento del tiempo sobre el que se va comparando
la evolucin de la magnitud o variable estadstica X0.
Periodo de comparacin, es aquel momento del tiempo en el que el valor de la
magnitud Xt se compara con el del periodo base.
El indice de evolucin de 0 a t expresado en %:
I 0t =
Xt
100
X0
t
I 0 toma el valor 100 en el periodo base
t
I 0 < 100 implica que Xt < X0 (indicando una evolucin negativa del periodo 0 al t )
t
I 0 > 100 implica que Xt > X0 (indicando una evolucin negativa del periodo 0 al t )
Simples
Complejas
Sin ponderar
Ponderados
www.uned-ade.com
I 0t =
Xt
100
X0
i= 1
I i0t =
i= 1
X it
100
X i0
i= 1
t
i0
I wi
i= 1
wi
i= 1
X it
100 wi
X i0
i= 1
wi
www.uned-ade.com
Propiedades que cumplen en general los ndices simples (pero no todos los
complejos)
I 0t 0
I 0t = 1 0 0
I 0t I t0 = 1
'
I 0t I tt' I t0 = 1
X'0t = X 0t + X 0t
I'ot = I ot + I ot
Sauerbeck
Bradstreet-Dutot
Sin ponderar
Complejos
Ponderados
Laspeyres
Paasche
Edgeworth
Fisher
P0t =
pt
100
p0
1
PS =
1
P =
i= 1
t
i0
pit
100
pi0
i= 1
PBD
=
1
pit
pi0
i= 1
i= 1
100 =
pit
pi0
i= 1
i= 1
100
www.uned-ade.com
PX =
i= 1
pit
w
pi0 i
i= 1
100
wi
PF =
PL PP
QX =
qit
wi
i = 1 q i0
i= 1
wi
wi = qi0 pi0
wi = qi0 pit
100
QF =
QL QP
www.uned-ade.com
I 0t' I t't I t0 = 1
I 0t' I t't =
1
= I 0t
I t0
I t't =
I 0t
100
I 0t'
I 00
I = t'
I0
0
t'
0
Coeficiente de Transformacin: I t' =
100
I 0t'
www.uned-ade.com
I t'0 =
I 00
I 0t'
0
Coeficiente de Enlace : I t' =
100
I 0t'
V0 =
i= 1
pi0 q i0
Valor en el periodo t :
Vt =
i= 1
pit q it
IVt =
pit qit
pi0 qi0
i= 1
i= 1
La evolucin de los ndices a lo largo del tiempo est motivado, segn la expresin anterior, por
variaciones conjuntas de precios y cantidades, no pudiendo aislarse la influencia de cada una.
En economa interesa analizar la evolucin del conjunto de N mercancas bajo lo que se
denomina a precios constantes, es decir, sin que se produzcan variaciones en los precios de
los distintos componentes. Para hacerlo se realiza la operacin denominada deflactacin de
series de valores expresadas en precios o pesetas corrientes de cada ao.
NUMEROS INDICES
Para comparar el valor de un conjunto de bienes en dos periodos distintos interesa aislarlo de la
subida, inflacin, o de la bajada, deflacin, de sus respectivos precios. De esta manera, se
consigue aislar el clculo de la distorsin que las subidas de precios, que no sean debidas a una
mejora en la calidad de los bienes y los servicios.
Para poder efectuar un anlisis comparativo de una serie de valor entre distintos periodos, hay
que pasarla de pesetas corrientes o de cada ao a pesetas constantes o del periodo que se
considere como base. Esto es lo que se denomina deflactar la serie, dividindola por el ndice
de precios que se considere ms adecuado llamado deflactor de la serie.
www.uned-ade.com
Los ndices de Laspeyres y Paasche son los que ms se utilizan como deflactores de series.
a) Deflaccin por un Indice de Laspeyres
Si el valor a precios corrientes se divide por un ndice de precios de Laspeyres tendremos:
Vt
=
PL
i= 1
pit qit
pit qi0
pi0 qi0
i= 1
i= 1
i= 1
pit q
pit qit
pit qi0
i= 1
i0
i= 1
= V0 QP
Al deflactar una serie de valor a precios corrientes por un ndice de precios de Laspeyres no se
obtiene una serie de valor a precios constantes sino V0 Qp que es el producto del valor en el ao
base por un ndice cuntico de Paasche. El PL no es por tanto un verdadero deflactor, aunque en
la prctica se considera como tal por ser el ndice que se suele elaborar.
b) Deflaccin por un Indice de Paasche
Este si es un verdadero deflactor ya que la expresin nos da el valor actual de un conjunto de N
mercancas a precios constantes del ao pi0 base:
Vt
=
PP
i= 1
pit qit
pit qit
pi0 q it
i= 1
i= 1
i= 1
pi0 q it
Segn sea la serie econmica que se desea deflactar, as habr que elegir el ndice de precios
ms adecuado:
Para deflactar la renta disponible de una familia en pesetas constantes de un determinado
ao, el deflactor adecuado ser el IPC (Indice de Precios de Consumo)
Para deflactar una serie del valor de un conjunto de productos industriales, su deflactor
adecuado ser el IPI (Indice de Precios Industriales)
Indice de Precios de Consumo (IPC)
El IPC es el indicador general ms conocido. Se elabora peridicamente por la mayora de los
paises, ante la necesidad de conocer la evolucin de los precios de bienes y servicios que
adquieren las familias. Nos basaremos fundamentalmente en la Metodologa del Indice de
Precios de Consumo con Base 1992, publicado por el INE en 1994.
Caractersticas principales
El Periodo Base del nuevo sistema es el ao 1992. Para ese ao, la media aritmtica de sus
ndices mensuales se hizo igual a 100.
www.uned-ade.com
(Encuesta de Presupuestos Familiares) que proporciona informacin bsica sobre los gastos
de las familias en bienes y servicios de consumo. La EPF se realiz entre el 1 de Abril de
1990 y el 31 de Marzo de 1991.
El Campo de Consumo del IPC est constituido por todos los bienes y servicios que los
hogares del estrato de referencia destinan al consumo.
Quedan excluidos por tanto los que suponen gastos de inversin. Se incluyen aquellos
que se pagan realmente en el periodo de referencia (se excluyen gastos ficticios e
imputados como autosuministros, autoconsumos, alquileres imputados y gastos
subvencionados por las A.A.P.P como sanitarios y educacin).
Los gastos de consumo se clasifican en la EPF segn una nomenclatura elaborada
por el INE y basada en la armonizada (a cuatro niveles) por EUROSTAT.
La aparicin o desarrollo de nuevos bienes o servicios en la estructura de gastos que
ha tenido lugar en la ltima dcada han aconsejado modificar el conjunto de artculos
de consumo para el clculo del IPC, incluyendo nuevos bienes y sustituyendo algunos
otros.
El nmero de artculos seleccionados es de 471 y todos ellos forman lo que se llama
cesta de la compra. Los artculos se agregan en subclases, estas en clases,
posteriormente en subgrupos y finalmente en grupos, siguiendo una codificacin.
Adems, estos artculos se agregan en 57 rbricas de consumo, a cada una de las
cuales le corresponde una ponderacin (en tanto por mil).
www.uned-ade.com
Hasta 1976, el IPC elaborado por el INE se denominaba Indice de Coste de la Vida.
Con este nombre se cre y se mantuvo en sus diferentes revisiones:
Desde 1939 a 1960 (base 1936)
Desde 1961 a 1968 (base 1958)
Desde 1969 a 1976 (base 1968).
Con el nombre de Indice de Precios al Consumo (IPC):
Desde 1977 a 1985 (base 1976)
Desde 1985 a 1992 (base 1983)
Desde 1993 hasta nuestros das (base 1992)
La citada Metodologa del INE (1992) propone los siguientes coeficientes de enlace de series:
K92/58 = 0.044699
K92/68 = 0.082113
K92/76 = 0.184347
K92/83 = 0.545261
Otros Indicadores de Coyuntura en Espaa
Indices de Produccin Industrial (IPI)
El INE est construyendo un nuevo indicador de las ventas al por menor tomando datos
en las grandes superficies.
Encuestas de coyuntura
www.uned-ade.com
El l/p ser distinto segn la naturaleza de la serie pero cuantos ms periodos, mejor el
anlisis.
Esta componente puede ser de naturaleza:
Estacionaria o constante (su representacin grfica es paralela al eje de abcisas)
Lineal (creciente o decreciente segn el coeficiente angular de la recta sea + o -)
Parablica, exponencial u otras posibles
Las Variaciones Cclicas (C):
Es la componente de la serie que refleja las oscilaciones peridicas de amplitud > 1 ao.
Las oscilaciones no son regulares y se presentan en los fenmenos econmicos cuando se
www.uned-ade.com
yt = T + C + E + A
yt = T x C x E x A
yt = T x C x E + A
Los mtodos que se utilizan para aislar las componentes de las series temporales estn basados
en alguno de los esquemas anteriores aunque no puede generalizarse el problema ya que no en
todas las series temporales aparecen todas las componentes. Para ello es necesario un anlisis
previo. De cualquier forma, la gran mayora de las magnitudes econmicas se adaptan
perfectamente al esquema multiplicativo.
Determinacin de la Tendencia (T)
La tendencia es una componente fundamental en el estudio de las series temporales pues
proporciona el hilo conductor de la evolucin del fenmeno a largo plazo.
Su determinacin slo debe efectuarse cuando se disponga de una larga serie de
observaciones (a partir de 12 o 15 aos es aconsejable) pues de lo contrario podran
concluirse estimaciones errneas.
Algunos de los mtodos ideados para tratar de aislar la tendencia de las dems variables:
a) Mtodo Grfico
Es el mtodo ms sencillo para obtener la linea de tendencia de una serie temporal sin
necesidad de hacer operaciones matemticas (por lo que es un mtodo ms impreciso). Estas
son sus fases:
www.uned-ade.com
Unir mediante segmentos todos los puntos altos de la serie, linea poligonal de cimas
Unir mediante segmentos todos los puntos bajos de la serie, linea poligonal de fondos
Trazar perpendiculares al eje de abcisas en cada punto de cima y de fondo
La tendencia biene dada por la linea amortiguada que une los puntos medios de los
segmentos, es decir, la linea de tendencia que tiene por ordenadas la media
aritmtica de las ordenadas de las dos lineas anteriores
www.uned-ade.com
decidir el tipo de funcin ms adecuada para el ajuste: lineal, parablica, exponencial, etc
El ajuste se realiza por el mtodo de los mnimos cuadrados que, como sabemos, consiste en
minimizar la suma de los cuadrados de las diferencias entre los valores observados en los
distintos periodos y los estimados por la ecuacin de la recta de regresin: yt = a + b t
Sistema de ecuciones normales
mnimo-cuadrticas para y = a + b x
yi = a + b
i= 1
i= 1
xi yi = a
Cambio de variable:
t' = 1
t' = 0
i= 1
i= 1
xi
t= 1
xi + b
i= 1
xi2
t= 1
Si N es impar t' = t - Ot
'
Si N es par t' = 2(t - Ot )
Sistema de ecuciones
para yt = a + b t
t' = 1
t' = 1
yt = a + b
t yt = a
t= 1
t + b
t= 1
t2
t= 1
yt' = a
t' yt' = b
a =
yt = a + b t
t'
t' = 1
yt'
b =
t' yt
t' 2
t' = 1
t' = 1
t' = 1
Deshaciendo cambio:
yt = a + b ( t - Ot )
yt = a +2b ( t - Ot )
La gran ventaja de este mtodo es que, una vez obtenida la recta de regresin, se pueden
hacer predicciones de cara al futuro de la magnitud en estudio. Basta sustituir en la ecuacin
de regresin valores de t de periodos futuros
Adems tambin podemos dar una medida de la fiabilidad de dichas predicciones a travs del
coeficiente de determinacin:
R =
2
( S t' yt )2
2
t'
S S
2
yt
S t' yt
1
=
t' = 1
t' yt ( t' y t )
S t'2 =
t' = 1
t' 2 ( t' ) 2
2
y t'
1
=
t' = 1
y 2 yt'2
t'
a+ b t
Si la tendencia es exponencial seguir un modelo de la forma yt = e
y tomando logaritmos
www.uned-ade.com
Se determina la tendencia por el mtodo de las medias mviles centradas en los periodos yt
Se divide (hipotesis multiplicativa) la serie observada yt por su correspondiente media mvil
centrada, con lo que estamos eliminando de forma conjunta las componentes del largo plazo
(tendencia y ciclo), es decir el conjunto T x C
yt
TxCxExA
=
= ExA
TxC
TxC
Como se observa en la anterior expresin, una vez eliminada la componente mixta, es decir,
I1 =
M1
100
MA
I2 =
M2
1 0 0 ... (expresados en %)
MA
Habr tantos ndices como estaciones o medias estacionales tengan las observaciones y nos
indicarn la importancia de la variacin estacional al pasar de un periodo a otro. Si un indice
es menor que 100 quiere decir que es un 20% ms bajo que su tendencia media
Una vez obtenidos los ndices de variacin estacional puede desestacionalizarse la serie
observada, dividiendo cada valor de la correspondiente estacin por su ndice
correspondiente expresado en tantos por uno
b) Mtodo de la Tendencia por Ajuste Mnimo-Cuadrtico
El objetivo sigue siendo aislar la componente estacional de la serie por eliminacin sucesiva de
todos los dems. La diferencia con el mtodo anterior es que, en este caso, las componentes a l/p
b) Mtodo de la Tendencia por Ajuste Mnimo-Cuadrtico
El objetivo sigue siendo aislar la componente estacional de la serie por eliminacin sucesiva de
todos los dems. La diferencia con el mtodo anterior es que, en este caso, las componentes a l/
p (tendencia-ciclo) las obtenemos mediante un ajuste mnimo-cuadrtico de las medias
aritmticas anuales y t calculndose bajo la hiptesis aditiva. Sigue los siguientes pasos:
www.uned-ade.com
observaciones son trimestrales estas medias se obtienen con 4 datos, si son mensuales con
12 datos, etc. para el caso de que el periodo de repeticin sea el ao
Se ajusta una recta por mnimos cuadrados yt = a + b t que nos representa, como sabemos,
la tendencia, siendo el coeficiente angular de la recta el incremento medio anual de la
tendencia, que influir de forma distinta al pasar de una estacin a otra
Se calculan, con los datos observados, las medias estacionales (M1, M2, M3, ...) con objeto de
eliminar la componente accidental. Estas medias son brutas pues siguen incluyendo los
componentes a l/p (tendencia-ciclo) que deben someterse a una correccin
Empleando el incremento medio anual dado por el coeficiente, se obtienen las medias
estacionales corregidas de las componentes a largo plazo (M1, M2, M3, ...) bajo el esquema
aditivo:
Para la r-sima estacin,
(r - 1)b
M r' = M r
la media estacional corregida
n estaciones
de la tendencia interestacional ser
Los ndices de variacin estacional se obtienen con la misma sistemtica del mtodo anterior:
con las medias estacionales corregidas se obtiene la media aritmtica anual MA que sirve de
base para calcular los ndices:
I1 =
M'1
100
M' A
I2 =
M'2
1 0 0 ... (expresados en %)
M' A
Estimar la tendencia
Calcular los ndices de variacin
estacional
Desestacionalizar la serie observada
Eliminar la tendencia dividiendo cada
valor desestacionalizado por la serie de
tendencia
Expresando el proceso en forma de
cociente sera:
Finalmente se intenta eliminar la
componente accidental con un anlisis
armnico
yt
TxCxExA
=
= CxA
TxE
TxE
www.uned-ade.com
Aleatorio
No se obtienen siempre los mismo resultados.
Ej: medir con la misma regla e identicas Ej: el lanzamiento de una moneda
condiciones la longitud de una barra
observando la sucesin de caras y cruces
que se presentan
Las siguientes son caractersticas de un experimento aleatorio:
El experimento se puede repetir indefinidamente bajo idnticas condiciones
Cualquier modificacin a las condiciones iniciales de la repeticin puede modificar el resultado
Se puede determinar el conjunto de posibles resultados pero no predecir un resultado
particular
Si el experimento se repite gran nmero de veces entonces aparece algn modelo de
regularidad estadstica en los resultados obtenidos
Espacio Muestral
Se denomina resultado bsico o elemental, comportamiento individual o punto muestral a
cada uno de los posibles resultados de un experimento aleatorio. Los resultados bsicos
elementales sern definidos de forma que no puedan ocurrir dos simultneamente pero si uno
necesariamente.
Se denomina conjunto universal, espacio muestral o espacio de comportamiento E al
www.uned-ade.com
conjunto de todos los resultados elementales del experimento aleatorio. Pueden ser de varios
tipos:
Espacio Muestral Discreto
Espacio muestral finito
Espacio muestral infinito numerable
Tiene un nmero finito de elementos.
Tiene un nmero infinito numerable de
elementos es decir, se puede establecer una
aplicacin biyectiva entre E y N.
Ejemplo:
Ejemplo:
Experimento aleatorio consistente en lanzar Experimento aleatorio consistente en
un dado. El espacio muestral es lanzar un dado hasta que sea obtenido el
nmero 1
E={1,2,3,4,5,6}
E={{1},{2,1},{3,1} ... {2,2,1},{2,3,1},...}
Espacio Muestral Continuo
Si el espacio muestral contiene un nmero infinito de elementos, es decir, no se puede
establecer una correspondencia biunvoca entre E y N.
Ejemplo:
Experimento aleatorio consistente en tirar una bola perfecta sobre un suelo perfecto y
observar la posicin que ocupar esa bola sobre la superficie. E={Toda la superficie del
suelo}
Sucesos
Un suceso S es un subconjunto del espacio muestral, es decir, un subconjunto de resultados
elementales del experimento aleatorio.
Diremos que ocurre o se presenta el suceso cuando al realizarse el experimento aleatorio, da
lugar a uno de los resultados elementales pertenecientes al subconjunto S que define el suceso
Se pueden considerar cuatro tipos de sucesos segn el n de elementos que entren a formar
parte:
Suceso elemental, suceso simple o punto muestral es cada uno de los resultados posibles
del experimento aleatorio luego los sucesos elementales son subconjuntos de E con slo un
elemento
Suceso compuesto es aquel que consta de dos o ms sucesos elementales
Suceso seguro, cierto o universal es aquel que consta de todos los sucesos elementales del
espacio muestral E, es decir, coincide con E. Se le denomina seguro o cierto porque ocurre
siempre.
Suceso imposible es aquel que no tiene ningn elemento del espacio muestral E y por
tanto no ocurrir nunca. Se denota por .
Operaciones con sucesos
Con los sucesos se opera de manera similar a como se hace en los conjuntos y sus operaciones
se definen de manera anloga. Los sucesos a considerar sern los correspondientes a un
experimento aleatorio y por tanto sern subconjuntos del espacio muestral E.
Suceso Contenido en Otro
Dados dos sucesos A y B de un experimento aleatorio:
Diremos que A est incluido en B si:
Cada suceso elemental de A pertenece tambin a B, es decir,
www.uned-ade.com
A B
A B
Igualdad de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:
Diremos que A y B son iguales si:
Siempre que ocurre el suceso A tambin ocurre B y al revs.
A B
A= B
B A
Unin de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:
A B
A
i= 1
Interseccin de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:
A B
A
i= 1
A B =
n
A =
i= 1
A1 A2 ... An =
Ai Aj =
A=
i= 1
i j
www.uned-ade.com
Diferencia de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:
A B = A B
A B = (A B) (B A)
A B = (A B) (B A)
E=
=E
E A = E
A=A
A= A
A A = E
Propiedad idempotente: A A = A
E A= A
A A =
A A= A
Propiedad conmutativa: A B = B A
A B= B A
A=
A1 (A2 A3 ) = (A1 A2 ) A3
A1 (A2 A3 ) = (A1 A2 ) ( A1 A3 )
A1 (A2 A3 ) = (A1 A2 ) ( A1 A3 )
Propiedad simplificativa: A (A B) = A
A (A B) = A
www.uned-ade.com
Leyes de Morgan: ( A B ) = A B
( A B ) = A B
Sucesin de Sucesos
Llamaremos sucesin de sucesos a una familia de sucesos A1, A2, A3,..., An en la que stos
aparecen ordenados por el subndice n. La representaremos por { An } n=1,2,3,...
Sucesin Creciente
Una sucesin de sucesos { An } diremos
que es creciente si se verifica:
A1 A2 A3 ...
la representamos por
{ An}
Sucesin Decreciente
Una sucesin de sucesos { An } diremos
que es decreciente si se verifica:
A1 A2 A3 ...
la representamos por
{ An}
lim An =
A
n= 1
lim An =
A0 = lim inf An =
n
Ak
n= 1 k
=n
A0 = lim sup An =
n
A
n= 1
Ak
n= 1 k = n
An A
lim An = A
Algebra de Sucesos
Como se ha venido observando, los sucesos los consideramos como conjuntos, siendo vlido
para stos todo lo estudiado en la teora de conjuntos. Para llegar a la construccin axiomtica
del Clculo de Probabilidades, necesitamos dar unas estructuras algebraicas bsicas
construidas sobre los sucesos, de la misma manera que se construyen sobre los conjuntos.
Coleccin de Conjuntos o Sucesos
Es otro conjunto cuyos elementos son conjuntos y lo llamaremos conjunto de las partes de E,
es decir, A=P(E) es el conjunto formado por todos los subconjuntos de E o por todos los sucesos
contenidos en el espacio muestral E.
Algebra de Sucesos o Algebra de Boole
Sea A=P(E) una coleccin de sucesos donde se han definido las operaciones:
- Unin de sucesos - Interseccin de sucesos - Complementario de un suceso
y que adem verifican las propiedades definidas al exponer las operaciones con sucesos.
Diremos que la coleccin de sucesos no vacia A tiene estructura de Algebra de Boole si A es
una clase cerrada frente a las operaciones de complementario, unin e interseccin de sucesos
en nmero finito, es decir si se verifican las condiciones siguientes:
www.uned-ade.com
Lo relativo a que la interseccin sea cerrada y que el nmero de sucesos sea finito se obtiene
como consecuencia de las condiciones anteriores, como ahora se indicar
De las dos condiciones iniciales, se deducen las siguientes consecuencias:
A
i=1
A = P(E)
www.uned-ade.com
Combinaciones
Llamaremos combinaciones de m
elementos
tomados de n en n al nmero de
subconjuntos diferentes de n elementos
que se pueden
formar con los m elementos del conjunto
inicial
Combinaciones con repeticin
Si en los subconjuntos anteriores se
pueden
repetir los elementos
Variaciones
Llamaremos variaciones de m elementos
tomados de n en n a los distintos
subconjuntos diferentes de n elementos
que se pueden formar
con los m elementos, influyendo el orden
en el
que se toman
Variaciones con repeticin
Si en los subconjuntos anteriores se
pueden
repetir los elementos
Permutaciones
Llamaremos permutaciones de n
elementos a las variaciones de n
elementos tomados de n en n
Permutaciones con repeticin
Llamaremos permutaciones con repeticion
de n elementos k-distintos que se repiten
uno x1 veces, otro x2 veces, ... y el ltimo
xk veces
m!
C m,n = m =
n
n!(m - n)!
(m + n - 1)!
CRm,n = m + n - 1 =
n
n!(m - 1)!
VRm,n = m n
Pn = n!
n!
x1! x2!...x k !
x1 + x 2 + ... + x k = n
m!
(m - n)!
www.uned-ade.com
TEMA 11 PROBABILIDAD
Introduccin
Se indicaba en el captulo anterior que cuando un experimento aleatorio se repite un gran
nmero de veces, los posibles resultados tienden a presentarse un nmero muy parecido de
veces, lo cual indica que la frecuencia de aparicin de cada resultado tiende a estabilizarse.
El concepto o idea que generalmente se tiene del trmino probabilidad es adquirido de forma
intuitiva, siendo suficiente para manejarlo en la vida corriente.
Nos interesa ahora la medida numrica de la posibilidad de que ocurra un suceso A cuando se
realiza el experimento aleatorio. A esta medida la llamaremos probabilidad del suceso A y la
representaremos por p(A).
La probabilidad es una medida sobre la escala 0 a 1 de tal forma que:
Al suceso imposible le corresponde el valor 0
Al suceso seguro le corresponde el valor 1
El resto de sucesos tendrn una probabilidad comprendida entre 0 y 1
El concepto de probabilidad no es nico, pues se puede considerar desde distintos puntos de
vista:
El punto de vista objetivo
Definicin clsica o a priori
Definicin frecuentista o a posteriori
El punto de vista subjetivo
Definicin Clsica de la Probabilidad
Sea un experimento aleatorio cuyo correspondiente espacio muestral E est formado por un
nmero n finito de posibles resultados distintos y con la misma probabilidad de ocurrir {e1, e2, ... ,
en}.
Si n1 resultados constituyen el subconjunto o suceso A1, n2 resultados constituyen el subconjunto
o suceso A2 y, en general, nk resultados constituyen el subconjunto o suceso Ak de tal forma que:
n1 + n2 + ... + nk = n
Las probabilidades de los sucesos A1, A1,..., An son:
p(A1 ) =
n1
n
p(A2 ) =
n2
n
... p(Ak ) =
nk
n
p(A) =
N de casos favorables de A
N de casos posibles de E
p(e1) = p(e2) = ... = p(en)
y por tanto
p(ei)=1/n i=1,2,...,n
n
k N casos favorables
Siendo A={e1, e2, ... , ek} el suceso formado por
p(A)
=
p(e
)
=
=
j
k sucesos elementales siendo k n tendremos:
n
N casos posibles
j=1
www.uned-ade.com
p(A) =
p(E) =
ni
n
ni n
n
=1
n
ni , n 0
p( ) =
0
=0
n
Esta defincin clsica de probabilidad fue una de las primeras que se dieron (1900) y se atribuye
a Laplace; tambin se conoce con el nombre de probabilidad a priori pues, para calcularla, es
necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y el nmero de
resultados o sucesos elementales que entran a formar parte del suceso.
La aplicacin de la definicion clsica de probabilidad puede presentar dificultades de aplicacin
cuando el espacio muestral es infinito o cuando los posibles resultados de un experimento no
son equiprobables. Ej: En un proceso de fabricacin de piezas puede haber algunas
n(A)
n
p(A) = lim
n
n(A)
n
Es imposible llegar a este lmite, ya que no podemos repetir el experimiento un nmero infinito
de veces, pero si podemos repetirlo muchas veces y observar como las frecuencias relativas
tienden a estabilizarse.
Esta definicin frecuentista de la probabilidad se llama tambin probabilidad a posteriori ya
que slo podemos dar la probabilidad de un suceso despus de repetir y observar un gran
nmero de veces el experimento aleatorio correspondiente. Algunos autores las llaman
probabilidades tericas.
www.uned-ade.com
p(E) = 1
Dada una sucesin numerable de sucesos incompatibles A1, A2,... A, se verifica que
A la funcin p: A [ 0,1 ]
A p = p(A) se denomina probabilidad del suceso A.
La terna (E, A, p) formada por el espacio muestral E, la -Algebra A=P(E) y la probabilidad p se
denomina espacio probabilstico.
Teoremas Elementales o Consecuencias de los Axiomas
Los siguientes resultados se deducen directamente de los axiomas de probabilidad.
Teorema I
La probabilidad del suceso imposible es nula p( ) = 0
Si para cualquier suceso A resulta que p(A)=0 diremos que A es el suceso nulo, pero esto no
implica que A =
Si para cualquier suceso A resulta que p(A)=1 diremos que A es el suceso casi seguro, pero
esto no implica que A = E
Teorema II
Para cualquier suceso A A=P(A) se verifica que:
La probabilidad de su suceso complementario es p(A ) = 1 - p(A)
www.uned-ade.com
Teorema III
La probabilidad P es montona no decreciente, es decir:
A,B A=P(A) con A B p(A) p(B) y adems p(B - A) = p(B) - p(A)
Teorema IV
Para cualquier suceso A A=P(A) se verifica que: p(A) 1
Teorema V
Para dos sucesos cualesquiera A,B A=P(A) se verifica que: p( AB ) = p(A) + p(B) - p( AB )
Esta propiedad es generalizable a n sucesos:
n
n
n
n
p Ai = p(Ai ) - p(Ai Aj ) + p(Ai Aj Ak ) +...+(-1) n+ 1 p Ai
i=1 i=1
i= 1
i< j
i< j< k
Teorema VI
Para dos sucesos cualesquiera A,B A=P(A) se verifica que: p( AB ) p(A) + p(B)
Esta propiedad es generalizable a n sucesos:
p Ai
i=1
i=1
p(Ai )
Teorema VII
Dada una sucesin creciente de sucesos A1, A2, ... , An (abreviadamente representado por { An})
se verifica que:
Teorema VIII
Dada una sucesin decreciente de sucesos A1, A2, ... , An (abreviadamente representado por
{ An})
se verifica que:
Probabilidad Condicionada
Hasta ahora hemos introducido el concepto de probabilidad considerando que la nica
informacin sobre el experimiento era el espacio muestral. Sin embargo hay situaciones en las
que se incorpora informacin suplementaria respecto de un suceso relacionado con el
experimento aleatorio, cambiando su probabilidad de ocurrencia.
El hecho de introducir ms informacin, como puede ser la ocurrencia de otro suceso, conduce a
que determinados sucesos no pueden haber ocurrido, variando el espacio de resultados y
cambiando sus probabilidades.
Definicin
Dado un espacio probabilstico (E, A, p) asociado a un experimento aleatorio.
Sea A un suceso tal que A A=p(A) y p(A)0
Sea B un suceso tal que B A=p(A)
www.uned-ade.com
p(B / A) =
p(A B)
p(A)
p( B) = p(Ai ) p(B / Ai )
i=1
Teorema de Bayes
Sean n sucesos disjuntos A1, A2,..., An A=P(A) tales que p( Ai )>0 i=1,2,...,n y tales que forman
un sistema completo de sucesos. Para cualquier suceso B A=P(A) se verifica que:
y aplicando el teorema de la probabilidad total:
p( Ai / B) =
p(Ai ) p(B / Ai )
n
i=1
p( Ai / B) =
p(Ai ) p(B / Ai )
p(Ai ) p(B / Ai )
p(B)
Se denominan hiptesis
Las verosimilitudes p( B/Ai ) nos permiten modificar nuestro grado de creencia original p( Ai )
obteniendo la probabilidad a posteriori p( Ai / B ).
www.uned-ade.com
p( B / A) = p( B) si P( A )>0
p( A / B) = p( B) si P( B )>0
p( A B) = p(A) p( B)
Podemos decir por tanto que si el suceso B es independiente del suceso A, entonces el suceso A
tambin es independiente del suceso B, lo que equivale a decir que ambos sucesos son
mutuamente independientes.
La independencia de sucesos puede extenderse a ms de dos sucesos:
p( A B C) = p(A) p( B) p( C)