Sei sulla pagina 1di 66

www.uned-ade.

com

Esta obra est bajo una licencia Creative Commons


http://creativecommons.org/licenses/by-nc-sa/2.5/es/
http://creativecommons.org/licenses/by-nc-sa/2.5/es/
CAPITULO I Generalidades y antecedentes histricos
1.1
Estadstica es la ciencia que estudia las regularidades que se observan en una serie de
fenmenos que pueden expresarse a travs de la informacin numrica.
Viene del Latn status
RAMAS: Estadstica descriptiva = Recogida de datos histricos. Es un mtodo deductivo
Calculo de probabilidades = Razonamiento matemtico. Es un mtodo deductivo
Inferencia estadstica = Trabaja a partir del clculo de probabilidades. Mtodo
inductivo
ETAPAS DE LA INVESTIGACIN ESTADSTICA
Definicin del objetivo
Encuesta censal = Toda la poblacin
Recogida de datos poblacionales
Encuesta muestral =Parte de la poblacin
Descripcin y estimacin de los parmetros poblacionales
1.2 ESTADSTICA DESCRIPTIVA - Historia

Herodoto (485-425 a de JC) relata que ya en Egipto (3050 a de JC) se elabor un


censo de poblacin y riqueza

Se tienen noticias de que lo mismo hicieron los chinos

Grecia y Roma efectuaron recuentos peridicos sobre riqueza con fines tributarios
Edad Media = No se tienen noticias sobre operaciones estadsticas mas que sobre
los bienes de la Iglesia
s. XVI = Nace la escuela mercantilista francesa con Colbert, Bufn y Condorcet

De ella nacen la escuela Inglesa con Graunt, Petty, Halley, Davenant y King y la
Alemana con Seckendorf, Coring y Achenwall

s. XVII (mediados) = Graunt Destaca por sus estudios demogrficos

s XVII (finales) = Petty efecta estudios sobre demografa, Renta y Trfico Mercantil

s. XVIII y XIX = Se produce un gran crecimiento de la estadstica descriptiva y se


elaboran los primeros censos oficiales (1790 USA)

1.3
EL CLCULO DE PROBABILIDADES
Es la rama de las matemticas que se basa en el razonamiento deductivo

S. XVI = Cardano (1501 1576) y Galileo (1564 1642) son pioneros en esta rama

S. XVII = Pascal (1623 1622) y Pierre de FermaT (1601 1665) comienzan con la
formalizacin del clculo de probabilidades sobre los juegos de azar
propuesto por un jugador (Mer)

www.uned-ade.com

= Huygens recopila los trabajos de los anteriores y aparece la


sistematizacin del Clculo de probabilidades (1669)

S. XVIII y XIX = Movidos por el intento de la contrastacin emprica sobre


astronoma y Fsica, destacaron Jacobo y Damiel Bernouilli,
Abraham de Moivre, Laplace, Gauss, Poisson y Chebychev

S. XX = Autores clsicos de la escuela rusa son Markov, Liapounoff y Kolmogoroff


De la escuela francesa destacaron Borel, Levy, Lebesgue y Frchet
1.4 LA INFERENCIA ESTADSTICA

Arranca EN el s. XVIII con Laplace y Gauss

Tres corrientes = La escuela Inglesa


Inferencia Bayesiana
Teora de la decisin

La escuela Inglesa destaca por sus estudios biolgicos = Pearson, Gosset, Fisher y
Neyman

Influencia Bayesiana = Nace a partir del sacerdote Thomas Bayes (Teorema de


Bayes)
Le siguen Ramsey, Bruno de Finetti y Savage con la
Probabilidad subjetiva

Teora de la Decisin =
De Wald, aprovecha la influencia Bayesiana y aporta el
concepto de Funcin de prdida
Sociedad de Econometra =Fundada por Irwing Fisher, junto con Roos y Frish en
1930 aplican los conocimientos de inferencia estadstica
sobre fsica, astronoma y ciencias naturales a la Economa.

www.uned-ade.com

CAPITULO II Estadstica descriptiva Distribucin de frecuencias


CONCEPTOS FUNDAMENTALES:
Poblacin
Muestra
Atributos
Escalas de medicin
Variables estadsticas
TAREAS
Las investigacin estadstica tiene 3 fases:

Seleccin de objetivo
Recogida de datos
Estimaciones

DISTRIBUCIN DE FRECUENCIAS UNIDIMENSIONALES

Medidas de Posicin
Media
Mediana
Moda
Cuartiles

Medidas de dispersin
Recorrido
Intervalos intercuartlicos
Varianza y Desviacin tpica
Coeficiente de apertura
Coeficiente de variacin

Relativo
Semi-intercuartlico

Medidas de forma
Asimetra
Curtosis
Medidas de concentracin o de desigualdad
ndice de Gini
Curva de Lorentz

Estudio de las distribuciones


Momentos potenciales

2.-

CONCEPTOS FUNDAMENTALES
Poblacin

Tambin Universo o colectivo

El conjunto de entes en general portadoras de una serie de caractersticas que


nos interesa estudiar

Son finitas o infinitas, segn el nmero de elementos que la componen

www.uned-ade.com

Muestra

Todo subconjunto representativo de la poblacin

Lo vlido para la muestra se convierte en general para la poblacin

Censal = Todos los elementos de la poblacin

Estudio muestral = Parte o subconjunto de la poblacin


Atributo

Caracterstica no medible numricamente

Da lugar a modalidades

Escala nominal = Clasifica las modalidades del tributo

Escala ordinal = Clasifica por gradacin u ordenacin las modalidades del


atributo
Ejemplo: 1 = Muy malo
2 = Malo
3 = Regular
4 = Bueno 2 Malo (Bueno no es igual a 2 veces Malo)
5 = Muy bueno
Variables

Caractersticas de la muestra / poblacin susceptibles de tomar valores


numricos

Se les aplican las escalas de


Intervalo
Razn o Proporcin
Escala de intervalos
Permiten una unidad de medida y un origen (0) arbitrario
Podemos calcular la distancia entre 2 observaciones cualesquiera
No permiten operaciones matemticas
De Razn o proporcin
Adems de las caracterstica de la escala de intervalos, incorporan un origen
no arbitrario (0 absoluto)
Permiten las operaciones aritmticas

Unidimensionales = Una nica variable (Edad de un grupo de nios)

Bidimensionales = Dos variables (Edad y Sexo)

Pluridimensionales = Ms de dos variables

Discretas = Toman un nmero finito o infinito numerable de valores

Continuas = Toman un nmero infinito no numerable de valores

ETAPAS DE LA INVESTIGACIN ESTADSTICA


1 Etapa.- Definicin de objetivos

Identificacin de las caractersticas cualitativas y cuantitativas del estudio

Definicin de la poblacin

Marco = Soporte de los datos y su accesibilidad

Decisin sobre Censo o Muestra, su tamao y el presupuesto

mbito y forma de recogida de datos


2 Etapa.- Recogida de datos estadsticos

Diseo del cuestionario

Diseo muestral segn el marco disponible

Diseo del Material Auxiliar

Recogida de datos

Tratamiento de datos
3 Etapa.- Estimacin y Descripcin

Anlisis descriptivo primario

www.uned-ade.com

Estimacin de errores (Muestrales y No muestrales)


Anlisis especial multivariables

1 ETAPA No hay nada que decir est bien claro lo que hay que hacer
2 ETAPA.- RECOGIDA DE DATOS ESTADSTICOS
Diseo del cuestionario

Claridad en el lenguaje = evitar trminos tcnicos, usar un lenguaje sencillo

Precisin en las preguntas = Concretas y cortas para obtener respuestas precisas

No influir en la respuesta = Evitar preguntas que contengan juicios de valor

Evitar preguntas indiscretas = Aquellas que impliquen la intimidad del entrevistado

Cuidar el orden = Primero, las sencillas, al final las delicadas y complejas

Tipos de preguntas
Abiertas = La respuesta es totalmente libre
Cerradas = la respuesta se especifica y el entrevistado debe escoger una opcin
Dicotmicas = Dos alternativas de respuesta
Mltiples = Varias respuestas predefinidas
Directas e Indirectas
Diseo Muestral

Muestreo Aleatorio Simple (MAS)

De N elementos se seleccionan n de forma aleatoria (sin reemplazamiento)

Muestreo estratificado (Se emplea mucho en la prctica)

Consiste en dividir la poblacin en grupos homogneos internamente

Debe existir gran diferencia entre los estratos

Permite hacer estimaciones sobre cada estrato (subpoblacin)

Muestreo por conglomerados

Agrupaciones de poblacin de naturaleza heterognea dentro de ellos

Muestreo sistemtico

Sistemtico por que lo nico aleatorio es el arranque

El inconveniente es que hay que numerar toda la poblacin


Ejemplo:
1
N = 100
n = 5 (estratos)
N/n = 20
2
Se obtiene un nmero aleatorio entre 1 y 20 (supongamos 12 = n1)
3
Se obtiene n sumando 20 + n1 (20 + n1 = 32 = n2)
n3 = 20 + n2 (20 + 32 = 52)
n4 = 20 + n3 (20 + 52 = 72)
n5 = 20 + n4 (20 + 72 = 92)

Muestreo polietpico (Se aplica en la prctica cuando se hacen estudios sociales)


o
Es bsicamente una mezcla de distintos tipos de muestreo, principalmente el
MAS y el estratificado)
Ejemplo:
En una manzana de casas escoger N personas al azar pero necesariamente
50% hombre y 50% mujeres (Muestreo por cuotas)

Abarata mucho la recogida de datos

No tiene rigor cientfico

No se pueden estimar errores muestrales ni establecer intervalos de confianza


Material auxiliar

Hojas de control de trabajo de campo

Partes de incidencias
Recogida de datos (Es la parte esencial)

Entrevistas personales

www.uned-ade.com

Entrevistas personales ayudadas por ordenador (Control de inconsistencias)

Entrevistas telefnicas ayudadas por ordenador


Tratamiento de los datos

Programa de validacin

Listado de inconsistencias

3 ETAPA.- ESTIMACIN Y DESCRIPCIN


Anlisis descriptivo primario

Distribucin de frecuencias

Su representacin grfica

Medidas de posicin = Media, Mediana, Moda, Cuartiles

Medidas de dispersin = Recorrido, Varianza, Desviacin tpica, etc

Medidas de forma = Asimetra y Curtosis


Estimacin de errores

De muestreo = a priori

Se define el tamao de la muestra para asegurar unos errores mximos para


determinado nivel de fiabilidad

Ajenos al muestreo = a posteriori

Proceden de cuestionarios mal diseados

Deficiencias en la grabacin de datos

Validaciones inadecuadas
Anlisis especiales multivariables

Modelos de reduccin de la dimensin

Anlisis factoriales

Componentes principales

Correlaciones cannicas

Modelos causales

Regresiones

Anlisis de la varianza

Modelos de agrupaciones y clasificaciones

Anlisis de grupos y Discriminante

Modelos dinmicos o de series temporales

Estocsticos

No estocsticos

Modelizacin estadstica

Postulado del modelo

Contraste de las hiptesis iniciales del modelo

Estimacin de los parmetros del modelo

Validacin

Resultados finales.
CONSTRUCCIN NUMRICA Y GRFICA
DISTRIBUCIN DE FRECUENCIAS UNIDIMENSIONALES

Las llamamos unidimensionales por slo observamos una caracterstica

Tipos:

Datos no agrupados

Datos agrupados en intervalos de clase


DATOS NO AGRUPADOS

Se observan los valores de la caracterstica (X)

Tabulacin
de datos

www.uned-ade.com

Si la variable admite ordenacin stos se ordenan de menor a mayor


Si hay valores repetidos se agrupan (si x se repite n veces entonces n*x)
Tipos:
Tabla X

Unitarios = Los que no tienen valores repetidos


150
Ejemplo: Las rentas anuales de 5 familias son
175
200
200 u.m.,150 u.m., 300 u.m., 250 u.m. y 175 u.m.
150
300

No unitarios = Los que tienen valores repetidos

El conjunto de R datos distintos ordenados de menor a mayor


acompaados de sus respectivas frecuencias absolutas

La caracterstica x toma pocos valores pero se repiten gran nmero de


veces.
Ejemplo: En una comunidad de vecinos hemos preguntado a 20 de ellos por el
nmero de personas que trabaja en cada familia, sus respuestas han sido:
1, 3, 0, 1, 0, 2, 2, 1, 2, 0, 1, 1, 4, 1, 1, 1, 1, 1, 0, 2
Tabla X
n
4
10
Valores
posibles
4
1
1

x
0
1
2
3
4

se repite
cada Valor
de x

Frecuencia total
N = n = 20
Frecuencia relativa
f = n / N f0 = n0 / N = 4/20=0,2 f1 = n1 / N = 10/20 = 0,5
* La suma de las frecuencias relativas = 1
Frecuencia absoluta acumulada ascendente Ni un determinado valor ordenado de
menor a mayor xi al numero de datos que son menores o iguales a l
Se representa:
n
N i = nj
J=1

Frecuencia absoluta acumulada descendente Ni un determinado valor ordenado de


menor a mayor xi al numero de datos que son mayores o iguales a l
Se representa N con la hacia abajo
Frecuencias relativas ascendentes y descententes
i

Fi = fj

Fi = fj
j = i+ 1

j=1

Ejemplo
xi
150
175
200
250
300

ni
1
1
1
1
1

fi
1/5
1/5
1/5
1/5
1/5

Ni
Ni
Fi
1 (slo hay 1 valor igual o menor)
5
2 (hay 2 valores ig. o men. a l)
4
3 (hay 3 valores ------- ------)3
3/5**
4 (hay 3 valores ------- ------)2
4/5**
5 (hay 3 valores ------- ------) 1
1**

* El contrario que N hay 5 valores mayores o iguales a l


** y *** deben sumar siempre 1

Fi
1/5** 4/5***
2/5** 3/5***
2/5***
1/5***
0***

www.uned-ade.com

Otro ejemplo
xi
ni
fi
Ni
Ni
0
4
4/20
4*
16**
1
10
10/20
14*
6**
2
4
4/20
18*
2**
3
1
1/20
19*
1**
4
1
1/20
20*
0**
N = 20
* y ** deben sumar siempre N
*** y *** deben sumar siempre 1

Fi
1/5***
2/5***
3/5***
4/5***
1***

Fi
4/5****
3/5****
2/5****
1/5****
0****

Todo lo anterior si se trata de variables o caractersticas de naturaleza cuantitativa,


si se tratara de atributos que toman distintas modalidades cualitativas, no tiene
sentido calcular las frecuencias a cumuladas
Ejemplo: A 100 personas se les ha preguntado su estado civil (x = casado, viudo,
soltero, otro)
xi
ni
fi
Casado
50 50/100
Viudo
15 15/100
La F = N
Soltero
25 25/100
Otro
10 10/100
N = 100

DATOS AGRUPADOS EN INTERVALOS DE CLASE

Se realiza cuando el nmero de valores que puede tomar la caracterstica X es muy


elevado por lo que es necesario agruparlos en intervalos

Slo tienen sentido en el caso de variables cuantitativas

Conceptos:

Recorrido o Rango
R = xr xi = max xi - min xi

Amplitud del intervalo

Clases:

Constante
c = R / k siendo k el nmero de clase o
agrupamientos

Variable

Marcas de clase = El valor medio entre 2 datos


x1 = (L0 + L1)/2 siendo L0 = x1, L1 = L0 + c, c = R / k (amplitud)
Ejemplo:
La recaudacin de 25 das del mes ha sido
16500 10050 12320 10000 22540
7325 13800 18300 14600 25000
17085 19000 11900 13760 15075
20210 7280 21200 23090 24500
15800 5000 13050 21600 17700
Despus ordenaramos de menor a mayor con lo que xmin = 5000 y xmax = 25000
Rango R = xr x1 = xmax xmin = x25 x1 = 25000 - 5000 = 20000
Suponiendo que desearamos 5 clases o agrupamientos k = 5, la amplitud c = R / k =
= 2000 / 5 = 4000
Luego L0 = x1 = 5000
L1 = L0 + c = 5000 + 4000 = 9000
L2 = L1 + c = 9000 + 4000 = 13000

www.uned-ade.com

L3 = L2 + c = 13000 + 4000 = 17000


L4 = L3 + c = 17000 + 4000 = 21000
L5 = L4 + c = 21000 + 4000 = 25000
Marcas de clase
x1 = (L0 + L1)/ 2 = (5000 + 9000) / 2 = 7000
x2 = (L1 + L2)/ 2 = (9000 + 13000) / 2 = 11000
x3 = (L2 + L3)/ 2 = (13000 + 17000) / 2 = 15000
.......... .......... ...........
Tabla agrupada de frecuencias
Intervalos
Marcas de clase
[5000,9000]
7000
[9000,13000]
11000
[13000,17000]
15000
[17000,21000]
19000
[21000,25000]
23000

Frecuencia Absoluta
3 (5000,7280,7325)
4 (10050,12320,11900,10000)
7 (las buscais en los datos)
5 (idem anterior)
6 (idem anterior)

Tabla de frecuencias agrupadas en intervalos de clase


Intervalos
xi
ni
fi
Ni
Ni
Fi
Fi
[5000,9000] 7000
3
3/25
3
22 3/25 22/25
[9000,13000] 11000
4
4/25
7
18 7/25 18/25
[13000,17000]15000 7
7/25 14
11 14/25 11/25
[17000,21000]19000 5
5/25 19
6 19/25
6/25
[21000,25000]23000 6
6/25 25
0
1
0
* Nota del autor = Os recuerdo que N + N = n y F + F = 1

www.uned-ade.com

Ejemplo:
Una sociedad adquiere troncos de madera y decide clasificarlos en tramos de m3 por
unidad
resultado de esta operacin ha sido recogido en la Siguiente tabla agrupada de
frecuencias:
Metros cbicos (en m3)
absolutas
[0,
0,25]
(0,25 ,
0,50]
(0,50 ,
1]
(1,
2]
(2,
5]

Marca de clase (en mi)


0,125]
1,5
3,5

Las amplitudes de los intervalos son:


c1 = 0,25 - 0 = 0,25 c2 = 0,50 - 0,25 = 0,25
c4 = 2 1 = 1
c5 = 5 2 = 3
Tabla de frecuencias:
(Li 1, Li]
xi
ni
fi
[0, 0,25] 0,125 1.235 1.235 /1.500
(0,25,0,50] 0,375 1.87 1871/1.500
(0,50, 1] 0,75
50
50/1.500
(1,
2]
1,5
18
18/1.500
(2,
5]
3,5
10
10/1.500
N = 1500
fi = 1

N
1.235
1.422
1.472
1.490
1.500

Frecuencias
1.235
0,375 187
0,75 50
18
10
1.500

c3 = 1 - 0,50 = 0,50

N
F
F
265 1.235/1.500 265/1.500
78 1.422/1.500 78/1.500
28 1.472/1.500 28/1.500
10 1.490/1.500 10/1.500
0
1
0

REPRESENTACIONES GRFICAS
Distribucin de frecuencias de datos cualitativos

Las representaciones grficas tienen la ventaja del impacto visual nos proporciona
de forma instantnea una visin global del reparto de los datos observados

Las figuras ms empleadas para los datos cualitativos son:

diagrama de rectngulos

diagrama de sectores o de pastel

Ambas se dibujan bajo el principio de proporcionalidad entre las reas de


los rectngulos o sectores y las frecuencias absolutas de cada modalidad
del atributo.

Pictogramas

consisten en reflejar las frecuencias de cada modalidad a travs de


dibujos artsticos cuyo tamao tambin guarda proporcionalidad con las
frecuencias absolutas

cartogramas

cartogramas son una representacin por medio de un mapa que se


utiliza cuando las modalidades estn contenidas en reas geogrficas.

Si la distribucin de frecuencias es unitaria su representacin grfica carece de


inters
Si los datos son frecuencias no unitarias, podemos construir los siguientes grficos
o
Diagrama de rectngulos, todos los rectngulos tienen la misma base y sus
reas son proporcionales a las frecuencias absolutas ni
Ejemplo:

www.uned-ade.com

ni
50
40
30
20
10
CasadoViudo Divorciado
o

Otros Mi

Diagrama de sectores, el rea de cada sector es proporcional a la frecuencia


de cada modalidad

Viudos
Solteros
Otros
Casados

Pictogramas, el tamao de las figuras es proporcional a la frecuencia de cada


modalidad

Casados

Solteros

Viudos

Otros

Distribucin de frecuencias de datos cuantitativos

Diagramas de barras

Se representan como un eje cartesiano en el que en las abscisas figuran los


valores de la variable y en las ordenadas las frecuencias absolutas

Diagramas acumulativos de frecuencias

www.uned-ade.com

Representan los valores de N N F y F


Tienen forma de escalera ascendente para N y F y descendente para las
otras

La altura de cada peldao viene dada por los valores de las frecuencias
absoluta o relativa y en el eje x se representan los valores de la variable, en las
ordenadas las frecuencias acumuladas.
Ejemplo Ascendente:
20
xi
Ni
Fi
19
0
4
4/20 = 0,2 18
1
14
14/20 = 0,7 14
2
18
18/20 = 0,9
3
19 19/20 = 0,95 4
4
20
20/20 = 1
1
2
3
4
Ejemplo Descendente:
xi
Ni
Fi
0
16
16/20 = 0,8
1
6
6/20 = 0,3
2
2
2/20= 0,1
3
1
1/20 = 0,05
4
0
0
Diagramas de frecuencias agrupadas en intervalos de clase

Histogramas de frecuencias
Se representan mediante rectngulos cuya base es la amplitud del intervalo
La altura de cada rectngulo ni / ci se llama densidad de frecuencia
Intervalo ni
[5000-9000] 3
(9000-13000] 4
(13000-17000]
(17000-21000]
(21000-25000]

7
6
7 5
5 4
6
3
0
5000 900013000170002100025000

La representacin de las frecuencias acumuladas Ni y Fi se conoce por


Polgonos acumulativos de frecuencias

Se construyen utilizando las Ni o las Fi en el eje de las ordenadas y los


intervalos en el eje de las abscisas.
En lugar de rectngulos, se representa un punto en cada par (5000,0), (9000,3) (13000,4)
y as sucesivamente y despus unimos todos los puntos mediante una recta.
LA MEDIANA

Mediana (Me) es el valor de la variable que deja a su izquierda tantas frecuencias


como a su derecha

Para su clculo no intervienes los valores de x sino las frecuencias observadas a


ambos lados de su valor.
Ejemplo: Valores unitarios
xi
ni
Ni
0
4
4
La media estara entre 4 y 14
1
10
14

www.uned-ade.com

18
19
20
N = 20
La media de los valores de N sera N/2 , luego 20/2 = 10
Otro

2
3
4

4
1
1

Salarios
100000
125000
200000
300000

ni
50
30
15
5

Ni
50
80
95
100
N = 100

La media estara entre 50 y 80

N/2 = 50

Me = 100000 + 125000 / 2 = 112500


Clculo de la mediana con valores agrupados en intervalos de clase
N/2 Ni -1
La formula del libro es Me = Li 1 +
* ci
ni
N/2 N anterior
La misma segn mi amantsima sera Me = Linferior +
* Intervalo
n Me
Para su clculo empezamos hallando la media de N, ese valor nos sita en la tabla
L inferior = Ser el valor mnimo del intervalo donde nos ha situado N/2
N anterior = Ser el valor N anterior al de la Media de N
n Me = Es el valor de n que corresponde al valor donde nos situ N/2
Intervalo = Diferencia absoluta entre los valores del Intervalo
* No se puede hallar con la calculadora, hay que aprenderse la formula
Ejemplo:
Intervalo
8 - 12
12 - 16
16 - 20
20 - 24
24 28
28 32

n
7
8
15
17
10
3

MdeC
10
14
18
22
26
30

N
7
15
30
47
57
60

Nanterior
n Me

1 Calculamos N/2 = 30 lo que nos sita en el intervalo 16 20


2 Linferior = 16
3 Nanterior = 15
4 n Me = 15
5 Intervalo o c = 20 16 = 4
Aplicamos la formula

30 - 15
Me = 16 +
15

*4

= 20

Otro (del libro)


Intervalo
[40,100]
(100, 200]

n
10
20

N
10
30

Nanterior
n Me

www.uned-ade.com

(200, 500]
(500,1000]

15
5

45
50

1 Calculamos N/2 = 25 lo que nos sita en el intervalo 100, 200


2 Linferior = 100
3 Nanterior = 10
4 n Me = 20
5 Intervalo o c = 200 100 = 100
25 - 10
Aplicamos la formula Me = 100 +
* 100 = 175
20
Otro (del libro)
100 pequeos comercios se agrupan segn el nmero de empleados
Intervalo
n
N
[0, 1]
20
20
Nanterior
(1, 2]
30
50
(2, 4]
20
70
(4, 6]
15
85
(6, 10]
10
95
(10, 15]
5
100
Siguiendo el mismo razonamiento que en los anteriores obtendremos el resultado Me = 2
Ventajas

Es la medida mas representativa en el caso de variables de escala ordinal

Es una posicin central

Tiene fcil interpretacin


Inconveniente

En su clculo no intervienen todos los valores de la variable


MODA

Es el valor de la variable que mayor n tiene

Si hay un nico valor mximo = Moda absoluta

Si hay x valores mximos iguales x = 2 Bimodal si x = 3 Multimodal


Ejemplos

Otro

x
0
1
2
3
4

n
4
10
4
1
1

x
2
6
7
8

n
15
40
40
5

Moda absoluta = 1

Moda bimodal = 6
Moda bimodal = 7

Moda relativa
Es aqul valor de x cuya frecuencia absoluta no es superada por los valores contiguos

www.uned-ade.com

Ejemplo

x
1
3
4
5
8

n
20
30
20
40
5

Moda relativa = 3
Moda absoluta = 5

Clculo de la Moda
** Los que habeis visto mi mail en las news reclamando una diferencia de formulas, me
inclino a pensar que no tendr respuesta y al fin y al cabo nos vamos a examinar del libro,
as que desarrollar las formulas del libro y que Dios nos pille confesados.
* Intervalos de amplitud (c) constante
Formula Mo = Linferior +

ni+1

*c

n i -1 + ni + 1

Donde Linferior es el valor mnimo del intervalo al que corresponde la Moda


ni - 1, es el valor de n anterior al de la moda
ni+1, es el valor siguiente al de la moda
Ejemplo
Intervalo
s
[8-12]
(12-16]
(16-20]
(20-24]
(24-28]
(28-32]

x
7
8
15 ni-1 valor anterior
17 Moda Mn. = 20
10 ni+1 valor siguiente
3

15
Mo = 20 +

4 = 22,8

15 + 10

Otro,

del

libro:

Los

salarios

de

200

trabajadores son los siguientes


Intervalo Trabaj
s
.
[75-125]
25
ni-1 valor anterior
(125-175]
100
Moda Mn. = 125
(175-225]
50
ni+1 valor siguiente
(225-275]
25

50
x 50 = 158,33

Mo = 125 +
25 + 50

* Intervalos de amplitud variable (h), utiliza la misma formula pero en vez de n se calcula
hi = ni/ci
MEDIDAS DE POSICIN NO CENTRALES - CUANTILES

Medidas que dividen la distribucin en partes proporcionales

Cuartiles Q: Dividen la serie en 4 partes iguales. Hay 3 Cuartiles

Deciles D:
Dividen la serie en 10 partes iguales. Hay 9 Deciles

Percentiles P: Dividen la serie en 100 partes iguales. Hay 99 Percentiles


El clculo para datos no agrupados es sencillo y con el ejemplo queda claramente
explicado, en cuanto a los datos agrupados, utilizamos la misma formula para todos ellos
y es la misma que la de la Mediana pero en lugar de N/2 aplicaremos en Cuartil xN/4,
Decil xN/10 o Percentil xN/100, que nos pidan

www.uned-ade.com

Empezaremos, como lo hicimos con la Me, por calcular el Cuartil, Decil o percentil que
nos piden
Q1 = 1 * N / 4
Q2 = 2 * N / 4
Q3 = 2 * N / 4
D1 = 1 * N / 10
D3 = 3 * N / 10
D7 = 7 * N / 10
P11 = 11 * N / 100 P35 = 35 * N / 100 P76 = 76 * N / 10
Ese valor nos dar el intervalo o el valor de x sobre el que trabajar, para los clculos
posteriores aplicamos la formula de la mediana como ya hemos visto.
Ejemplo, del libro, datos no agrupados:
Dada la distribucin, calcular los 3Q, el 7 D y el 99P
xi
ni
N
1
20
20
3
30
50
4
20
70
5
40
110
D7
7
7
117
9
3
120
P99
Los Q, N/4 = 30, luego Q1 = 30, Q2 = 60 y Q3 = 90
El 7 D, N/10 = 120/10 = 12, por lo tanto 7*12 = 84 y el D7 = 5
El 99 P, N/100 = 120/100 = 1.2, por lo tanto 1,2 * 99 = 118,8 , luego P99 = 9
Otro, del libro:
a) Calcular el nivel salarial que no es superado por el 25% de la poblacin
b) El nivel salarial mnimo que perciben el 15% de los trabajadores que ms cobran.
Intervalo
n
N
[75 - 200]
50 50
Q1
(200 - 250]
40 90
P85
(250 300]
7
97
(300 400]
3 100
El 25% corresponde al Q1 luego Q1 = Linf + (N/4 - Nant)/nQ1 * c
Q1 = 75 + (25 0) / 50 * 125 = 137,5
b) Necesitamos conocer el percentil 85 ya que es el punto en que los salarios por debajo
es igual a los salarios por encima de l.
P85 = 85N / 100 = 85
Aplicamos la formula = 200 + (85 50)/40 * 50 = 243,5
MOMENTOS

Caracterizan A las distribuciones de tal forma que si los momentos de 2


distribuciones distintas coincides, diremos que stas son iguales

Dos distribuciones distintas son ms semejantes cuanto en ms momentos


coinciden

Existen:

De orden h respecto al origen ah


xi
ni
fi
x1fi
x2fi
x3fi
5
4 4/20 = 0,2
5*0,2 = 1
52*0,2 = 5
53*0,2 =2 5

www.uned-ade.com

10/20 =
6*0,5 = 3
62*0,5 = 18 63*0,5 = 108
0,5
7
4/20 = 0,2 7*0,2 = 0,14
72*0,2 = 9,8 73*0,2 =68,6
8
1/20
= 8*0,05 = 0,4
82*0,05 =
83*0,05 =
0,05
3,2
25,6
2
3
9
1 1/20
= 9*0,05 = 0,45
9 *0,05 =
9 *0,05 =
0,05
4,05
36,45
1
1
N 2
h = x fi =
=
0
6,25 =
Media
aritmtica
1
Donde x fi es el momento a1, x2fi es el momento a2 y x3fi sera el momento a3

De orden h respecto a la media aritmtica mh


Utiliza la formula mh = (xi x)h
* ni/N
6

1
0
4
1

x
5
6
7
8
9

ni ni/N xifi (x x)
4 0,2
1
-1,25
10 0,5
3
-0,25
4 0,2 1,4
0,75
1 0,05 0,4
1,75
1 0,05 0,45 2,75
6,25 3,75

(x x ) 1 * fi
-1,251* 0,2 = -0,25
-0,251* 0,5 = 0,125
0,751* 0,2 = 1,5
1,751* 0,05 = 0,0875
2,751* 0,05 = 0,1375

Si h = 1, como en este caso, (x x)1 * ni /N = 0 (siempre)


Si h = 2, entonces (x x) 2 * ni/N = Varianza
MEDIDAS DE DISPERSIN

Recorrido, Rango o Intervalo de variacin


R = xr xi = max xi - min xi

Intervalos intercuantlicos
2
Intervalo intercuartlico
I = Q3 Q1
3
Intervalo semiintercuartlico
(Q3 Q1 ) / 2
4
Intervalo intercuartlico relativo
Q3 Q1 / Me
5
Intervalo 10 90 por cien
D9 D1
6
Intervalo 7 93 por cien
P93 P7

De dispersin respecto a la media


xi x * ni

Desviacin absoluta
da =
N

Varianza (formula del libro)


Varianza (mi amantsima)

s2 =
2 =

xi x 2 * n i
N
x * ni
2
i

- x2

Desviacin tpica
= Varianza

Coeficiente de variacin de Pearson / x


Propiedades de la varianza

Siempre es positiva

Clculo de la media, varianza, desviacin


Intervalo n MdeC N
tpica y Coef. de variacin de Pearson
s
Calculadora Casio fx-85v
[8-12]
7
(12-16]
8
(16-20] 15
(20-24] 17
(24-28] 10
(28-32]
3
N = 60

10
14
18
22
26
30

7
15
30
47
57
60

www.uned-ade.com

Mode

3(SD) Shift

KAC Para quitar los datos de cualquier otra tabla introducida

Introducimos los datos de la tabla (muy importante, primero las x)


10 x
7 DATA
14 x
8 DATA
18 x 15 DATA - y el resto
Kout

n - Comprobamos que hemos introducido todos los datos, debe ser N (60)

Shift
Ahora ha sacar resultados: la media aritmtica

La desviacin tpicaShift
Pearson
La varianza

Shift

xn debe daros 5,42

xn
Shift

debe daros 19,6

Shift

xy
xn

x=
=2

0,2768
29,44

Otro ejemplo, del libro


Intervalo
[5000-9000]
(900013000]
(1300017000]
(1700021000]
(2100025000]
Mode

Mde
C
7000
1100
0
1500
0
1900
0
2300
0

3(SD) Shift

n N
3 3
4 7
7 1
4
5 1
9
6 2
5

KAC

Introducimos los datos de la tabla (muy importante, primero las x)


x
7000
3 DATA
11000 x 4 DATA
15000 x 7 DATA
19000 x 5 DATA
23000 x 6 DATA
Kout

n - Comprobamos que hemos introducido todos los datos, debe ser N (25)

Shift
Ahora ha sacar resultados: la media aritmtica

La desviacin tpicaShift

debe daros 16120

xn debe daros 5248,39

www.uned-ade.com

Pearson
La varianza

Shift

xn
Shift

Shift

x=

xy
xn

0,3255

=2

27545600

MEDIDAS DE ASIMETRA Y CURTOSIS

Una distribucin es simtrica si y slo si su diagrama de Barras que la representa es


simtrica respecto al eje x

Si una distribucin es simtrica el momento m3 = 0, pero no al revs, es decir de un


m3 = 0 no se deduce la simetra

Existen varios coeficientes de asimetra, aqu utilizaremos el de Fischer


G1= m3 / s3

si g1 < 0 la distribucin es positiva o a la derecha


si g1 =0 la distribucin puede ser simtrica o no
si g1 > 0 la distribucin es negativa o a la izquierda

g1 = 0 Puede ser simtrica si adems Me=x


y Uniforme si Me=x=Mo
g1 > 0 Asimtrica positiva o a la derecha
g1 < 0 Asimtrica negativa o a la izquierda

Me
Mo x

Me

Mo
CURTOSIS
La curtosis o apuntamiento surge al comparar la forma de una variable respecto a
la distribucin llamada normal (campana de Gauss)
Se mide por el coeficiente de curtosis de Fisher
Se calcula mediante la formula g2 = m4 / s4 siendo s = Varianza 2 = 4
Si g2 > 0 la curva tiene ms apuntamiento = Leptocrtica
Si g2 = 0 la curva tiene apuntamiento normal = Mesocrtica
Si g2 < 0 la curva tiene menos apuntamiento = Platicrtica

Leptocrtica

Normal o Mesocrtica

Platicrtica

www.uned-ade.com

MEDIDAS DE CONCENTRACIN

El ndice de Gini y la curva de Lorenz analizan la mayor o menor concentracin de


una distribucin
Indice de Gini

Puede tomar el valor entre 0 y 1, cuando ms cerca de 0 mejor equidistribuda est


la variable
r-1

(p - q )
i

Ig =

i=1

(que no hay quien la entienda)

r-1

i=1

xi
0
1
2
3
4
5
6

ni
3
8
9
10
7
2
1
N=40

fi
0,075
0,2
0,225
0,25
0,175
0,05
0,025

F
xini qi =xini/xini
0,075 0
0
0,275 8
0,08
0,500 18
0,18
0,750 30
0,3
0,925 28
0,1
0,975 10
0,06
6
3,475 100

Qi
0
0,08
0,26
0,56
0,84
0,94

Fi - Qi
0,075
0,195
0,24
0,19
0,085
0,035

Resolucin prctica

0,82

IG = 0,82 / 3,475 = 0,236 la variable est bastante equidistribuida


La curva de Lorentz

Se construye a partir de los datos de la tabla de arriba en la que en un eje de


coordenadas se traza una diagonal entre el 0 y el valor mximo de x e y,
dispononiendo en el eje x los valores de pi y en el de las y qi, siendo: pi = Fi * 100 y
qi = Qi * 100
Ejemplo (del libro) :
Las rentas de 40 individuos de distribuyen segn la tabla. Hallar el Indice de Gini y trazar
la curva de Lorentz.
Renta Individuo
fi
Fi
xi ni
s
s
10000
25
0,62 0,62 250000
0
5 5
0
20000
10
0,25 0,87 200000
0
5
0
30000
4
0,1 0,97 120000
0
5
0
40000
1
0,02
400000
0
5
N = 40
2,47 610000
5
0

qi

Qi

Fi - Qi

0,409
8
0,327
8
0,196
7

0,409
8
0,736
7
0,933
4

0,215
2
0,138
3
0,041
6
0,395

IG = 0,395 / 2,475 = 0,159 Existe una buena equidistribucin de la renta

www.uned-ade.com

Curva de Lorentz

100
93,440

73,670

40,980

62,5

100

83,75
97,5

www.uned-ade.com

TEMA 3 DISTRIBUCIONES BIDIMENSIONALES


INDEPENDENCIA ESTADSTICA

Dos variables X e Y son independientes entre s, cuando la variacin de una de ellas


no influye en la distribucin de la otra condicionada por el valor que tome la primera

Se puede saber si son o no por el Coeficiente de Correlacin de Pearson, que ya


hemos dicho que si r=0 son independientes, si r tiende hacia 1, cuando aumente
una, aumentar la otra, si r tiende a 1, cuando una disminuye la otra aumenta y
tienen mayor dependencia.

Tambin se puede saber aplicando las frecuencias relativas segn la siguiente


igualdad, son independientes si nij = ni/N * nj/N

TABLAS DE CONTINGENCIA
Se aplican en estudios socioeconmicos y trabajan sobre variables cualitativas
La dependencia de las variables se puede conocer aplicando las frecuencias
relativas expresadas arriba.

Ejemplo:
De 100 conductores 40 estn casados y 60 solteros
De los 40 casados, 5 han tenido algn tipo de accidente en el ltimo ao
De los 6 solteros, 15 han tenido algn tipo de accidente en el ltimo ao
Obtener
a)Tabla de contingencia y sus modas
b) Distribuciones marginales y sus modas
c) Distribucin condicionada a que sean solteros los que tienen accidente y su moda
d) Independencia de los atributos
Accidente

s
E. civil
Casados
Solteros

Accidente
C
S

ni
40
60

Accidente No accidente
5
15
20

Moda

35
45
80

SI
NO

20
80

ni
40
60
100

a)

b)

E. Civil

Moda

c) Distribucin condicionada a SOLTEROS


Solteros
Accidente
No accidente
N=

ni
15
45
60

d) Independencia estadstica

Accidente
s
E. civil
Casados
Solteros
nj/N

Accidente No accidente
fi
fi
ni /N
5/100
15/100
0,2

35/100
45/100
0,8

0,4
0,6
1

ni

www.uned-ade.com

nij/N = n1i/N * n1j/N


0,05 0,2 * 0,4 luego no son independientes
Dependencia funcional y dependencia estadstica

Funcional: Cuando existe una relacin matemtica exacta entre las variables. Por
ejemplo la recta x = f(y)

Estadstica: Cuando la relacin ente los dos fenmenos slo es aproximada

Variable dependiente o endgena: Es la que est influida por otra variable


independiente o exogena

Relacin causa-efecto: Son las que tienen una base terica y las que se estudian
en los fenmenos socio-econmicos

Regresin: Es la parte de la Estadstica Descriptiva que nos ensea a determinar la


lnea hacia la que tiende la nube de datos. Existen 2 mtodos
o
Distribuciones de frecuencia condicionadas
o
Ajuste de mnimos cuadrados

x x
x x
x
x

x
x
x

Nube de datos

x
x

Lnea de regresin
Regresin por Distribuciones de frecuencias por el mtodo de las Medias Aritmticas
condicionadas
Se trata de situar los puntos que formaran, en el caso de la Y sobre X , o sea y=f(x),
siguiendo la siguiente formula:
P1= (x1, Y/x1) P2 = (x2, Y/x2) y as sucesivamente (ojo, la formula no es la media de y
dividida por x1 sino la media de y sobre x1)
En el caso de querer obtener la otra variable X sobre Y, es decir x= f(y), cambiaramos en
la de arriba las x por las y
y
x
2
3
4
ny

Ejemplo:
1

nx

1
2
1
4

4
4
2
10

1
2
1
4

6
8
4
18

Calculemos y/x (y sobre x)


P1 (x1,x/Nx) = Un punto sobre el eje de las x ser 2, sobre el de las y = (1*1 + 2*4 + 3*1)/6
=2
P2 (x2,x/Nx) = Otro punto sobre el eje de las x ser 3, sobre el de las y = (1*2 + 2*4 + 3*2)/
8=2
P3 (x3,x/Nx) = Otro punto sobre el eje de las x ser 4, sobre el de las y = (1*1 + 2*2 + 3*1)/
4=2
Luego la recta que une los 3 puntos ser una paralela al eje de las x, pero eso no implica
independencia estadstica entre las variables.

www.uned-ade.com

Calculemos x/y (x sobre y) para ver como se cortan


P1 (y1,y/Ny) = Un punto sobre el eje de las y ser 1, sobre el de las x = (2*1 + 3*2 + 4*1)/4
=3
P2 (y2,y/Ny) = Otro punto sobre el eje de las y ser 2, sobre el de las x = (2*4 + 3*4 + 4*2)/
10 = 2,8
P3 (y3,y/Ny) = Otro punto sobre el eje de las y ser 3, sobre el de las x = (2*1 + 3*2 + 4*1)/
4=3
Esta lnea corta a la anterior.
Una forma mucho mas rpida de saberlo es a travs del Coeficiente de Correlacin de
Pearson r que en el caso de y sobre x (que es la que calcula la mquina
siempreeeeeeee, recordad esto) da 0, lo cual indicara que las lneas son
independientes, pero si calculamos la x sobre y con la formula de la recta, nos daramos
cuenta que obtenemos valores para cada x (la variable tiene un multiplicador) en
consecuencia y tambin cambiara de valor y por tanto indica que son dependientes.
Este ejercicio con la calculadora aplicando la formula de la recta:
(y y) = (Covx y/ Varianzax )* (x x) o (y y) = (r*y/x) * (x x)
Introduciremos la tabla en la calculadora, recordad que estamos ante una tabla
bidimensional de datos NO AGRUPADOS, la introduccin de datos es diferente.
Mode

2(LR) Shift KAC

2 [(---

1 x 1 DATA

2 [(---

2 x 4 DATA

[(---

3x

[(---

1 x 1 DATA

[(---

2 x 4 DATA

1 DATA

Etc, etc, etc


Kout

n , debe daros 18
Si hacemos ahoraShift r da 0
Si pulsamos Shift
A dar 2 siShift
pulsamos
B os debe dar 0 si
sustituimos estos valores en la formula de la recta y = a + bx y siempre dar resultado 2
para cualquier valor de x por lo tanto es paralela a x, en consecuencia independiente.
Calculemos ahora por la formula de la recta x sobre y
(x x) = (Covx y/ Varianzay )* (y y)
x = Shift x os dar 2,88 Shift
y=
y os dar 2
x
Shift n
Para la CovarianzaxyKout
xy aparecer
Kout104 y
y debe daros 3,77
La Varianzax la obtendremos a partir de la desviacin tipica (2)
Shift xn
2 y debe daros 0,5432
xy
=

Shift

=
x

Aplicamos los datos a la formula (desgraciadamente la mquina no lo puede hacer


directamente, grrrrrrrr)
(x 2,88) = (3,77 / 0,5432) * (y 2) (x 2,88) = 6,94y 13,88
x = 6,94y 11, es decir para cada valor de y obtendramos otro de x, por lo tanto las
lneas son dependientes.

www.uned-ade.com

TEMA 5 DISTRIBUCIONES BIDIMENSIONALES


Son las que estudian 2 variables
Hay de dos tipos:
Tabla de correlacin = Variables cuantitativas
Tabla de contingencia = Variables cualitativas

Tabla de correlacin (del libro)


y
1

ni

fi

15

18

0,18

10

30

32

0,32

12

30

46

0,46

0,04

38

54

Nij=10
0

0,38

0,54

0,08

x
Intervalo
s
100-150
MdeC
125
150-200
MdeC
175
200-300
MdeC
250
300-350
MdeC
325
nj
fj

Fij=1

Tabla de correlacin de mi amantsima, para los que no tengan calculadora para 2 Tablas
Mode 2 LR
x

1-3
MdeC
2
3-7
MdeC
5
nj
y
njyj
Y2
njy2

0
2

2
3

0
0
0

0
2
0
0
0
0

4
1

6
5
0
3
1
3
1
3

4
10
10
2
2
4
4
8

nix

x2 nix2 nijxiyj

6
0

ni x

2 12

24

10

0
15
2

30
2
9
3
6
13
9
18
29

15

25 75

40

27

99

50

0 = MdeC
* y = 2*0 =0
0 = 0 * x = 0*2 = 0
12 =
10 =

www.uned-ade.com

A partir de esta Tabla empezamos los clculos:


x = nix/Ni = 27/9 = 3 y = njy/Nj = 13/9 = 1,4
Varianza x = (x2n / N) x2 = 99/9 32 = 2 Desv. Tpica = 2 = 1,4
Varianza y = (y2n / N) y2 = 29/9 1,42 = 1,26 Desv. Tpica = 1,26 = 1,12
Covarianza = (nijxiyj/N) x y = 50/9 1,4 * 3 = 1,35
Coeficiente de correlacin de Pearson = Covarianza / xy = 1,35 / 1,4*1,12 = 0,86
Tambin se conoce por r (-1<r<1), cuando ms se acerca a 1 ms dependencia existe
entre las variables, es decir si aumenta o disminuye la una, aumenta o disminuye la otra,
cuando r = 0 las variables son independientes y cuando son <0, si una aumenta la otra
disminuye y al contrario.
Clculo de las rectas x=f(y) e y =f(x)
x sobre y (x x) = (Cov/Varianza y) (y y)
y sobre x (y y) = (Cov/Varianza x) (x x)
Tambin
r*y
x sobre y (x x) =
x
r*x

y sobre x (y y) =

(x - x )
(y - y )

Calcularemos las dos


(x x) = (Cov/Varianza y) (y y) ( x 3) = 1,35 / 1,26 ( y 1,4) x = 1,07y + 1,5
(y y) = (Cov/Varianza x ) (x x) ( y 1,4) = 1,35 / 2 ( x 3) y = 0,675x + 0,625
Con la calculadora (ya sabeis, la Casio fx-85v)
Mode

2 (LR) Shift

KAC

Introducimos la tabla: Primero como siempre las x


2

[(---

0 X

2 DATA 5

[(---

0 DATA

[(---

1 X

3 DATA 5

[(---

0 DATA

[(---

2 X

1 DATA 5

[(---

0 X

1 DATA

[(---

3 DATA 5

[(---

2 DATA

Koutn

n Para comprobar que hemos introducido 9 datos

A partir de aqu slo hay que ir apretando teclitas y sacando los valores.
x = Shift

x y =

Varianza x = Kout

Shift

x2
Shift

y
Shift
- n

Kout
x

Shift

=
x
x

2
=

www.uned-ade.com

Tambin se calcula
2
Varianza y = Kout
x

y
125
175
250
400

xn
y2

1
15
10
12
1
38

2
2
20
30
2
54

3
1
2
4
1
8

nx
18
32
46
4

Kout

2
Shift
- n

Covarianza Kout
xy
x
y

yn
y
=
Kout

2
n
-

Shift

La rectas se obtienen como hemos visto, adems la de y


Shift
sobreShift
x, para comprobar,
y=
B x +
A

Distribuciones marginales de frecuencia


No son ms que el sumatorio de x e y de las frecuencias de cada variable

Ejemplo: De la siguiente tabla, hallar las frecuencias marginales, la Mo de y y la x

Frecuencias marginales de x

Frecuencias marginales de y
Moy = 2
x = xi ni / N = (125*18 + 175*32 + 250*46 + 400 * 4)/ 100 = 209,5
La x con la calculadora
Mode

3(SD) Shift

KAC Para quitar los datos de cualquier otra tabla introducida

Introducimos los datos de la tabla (muy importante, primero las x)


125 x 18 DATA
175 x 32 DATA
250 x 46 DATA
400 x
4 DATA
Kout

n - Comprobamos que hemos introducido todos los datos, debe ser N (100)

Ahora la media aritmticaShift

x = 209,5

Distribuciones condicionadas de frecuencias

Llamamos variable X condicionada a que Y = yj , se representa (X Y = yj), ala


variables estadstica que toma los valores xi con frecuencia absoluta nij
Ejemplo: De la tabla, obtener
o
La distribucin de Y condicionada a X = 175
o
Moda, y, y r (Coef. de Pearson)

Shift

www.uned-ade.com

Tabla X = 125, 175, 250, 400, si queda condicionada a que x = 175, la nueva tabla tomar
la siguiente forma
X = Yj X = x=175 n

10
2
20
3
2
N = 32
Mo = 2 x = (1*10 + 20*2 + 2*3) / 32 = 1,75
Varianza = x2 x2 = (108/32) 1,752= 0,3125, luego = 0,56
Coef. de Pearson = / x = 0,56 / 1,75 0,32
Con la calculadora
x
N
1
2
3

10
20
2

3(SD) Shift
KAC
Introducimos los datos de la tabla: x 1 10 DATA
2 x 20 DATA
3 x 2 DATA
Mode

Kout

n - para comprobar que estn bien los datos, debe daros 32


x - debe daros 1,75

Shift
Shift

Shift xn = 0,32 (si pidieran la varianza no hay mas que hacer 2)


Coeficiente de Pearson = / x luego, obtenidala Shift
0,319
= x
MOMENTOS DE LAS DISTRIBUCIONES BIDIMENSIONALES

Como en las unidimensionales reducen los datos de las variables para tener una
idea general de la distribucin

Hay de 2 tipos:

Con respecto al origen

Con respecto a la media


Momentos con respecto al origen
r

a10 = xi ni/N - Media marginal de x


i=1r

Con calculadora, se introduce la tabla que como ya sabeis es


1 x [(--- y x
ni y as con todos los datos
2 Kout

Kout

a01 = yj nj/N - Media marginal de y, igual que la x pero con el y


j=1r
r

a20 = x2 ni /N, con calculadora,Kout


i=1r
r
2

a02 = y nj /N, con calculadora,Kout


j=1r
r s

a11 = xi yj nij / N, con calculadoraKout


j=1r

j=1r

2
x

Kout
2

Kout
y
xy

Kout

n
=

www.uned-ade.com

Momentos con respecto a la Media


m20 que es la varianza de x y m02 que es la varianza de y
Con la calculadora lo podeis sacar hallando la de cada variable y elevandola al
cuadrado
m11 que es la covarianza de x e y, con la calculadora, introducida la tabla
Kout
Kout xy
Shift
= n
x - Shift
= x

www.uned-ade.com

TEMA 6 CORRELACIN LINEAL SIMPLE

Estudia el grado de asociacin que existe entre las dos variables


Mide la intensidad de la dependencia entre las mismas
La dispersin o variabilidad de una variable de mide con su varianza.

Siendo la funcin lineal yi = yti + ei, donde


yi es la Varianza de la variable endgena (S2y)
yti es la Varianza del valor explicado o estimado por la funcin (S2yt)
ei la Varianza residual (S2ry)
la relacin entre la variable dependiente, la variable explicada por la regresin y la
varianza residual ser
S2y = S2yt + S2ry
En el libro esta funcin se resuelve utilizando momentos, as que recordaremos los que
vamos a utilizar, al final hay otra forma (proporcionada por mi amantsima) de calcularlo y
con la calculadora.
Momentos:
a10 = Media de x
a01 = Media de y
a20 = x2ni/N a02 = y2ni/N a11 = xy nij/N
m20 = Varianza x
m02 = Varianza y
m11 = Cov xy = a11 a10*a01
Siendo en la formulacin digamos clsica:
Covarianza xy = xy nij/N x*y
Varianza x = x2ni/N x2
Varianza y = y2ni/N y2
Formula de la recta y = a + bx

a = a01 ba10 b= m11 / m20

Dicho esto, en la formula S2y = S2yt + S2ry, conocemos S2y, que es la Varianza de y,
desconocemos S2ry y S2yt
S2ry = m02 m211 / m20 = m02 bm11
S2yt = bm11
Ejemplo:
Calcular la varianza explicada por la regresin, la residual y explicar ambas.

0 3 6

x
1
2

1 5 2 8
4 4 1 9
5 9 3 17

S2ry = m02 m211 / m20


m02 = Varianza y = 4,11
m20 = Varianza x = 0,249
m11 = Cov xy = -0,34, luego m211 = 0,1173
S2ry = 4,11 0,1173 / 0,249 = 3,64
S2yt = S2y - S2ry = 4,11 3,62 = 0,469

La varianza residual S2ry es muy elevada respecto a la varianza de la variable S 2y por lo


que la Varianza explicada por la regresin S2yt es muy reducida en consecuencia, la recta
no es representativa de los valores de x pero tal vez pueda ser representada por otras
funciones no lineales,
Ahora estudiaremos otra forma de resolver este problema, hay que aplicar la formula
Vy = Vyt + Vy ( 1 + r2), donde conocemos, como antes Vy y r que es el coeficiente de
correlacin de Pearson = Cov xy/ x*y

www.uned-ade.com

El resto se resuelve igual


Con calculadora
Mode 2 (LR) Shift KAC
Introducimos la tabla, como siempre primero los valores de x
1 [(--- 0 x 1 Data
1 [(--- 3 x 5 Data
1 [(--- 6 x 2 Data
2 [(--- 0 x 4 Data
2 [(--- 3 x 4 Data
2 [(--- 6 x 1 Data
Para asegurarnos Kout n 17
Obtenemos directamente los datos que necesitamos
Vy Shift yn x2 4,1107266
R
Shift r -0,3385016
Luego aplicamos la formula o le atacamos directamente a la calculadora
Shift r x2 +/- + 1 = 0,885 x Shift yn x2 = 3,6397
S2yt = S2y - S2ry = 4,11 3,6397 = 0,469
COEFICIENTE DE DETERMINACIN Y CORRELACIN SIMPLE

Coef. de determinacin, es la participacin de la Vyt en la Varianza marginal de la


variable independiente observada.

Es el coeficiente de correlacin de Pearson2 siendo 0<=R2<=1

Si el valor es igual o superior a 0,75 (75 %) el modelo es generalmente aceptado

Si el valor es menor del 75% la relacin elegida no es buena y se debe ensayar


con otras funciones.

Coeficiente de Correlacin simple R = Cov xy/x*y, en la calculadora es el


simbolito ese r

Sirve para determinar el grado de dependencia lineal


Si la Cov es + r tambin lo es y tomar valores 0<=R<=1

Si r=1 implica que S2ry = 0 y los valore estimados coinciden con los observados,
existiendo una dependencia exacta o funcional positiva. La funcin explica
plenamente la distribucin
Si r=0 implica que S2ry= S2y no existiendo ninguna dependencia lineal entre las
variables pero puede haber una relacin parablica o exponencial. Las rectas son
paralelas.
Si Cov xy es negativa entonces r tambin lo es y toma los valores 1<=R<=0
Si R = -1 la correlacin es perfecta y existe dependencia exacta funcional negativa.

Coeficiente de Determinacin
La formula que utiliza el libro es R2 = m211 / m20 * m02
Lo mismo en castellano R2 = Cov2 xy / Vx * Vy = Cov2 xy/x2*y2
Coeficiente de Correlacin
R = m11/ m20 * m02
R = Cov xy / x*y

www.uned-ade.com

Con la calculadora
Una vez introducida la tabla
Shift r 0,338 que es el coeficiente de correlacin R
Shift r x2 = 0,11458 , que el de determinacin R2
En este caso, como el coeficiente de determinacin es 11,45% que no llega al 75% nos
indica que la funcin lineal no representa la dependencia de las variables y el modelo no
es bueno.
Otro ejemplo, con calculadora
x 2 3 4 5 6 7 8 8 9 10
y 2 3 3 4 4 5 6 5 7 9
Como siempre Mode 2 (LR) y Shift KAC
Introducimos la tabla, datos no agrupados es decir despus de cada valor de x [(--- y el
valor de y
Comprobar con Kout n
Shift r nos dar 0,9445, que es R, el coeficiente de correlacin
Shift r x2 = 0,892, que el de determinacin R 2, luego como es superior al 75%,
quiere decir que el modelo es fiable en un 89,2 %, por lo tanto bueno para hacer
predicciones.

www.uned-ade.com

TEMA 7 REGRESIN Y CORRELACIN LINEAL MLTIPLE


Ajuste de un plano por el mtodo mnimo cuadrtico

Utiliza la formula y = b0 + b1x1 + b2x2 que se transforma al dividir las variables por N
en
y = b0 + b1x1 + b2x2
Para facilitar el clculo cambiamos las variables medias por sus respectivas desviaciones
a sus correspondientes medias aritmticas, luego
y = y1 y
x1i = x1i x1 x2i = x2i x2
luego la formula del plano que pasa por el origen es: y ti = b1x1i b2x2i Siendo
b 1=
b 2=

Sy
Sx1
Sy
Sx2

Ry1 - Ry2 R12


*
1 R212
Ry1 - Ry1 R12
*
1 R212

Coeficientes de determinacin y correlacin mltiple en el ajuste del plano


De determinacin:
Segn la formula S2y = S2yt12 + S2ry12
R2y12 = S2yt12 / S2y = 1 S2ry/S2y
Siendo 0R2y121
De correlacin
La raz cuadrada del de determinacin
Coeficientes de determinacin y correlacin parcial en el ajuste del plano
Estudia la evolucin de las variables permaneciendo constante la otra explicativa x2i, es
decir, que slo x1i influye en yti
De determinacin de yti sobre x2i permaneciendo x2i constante
R2y2.1 =

(Ry2 Ry1R12)2

(1 R212)(1 R2y1)

De determinacin de yti sobre x1i permaneciendo x1i constante


2

R y1.2 =

(Ry1 Ry2R12)2

(1 R212)(1 R2y2)

De correlacin parcial
La raz cuadrada de R2y
Ejemplo del libro
Se observa en 5 individuos, sus gastos totales anuales, sus niveles de ingresos y el
nmero de habitantes de las ciudades donde viven.
yi = Gastos
x1i = Ingresos
x2i = Habitantes.
Se pide;
Estimar el plano de regresin, comentar el problema de la multicoliniedad
Descomponer la V marginal de los gastos en Varianza explicada por la regresin y
la varianza no explicada
Obtener los Coef. de determinacin y correlacin mltiple

www.uned-ade.com

Obtener los Coef. de determinacin y correlacin parcial

Construimos la tabla
yi X1i x2i Y2i
1 1 1 1
2 3 1 4
3 4 2 9
2 4 3 4
4 5 4 16
12 17 11 34

x21i x22i yi*x1i x1*x2i x1i*x2i


1
1
1
1
1
9
1
6
2
3
16 4
12
6
8
16 9
8
6
12
25 16
20
16
20
67 31
47
31
44

Medias marginales y = 12/ 5 = 2,4 xi = 17/5 = 3,4

x2 = 11/5 = 2,2

b0 = y + b1x1 + b2x2 = 2,4 + 3,4b1 + 2,2b2


b 1=

Sy
Sx1

Ry1 - Ry2 R12


*
1 R212

Ry1 - Ry1 R12


*
Sx2
1 R212
Necesitamos conocer las S a travs del clculo de las varianzas, las covarianzas y los
coeficientes de correlacin R.
Varianzas marginales
S2y = y2/N y2 = 34/5 2,42 = 1,04
= 1,02
= 1,36
S2x1 = x21/N x21 = 67/5 3,42 = 1,84
S2x2 = x22 /N x22 = 31/5 2,22 = 1,36 = 1,17
Covarianzas
Cov y1 = yix1i /N x1 y = 47/5 2,4 * 2,4 = 1,24
Cov y2 = yix2i /N x2 y = 31/5 2,4 * 2,2 = 0,92
Cov y12 = x1i x2i /N x1 x2 = 44/5 3,4 * 2,2 = 1,32
Coeficientes de correlacin simples
Ry1 = Sy1/ Sy * Sx1 = 1,24 / 1,02*1,36 = 0,89
Ry2 = Sy2/ Sy * Sx2 = 0,92 / 1,02*1,17 = 0,77
R12 = S12/ Sx1 * Sx2 = 1,32 / 1,36*1,17 = 0,83
b 2=

Sy

Ahora ya podemos resolver las igualdades b1 y b2


b 1=
b 2=

Sy
Sx1
Sy
Sx2

Ry1 - Ry2 R12


*
=
1 R212

*
1,36

1,02

Ry1 - Ry1 R12


1,02
=
*
1 R212
1,17

0,89 0,83 * 0,77


= 0,61
1 0,69

0,77 0,89 * 0,83


= 0,084
1 0,69

Luego el plano b0 = 2,4 0,61 * 3,4 0,084 * 2,2 = 0,215


Comentario:
b1 que representa la variable y (el gasto) indica que por cada unidad de variacin de x1
permaneciendo constante x2, vara en 0,61

www.uned-ade.com

b2 que representa la variable y (el gasto) indica que por cada unidad de variacin de x2
permaneciendo constante x1, slo vara en 0,084, es decir que la variable x2 apenas tiene
relevancia en la determinacin del gasto.
b) Determinar la Vexplicada y la Vresidual
Tenemos que resolver la igualdad S2y = S2yt12 + S2ry12 en la que la expresin
S2ry12 = S2y b1Sy1 b2Sy2 = 0,14 0,61 * 1,24 0,084 * 0,92 = 0,2 , luego
S2yt12 = S2y - S2ry12 = 1,04 0,2 = 0,84
c) Determinar el Coef. de determinacin y el de correlacin simples
Determinacin
R2y12 = 1 S2ry/S2y = 1 0,2/1,04 = 0,8
Correlacin = R2y12 = 0,8 = 0,9
d) Coeficientes de Determinacin y Correlacin parcial
R2y2.1 =

(Ry2 Ry1R12)2

(1 R212)(1 R2y1)

(0,89 0,77*0,83)2

= 0,5 (Fuerte sentido explicativo)

(1 0,832)(1 0,772)

De determinacin de yti sobre x1i permaneciendo x1i constante


2

R y1.2 =

(Ry1 Ry2R12)2

(1 R212)(1 R2y2)

De correlacin Ry1.2 =

(0,77 0,89*0,77)2
(1 0,832)(1 0,89)2

0,1

0,1 (V no explicada se reduce en 10%)

= 0,31 Ry2.1 =

0,5 = 0,7

AJUSTE DE UN HIPERPLANO ........ LGEBRA MATRICIAL


No tengo ni la menor idea de matrices as que el que est al tanto del tema que se busque
la vidilla

AJUSTES NO LINEALES POR MNIMOS CUADRADOS


Parbola o polinomio de segundo grado
Hay que resolver la funcin y = a0 + a1x + a2x2
N

y1 = Na0 + a
1 xi

2xi2
+a
N

y1 xi= a0xi + a1 xi2


N

y1 x = a0 x2i + a1xi3
2
i

+
ax2 3i
N

+ax2i4

Hiprbola equiltera
Hay que resolver la funcin y = a0 + a11/x

Si hacemos que 1/x = z tendremos que y = a0 + z resolviendo entonces la ecuacin de la


recta
Siendo a0 = Y m11 / m20 * Z
Siendo a1 = m11 / m20
Funcin potencial

Hay que resolver la funcin y = a0 * x a


Utilizando logaritmos neperianos Ln y = Lna0 + a1Lnx
1

www.uned-ade.com

Si hacemos que Ln y = u, Lna 0 = a y Lnx = z, tendremos que u = a + bz, que


resolveremos como una funcin lineal.
Una vez calculadas a y b se sustituyen en la funcin a0 = antiLn a y a1 = b
Funcin exponencial

Hay que resolver la funcin y = a0 * a1x


Utilizando los Ln tendramos que Ln y = Ln a0 + x Ln a1
Si hacemos que Ln y = u, Lna0 = a y Lna1 = b, tendremos que u = a + bx, que
resolveremos como una funcin lineal.
Una vez calculadas a y b se sustituyen en la funcin a0 = antiLn a y a1 = antiLn b
Ejemplos, del libro
1

Pn Pn2 Pn

Pn4

P1

10

D1
6
P1*D 60

11

9 5
63 55

60
0

351

340 3360
3
3

8
28
92 P1*D1 250
=
64 P12*D1 2294
8
=

P12*
D1

37

44 60
1 5

Ajuste de una parbola


Hay que resolver el sistema de ecuaciones
N

y1 = Na0 + a
1 xi
N

2xi2
+a
N

y1 xi= a0xi + a1 xi
N

y1 x = a0 x
2
i

+
ax2 3i

+ a1x

3
i

+ax2i4

20 = 4a0 + 37b + 351c 250 = 37a + 351b + 3403c 2294 = 351a +3403b +33603c
Resolviendo es sistema, D = 2,43638 + 2,2188 P + 0,1818P2
Hiprbola equiltera
Hay que resolver la funcin y = a0 + a11/x
Construimos la tabla
x y Z= 1/
x
1 5
1
2 3 1/2
3 2 1/3
y = a0 + z resolviendo entonces la ecuacin de la recta
Siendo a0 = Y m11 / m20 * Z
Siendo a1 = m11 / m20
a1 = 4,3846
a0 = 0,6538, luego y = 0,6538 + 4,3846 1/x
Con la calculadora sale directo cambiando los datos de Z como x

www.uned-ade.com

Luego Shift A 0,6538 y Shift B 4,3846


Ajuste de las funciones potencial y exponencial
Tendris que esperar a que me lo expliquen desde la asignatura ya que yo obtengo
resultados distintos a los que da el libro. Lo siento .......
ESTUDIO DE LA ASOCIACIN ENTRE VARIABLES CUALITATIVAS

Partimos de que la independencia estadstica slo se dar si:


nij/ N = ni/N * nj/N ij
La frecuencia absoluta conjunta nij = ni * nj / N la llamaremos Frecuencia Terica
Si nij es la frecuencia absoluta observada
j =1
r s
i =1
2 =
(nij - nij) 2 / nij
El coeficiente de Contingencia ( C ) de Pearson ser : 2 / N + 2
Y su valor estar entre 0 C 1
A medida que el valor se aproxima a 1, el grado de asociacin de los atributos ser mayor

Ejemplo, resuelto como el libro

Mj

Para construir la tabla de frecuencias nij hacemos:


n11 = n1 * n.1 / N = 40 * 20 / 100 = 8
n12 = n1 * n.2 / N = 40 * 80 / 100 = 32
n21 = n2 * n.1 / N = 60 * 20 / 100 = 12
n22 = n2 * n.2 / N = 60 * 80 / 100 = 48

Mi
M1
M2

M1 M2
8
12

32
48

Ahora obtenemos los elementos de 2


2 = (n11 n11)2/ n11 = (8 - 5)2 / 8 = 1,125
Mj
M1
M2
M
2 = (n12 n12)2/ n12 = (32 - 35)2 / 32 = 0,281
Mi
2
2
2
M1
1,125 1,406 1,406 = (n21 n21) / n21 = (12 - 15) / 12 = 0,75
2
2
2
M2
0,75 0,188 0,938 = (n22 n22) / n22 = (48 - 45) / 48 = 0,188
= 2,344
Accidente
s
E. Civil
Casados
Solteros
nj

Con accidente Sin accidente


5
15
20

(1
)
Casados

con 5

35
45
80

(2)

ni
40
60
100

Por lo tanto 2 = 2,344 y C =


2,344 = 0.1513
El mismo ejemplo resuelto por
mi
amantsima
(ante
mi
insistencia de hacerlo mas
sencillo...pobrecita)
(3)

(4)

(5)

E. civil Accident
(1) (3)2 (4) /(2)
e
(2)
40
CC*CS/N =
-3
9 1,125

www.uned-ade.com

acc.
Solteros
acc.
Casados
acc.
Solteros
acc.

con 1
5
sin 3
5
sin 4
5

(CC)
60
(SC)
20 (CS)
80 (SS)

8
SC*CS/N =
12
CC*SS/N =
32
SC*SS/N =
48

0,75

-3

0,2812
5
0,1875

2 = (5 2,3437
)
5
Como ya sabeis C =

www.uned-ade.com

TEMA 8 NMEROS NDICES

Aplicacin
Existe un gran nmero de fenmenos econmicos cuyo significado y estudio alcanza
distintos niveles de complejidad (son los que se conocen como coyuntura econmica,
nivel de inflaccin, nivel de desarrollo, etc.).
Los nmeros ndice constituyen el instrumental ms adecuado para estudiar la evolucin
de una serie de magnitudes econmicas que nos den respuesta a cuestiones tales
como:
Es la coyuntura econmica positiva o negativa? Es el nivel de inflaccin el adecuado
o no? etc.
Definicin
Un nmero ndice puede definirse como una medida estadstica que nos proporciona la
variacin relativa de una magnitud (simple o cmpleja) a lo largo del tiempo o el espacio.
Sea X una variable estadstica cuya evolucin se pretende estudiar.
Llamaremos:
Periodo inicial o base, es aquel momento del tiempo sobre el que se va comparando
la evolucin de la magnitud o variable estadstica X0.
Periodo de comparacin, es aquel momento del tiempo en el que el valor de la
magnitud Xt se compara con el del periodo base.
El indice de evolucin de 0 a t expresado en %:

I 0t =

Xt
100
X0

t
I 0 toma el valor 100 en el periodo base
t
I 0 < 100 implica que Xt < X0 (indicando una evolucin negativa del periodo 0 al t )
t
I 0 > 100 implica que Xt > X0 (indicando una evolucin negativa del periodo 0 al t )

La elaboracin de nmeros ndices tiene sentido en variables de naturaleza


cuantitativa
El ndice, por estar definido por un cociente, es independiente de las unidades de
medida en las que venga expresada la variable, con lo que se puedan efectuar
agregaciones de distintos ndices, construyndose indicadores de evolucin general
de fenmenos econmicos.
Los nmeros ndices se clasifican atendiendo a:
La naturaleza de las magnitudes que miden

Simples
Complejas

En el segundo caso, a la importancia relativa de cada


componente

Sin ponderar
Ponderados

www.uned-ade.com

Nmeros Indices Simples


Estudian la evolucin en el tiempo de una magnitud que slo tiene un componente (sin
desagregacin). Se emplean con gran difusin en el mundo de la empresa a la hora de
estudiar las producciones y ventas de los distintos artculos que fabrican y lanzan al
mercado.
I 0t Nmero ndice en el periodo t de la magnitud X
Xt Valor de la magnitud X en el periodo t
X0 Valor de la magnitud X en el periodo base 0

I 0t =

Xt
100
X0

Nmeros Indices Complejos Sin Ponderar


Estudian la evolucin en el tiempo de una magnitud que tiene varios componentes y a
los cuales se asigna la misma importancia o peso relativo (siendo esta ltima hiptesis
nada realista).
Por su naturaleza son de poco uso en el mundo de la economa.
Sea una magnitud compleja agregada de N componentes (1,2,..., N )
t
Sean I i0 los nmeros ndices simples de cada componente i en el periodo t
I 0t
Nmero ndice total en el periodo t de la magnitud
1
agregada
I 0t =
t
I i0 Nmero ndice simple del componente i en el periodo t

X it Valor del componente i en el periodo t


X i0 Valor del componente i en el periodo base 0

i= 1

I i0t =

i= 1

X it
100
X i0

Nmeros Indices Complejos Ponderados


Estudian la evolucin en el tiempo de una magnitud que tiene varios componentes y a
los cuales se asigna un determinado coeficiente de ponderacin wi. Son los que
realmente se emplean en el anlisis de la evolucin de fenmenos complejos de
naturaleza econmica (IPC, IPI, etc.)
Sea una magnitud compleja agregada de N componentes (1,2,..., N )
t
Sean I i0 los nmeros ndices simples de cada componente i en el periodo t
Sean (w1, w2, ...,wN) los coeficientes de ponderacin de los componentes
I 0t
Nmero ndice total en el periodo t de la magnitud
agregada
I 0t =
I i0t Nmero ndice simple del componente i en el periodo t
X it Valor del componente i en el periodo t
X i0 Valor del componente i en el periodo base 0
wi Coeficiente de ponderacin del componente i

i= 1

t
i0

I wi

i= 1

wi

i= 1

X it
100 wi
X i0

i= 1

wi

www.uned-ade.com

Propiedades que cumplen en general los ndices simples (pero no todos los
complejos)
I 0t 0
I 0t = 1 0 0

Existencia: el ndice debe concretarse en un valor real y finito y:


Identidad: si coinciden el periodo base y el de comparacin,
entonces:
Inversin: el producto de dos ndices invertidos de dos periodos
es:
Circular: la generalizacin de la inversin para varios periodos

I 0t I t0 = 1
'

I 0t I tt' I t0 = 1
X'0t = X 0t + X 0t
I'ot = I ot + I ot

Proporcionalidad: Si la magnitud vara en proporcion 1+K, el


ndice:
Indices de Precios
Estos ndices miden la evolucin de los precios a lo largo del tiempo.
Los ndices de precios se clasifican en:
Simples
Nmeros ndice de precios

Sauerbeck
Bradstreet-Dutot

Sin ponderar
Complejos
Ponderados

Laspeyres
Paasche
Edgeworth
Fisher

Indices Simples de Precios


Pt Indice simple de precios en el periodo t
p0 Precio en el periodo base 0
pt Precio en el periodo t

P0t =

pt
100
p0

Indices Complejos de Precios Sin Ponderar


a) Indice media aritmtica de ndices simples o de Sauerbeck
Es la media aritmtica de los ndices de precios simples para cada componente.
PS Indice de Sauerbeck

1
PS =

1
P =
i= 1

t
i0

pit
100
pi0

i= 1

b) Indice media agregativa simple o de Bradstreet-Dutot


Es el cociente entre la media aritmtica simple de los N precios en el periodo t y en el 0.

PBD Indice de Bradstreet-Dutot

PBD

=
1

pit

pi0

i= 1

i= 1

100 =

pit

pi0

i= 1

i= 1

100

www.uned-ade.com

Indices Complejos de Precios Ponderados

Cada uno de los mtodos apunta una forma distinta para


establecer los coeficientes de ponderacin wi

PX =

i= 1

pit
w
pi0 i

i= 1

100

wi

a) Indice de precios de Laspeyres PL


Utiliza como coeficientes de ponderacin el valor de las transacciones en el periodo base.
Tiene la ventaja de que las ponderaciones del periodo se mantienen fijas para todos los periodos
pero por contra el inconveniente de que su representatividad disminuye segn nos alejamos.
wi = pi0 qi0
b) Indice de precios de Paasche PP
Utiliza como coeficientes de ponderacin el valor de las transacciones, con las cantidades del
periodo de comparacin y los precios del periodo base. Las ponderaciones son por ello
variables.
Tiene la ventaja de que los pesos relativos de los distintos componentes se actualizan cada
periodo con el agravante de complejidad y costes derivados de este clculo.
wi = pi0 qit
c) Indice de precios de Edgeworth PE
Utiliza como coeficientes de ponderacin la suma de los dos anteriores.
wi = pi0 qi0 + pi0 qit
d) Indice de precios de Fisher PF
Se define como la media geomtrica de los indices de Laspeyres y Paasche

PF =

PL PP

Indices de Cantidades o Cunticos


Los ndices cunticos miden la evolucin de cantidades a lo largo del tiempo.
Para cualquier magnitud y por supuesto las cantidades, siempre se pueden elaborar nmeros
ndices simples, complejos sin ponderar y complejos ponderados empleando las mismas
consideraciones y la misma formulacin que la vista para ndices de precios.

Cada uno de los mtodos apunta una forma distinta para


establecer los coeficientes de ponderacin wi

QX =

qit
wi
i = 1 q i0

i= 1

wi

a) Indice cuntico de Laspeyres QL

wi = qi0 pi0

b) Indice cuntico de Paasche QP

wi = qi0 pit

c) Indice cuntico de Edgeworth QE


d) Indice cuntico de Fisher QF

100

wi = qi0 pi0 + qi0 pit

QF =

QL QP

www.uned-ade.com

Propiedades de los Indices Complejos


Los nmeros ndices deben cumplir una serie de propiedades ideales: existencia, identidad,
inversin, circular y de proporcionalidad. As como los ndices simples las cumplen en su mayora,
los complejos y ponderados no cumplen algunas de ellas.
Sobre los dos ndices ms importantes, los de Laspeyres y Paasche podemos decir:
Cumplen: la existencia, identidad y proporcionalidad
No cumplen: la inversin y por tanto tampoco la circular
El ndice de Laspeyres (tanto de precios como cuntico) es el ms utilizado en los indicadores
generales de precios y produccin. Su diseo y posterior clculo requiere una rigurosa seleccin
de sus componentes y ponderaciones.
Ahora bien, a medida que nos alejamos del periodo base, la estructura de coeficientes de
ponderacin de este ndice (y de los dems) es cada vez menos representativa con lo que es
necesario fijar un nuevo periodo base y establecer una nueva estructura de ponderaciones.
Cambio de Base en una Serie de Nmeros Indices
En los enlaces de series de nmeros ndices que tienen distinta base, nos apoyamos en la
propiedad de inversin que, como se ha indicado, no la cumple el ndice de Laspeyres, pero que
se actua en la prctica como si se cumpliera, ante la necesidad de efectuar dichos enlaces.
Sea una serie de nmeros ndices cuyo periodo base es o: I 00 , I 01 , I 02 ,..., I 0n
Puede interesar cambiar la base o si est muy alejada en el periodo t de comparacin.
Para ello no es necesario efectuar un profundo estudio para determinar nuevos coeficientes de
ponderacin (en el caso de ndices complejos) sino nicamente apoyarnos en la propiedades de
inversin y circular que nos permiten obtener el coeficiente tcnico que transforma la serie dada
en una nueva con un periodo base distinto t.
a) Valor de cada ndice en la nueva base t
Para el periodo t existir un ndice I 0t' que sirve de enlace tcnico para transformar la serie.
Se cumple que para expresar cada ndice antiguo en la nueva base:

I 0t' I t't I t0 = 1

I 0t' I t't =

1
= I 0t
I t0

I t't =

I 0t
100
I 0t'

b) Clculo del coeficiente de transformacin


Este coeficiente, multiplicado por cada ndice antiguo permite obtener el ndice en la nueva base

I 00
I = t'
I0
0
t'

0
Coeficiente de Transformacin: I t' =

100
I 0t'

Renovacin o Enlace de Series de Nmeros Indices con Distintas Bases


La necesidad de la renovacin peridica de una serie de nmeros ndices nos puede llevar a
contar con dos series que tienen perodos base distintos y hay que enlazarlos o empalmarlos
para poder estudiar el fenmeno, comparando su evolucin con una nica base.
El periodo base que se mantiene es el de la serie que lo tiene ms cercano al momento actual,
aplicando el coeficiente de enlace o empalme a la serie ms antigua.

www.uned-ade.com

El concepto o definicin de este coeficiente de enlace es el mismo empleado en los cambios de


base dentro de la misma serie, aplicndose ahora slo a los elementos de la serie que tengan la
base ms antigua.
Sea la serie de nmeros ndices ms antigua en base o: I 00 , I 01 , I 02 ,..., I 0t ,..., I 0n
Sea t el periodo de la serie antigua al que se quieren actualizar los ndices de esta serie.
El coeficiente de enlace, multiplicado por cada ndice de la serie antigua permite obtener el
ndice en la nueva base.

I t'0 =

I 00

I 0t'

0
Coeficiente de Enlace : I t' =

100
I 0t'

Indices de Valor y Deflactacin de Series Econmicas


En economa, los bienes y servicios producidos son adquiridos por las familias, empresas, etc.
Estos bienes presentan gran heterogeneidad y para agregarlos hay que someterlos a un proceso
de homogeneizacin a travs de la obtencin de su valor, aplicando un sistema de precios.
El proceso de multiplicar (cantidades x precios respectivos) de los distintos componentes
transforma cantidades fsicas heterogneas (leche, pescado, etc.) en valores econmicos
homogneos (pesetas, dolares, etc.)
Los ndices de valor nos permiten estudiar la evolucin a lo largo del tiempo de la cuantificacin
monetaria de un conjunto de bienes. Este valor se llama nominal o en pesetas corrientes o de
cada ao cuando los precios son los del periodo de comparacin.
Valor en el periodo base 0 :

V0 =

i= 1

pi0 q i0

Valor en el periodo t :

Vt =

i= 1

pit q it

El ndice complejo de valor, para N componentes:

IVt =

pit qit

pi0 qi0

i= 1

i= 1

La evolucin de los ndices a lo largo del tiempo est motivado, segn la expresin anterior, por
variaciones conjuntas de precios y cantidades, no pudiendo aislarse la influencia de cada una.
En economa interesa analizar la evolucin del conjunto de N mercancas bajo lo que se
denomina a precios constantes, es decir, sin que se produzcan variaciones en los precios de
los distintos componentes. Para hacerlo se realiza la operacin denominada deflactacin de
series de valores expresadas en precios o pesetas corrientes de cada ao.
NUMEROS INDICES
Para comparar el valor de un conjunto de bienes en dos periodos distintos interesa aislarlo de la
subida, inflacin, o de la bajada, deflacin, de sus respectivos precios. De esta manera, se
consigue aislar el clculo de la distorsin que las subidas de precios, que no sean debidas a una
mejora en la calidad de los bienes y los servicios.
Para poder efectuar un anlisis comparativo de una serie de valor entre distintos periodos, hay
que pasarla de pesetas corrientes o de cada ao a pesetas constantes o del periodo que se
considere como base. Esto es lo que se denomina deflactar la serie, dividindola por el ndice
de precios que se considere ms adecuado llamado deflactor de la serie.

www.uned-ade.com

Los ndices de Laspeyres y Paasche son los que ms se utilizan como deflactores de series.
a) Deflaccin por un Indice de Laspeyres
Si el valor a precios corrientes se divide por un ndice de precios de Laspeyres tendremos:

Vt
=
PL

i= 1

pit qit

pit qi0

pi0 qi0

i= 1

i= 1

i= 1

pit q

pit qit

pit qi0

i= 1
i0
i= 1

= V0 QP

Al deflactar una serie de valor a precios corrientes por un ndice de precios de Laspeyres no se
obtiene una serie de valor a precios constantes sino V0 Qp que es el producto del valor en el ao
base por un ndice cuntico de Paasche. El PL no es por tanto un verdadero deflactor, aunque en
la prctica se considera como tal por ser el ndice que se suele elaborar.
b) Deflaccin por un Indice de Paasche
Este si es un verdadero deflactor ya que la expresin nos da el valor actual de un conjunto de N
mercancas a precios constantes del ao pi0 base:

Vt
=
PP

i= 1

pit qit

pit qit

pi0 q it

i= 1

i= 1

i= 1

pi0 q it

Segn sea la serie econmica que se desea deflactar, as habr que elegir el ndice de precios
ms adecuado:
Para deflactar la renta disponible de una familia en pesetas constantes de un determinado
ao, el deflactor adecuado ser el IPC (Indice de Precios de Consumo)
Para deflactar una serie del valor de un conjunto de productos industriales, su deflactor
adecuado ser el IPI (Indice de Precios Industriales)
Indice de Precios de Consumo (IPC)
El IPC es el indicador general ms conocido. Se elabora peridicamente por la mayora de los
paises, ante la necesidad de conocer la evolucin de los precios de bienes y servicios que
adquieren las familias. Nos basaremos fundamentalmente en la Metodologa del Indice de
Precios de Consumo con Base 1992, publicado por el INE en 1994.
Caractersticas principales

El Periodo Base del nuevo sistema es el ao 1992. Para ese ao, la media aritmtica de sus
ndices mensuales se hizo igual a 100.

El Periodo de Referencia de la Estructura es aquel durante el que se desarrolla la EPF

www.uned-ade.com

(Encuesta de Presupuestos Familiares) que proporciona informacin bsica sobre los gastos
de las familias en bienes y servicios de consumo. La EPF se realiz entre el 1 de Abril de
1990 y el 31 de Marzo de 1991.

La Poblacin del Indice o Estrato de Referencia es el grupo de poblacin cuya estructura

de gastos de consumo sirve de base para la seleccin de los artculos representativos y el


clculo de las ponderaciones de los mismos. En el IPC de 1992, el estrato de referencia
incluye toda la poblacin que reside en viviendas familiares en Espaa, amplindose respecto
a sistemas anteriores para los que el estrato estaba limitado a un colectivo definido por
diversas caractersticas de tipo socioeconmico (ingresos, composicin del hogar, etc.). Esta
estratificacin se adopt porque:
Los fines para la utilizacin del IPC son cada vez ms amplios y no se limitan a ningn
estrato de la poblacin
Era necesario armonizar la metodologa con la de los restantes paises de la CE
No parecan existir razones especiales para eliminar a un grupo especfico de
poblacin delimitando sus pautas de consumo, ingresos, tamao familiar y otros
criterios.

El Campo de Consumo del IPC est constituido por todos los bienes y servicios que los
hogares del estrato de referencia destinan al consumo.

Quedan excluidos por tanto los que suponen gastos de inversin. Se incluyen aquellos
que se pagan realmente en el periodo de referencia (se excluyen gastos ficticios e
imputados como autosuministros, autoconsumos, alquileres imputados y gastos
subvencionados por las A.A.P.P como sanitarios y educacin).
Los gastos de consumo se clasifican en la EPF segn una nomenclatura elaborada
por el INE y basada en la armonizada (a cuatro niveles) por EUROSTAT.
La aparicin o desarrollo de nuevos bienes o servicios en la estructura de gastos que
ha tenido lugar en la ltima dcada han aconsejado modificar el conjunto de artculos
de consumo para el clculo del IPC, incluyendo nuevos bienes y sustituyendo algunos
otros.
El nmero de artculos seleccionados es de 471 y todos ellos forman lo que se llama
cesta de la compra. Los artculos se agregan en subclases, estas en clases,
posteriormente en subgrupos y finalmente en grupos, siguiendo una codificacin.
Adems, estos artculos se agregan en 57 rbricas de consumo, a cada una de las
cuales le corresponde una ponderacin (en tanto por mil).

La Desagregacin Geogrfica de Indices es una caracterstica del IPC basado en 1992 y se

refiere a las 17 Comunidades Autnomas, las 50 Provincias, Ceuta-Melilla. No se elaboran


ndices por capitales de provincia ni por conjuntos urbano y no urbano.
Ponderaciones

El IPC es un ndice de precios de Laspeyres (luego complejo y ponderado). Segn la


metodologa del INE, la ponderacin del artculo, wi, se obtiene como cociente del gasto
realizado en las parcelas representadas por dicho artculo (durante el periodo de referencias de
la EPF 1990/1991) y el gasto total realizado en ese mismo periodo.
Las ponderaciones permanecen fijas a lo largo del periodo de vigencia del sistema de indices de
precios al consumo. Un mismo artculo puede tener ponderaciones diferentes en las distintas
agrupaciones geogrficas.
Enlaces de series

www.uned-ade.com

Hasta 1976, el IPC elaborado por el INE se denominaba Indice de Coste de la Vida.
Con este nombre se cre y se mantuvo en sus diferentes revisiones:
Desde 1939 a 1960 (base 1936)
Desde 1961 a 1968 (base 1958)
Desde 1969 a 1976 (base 1968).
Con el nombre de Indice de Precios al Consumo (IPC):
Desde 1977 a 1985 (base 1976)
Desde 1985 a 1992 (base 1983)
Desde 1993 hasta nuestros das (base 1992)
La citada Metodologa del INE (1992) propone los siguientes coeficientes de enlace de series:
K92/58 = 0.044699
K92/68 = 0.082113
K92/76 = 0.184347
K92/83 = 0.545261
Otros Indicadores de Coyuntura en Espaa
Indices de Produccin Industrial (IPI)

Es un ndice de naturaleza cuntica que estudia la evolucin de los volmenes de


produccin fsica de los distintos sectores industriales. Se elabora con periodicidad
mensual a travs de 600 productos industriales representativos del conjunto. El
organismo responsable es el INE.
Indice de Precios Industriales

Completa con el anterior la panormica coyuntural de la industria en nuestro pais. El


precio que se mide es el de salida de fabrica y cubre las mismas ramas que el IPI. Es el
deflactor que debe utilizarse para obtener la evolucin del valor real de los bienes de
produccin intermedia.
Indice de Ventas al Por Menor

El INE est construyendo un nuevo indicador de las ventas al por menor tomando datos
en las grandes superficies.
Encuestas de coyuntura

Encuesta de coyuntura Industrial del Ministerio de Industria y Energa


Encuesta de coyuntura de la construccin elaborada por el MOPTMA
Encuesta de coyuntura laboral del Ministerio de Trabajo
Indices de Cotizacin Bursatil

Mide las fluctuaciones de la cotizaciones de las acciones en los distintos mercados


burstiles de forma diaria. A partir de las cotizaciones de cada valor se elaboran ndices
de grupo (banca, comunicaciones, etc.) que convenientemente ponderados dan lugar al
ndice general de cada mercado.

www.uned-ade.com

TEMA 9 ESTUDIO CLASICO O DESCRIPTIVO DE LAS SERIES TEMPORALES


Concepto de Serie Temporal y Definicin de sus Componentes
As como en los nmeros ndices se estudia la evolucin de una magnitud en una serie de
periodos de tiempo, con el estudio descriptivo de las serie tratamos de hacer predicciones del
fenmeno basadas en sus caractersticas histricas o del pasado.
Dentro de estas ltimas, existen dos tipos de estudios:
El estudio clsico o descriptivo, que se ha venido empleando con exclusividad desde la
segunda mitad del siglo XIX hasta 1970 y que se basa en el mtodo tradicional de aislar lo
que se conoce por componentes de una serie econmica temporal
Los modelos univariantes de series temporales, que es un nuevo enfoque atribuido a Box
y Jenkins (desde 1970) y que se estudian en profundidad en Econometra
Definicin
Una serie temporal (o histrica o cronolgica) es un conjunto de datos, correspondientes a un
fenmeno econmico, ordenados en el tiempo.

Ej: ventas de nuestra empresa en cada uno de los 10 ltimos aos


En esencia una serie temporal es una distribucin de frecuencias bidimensional ( yt ,t ) donde:
La variable endgena o dependiente yt es la magnitud en estudio
La variable exgena o independiente es el tiempo t
Realmente slo existe una variable yt que se autoexplica por su propio pasado, no existiendo
ninguna variable explicativa que nos permita establecer una relacin de causa-efecto como se
estudia en la regresin y correlacin.
Se estudia el pasado histrico de yt (sus componentes) de forma descriptiva y, bajo el supuesto
de que su estructura va a permanecer constante, se hacen predicciones para el futuro.
En la representacin grfica de las series temporales se utilizan los ejes cartesianos (en
ordenadas los valores de la magnitud observada yt y en abcisas el tiempo t ) obtenindose una
conjunto de puntos ( yt ,t ) que, al unirlos, dan un impacto grfico de la serie, del cual se pueden
sacar las primeras conclusiones sobre su evolucin.

En el estudio clsico de las series temporales se considera que la concrecin de la magnitud en


un determinado valor y en un determinado periodo es consecuencia de la actuacin de los
siguientes 4 componentes o fuerzas:
La Tendencia (T) secular:

Es la componente de la serie que refleja su evolucin a largo plazo.

El l/p ser distinto segn la naturaleza de la serie pero cuantos ms periodos, mejor el
anlisis.
Esta componente puede ser de naturaleza:
Estacionaria o constante (su representacin grfica es paralela al eje de abcisas)
Lineal (creciente o decreciente segn el coeficiente angular de la recta sea + o -)
Parablica, exponencial u otras posibles
Las Variaciones Cclicas (C):
Es la componente de la serie que refleja las oscilaciones peridicas de amplitud > 1 ao.
Las oscilaciones no son regulares y se presentan en los fenmenos econmicos cuando se

www.uned-ade.com

dan de forma alternativa etapas de prosperidad y de depresin.


Las Variaciones Estacionales (E):
Es la componente de la serie que refleja las oscilaciones en periodos de repeticin 1 ao.
Su nombre proviene precisamente de las estaciones climatolgicas
Si el periodo marco o de repeticin es el ao / mes / semana, pueden considerarse las
fluctuaciones de la magnitud a lo largo de trimestres-cuatrimestres-meses... / decenassemanas- das... / das.
El origen de las variaciones estacionales puede estar en factores fsico-naturales (estaciones
climatolgicas) o en factores culturales y de tradicin (fiestas navideas, vacaciones, etc.)
Las Variaciones Accidentales (A):
Es la componente de la serie que refleja las fluctuaciones errticas que se dan por la
ocurrencia de fenmenos imprevisibles. Tambin reciben el nombre de irregulares, residuales
o errticas.
Adems de los fenmenos imprevisibles o extraordinarios, tambin existen pequeas
variaciones de origen aleatorio cuyas causas pueden ser mltiples.
Cmo actan las 4 fuerzas para que, como resultado, den los distintos valores de la
serie?
En el estudio clsico se han manejado dos hiptesis de trabajo:
Esquema o Hiptesis Aditiva
Los valores observados de cualquier serie temporal son
el resultado de la adicin de las cuatro componentes
Esquema o Hiptesis Multiplicativa
Los valores observados de cualquier serie temporal son
el resultado de la multiplicacin de las cuatro componentes.
Esta expresin admite variantes para recoger el supuesto de
que la componente accidental es independiente de las dems
y por tanto aparece de forma aditiva (Esquema o Hiptesis Mixta)

yt = T + C + E + A

yt = T x C x E x A

yt = T x C x E + A

Los mtodos que se utilizan para aislar las componentes de las series temporales estn basados
en alguno de los esquemas anteriores aunque no puede generalizarse el problema ya que no en
todas las series temporales aparecen todas las componentes. Para ello es necesario un anlisis
previo. De cualquier forma, la gran mayora de las magnitudes econmicas se adaptan
perfectamente al esquema multiplicativo.
Determinacin de la Tendencia (T)
La tendencia es una componente fundamental en el estudio de las series temporales pues
proporciona el hilo conductor de la evolucin del fenmeno a largo plazo.
Su determinacin slo debe efectuarse cuando se disponga de una larga serie de
observaciones (a partir de 12 o 15 aos es aconsejable) pues de lo contrario podran
concluirse estimaciones errneas.
Algunos de los mtodos ideados para tratar de aislar la tendencia de las dems variables:
a) Mtodo Grfico
Es el mtodo ms sencillo para obtener la linea de tendencia de una serie temporal sin
necesidad de hacer operaciones matemticas (por lo que es un mtodo ms impreciso). Estas
son sus fases:

Realizar la representacin grfica de la serie observada yt

www.uned-ade.com

Unir mediante segmentos todos los puntos altos de la serie, linea poligonal de cimas
Unir mediante segmentos todos los puntos bajos de la serie, linea poligonal de fondos
Trazar perpendiculares al eje de abcisas en cada punto de cima y de fondo
La tendencia biene dada por la linea amortiguada que une los puntos medios de los
segmentos, es decir, la linea de tendencia que tiene por ordenadas la media
aritmtica de las ordenadas de las dos lineas anteriores

b) Mtodo de las Medias Mviles


Es un mtodo de naturaleza mecnica que consiste en sustituir la serie temporal observada por
una amortiguada, obtenida por el clculo reiterado de valores medios, que nos representa la
tendencia. Su aplicacin consiste en lo siguiente:

Sea la serie temporal observada yt


Para cada yt, se obtienen sucesivas medias aritmticas con un nmero de
observaciones anteriores y posteriores fijado de antemano:
Si el n de observaciones utilizado es impar, la media y t est centrada en el
periodo t
Si el n de observaciones utilizado es par, la media y t no est centrada en el
periodo t (se calcula por tanto en un periodo ficticio) y hay que volver a calcular
una nueva media aritmtica yt utilizando los y t , con lo que se obtiene una serie
de medias mviles centradas ya en los periodos de tiempo dados
Las observaciones utilizadas para obtener las medias aritmticas suelen coincidir con
los periodos inferiores al ao que contiene la serie (ej: 3 si son cuatrimestrales, 4 si
son trimestrales, 12 si son meses, todos los das si el periodo de repeticin fuese la
semana, etc.). De esta forma se elimina la componente estacional que normalmente
se presentar de una forma regular en dichos periodos
La serie formada por y t o yt , segn sea par o impar, nos indica la linea amortiguada
de la tendencia
A medida que aumenta el n de observaciones utilizado para obtener las medias
mviles, ms valores se pierden por los extremos, aunque se obtiene una serie ms
amortiguada o suave para indicar la tendencia
Cuando los datos observados de la serie son anuales no existe componente
estacional y por tanto lo ideal es tomar los mismos aos que tenga la amplitud del
ciclo completo
En resumen, el mtodo mecnico de las medias mviles tiene como objetivo aislar la
componente tendencial de todas las dems mediante la suavizacin o amortiguamiento de la
serie observada. Al ir promediando los valores observados de forma sucesiva, se eliminan los
efectos de las otras componentes (cuando existan). El principal inconveniente del mtodo
mecnico de las medias mviles es que no permite efectuar predicciones a travs de una funcin
matemtica sino a travs de una serie amortiguada. Esto hace que se utilice poco aunque si es
til para obtener ndices de variacin estacional. Los programas de ordenador de
desestacionalizacin de series de tiempo estn basados en est mtodo.

Mtodo Analtico de los Mnimos Cuadrados


c) Mtodo Analtico de los Mnimos Cuadrados
Este mtodo tiene la ventaja, en comparacin con los anteriores, de que expresa la tendencia a
travs de una funcion matemtica que relaciona la magnitud con el tiempo t.
En primer lugar conviene representar grficamente la serie temporal observada, con objeto de

www.uned-ade.com

decidir el tipo de funcin ms adecuada para el ajuste: lineal, parablica, exponencial, etc

El ajuste se realiza por el mtodo de los mnimos cuadrados que, como sabemos, consiste en
minimizar la suma de los cuadrados de las diferencias entre los valores observados en los
distintos periodos y los estimados por la ecuacin de la recta de regresin: yt = a + b t
Sistema de ecuciones normales
mnimo-cuadrticas para y = a + b x

yi = a + b

i= 1

i= 1

xi yi = a

Cambio de variable:

t' = 1

t' = 0

i= 1

i= 1

xi

t= 1

xi + b

i= 1

xi2

t= 1

Si N es impar t' = t - Ot
'
Si N es par t' = 2(t - Ot )

Con objeto de que:

Sistema de ecuciones
para yt = a + b t

t' = 1

t' = 1

yt = a + b
t yt = a

t= 1

t + b

t= 1

t2

t= 1

Siendo Ot el valor de t central


Siendo Ot la media aritmtica de
los valores centrales de t

yt' = a
t' yt' = b

a =

yt = a + b t

t'

t' = 1

yt'
b =

t' yt

t' 2

t' = 1

t' = 1

t' = 1

Deshaciendo cambio:

yt = a + b ( t - Ot )
yt = a +2b ( t - Ot )

Cuando las observaciones estn en periodos inferiores al ao (meses, trimestres, etc.)


conviene calcular las medias anuales para eliminar la componente estacional que nos puede
distorsionar los clculos, empleando para la regresin y t en lugar de yt , es decir, y t = a + b t

La gran ventaja de este mtodo es que, una vez obtenida la recta de regresin, se pueden
hacer predicciones de cara al futuro de la magnitud en estudio. Basta sustituir en la ecuacin
de regresin valores de t de periodos futuros

Adems tambin podemos dar una medida de la fiabilidad de dichas predicciones a travs del
coeficiente de determinacin:

R =
2

( S t' yt )2
2
t'

S S

2
yt

S t' yt

1
=

t' = 1

t' yt ( t' y t )

S t'2 =

t' = 1

t' 2 ( t' ) 2

2
y t'

1
=

t' = 1

y 2 yt'2
t'

a+ b t
Si la tendencia es exponencial seguir un modelo de la forma yt = e
y tomando logaritmos

neperianos la tendencia exponencial pasa a ser lineal en el logaritmo neperiano de la


Ln yt = ( a + bt) Ln e = a + bt
variable, aplicando todo lo anterior para calcular a y b:
Determinacin de las Variaciones Estacionales (E)

Son oscilaciones de la magnitud en periodos de tiempo de repeticin de un ao


(cuatrimestres, trimestres y meses) o inferiores si se trata de periodos de repeticin del mes (y
sus componentes las semanas, etc.)
Cuando se pretende en los fenmenos econmicos analizar su evolucin real hay que

www.uned-ade.com

eliminar la componente estacional, pues sus fluctuaciones pueden distorsionarla. A este


proceso se le denomina desestacionalizacin de la serie observada
Antes de la determinacin de las variables estacionales hay que asegurarse de que existen,
por medio de una representacin grfica de los valores observados, viendo la regularidad en
las oscilaciones
A veces la estacionalidad no tiene regularidad (vara de posicin y/o amplitud de un periodo a
otro)
Adems, hay que determinar si la que acta es la hiptesis aditiva, multiplicativa o mixta
En los dos mtodos siguientes para determinar las variables estacionales se establecen las
hiptesis de que la estacionalidad es regular o estable en el tiempo y lo que acta es el esquema
multiplicativo en el primero y el aditivo en el segundo:
a) Mtodo de la Razn a la Media Mvil
Este mtodo aisla la componente estacional mediante la eliminacin sucesiva de las dems
componentes. Sigue los siguientes pasos:

Se determina la tendencia por el mtodo de las medias mviles centradas en los periodos yt
Se divide (hipotesis multiplicativa) la serie observada yt por su correspondiente media mvil
centrada, con lo que estamos eliminando de forma conjunta las componentes del largo plazo
(tendencia y ciclo), es decir el conjunto T x C

yt
TxCxExA
=
= ExA
TxC
TxC
Como se observa en la anterior expresin, una vez eliminada la componente mixta, es decir,

tendencia-ciclo, sigue quedando la componente accidental. Con objeto de eliminar sta de la


serie y t / y t se calculan las medias aritmticas a nivel de cada estacin (las media de todos
los cuatrimestres, trimestres, meses, etc). Ej: Si las observaciones son trimestrales tendremos
4 medias (M1, M2, M3, M4). Estas medias nos representarn de forma aislada la importancia
de la componente estacional
Se obtienen los ndices de variacin estacional. calculando la media aritmtica anual MA de
las medias estacionales, que ser la base de los ndices de variacin estacional:

I1 =

M1
100
MA

I2 =

M2
1 0 0 ... (expresados en %)
MA

Habr tantos ndices como estaciones o medias estacionales tengan las observaciones y nos
indicarn la importancia de la variacin estacional al pasar de un periodo a otro. Si un indice
es menor que 100 quiere decir que es un 20% ms bajo que su tendencia media
Una vez obtenidos los ndices de variacin estacional puede desestacionalizarse la serie
observada, dividiendo cada valor de la correspondiente estacin por su ndice
correspondiente expresado en tantos por uno
b) Mtodo de la Tendencia por Ajuste Mnimo-Cuadrtico
El objetivo sigue siendo aislar la componente estacional de la serie por eliminacin sucesiva de
todos los dems. La diferencia con el mtodo anterior es que, en este caso, las componentes a l/p
b) Mtodo de la Tendencia por Ajuste Mnimo-Cuadrtico
El objetivo sigue siendo aislar la componente estacional de la serie por eliminacin sucesiva de
todos los dems. La diferencia con el mtodo anterior es que, en este caso, las componentes a l/
p (tendencia-ciclo) las obtenemos mediante un ajuste mnimo-cuadrtico de las medias
aritmticas anuales y t calculndose bajo la hiptesis aditiva. Sigue los siguientes pasos:

www.uned-ade.com

Se calculan las medias anuales de los datos observados yt : y1 , y2 , y3 ,... Si las

observaciones son trimestrales estas medias se obtienen con 4 datos, si son mensuales con
12 datos, etc. para el caso de que el periodo de repeticin sea el ao
Se ajusta una recta por mnimos cuadrados yt = a + b t que nos representa, como sabemos,
la tendencia, siendo el coeficiente angular de la recta el incremento medio anual de la
tendencia, que influir de forma distinta al pasar de una estacin a otra
Se calculan, con los datos observados, las medias estacionales (M1, M2, M3, ...) con objeto de
eliminar la componente accidental. Estas medias son brutas pues siguen incluyendo los
componentes a l/p (tendencia-ciclo) que deben someterse a una correccin
Empleando el incremento medio anual dado por el coeficiente, se obtienen las medias
estacionales corregidas de las componentes a largo plazo (M1, M2, M3, ...) bajo el esquema
aditivo:
Para la r-sima estacin,
(r - 1)b
M r' = M r
la media estacional corregida
n estaciones
de la tendencia interestacional ser

Los ndices de variacin estacional se obtienen con la misma sistemtica del mtodo anterior:

con las medias estacionales corregidas se obtiene la media aritmtica anual MA que sirve de
base para calcular los ndices:

I1 =

M'1
100
M' A

I2 =

M'2
1 0 0 ... (expresados en %)
M' A

Obtenidos estos ndices, podemos desestacionalizar la serie como en el mtodo anterior.


Determinacin de las Variaciones Cclicas
Recoge las oscilaciones periodicas de larga duracin
El problema es que estos movimientos no suelen ser regulares como los estacionales y su
determinacin encierra dificultades de forma que, como se ha apuntado, en los casos
prcticos suele tratarse conjuntamente con la tendencia, llamando componente
extraestacional al efecto de T + C si estamos en la hiptesis aditiva y T x C si estamos en la
hiptesis multiplicativa
A pesar de las dificultades se puede tratar de aislar el ciclo bajo la hiptesis multiplicativa
dejndolo como residuo, con la eliminacin de la tendencia y la variacin estacional
Los pasos a dar son los siguientes:

Estimar la tendencia
Calcular los ndices de variacin
estacional
Desestacionalizar la serie observada
Eliminar la tendencia dividiendo cada
valor desestacionalizado por la serie de
tendencia
Expresando el proceso en forma de
cociente sera:
Finalmente se intenta eliminar la
componente accidental con un anlisis
armnico

yt
TxCxExA
=
= CxA
TxE
TxE

www.uned-ade.com

TEMA 10 FENOMENOS ALEATORIOS Y SUSCESOS


Introduccin
Dentro de la estadstica se pueden considerar dos ramas perfectamente diferenciadas por sus
objetivos y por los mtodos que utilizan:
Estadstica Descriptiva o Deductiva
Fue estudiada en el captulo 5
Inferencia Estadstica o Estadstica Inductiva
Se utiliza cuando la observacin de la poblacin no es exhaustiva sino slo de un subconjunto
de la misma de forma que, los resultados o conclusiones obtenidos de la muestra, los
generalizamos a la poblacin
La muestra se toma para obtener un conocimiento de la poblacin pero nunca nos
proporciona informacin exacta, sino que incluye un cierto nivel de incertidumbre
Sin embargo s ser posible, a partir de la muestra, hacer afirmaciones sobre la naturaleza de
esa incertidumbre que vendr expresada en el lenguaje de la probabilidad, siendo por ello un
concepto muy necesario y muy importante en la inferencia estadstica
Segn V. Barnett (1982): -La estadstica es la ciencia que estudia como debe emplearse la
informacin y como dar una gua de accin en situaciones prcticas que envuelven
incertidumbre-. Las situaciones prcticas que envuelven incertidumbre son lo que nosostros
llamaremos experimentos aleatorios.
Fenmenos Aleatorios
Un experimento es cualquier situacin u operacin en la cual se pueden presentar uno o varios
resultados de un conjunto bien definido de posibles resultados.
Los experimentos pueden ser de dos tipos segn si, al repetirlo bajo idnticas condiciones:
Determinstico
Se obtienen siempre los mismo resultados.

Aleatorio
No se obtienen siempre los mismo resultados.

Ej: medir con la misma regla e identicas Ej: el lanzamiento de una moneda
condiciones la longitud de una barra
observando la sucesin de caras y cruces
que se presentan
Las siguientes son caractersticas de un experimento aleatorio:
El experimento se puede repetir indefinidamente bajo idnticas condiciones
Cualquier modificacin a las condiciones iniciales de la repeticin puede modificar el resultado
Se puede determinar el conjunto de posibles resultados pero no predecir un resultado
particular
Si el experimento se repite gran nmero de veces entonces aparece algn modelo de
regularidad estadstica en los resultados obtenidos
Espacio Muestral
Se denomina resultado bsico o elemental, comportamiento individual o punto muestral a
cada uno de los posibles resultados de un experimento aleatorio. Los resultados bsicos
elementales sern definidos de forma que no puedan ocurrir dos simultneamente pero si uno
necesariamente.
Se denomina conjunto universal, espacio muestral o espacio de comportamiento E al

www.uned-ade.com

conjunto de todos los resultados elementales del experimento aleatorio. Pueden ser de varios
tipos:
Espacio Muestral Discreto
Espacio muestral finito
Espacio muestral infinito numerable
Tiene un nmero finito de elementos.
Tiene un nmero infinito numerable de
elementos es decir, se puede establecer una
aplicacin biyectiva entre E y N.

Ejemplo:
Ejemplo:
Experimento aleatorio consistente en lanzar Experimento aleatorio consistente en
un dado. El espacio muestral es lanzar un dado hasta que sea obtenido el
nmero 1
E={1,2,3,4,5,6}
E={{1},{2,1},{3,1} ... {2,2,1},{2,3,1},...}
Espacio Muestral Continuo
Si el espacio muestral contiene un nmero infinito de elementos, es decir, no se puede
establecer una correspondencia biunvoca entre E y N.

Ejemplo:
Experimento aleatorio consistente en tirar una bola perfecta sobre un suelo perfecto y
observar la posicin que ocupar esa bola sobre la superficie. E={Toda la superficie del
suelo}
Sucesos
Un suceso S es un subconjunto del espacio muestral, es decir, un subconjunto de resultados
elementales del experimento aleatorio.
Diremos que ocurre o se presenta el suceso cuando al realizarse el experimento aleatorio, da
lugar a uno de los resultados elementales pertenecientes al subconjunto S que define el suceso
Se pueden considerar cuatro tipos de sucesos segn el n de elementos que entren a formar
parte:

Suceso elemental, suceso simple o punto muestral es cada uno de los resultados posibles

del experimento aleatorio luego los sucesos elementales son subconjuntos de E con slo un
elemento
Suceso compuesto es aquel que consta de dos o ms sucesos elementales
Suceso seguro, cierto o universal es aquel que consta de todos los sucesos elementales del
espacio muestral E, es decir, coincide con E. Se le denomina seguro o cierto porque ocurre
siempre.
Suceso imposible es aquel que no tiene ningn elemento del espacio muestral E y por
tanto no ocurrir nunca. Se denota por .
Operaciones con sucesos
Con los sucesos se opera de manera similar a como se hace en los conjuntos y sus operaciones
se definen de manera anloga. Los sucesos a considerar sern los correspondientes a un
experimento aleatorio y por tanto sern subconjuntos del espacio muestral E.
Suceso Contenido en Otro
Dados dos sucesos A y B de un experimento aleatorio:
Diremos que A est incluido en B si:
Cada suceso elemental de A pertenece tambin a B, es decir,

www.uned-ade.com

siempre que ocurre el suceso A, tambin ocurre el suceso B.


Diremos tambin que A implica B.

A B

A B

Igualdad de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:
Diremos que A y B son iguales si:
Siempre que ocurre el suceso A tambin ocurre B y al revs.

A B

A= B
B A

Unin de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:

A B

La union de ambos sucesos A y B es:


Otro suceso compuesto por los resultados o sucesos
elementales pertenecientes a A, a B, o a los dos a la vez
(interseccin).
En general, dados n sucesos A1, A2, A3,..., An, su unin es
otro suceso formado por los resultados o sucesos elementales
que pertenecen al menos a uno de los sucesos Ai.

A
i= 1

Interseccin de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:

A B

La interseccin de ambos sucesos A y B es:


Otro suceso compuesto por los resultado o sucesos
elementales que pertenecen a A y a B, simultneamente.
En general, dados n sucesos A1, A2, A3,..., An, su interseccin es
otro suceso formado por los resultados o sucesos elementales
que pertenecen a todos los sucesos Ai.
Sucesos Disjuntos, Incompatibles o Excluyentes
Dados dos sucesos A y B de un experimento aleatorio:
Diremos que estos sucesos A y B son disjuntos,
incompatibles o mutuamente excluyentes cuando:
No tienen ningn suceso elemental en comn o dicho de otra
forma, si al verificarse A no se verifica B, ni al revs.

A
i= 1

A B =
n

A =
i= 1

Sistema Exhaustivo de Sucesos


Dados n sucesos A1, A2, A3,..., An de un experimento aleatorio:
Diremos que estos forman una coleccin o sistema exhaustivo
de sucesos si la unin de todos ellos es igual al espacio
muestral E.

A1 A2 ... An =

Diremos que estos forman un sistema completo de sucesos o


una particin de E si, adems de la anterior, condicin, se
cumple que son disjuntos dos a dos, es decir, son mutuamente

Ai Aj =

A=
i= 1

i j

www.uned-ade.com

excluyentes, disjuntos o incompatibles.


El conjunto de todos los sucesos elementales que constituyen un espacio muestral forman una
coleccin de sucesos mutuamente excluyente y exhaustivo ya que, de todos ellos, slo uno debe
ocurrir y no pueden ocurrir dos simultneamente.
Suceso Complementario o Contrario
Dado un suceso A de un experimento aleatorio:

Se define como suceso complementario o contrario de A a:


Otro suceso que ocurre cuando no ocurre el suceso A, o bien,
es el suceso constituido por todos los sucesos elementales del
espacio muestral E que no pertenecen a A.

Diferencia de Sucesos
Dados dos sucesos A y B de un experimento aleatorio:

A B = A B

Se define como la diferencia de ambos sucesos A y B a:


Otro suceso constituido por los sucesos elementales que
pertenecen a A, pero no a B.

Diferencia Simtrica de Sucesos


Dados dos sucesos A y B de un experimento aleatorio:

A B = (A B) (B A)
A B = (A B) (B A)

Se define como diferencia simtrica de ambos sucesos A y B a:


Otro suceso constituido por los sucesos elementales que
pertenecen a A, o a B, pero que no simultneamente a ambos.

Propiedades de las Operaciones con Sucesos


Los sucesos asociados a un experimento aleatorio verifican las siguientes propiedades:

E=

=E

E A = E

A=A

A= A

A A = E

Propiedad idempotente: A A = A

E A= A

A A =

A A= A

Propiedad conmutativa: A B = B A

A B= B A

Propiedad asociativa: A1 (A2 A3 ) = (A1 A2 ) A3


Propiedad distributiva:

A=

A1 (A2 A3 ) = (A1 A2 ) A3

A1 (A2 A3 ) = (A1 A2 ) ( A1 A3 )
A1 (A2 A3 ) = (A1 A2 ) ( A1 A3 )

Propiedad simplificativa: A (A B) = A

A (A B) = A

www.uned-ade.com

Leyes de Morgan: ( A B ) = A B

( A B ) = A B

Sucesin de Sucesos
Llamaremos sucesin de sucesos a una familia de sucesos A1, A2, A3,..., An en la que stos
aparecen ordenados por el subndice n. La representaremos por { An } n=1,2,3,...
Sucesin Creciente
Una sucesin de sucesos { An } diremos
que es creciente si se verifica:

A1 A2 A3 ...

la representamos por
{ An}

Sucesin Decreciente
Una sucesin de sucesos { An } diremos
que es decreciente si se verifica:

A1 A2 A3 ...

la representamos por
{ An}

Lmite de una Sucesin


El lmite de una sucesin creciente /
decreciente de sucesos { An} / { An} :

lim An =

A
n= 1

lim An =

Lmites Inferior y Superior de una Sucesin de Sucesos

A0 = lim inf An =
n

Ak
n= 1 k

=n

A0 = lim sup An =
n

A
n= 1

Ak

n= 1 k = n

El lmite inferior de la sucesin es un suceso formado


El lmite superior de la sucesin es un
por los resultados o sucesos elementales que
suceso formado por todos los resultados
pertenecen a todos los sucesos de la sucesin
o sucesos elementales que pertenecen a
excepto quiz a un nmero finito de sucesos
una infinidad de sucesos de la sucesin
En el supuesto que se verifique diremos que la sucesin es convergente y se expresa como:

A0 = lim inf An = lim sup An = A0 = A


n

An A

lim An = A

Algebra de Sucesos
Como se ha venido observando, los sucesos los consideramos como conjuntos, siendo vlido
para stos todo lo estudiado en la teora de conjuntos. Para llegar a la construccin axiomtica
del Clculo de Probabilidades, necesitamos dar unas estructuras algebraicas bsicas
construidas sobre los sucesos, de la misma manera que se construyen sobre los conjuntos.
Coleccin de Conjuntos o Sucesos
Es otro conjunto cuyos elementos son conjuntos y lo llamaremos conjunto de las partes de E,
es decir, A=P(E) es el conjunto formado por todos los subconjuntos de E o por todos los sucesos
contenidos en el espacio muestral E.
Algebra de Sucesos o Algebra de Boole
Sea A=P(E) una coleccin de sucesos donde se han definido las operaciones:
- Unin de sucesos - Interseccin de sucesos - Complementario de un suceso
y que adem verifican las propiedades definidas al exponer las operaciones con sucesos.
Diremos que la coleccin de sucesos no vacia A tiene estructura de Algebra de Boole si A es
una clase cerrada frente a las operaciones de complementario, unin e interseccin de sucesos
en nmero finito, es decir si se verifican las condiciones siguientes:

A A = P(E) se verifica que su complementario A A = P(E)

www.uned-ade.com

A1 , A2 A = P(E) se verifica que A1 A2 A = P(E)

Lo relativo a que la interseccin sea cerrada y que el nmero de sucesos sea finito se obtiene
como consecuencia de las condiciones anteriores, como ahora se indicar
De las dos condiciones iniciales, se deducen las siguientes consecuencias:

El espacio muestral E A = P(E)


Si los sucesos A, B A = P(E) se verifica que A B A = P(E)
El suceso imposible A = P(E)
n

Si A1 , A2 , A3 ,..., An A = P(E) se verifica que Ai A = P(E) y


i=1

A
i=1

A = P(E)

Si hacemos la extensin al caso de un nmero infinito numerable de sucesos, entonces aparece


una nueva estructura algebraica que recibe el nombre de -Algebra o Campo de Borel, que es
una generalizacin de la anterior.
Cuando el espacio muestral E es finito, todos los subconjuntos de E se pueden considerar como
sucesos. Esto no ocurre cuando el espacio muestral es infinito (no numerable), pues es difcil
considerar el conjunto formado por todos los subconjuntos posibles, existiendo subconjuntos que
no pueden considerarse como sucesos.
En resumen, podemos decir que a partir del espacio muestral E, hemos llegado a definir la
coleccin de sucesos A=P(E) que tiene estructura de Algebra de Sucesos o Algebra de Boole
si el espacio muestral es finito o bien tiene la estructura de -Algebra si el espacio muestral es
infinito.
Al par (E, A) en donde E es el espacio muestral y A una -Algebra sobre E, le llamaremos
espacio o conjunto medible, en el cual ser posible establecer una medida o probabilidad, como
se ver despus.
Mtodos de Enumeracin o Conteo
Las siguientes son algunas tcnicas tiles para contar el nmero de resultados o sucesos de un
experimento aleatorio.
Tablas de Doble Entrada
Es til para relacionar dos pruebas, indicndonos los resultados que integran el espacio
muestral, pudiendo indicar sobre la tabla determinados sucesos en los que estemos interesados.
En general con m elementos a1, a2, a3,..., am y n elementos b1, b2, b3,..., bn es posible formar m x n
pares (ar , bs) tales que cada par tiene al menos algn elemento diferente de cada grupo.
Principio de Multiplicacin
Sean los conjuntos C1, C2, C3,..., Ck que tienen respectivamente n1, n2, n3,..., nk k-uplas donde, en
cada k-upla, el primer elemento pertenece a C1, el segundo a C2, etc.
En el caso particular de que n1 = n2 = n3 = ... = nk el nmero posible de k-uplas sera nk .
En el caso general, el nmero de posibles resultados ser n1 x n2 x n3 x ... x nk. Este principio
es de utilidad en el caso de un experimento aleatorio compuesto por otros k experimentos.
Diagramas de rbol
Este diagrama nos permite indicar de manera sencilla el conjunto de posibles resultados en un
experimento aleatorio siempre y cuando los resultados del experimento puedan obtenerse en
diferentes fases sucesivas.

Ej: Experimento aleatorio consistente en lanzar al aire un dado y despus 3 veces


consecutivas una moneda.

www.uned-ade.com

Combinaciones, Variaciones y Permutaciones

Combinaciones
Llamaremos combinaciones de m
elementos
tomados de n en n al nmero de
subconjuntos diferentes de n elementos
que se pueden
formar con los m elementos del conjunto
inicial
Combinaciones con repeticin
Si en los subconjuntos anteriores se
pueden
repetir los elementos
Variaciones
Llamaremos variaciones de m elementos
tomados de n en n a los distintos
subconjuntos diferentes de n elementos
que se pueden formar
con los m elementos, influyendo el orden
en el
que se toman
Variaciones con repeticin
Si en los subconjuntos anteriores se
pueden
repetir los elementos
Permutaciones
Llamaremos permutaciones de n
elementos a las variaciones de n
elementos tomados de n en n
Permutaciones con repeticin
Llamaremos permutaciones con repeticion
de n elementos k-distintos que se repiten
uno x1 veces, otro x2 veces, ... y el ltimo
xk veces

m!

C m,n = m =
n
n!(m - n)!

(m + n - 1)!
CRm,n = m + n - 1 =
n
n!(m - 1)!

Vm,n = m(m - 1)(m - 2)...(m - m + 1) =

VRm,n = m n

Pn = n!

Pnx1 ,x2 ,...,xk =

n!
x1! x2!...x k !

x1 + x 2 + ... + x k = n

m!
(m - n)!

www.uned-ade.com

TEMA 11 PROBABILIDAD
Introduccin
Se indicaba en el captulo anterior que cuando un experimento aleatorio se repite un gran
nmero de veces, los posibles resultados tienden a presentarse un nmero muy parecido de
veces, lo cual indica que la frecuencia de aparicin de cada resultado tiende a estabilizarse.
El concepto o idea que generalmente se tiene del trmino probabilidad es adquirido de forma
intuitiva, siendo suficiente para manejarlo en la vida corriente.
Nos interesa ahora la medida numrica de la posibilidad de que ocurra un suceso A cuando se
realiza el experimento aleatorio. A esta medida la llamaremos probabilidad del suceso A y la
representaremos por p(A).
La probabilidad es una medida sobre la escala 0 a 1 de tal forma que:
Al suceso imposible le corresponde el valor 0
Al suceso seguro le corresponde el valor 1
El resto de sucesos tendrn una probabilidad comprendida entre 0 y 1
El concepto de probabilidad no es nico, pues se puede considerar desde distintos puntos de
vista:
El punto de vista objetivo
Definicin clsica o a priori
Definicin frecuentista o a posteriori
El punto de vista subjetivo
Definicin Clsica de la Probabilidad
Sea un experimento aleatorio cuyo correspondiente espacio muestral E est formado por un
nmero n finito de posibles resultados distintos y con la misma probabilidad de ocurrir {e1, e2, ... ,
en}.
Si n1 resultados constituyen el subconjunto o suceso A1, n2 resultados constituyen el subconjunto
o suceso A2 y, en general, nk resultados constituyen el subconjunto o suceso Ak de tal forma que:
n1 + n2 + ... + nk = n
Las probabilidades de los sucesos A1, A1,..., An son:

es decir, que la probabilidad de cualquier suceso A


es igual al cociente entre el nmero de casos
favorables que integran el suceso A y el nmero
de casos posibles del espacio muestral E.

Para que se pueda aplicar la regla de Laplace es


necesario que todos los sucesos elementales
sean equiprobables, es decir:

p(A1 ) =

n1
n

p(A2 ) =

n2
n

... p(Ak ) =

nk
n

Regla de Laplace para E finitos

p(A) =

N de casos favorables de A
N de casos posibles de E
p(e1) = p(e2) = ... = p(en)
y por tanto
p(ei)=1/n i=1,2,...,n

n
k N casos favorables
Siendo A={e1, e2, ... , ek} el suceso formado por
p(A)
=
p(e
)
=
=

j
k sucesos elementales siendo k n tendremos:
n
N casos posibles
j=1

www.uned-ade.com

La probabilidad verifica las siguientes condiciones:


La probabilidad de cualquier suceso es siempre
un nmero no negativo entre 0 y 1

p(A) =

La probabilidad del suceso seguro E vale 1

p(E) =

La probabilidad del suceso inmposible es 0

ni
n

ni n

n
=1
n

ni , n 0

p( ) =

0
=0
n

La probabilidad de la unin de varios sucesos

incompatibles o excluyentes A1, A1,..., Ar es igual


a la suma de probabilidades de cada uno de ellos

p(A1 ... Ar ) = p(A1 ) + p(A2 ) + ... + p(Ar )

Esta defincin clsica de probabilidad fue una de las primeras que se dieron (1900) y se atribuye
a Laplace; tambin se conoce con el nombre de probabilidad a priori pues, para calcularla, es
necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y el nmero de
resultados o sucesos elementales que entran a formar parte del suceso.
La aplicacin de la definicion clsica de probabilidad puede presentar dificultades de aplicacin
cuando el espacio muestral es infinito o cuando los posibles resultados de un experimento no
son equiprobables. Ej: En un proceso de fabricacin de piezas puede haber algunas

defectuosas y si queremos determinar la probabilidad de que una pieza sea defectuosa


no podemos utilizar la definicin clsica pues necesitaramos conocer previamente el
resultado del proceso de fabricacin.
Para resolver estos casos, se hace una extensin de la definicin de probabilidad, de manera
que se pueda aplicar con menos restricciones, llegando as a la definicin frecuentista de
probabilidad.

Definicin Frecuentista de la Probabilidad


La definicin frecuentista consiste en definir la probabilidad como el lmite cuando n tiende a
infinito de la proporcin o frecuencia relativa del suceso.
Sea un experimento aleatorio cuyo espacio muestral es E
Sea A cualquier suceso perteneciente a E
Si repetimos n veces el experimiento en las mismas
condiciones, la frecuencia relativa del suceso A sera:

n(A)
n

Cuando el nmero n de repeticiones se hace muy grande


la frecuencia relativa converge hacia un valor que
llamaremos probabilidad del suceso A.

p(A) = lim
n

n(A)
n

Es imposible llegar a este lmite, ya que no podemos repetir el experimiento un nmero infinito
de veces, pero si podemos repetirlo muchas veces y observar como las frecuencias relativas
tienden a estabilizarse.
Esta definicin frecuentista de la probabilidad se llama tambin probabilidad a posteriori ya
que slo podemos dar la probabilidad de un suceso despus de repetir y observar un gran
nmero de veces el experimento aleatorio correspondiente. Algunos autores las llaman
probabilidades tericas.

www.uned-ade.com

Definicin Subjetiva de la Probabilidad


Tanto la definicin clsica como la frecuentista se basan en las repeticiones del experimento
aleatorio; pero existen muchos experimentos que no se pueden repetir bajo las mismas
condiciones y por tanto no puede aplicarse la interpretacin objetiva de la probabilidad.
En esos casos es necesario acudir a un punto de vista alternativo, que no dependa de las
repeticiones, sino que considere la probabilidad como un concepto subjetivo que exprese el
grado de creencia o confianza individual sobre la posibilidad de que el suceso ocurra.
Se trata por tanto de un juicio personal o individual y es posible por tanto que, diferentes
observadores tengan distintos grados de creencia sobre los posibles resultados,
igualmente vlidos.
Definicin Axiomtica de la Probabilidad
La definicin axiomtica de la probabilidad es quizs la ms simple de todas las definiciones y la
menos controvertida ya que est basada en un conjunto de axiomas que establecen los
requisitos mnimos para dar una definicin de probabilidad.
La ventaja de esta definicin es que permite un desarrollo riguroso y matemtico de la
probabilidad. Fue introducida por A. N. Kolmogorov y aceptada por estadsticos y matemticos
en general.
Definicin
Dado el espacio muestral E y la -Algebra A=P(E) diremos que una funcin p: A [ 0,1 ] es
una probabilidad si satisface los siguientes axiomas de Kolmogorov:

p(A) 0 para cualquier suceso A A=P(A)

p(E) = 1
Dada una sucesin numerable de sucesos incompatibles A1, A2,... A, se verifica que

p(A1 A2 ... ) = p Ai = p(A1 ) + p(A2 ) + ...


i=1

A la funcin p: A [ 0,1 ]
A p = p(A) se denomina probabilidad del suceso A.
La terna (E, A, p) formada por el espacio muestral E, la -Algebra A=P(E) y la probabilidad p se
denomina espacio probabilstico.
Teoremas Elementales o Consecuencias de los Axiomas
Los siguientes resultados se deducen directamente de los axiomas de probabilidad.
Teorema I
La probabilidad del suceso imposible es nula p( ) = 0
Si para cualquier suceso A resulta que p(A)=0 diremos que A es el suceso nulo, pero esto no
implica que A =
Si para cualquier suceso A resulta que p(A)=1 diremos que A es el suceso casi seguro, pero
esto no implica que A = E
Teorema II
Para cualquier suceso A A=P(A) se verifica que:
La probabilidad de su suceso complementario es p(A ) = 1 - p(A)

www.uned-ade.com

Teorema III
La probabilidad P es montona no decreciente, es decir:
A,B A=P(A) con A B p(A) p(B) y adems p(B - A) = p(B) - p(A)
Teorema IV
Para cualquier suceso A A=P(A) se verifica que: p(A) 1
Teorema V
Para dos sucesos cualesquiera A,B A=P(A) se verifica que: p( AB ) = p(A) + p(B) - p( AB )
Esta propiedad es generalizable a n sucesos:
n
n
n

n
p Ai = p(Ai ) - p(Ai Aj ) + p(Ai Aj Ak ) +...+(-1) n+ 1 p Ai
i=1 i=1
i= 1
i< j
i< j< k

Teorema VI
Para dos sucesos cualesquiera A,B A=P(A) se verifica que: p( AB ) p(A) + p(B)
Esta propiedad es generalizable a n sucesos:

p Ai
i=1

i=1

p(Ai )

Teorema VII
Dada una sucesin creciente de sucesos A1, A2, ... , An (abreviadamente representado por { An})
se verifica que:

lim p(An ) = p( lim An ) = p An


n
n
n=1

Teorema VIII
Dada una sucesin decreciente de sucesos A1, A2, ... , An (abreviadamente representado por
{ An})
se verifica que:

lim p(An ) = p( lim An ) = p An


n
n
n=1

Probabilidad Condicionada
Hasta ahora hemos introducido el concepto de probabilidad considerando que la nica
informacin sobre el experimiento era el espacio muestral. Sin embargo hay situaciones en las
que se incorpora informacin suplementaria respecto de un suceso relacionado con el
experimento aleatorio, cambiando su probabilidad de ocurrencia.
El hecho de introducir ms informacin, como puede ser la ocurrencia de otro suceso, conduce a
que determinados sucesos no pueden haber ocurrido, variando el espacio de resultados y
cambiando sus probabilidades.
Definicin
Dado un espacio probabilstico (E, A, p) asociado a un experimento aleatorio.
Sea A un suceso tal que A A=p(A) y p(A)0
Sea B un suceso tal que B A=p(A)

www.uned-ade.com

Se define la probabilidad condicionada de B dado A o


probabilidad de B condicionada a A como:

p(B / A) =

p(A B)
p(A)

La probabilidad condicionada cumple los tres axiomas de Kolmogorov:


p(A B)
0
B A = P(E) p(B / A) =
p(A)
p(A E)
= 1
p(E / A) =
p(A)


Sea { Ai } una sucesin de sucesos disjuntos dos a dos, entonces: p Ai / A = p(Ai / A)
i=1
i=1
Regla de Multiplicacin de Probabilidades o Probabilidad Compuesta
Partiendo de la definicin de la probabilidad
p(A B) = p(A) p(B / A)
condicionada p(B/A) podemos escribir:
Teorema de la Probabilidad Compuesta o Producto
n 1
Sean n sucesos A1, A2,..., An A=P(A) y tales que p Ai > 0 . Se verifica que:
i=1

p(A1 A2 ... An ) = p(A1 ) p(A2 / A1 ) p(A3 / A1 A2 ) ... p(An / A1 ... An-1 )


Teorema de la Probabilidad Total
Sean n sucesos disjuntos A1, A2,..., An A=P(A) tales que p( Ai )>0 i=1,2,...,n y tales que forman
un sistema completo de sucesos. Para cualquier suceso B A=P(A) cuyas probabilidades
condicionadas son conocidas p( B/Ai ), se verifica que:
n

p( B) = p(Ai ) p(B / Ai )
i=1

Teorema de Bayes
Sean n sucesos disjuntos A1, A2,..., An A=P(A) tales que p( Ai )>0 i=1,2,...,n y tales que forman
un sistema completo de sucesos. Para cualquier suceso B A=P(A) se verifica que:
y aplicando el teorema de la probabilidad total:

p( Ai / B) =

p(Ai ) p(B / Ai )
n

i=1

p( Ai / B) =

p(Ai ) p(B / Ai )

p(Ai ) p(B / Ai )
p(B)

Sistema completo de sucesos A1, A2,..., An

Se denominan hiptesis

Las probabilidades p( Ai )>0 i=1,2,...,n

Se denominan probabilidades a priori ya que


son las que se asignan inicialmente al los sucesos
Ai

Las probabilidades p( B/Ai )>0 i=1,2,...,n

Se denominan verosimilitudes del suceso B


admitiendo la hiptesis Ai

Las verosimilitudes p( B/Ai ) nos permiten modificar nuestro grado de creencia original p( Ai )
obteniendo la probabilidad a posteriori p( Ai / B ).

www.uned-ade.com

El teorema de Bayes, adems de ser una aplicacin de las probabilidades condicionadas, es


fundamental para el desarrollo de la estadstica bayesiana, la cual utiliza la interpretacin
subjetiva de la probabilidad.
Independencia de Sucesos
Teniendo en cuenta la definicin de la probabilidad del suceso B condicionada a A se puede decir:

Cuando p( B/A ) > P( B ) entonces el suceso A favorece al B


Cuando p( B/A ) < P( B ) entonces el suceso A desfavorece al B
Cuando p( B/A ) = P( B ) entonces la ocurrencia de A no tiene ningn efecto sobre la de B
Diremos que dos sucesos A y B son independientes si se verifica una cualquiera de las
siguientes condiciones equivalentes:

p( B / A) = p( B) si P( A )>0
p( A / B) = p( B) si P( B )>0
p( A B) = p(A) p( B)
Podemos decir por tanto que si el suceso B es independiente del suceso A, entonces el suceso A
tambin es independiente del suceso B, lo que equivale a decir que ambos sucesos son
mutuamente independientes.
La independencia de sucesos puede extenderse a ms de dos sucesos:

p( A B C) = p(A) p( B) p( C)

Adems, se cumple el siguiente teorema: Si A y B son dos sucesos independientes,


entonces tambin lo son los sucesos A y B A y B A y B

Esta obra est bajo una licencia Creative Commons


http://creativecommons.org/licenses/by-nc-sa/2.5/es/
http://creativecommons.org/licenses/by-nc-sa/2.5/es/

Potrebbero piacerti anche