Sei sulla pagina 1di 36

Introduccin Distribuciones Univariantes Distribuciones Multivariantes

Preliminares Estadsticos
Juan Carlos Riao Rojas
Universidad de Sucre
28 de septiembre de 2012
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Inferencia estadstica
El investigador o estadstico toma una muestra de la poblacin
para extraer algn tipo de informacin.
A la metodologa concerniente a hacer referencias, predicciones y
generalizaciones sobre la poblacin a partit de la muestra se
denomina Inferencia Estadstica. Sin embargo, por lo general se
basa en modelos probablsticos del cual se desconocen sus
parmetros.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Estimacin
Cuando se realizan armaciones acerca de los parmetros de la
poblacin basandose en la informacin contenida en la muestra
sealando un intervalo o zona donde se tiene conanza de que los
parmetros esten. (Estimacin puntual, por intervalo)
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Contraste
Procedimiento estadstico mediante el cual se investiga la
aceptacin o el rechazo de una armacin acerca de una o varias
caractersticas de la poblacin.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Fases de un Contraste
1. Enunciar y determinar las hiptesis nula y alterna.
2. Elegir el nivel de conanza o el nivel de signicacin.
3. Especicar el tamao muestral.
4. Seleccionar la funcin de decisin (estadstico,
conociendo la distribucin de la hiptesis nula)
5. Determinar la regin crtica.
6. Calcular el valor de la funcin de decisin para la
muestra.
7. Conclusiones del estadstico.
8. Analisis e interpretacin de los resultados.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Principales distribuciones
Algunos datos suelen provenir de una poblacin caracterizada por
una distribucin multivariante. Sea X = (X
1
, . . . , X
p
) un vector
aleatorio con distribucin absolutamente continua y funcin de
densidad f(x
1
, . . . , x
p
). Es decir, f verica:
1.) f(x
1
, . . . , x
p
) 0, para todo (x
1
, . . . , x
p
) R
p
.
2.)
_
R
p
f(x
1
, . . . , x
p
)dx
1
. . . dx
p
= 1
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin Beta
Es una distribucin de probabilidad continua con dos parmetros a
y b cuya funcin de densidad para valores 0 < x < 1, es:
x
1
(1 x)
1
B(, )
y funcin de distribucin
I
x
(, )
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin Exponencial
Es una distribucin de probabilidad continua con un parmetro ,
cuya funcin de densidad, es:
f(x) =
_
e
x
, para x 0
0, de otro modo
y funcin de distribucin es:
F(x) = P(X x) =
_
0 para x < 0
1 e
x
, para x 0
Esta distribucin es un caso particular de la distribucin gamma.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin F
Es ms conocida coma la distribucin F de Fisher- Snedecor. Una
variable aleatoria de distribucin F se construye como el siguiente
cociente:
F =
U
1
/d
1
U
2
/d
2
donde
i. U
1
y U
2
siguen una distribucin chi-cuadrado con d
1
y d
2
grados de libertad respectivamente, y
ii. U
1
y U
2
son estadsticamente independientes.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
La funcin de densidad de una F(d
1
, d
2
) viene dada por
g(x) =
1
B
_
d
1
2
,
d
2
2
_
_
d
1
x
d
1
x +d
2
_
d
1
2
_
1
d
1
x
d
1
x +d
2
_
d
2
2
x
1
para todo nmero real x 0, donde d
1
y d
2
son enteros positivos
y B es la funcin beta.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
La funcin de distribucin es:
G(x) = I d
1
x
d
1
x+d
2
_
d
1
2
,
d
2
2
_
donde I es la funcin beta incompleta regularizada.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin Gamma
Es una funcin de distribucin de probabilidad continua con dos
parmetros k y cuya funcin de densidad para valores x > 0 es:
f(x) = e
x
(x)
k1
(k)
donde es la funcin Gamma. Para valores k = 1, 2, . . ., as
(k) = (k 1)! el factorial de k 1.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin chi-cuadrado
La funcin chi-cuadrado o de Pearson, es una distribucin de
probabilidad continua con un parametro k que representa los
grados de libertad de la variable aleatoria
X = Z
2
1
+. . . +Z
2
k
donde Z
i
son variables aleatorias normales independientes de
media cero y de varianza uno.
Su funcin de densidad es:
f(x; k) =
_
_
_
1
2
k
2
(
k
2
)
x
(k/2)1
e
x/2
para x 0
0 para x < 0
donde es la funcin gamma.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Su funcin de distribucin es:
F
k
(x) =
(k/2, x/2)
(k/2)
donde (k, z) es la funcin gamma incompleta.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin Normal
Esta distribucin es la que con ms frecuencia aparece aproximada
en fenmenos reales. La grca de su funcin de densidad tiene
una forma acampanada y es simtrica respecto de un determinado
parmetro estadstico. Esta curva se conoce como campana de
Gauss y es el grco de una funcin gaussiana.
la importancia de esta distribucin radica en que permite modelar
numerosos fenmenos naturales, sociales y psicolgicos. La
importancia de esta distribucin tambien radica en su relacin con
la estimacin por minimos cuadrados uno de los mtodos de
estimacin ms simples y antiguos.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Se dice que una variable aleatoria continua X sigue una
distribucin normal de parmetros y y se denota X N(, )
si su funcin de densidad est dada por:
f(x) =
1

2
e
1
2
(
x

)
2
, x R
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Propiedades
Algunas propiedades de la distribucin normal son:
1. Es simtrica respecto de su media, .
2. Si X N(,
2
) y a y b son nmeros reales, entonces
(aX +b) N(a +b, a
2

2
).
3. Si X
1
, . . . , X
n
son variables normales estndar independientes,
entonces X
2
1
+. . . +X
2
n
sigue distribucin
2
con n grados de
libertad.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin t Student
Esta distribucin surge del problema de estimar la media de una
poblacin normalmente distribuida cuando el tamao de muestra
es pequeo. Realizar la prueba t de Student para la determinacin
de las diferencias entre dos medias muestrales y para la
construccin del intervalo de conanza para la diferencia entre las
medias de dos poblaciones cuando se desconoce la desviacin
tipica de una poblacin y esta debe ser estimada a partir de los
datos de una muestra.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
La funcin de densiadad esta dada por:

_
(v+1)
2
_

v
_
v
2
_
_
1 +
x
2
v
_

(v+1)
2
Y la funcin de distribucin esta dada por:
1
2
+x
_
v + 1
2
_
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin Normal Multivariante
La distribucin Normal Multivariante N
p
(, ) como una
generalizacin de la normal univariante, se dene la densidad de
X = (X
1
, . . . , X
p
)

N
p
(, ) segn:
f(x; , ) =
||

1
2
(

2)
p
e

1
2
(x)

1
(x)
, (1)
siendo x = (x
1
, . . . , x
p
)

, = (
1
, . . . ,
p
)

y = (
ij
) una matriz
denida positiva, que es la matriz de covarianzas
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Se sugiere denir la distribucin X = (X
1
, . . . , X
p
)

N
p
(, )
como una combinacion lineal de p variables Y
1
, . . . , Y
p
independientes con distribucion N(0, 1).
X
1
=
1
+a
11
Y
1
+ +a
1p
Y
p
(2)
.
.
.
X
p
=
p
+a
p1
Y
1
+ +a
pp
Y
p
Que podemos escribir como
X = +AY (3)
Siendo Y = (Y
1
, . . . , Y
p
)

y A = (a
ij
) una matriz p p que verica
AA

=
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Propiedades
1. De (3) es inmediato que E(X) = y que la matriz de
covarianzas es:
E[(X )(X )

] = E(AY Y

) = AI
p
A

= (4)
2. La distribucin de cada variable marginal X
i
es normal
univariante:
X
i
N(
i
,
ii
), i = 1, . . . , p. (5)
En consecuencia de la denicin (2).
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
3. Toda Combinacin lineal de las variables X
1
, . . . , X
p
Z = b
0
+b
1
X
1
+. . . +b
p
X
p
Es tambien normal univariante. En efecto, de (2) resulta que
Z es combinacion lineal de N(0, 1) independientes.
4. Si = diag(
11
, . . . ,
pp
) es matriz diagonal, es decir,

ij
= 0, i = j, entonces las variables (X
1
, . . . , X
p
) son
estocsticamente inddependientes. En efecto, la funcin de
densidad conjunta resulta igual al producto de las funciones
de densidad marginales:
f(x
1
, . . . , x
p
, , ) = f(x
1
;
1
,
11
) . . . f(x
p
;
p
,
pp
)
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
5. La distribucin de forma cuadrtica
U = (x )

1
(x )
en ji-cuadrado con p grados de libertad. En efecto, de (3)
U = Y

Y =
p

i=1
Y
2
i
es suma de los cuadrados de p variables N(0, 1)
independientes.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin de Wishart
La distribucin de Wishart es la que sigue una matriz aleatoria
simtrica denida positiva, generaliza la distribucin ji-cuadrado y
juega un papel importante en inferencia multivariante. Sean las
las de la matriz Z
np
son independientes N
p
(0, ) entonces
diremos que la matriz Q = Z

Z es wishart W
p
(, n), con
parametros y n grados de libertad.
Se prueba que cuando es denida positiva y n p, la densidad
de Q es
f(Q) = c|Q|
np1
exp
_

1
2
tr(
1
Q)
_
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
siendo
c
1
= 2
np
2

p(p1)
4
||
n
2
p

i=1

_
1
2
(n + 1 i)
_
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Propiedades
1. Si Q
1
, Q
2
son independientes Wishart W
p
(, m), W
p
(, n),
entonces la suma Q
1
+Q
2
es tambien Wishart W
p
(, m+n).
2. Si Q es Wishart W
p
(, n), y separamos las variables en dos
conjuntos y consideramos las particiones correspondientes de
las matrices y Q.
3. Si Q es Wishart W
p
(, n) y T es una matriz p q de
constantes, entonces T

QT es W
q
(T

T, n). En particular, si
t es un vectoe, entonces
t

Qt
t

t
es
2
n
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin de Hotelling
Es una generalizacin multivariante de la distribucin t de Student.
Si y es N
p
(0, I), Q es Wishart W
p
(I, m) y adems y, Q son
independientes, entonces
T
2
= my

Q
1
y
sigue la distribucin T
2
de Hotelling, que se indica por T
2
(p, m)
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Propiedades
1. Si x es N
p
(, ) independiente de M que es W
p
(, m),
entonces
T
2
= m(x )

M
1
(x ) T
2
(p, m)
2. T
2
est directamente relacionada con la distribucin de
Fisher-Snedecor
T
2
(p, m)
mp
mp + 1
F
p
mp+1
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
3. Si x, S son el vector de medias y la matriz de covarianzas de
la matriz X
np
con las independientes N
p
(, ), entonces
(n 1)(x )

S
1
(x ) T
2
(p, n 1),
y por lo tanto
n p
p
(X )

S
1
(X ) F
p
np
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
4. Si x, S
1
, y, S
2
son el vector de medias y la matriz de
covarianzas de las matrices X
n
1
p
, Y
n
2
p
, respectivamente,
con las independientes N
p
(, ), y consideramos la
estimacin conjunta centrada de
S =
(n
1
S
1
+n
2
S
2
)
(n
1
+n
2
2)
,
entonces
T
2
=
n
1
n
2
n
1
+n
2
(x y)

S
1
(x y) T
2
(p, n
1
+n
2
2)
Y por lo tanto
n
1
+n
2
1 p
(n
1
+n
2
2)
T
2
F
p
n
1
+n
2
1p
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin de Wilks
La distribucin F con m y n grados de libertad surge considerando
el cociente
F =
A/m
B/n
,
Donde A y B son ji-cuadrados estocsticamente independientes
con m y n grados de libertad. Si las matrices A, B de ordden p p
son independientes Wishart W
p
(, m), W
p
(, n) ,
respectivamente, con m p, la distribucin del cociente de
determinantes
=
|A|
|A+B|
Es por denicin, la distribucin lambda de Wilks, que indicaremos
por (p, m, n).
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Propiedades
1. 0 1 y adems no depende de . Por lo tanto,
podemos estudiarla suponiendo = I.
2. Su distribucin es equivalente a la del producto de n variables
beta independientes:
(p, m, n)
n

i=1
U
i
,
donde U
i
es beta B
_
1
2
(m+i p),
1
2
p
_
.
3. Los parmetros se pueden permutar manteniendo la misma
distribucin. Concretamente:
(p, m, n) (n, m+n p, p)
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
4. En general, una transformacin de equivale, exacta o
asintticamente, a la distribucin F. Si (p, n q, q) es Wilks
con n relativamente grande, consideremos
F =
ms 2
pq
1
1
s

1
s
(6)
con m =
n(p+q+1)
2
, =
(pq2)
4
, s =
_
(p
2
q
2
4)
(p
2
+q
2
5)
. Entonces F
sigue asintticamente la distribucin F con pq y (ms 2)
grados de libertad.
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
Distribucin Multinomial
Supongamos que la poblacin es la reunion disjunta de k sucesos
excluyentes A
1
, . . . , A
k
,
= A
1
+. . . +A
k
,
Consideremos n observaciones independientes y sea (f
1
, . . . , f
k
) el
vector con las frecuencias observadas de A
1
, . . . , A
k
, siendo
f
1
+. . . +f
k
= n (7)
La distribucin multinomial es la distribucin de f = (f
1
, . . . , f
k
)
con funcin de densidad discreta
f(f
1
, . . . , f
k
) =
n!
f
1
! . . . f
k
!
p
f
1
1
p
f
k
k
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos
Introduccin Distribuciones Univariantes Distribuciones Multivariantes
CONTINUARA...
Juan Carlos Riao Rojas Universidad de Sucre
Preliminares Estadsticos

Potrebbero piacerti anche