Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadstica
La ESTADSTICA es la ciencia de los datos. Implica la recoleccin, clasificacin, sntesis,
organizacin, anlisis e interpretacin de dichos datos. Acta como nexo entre los modelos
matemticos y los fenmenos reales.
Tipos de Estadstica
1-Estadstica Descriptiva: es la que se dedica a la organizacin, sntesis y descripcin de
un conjunto de datos.
2-Estadstica Inferencial: es la que usa datos de una muestra para inferir algo acerca de
una poblacin
Poblacin y Muestra
La poblacin representa la coleccin completa de elementos, resultados o individuos de los
que queremos analizar una similar caracterstica. Puede ser finita o infinita.
-Variable: es cualquier caracterstica que vara de una unidad experimental a otra. Una
variable aleatoria es aquella que toma valores de observaciones hechas sobre un conjunto
aleatorio de objetos o individuos.
ESTADSTICA
DAEZEGO
Tipos de variables
3~Variables Numricas: toman valores numricos. Hoy dos tipos de variables numricas:
Una medicin consiste en darle un nmero o cdigo a las observaciones hechas mediante
alguna escala adecuada, donde una escala es un instrumento de medicin.
ESTADSTICA
DAEZEGO
Distribucin de frecuencias
Una tabla de distribucin de frecuencia nos sirve para organizar los datos y presentarlos de
manera ms til, y as poder obtener cierta informacin que no se vera tan fcilmente si los
datos no estuviesen ordenados.
Segn con el tipo de dato que estemos trabajando podremos realizar distintos tipos de tabla
distribuciones de frecuencia. En esta tabla aparecern distintos tipos de frecuencias, entre
las cuales tenemos:
Es una tabla que asocia a cada categora de la variable con el nmero de veces que se repite
dicha categora. Entonces en esta tabla tenemos la frecuencia absoluta y la frecuencia
relativa. En la primera columna se coloca la identificacin, en la segunda columna las
categoras, en la tercera las frecuencias absolutas y en la cuarta las frecuencias relativas:
Id Categora f fr
1 Categora 1 5 5/12
2 Categora 2 2 2/12
3 Categora 3 3 3/12
4 Categora 4 2 2/12
6
5
4
3
f
2
1
0
Categora 1 Categora 2 Categora 3 Categora 4
ESTADSTICA
DAEZEGO
Es una tabla que asocia cada valor que toma la variable numrica con la cantidad de veces
que se repite dicho valor. As en esta tabla obviamente aparecen nuevamente las
frecuencias absolutas y relativas. Para los datos numricos podemos agregar dos tipos de
frecuencias mas que son las frecuencias acumuladas:
-Frecuencia Relativa Acumulada Fr: es la suma de las frecuencias relativas de los valores
menores o iguales al valor que se est considerando. Por supuesto que en al ultimo valor de
la tabla le corresponde un valor de Fr = 1.
Por lo tanto nuestra tabla de distribucin de frecuencias tendr 6 columnas ahora, ya que
debemos agregar estas 2 frecuencias.
Id Valor f fr F Fr
1 8 2 2/16 2 2/16
2 9 3 3/16 5 5/16
3 10 6 6/16 11 11/16
4 11 4 4/16 15 15/16
5 12 1 1/16 16 1
En este caso empleamos grficos de bastones para representar los datos agrupados.
Entonces sera:
7
6
5
4
f
3
2
1
0
8 9 10 11 12
Valor
ESTADSTICA
DAEZEGO
Otra manera de agrupar los datos numricos es mediante una tabla de frecuencias en las que
se agrupan las observaciones en intervalos llamados intervalos de clase, que no es ms que
el rango de valores en que se ha decido agrupar parcialmente los datos. Se define el rango
como la diferencia entre el valor mximo y el mnimo que toma la variable. Tambin, la
cantidad de datos que quedan comprendidos dentro del intervalo representa la f del
intervalo. Para determinar la cantidad de intervalos, k, ms adecuada para nuestro conjunto
de datos podemos emplear dos ecuaciones:
Sturges Raz de n
k=
( )
( )
k=1+
Definimos la amplitud de cada intervalo, h, como el cociente entre el rango del conjunto de
datos y la cantidad de intervalos k
La marca de clase Mc es el punto medio del intervalo de clase, es decir, es la suma de los
extremos del intervalo dividida 2:
Mc =
ESTADSTICA
DAEZEGO
( ) ! ! ! !
=
( / )
! ! ! !
" #
Me =
( ) & ! ' ! ! ! !
=
( / )
& ! ' ! ! ! !
" #
Me =
=
('
( = + = ( = +
( ! *+ )
! ' ! (
;
/ 0 2 ' =
-
2 ' =
.0 3
-
Posicin Me =
2 ' = +
,
ESTADSTICA
DAEZEGO
Medidas de Dispersin
Nos dan idea de la separacin de los valores de una variable alrededor de su media
aritmtica. Las ms usuales son la varianza y el desvo estndar.
El desvo estndar es la raz de la varianza medida en las unidades del conjunto de datos. Si
es poblacional ser y si es muestral S.
5 = 5 = 7
( * 6) ( * 6)
8 = 8 = 7
( * ) ( * )
* *
8 = 8 = 7
((' * ) ((' * )
* *
Notar que para el clculo de las varianzas y desvos muestrales se divide por n-1 y no por
n. Esto es porque estamos trabajando con estadsticos (S2 y S)
'9 =
8
Variables Tipificadas
:=
*
8
ESTADSTICA
DAEZEGO
Medidas de Asimetra
Nos permiten apreciar la simetra o asimetra de una distribucin dada. El modo es la
referencia central. Segn estas medidas una distribucin puede ser normal, sesgada a la
derecha o sesgada a la izquierda.
Normal: = Me = Mo
ESTADSTICA
DAEZEGO
Medidas de Orden
Aqu aparece el concepto de cuantiles que son valores que dividen al conjunto de datos en
partes iguales. Entonces podemos nombrar los siguientes:
Para nuestro estudio emplearemos los Cuartiles, as que veremos como se calculan sus
posiciones y sus respectivos valores:
Las posiciones las indicaremos con letras minsculas q y los valores de los Cuartiles los
indicaremos con letras maysculas Q.
;1 =
(= >)
?
Q1 = Xq1
Q2 = Me
;3 =
A(= >)
?
Q3 = Xq3
ESTADSTICA
DAEZEGO
Probabilidad
Este trmino se usa generalmente para indicar que hay cierta incertidumbre sobre algo que
ya ocurri, que est ocurriendo o que ocurrir en el futuro.
Para realizar el estudio de la probabilidad debemos definir algunos conceptos bsicos que
son:
Los eventos, ya sean simples o compuestos se suelen representar con letras maysculas
distintas de S, por ejemplo:
Sea S={{C, X} x {C, X} x {C, X}} C={C,C,X} ; D={(C, X,C) , (X, C,C)}
ESTADSTICA
DAEZEGO
Tcnicas de Numeracin
- Principio de Multiplicacin
- Principio de Adicin
- Permutaciones
Pn = n!
- Combinaciones
=
!
! ( * )!
C(n, x) =
Probabilidad de un evento
A continuacin se veremos las teoras de probabilidad:
- Teora Clsica
- Teora de Frecuencias Relativas
- Teora Axiomtica
- Teora Personalista o Subjetiva
Teora Clsica
2(C) = 0 2(C) 1
exactamente nA de esos resultados pertenecen al evento A, entonces la probabilidad del
C
evento A ser: 0 nAn
2(C) =
C
ESTADSTICA
DAEZEGO
Teora Axiomtica
P(E) : S R+0
1- P(E) 0 VE
2- P(S) = 1
3- P(E U F) = P(E) + P(F) si (E F) = ; = conjunto vaco
1- P() = 0
2- Sea Ac el complemento de A, entonces
P(Ac) = 1 P(A)
ESTADSTICA
DAEZEGO
Probabilidad Marginal
D
exactamente nE de estos resultados pertenecen al evento E, entonces definimos la
probabilidad marginal de E as: P(E) =
Probabilidad Conjunta
( C F )
Dados dos sucesos A y B de S, la probabilidad de ocurrencia de A y B simultneamente la
denominamos probabilidad conjunta: P(AB) =
Probabilidad Condicionada
P(CF) =
2(CF)
Dados dos sucesos A y B de S con P(B) 0, la probabilidad de ocurrencia de A dado que
2(F)
ocurri B es:
Regla de Bayes
= =
2(CF) 2(CF) 2(C).2(FC)
2(F) 2(CF) 2(C).2(FC)
P(A/B) =
ESTADSTICA
DAEZEGO
La funcin f(xi) = P(X = xi) es una funcin de probabilidad de la variable aleatoria discreta
X si para cada xi Rx , donde Rx = resultados posibles o recorrido, si se cumple que:
2- ( ) =
1- f(x) 0 f(x) es funcin de probabilidad de la variable aleatoria X
(x, f(x)) distribucin de la variable aleatoria X
3- P(X = x) = f(x)
As decimos que f(x) es una funcin de masa o cuanta cuando X es una variable
aleatoria discreta.
I*J ( )! =
J
1- f(x) 0 f(x) es funcin de probabilidad de la variable aleatoria X
2- (x, f(x)) distribucin de la variable aleatoria X
P(a < X < b) = I ( )!
K
3-
As decimos que f(x) es una funcin de densidad cuando X es una variable aleatoria
continua.
+ ( ) = M ( )
ESTADSTICA
DAEZEGO
Propiedades:
/ X . ( ) 9. . ! '
-
DV W = J
.
- Y . ( ) 9. . '
,*J
Sea X una variable aleatoria con distribucin de probabilidad f(x), la varianza o variancia
de X es:
/ X( DV W) ( ) = DV W (DV W) 9. . ! '
-
ZV W = J
.
- Y ( DV W) ( ) ! = DV W (DV W) 9. . '
,*J
~ (DV W, ZV W)
Entonces la variable aleatoria, discreta o continua, se distribuye con una funcin de
parmetros E[X] y V[X]:
Sean dos variables aleatorias X e Y con medias E[X] y E[Y], la covarianza vale:
' 9V , ]W = DV ]W DV W . DV]W
ESTADSTICA
DAEZEGO
:=
*DV W
Supongamos que tenemos una variable aleatoria X ~ g (E[X], V[X]) y queremos emplear la
^ZV W
variable z que se define como sigue:
Ahora necesitamos saber como se distribuye esta variable z, es decir, con que esperanza y
con que varianza. Entonces hacemos lo siguiente:
X EVXW 1 1
ZV:W = V j k = VfX EVXWg = VVXW =
^VVXW VVXW VVXW
Entonces z ~ g (0, 1)
As, f(x, y) proporciona la probabilidad de que los dos resultados ocurran al mismo
tiempo.
( , l) S ( , l)
2- l ( , l) = o I Il ( , l)! !l =
1-
( , l) = ( ) (l) (r, s)
ESTADSTICA
DAEZEGO
Distribuciones Discretas
Si un S contiene una cantidad finita de posibilidades o una secuencia interminable con
tantos elementos como el total de nmeros enteros, dicho S se llama espacio muestral
discreto y a la variable aleatoria definida en dicho espacio se la llama variable aleatoria
discreta.
Distribucin Binomial
" # t *
= S, , , . ,
( ) = 2( = ) = K( , , ) = 3
S
con n entero y 0 p 1
DV W =
~ K( , , ) v
ZV W = t
ESTADSTICA
DAEZEGO
Distribucin Geomtrica
Consideramos un experimento donde tiramos una moneda las veces que sea necesario hasta
obtener la primera cruz, donde la probabilidad de obtener una cruz es p. Entonces, cuntos
tiros debemos realizar.
P (X = 1) = p
P (X = 2) = (1 p)p
P (X = 3) = (1 p)2 p
P (X = x) = (1 p)x1p
2( = ) = ( ) *
= t *
zVwW = {y
w ~ x(r, y) }
|VwW = {
y
Distribucin Hipergeomtrica
erhe* h
*r
r = S, , , , ( , )
~(r, , , ) = e h
S x
ESTADSTICA
DAEZEGO
DV W
~ , , ,
Q Q
ZV W t Q
Q Q
Distribucin de Poisson
Como consecuencia del teorema central del lmite, para valores grandes de , una variable
aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente
*
2 , S, , , ,
!
S
ESTADSTICA
DAEZEGO
DISTRIBUCIONES CONTINUAS
Los valores en los dos extremos a y b no son por lo general importantes porque no
afectan el valor de las integrales de f(x) dx sobre el intervalo, ni de x f(x) dx o
expresiones similares. Veamos como se distribuye una variable aleatoria con esta
funcin de densidad
K
K)
DV W Y !
KQ KQ
KQ
ZV W DV W Q DV W
DISTRIBUCIN EXPONENCIAL
ZV W
ESTADSTICA
DAEZEGO
DISTRIBUCIN NORMAL
La distribucin de una variable normal queda perfectamente definida por dos parmetros
que son su media y su desviacin estndar . Entonces se dice que una variable
aleatoria continua X sigue una distribucin normal de parmetros y si su funcin de
densidad est dada por:
Se llama distribucin normal "estndar" a aqulla en la que sus parmetros toman los
valores = 0 y = 1. En este caso la funcin de densidad tiene la siguiente expresin:
Debido a que la curva alcanza su mayor altura en torno a la media, mientras que sus colas
se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin
normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se
encuentre muy alejado de ste.
ESTADSTICA
DAEZEGO
pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos
cercanos al valor medio de la distribucin.
As podemos notar que no existe una nica distribucin normal, sino una familia de
distribuciones con una forma comn, diferenciadas por los valores de su media y su
varianza. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que
corresponde a una distribucin de media 0 y varianza 1, entonces resulta:
Es importante tener en cuenta que a partir de cualquier variable X que siga una
distribucin normal, se puede obtener otra caracterstica Z con una distribucin normal
estndar realizando la siguiente transformacin:
a partir de las que se puede obtener de modo sencillo la probabilidad de observar un dato
menor o igual a un cierto valor z, y que permitirn resolver preguntas de probabilidad
acerca del comportamiento de variables de las que se sabe o se asume que siguen una
distribucin aproximadamente normal.
~ 6 , 5
] ~ 6l , 5l . Si M = X + Y entonces:
Sean dos distribuciones normales, con variables aleatorias independientes e
(~ 6 ) 6] , 5 ) 5l
Es decir que segn esta propiedad podemos sumar algebraicamente las variables aleatorias
independientes para formar otra. Cabe aclarar que en dicha suma los coeficientes que
multiplican a las variables no necesariamente deben ser 1, sino que pueden tomar otros
valores inclusive negativos.
ESTADSTICA
DAEZEGO
1- n es grande y S, S,
2- n cualquiera y p = 0,5
Distribucin Gamma
( ) =
> 0, > 0 > 0
( )
ESTADSTICA
DAEZEGO
Distribucin CHI-CUADRADA ( 2)
x>0
" #
~ ( ) , y adems DV W = l ZV W =
Sean X1, X2,,Xn variables aleatorias independientes con distribucin 2 se tiene que:
]= ~( ) + ~( ) + + ~( ) ] ~ ( )
Distribucin t de Student
*
( )= " + # < <
V( )/ W
( / )
ESTADSTICA
DAEZEGO
Distribucin F de Fisher
Si > ~ (=
)
e ~ (=
) que son ambas variables aleatorias independientes, entonces la
]{
variable aleatoria + = ]
{
, que resulta del cociente de cada Chi-cuadrada divida por sus
( ) " #
+
(+) = ( ) ~ +( , )
e h e h +
ESTADSTICA
DAEZEGO
Teora de Muestras
La teora del muestreo es el estudio de las relaciones existente entre una poblacin y las
muestras extradas de la misma. Tiene gran inters en muchos aspectos de la estadstica.
Por ejemplo permite estimar cantidades desconocidas de la poblacin a partir del
conocimiento de las correspondientes cantidades muestrales. Las cantidades poblacionales
se conocen comnmente como parmetros, mientras que las cantidades muestrales
reciben el nombre de estadsticos.
La teora de muestreo es tambin til para determinar si las diferencias que se puedan
observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario
son solamente significativas.
Entonces en esta parte de nuestro estudio nos fijaremos en los distintos tipos de muestras y
las variables aleatorias asociadas a cada una de ellas.
Para seleccionar una muestra aleatoria de tamao n de una poblacin f(x), debe definirse
una variable aleatoria Xi, con i = 1, 2, , n. Las variables Xi formarn as una muestra
aleatoria de la poblacin f(x) con valores numricos xi si dichas variables son
independientes cada una con la misma distribucin de probabilidad f(x). Entonces su
)= ( ) ( ) ( )
distribucin de probabilidad conjunta se expresa como:
, ,,
La funcin conjunta resulta ser el producto de las funciones marginales
Dijimos que una cantidad muestral se llama estadstico, as que vamos a dar una definicin
del mismo. Decimos que cualquier valor calculado a partir de una muestra se llama
estadstico, o tambin que un estadstico es una variable aleatoria que depende slo de la
muestra aleatoria observada. Algunos estadsticos importantes de una muestra de tamao
n son la media muestral y la varianza muestral S2.
As, la distribucin de probabilidad de un estadstico recibe el nombre de distribucin
muestral.
A continuacin veremos como se distribuyen los estadsticos ms empleados para nuestro
estudio.
ESTADSTICA
DAEZEGO
Distribucin de Medias
Sea X1, X2,, Xn una muestra aleatoria con media entonces veamos como se
distribuye
DV W D DV W DV W DV W Es decir que DV W DV W
ZV W | ZV W ZV W ZV W Es decir que ZV W ZV W
6
5 6
= = ~
8
,( * )
( )8
5 ( )
Se distribuye con (n-1) grados de libertad. Esto es debido a que se trabaja con un
estadstico que es S2, si hubisemos empleado un estadstico ms seran (n-2) grados de
libertad y as sucesivamente.
ESTADSTICA
DAEZEGO
Distribucin de Varianzas
Si S2 es la varianza de una muestra aleatoria de tamao n extrada de una poblacin con
1- Poblaciones normales
Entonces tenemos dos poblaciones normales de las cuales conocemos sus varianzas
> y , y extraemos una muestra n1 y n2 respectivamente:
~ "6 6 , + #
5 5
Por lo tanto
ESTADSTICA
DAEZEGO
Entonces podemos emplear la variable aleatoria z siguiendo el teorema central del lmite:
: ~ (S, )
* * 6 *6
5 5
2- Poblaciones no normales
En el caso de que estemos tratando con poblaciones no normales pero el tamao de las
muestras es superior a 30, entonces podemos emplear la variable aleatoria z definida
anteriormente:
> 30 = ~ (S, )
( * )* (6 *6 )
5 5
1- Poblaciones normales.
En esta situacin suponemos que las varianzas poblacionales son iguales = > = y
deberemos emplear una variable aleatoria t cuya distribucin se compone del cociente entre
una Normal Estndar y la raz de una Chi-Cuadrada dividida entre sus grados de libertad, es
decir: = ~
(S, )
,(9),
7(9) 9
= ~ * ) donde 8' =7
( * )* (6 *6 ) ( * )8 ( * )8
,( ( * )
8' 7
2- Poblaciones no normales
> 30 = ~ (S, )
( * )* (6 *6 )
8 8
ESTADSTICA
DAEZEGO
Estimacin
La teora de la Estadstica Inferencial (o inferencia estadstica) se puede definir como
aquellos mtodos que permiten hacer inferencia sobre una poblacin. Para ello se eligen
estimadores de manera que el modelo se ajuste lo mejor posible al comportamiento
observado, para luego estudiar a dichos estimadores como variables aleatorias.
As lo que tratamos de hacer es emplear un determinado estadstico para que nos estime
un determinado parmetro. Generalmente se busca el estadstico que mejor estime a dicho
parmetro. A estos estadsticos los llamamos estimadores.
Estimacin Puntual
, , , , ) por lo que (
= , , , , )
.
Queda a la vista que es funcin de
=
(
= , , , , ) =
Aqu podemos ver que el estimador es funcin de los valores de la muestra y que tiene un
solo valor, ya que la media aritmtica tiene un solo valor.
Si hacemos los clculos para los diferentes estimadores de veremos que el que cumple
con las dos propiedades anteriores es .
ESTADSTICA
DAEZEGO
Dada una muestra aleatoria X1, X2,, Xn de una poblacin con funcin de densidad (o
cuanta), f(x, ) con desconocido y adems cada una de las variables aleatorias tienen
como funcin fi(xi, ):
=S
!V ()W
!
Luego procedemos a encontrar los puntos crticos haciendo:
ESTADSTICA
DAEZEGO
construir un intervalo lo que hacemos es tomar un valor inferior y otro valor superior
La estimacin por intervalos nos permite conocer con que error estamos trabajando. Para
tales que la probabilidad de que dichos valores encierren al valor verdadero de sea
igual a Q , que es el nivel de confianza del intervalo y es el error que nos podemos
permitir: 2 < < Q
Variable Fundamental
Una variable aleatoria es una variable fundamental o pivotal si y slo si:
Por ejemplo: Sea X ~ N(, ) con conocida, encontrar la variable pivotal para
:=5 ~(S, )
*6
{
Veremos como se construye un intervalo para la media poblacional segn sea el caso
que se nos presente.
El mejor intervalo es el que tiene menor longitud. Para el caso de una distribucin
Normal que posee simetra, el intervalo de menor longitud se da cuando los extremos
2 : <5 <: * =
*6
*
{
ESTADSTICA
DAEZEGO
~ ( * )
*6
8{
La variable pivotal es
Entonces por ser una distribucin simtrica los extremos deben tener la misma posicin
pero de signo opuesto, as resulta:
2( << )=
2 <8 < * =
*6
* {
2 " * << + * #=
8 8
Una estimacin puntual insesgada de la varianza de una poblacin normal est dada por
la varianza muestral S2, es decir que S2 es el estimador de mxima verosimilitud de 2.
2 < < =
(=*>) (=*>)
2 : * < < : * =
*2
t
7
2 : * 7 < < + : * 7 =
t
t
ESTADSTICA
DAEZEGO
2 : < <: =
( * )*(6 *6 )
* *
Este intervalo tambin se puede usar en el caso de que las poblaciones no sean normales y
las varianzas poblacionales sean desconocidas, siempre que el tamao de las muestras sea
mayor a 30. Lo nico que hacemos es usar las varianzas muestrales en lugar de las
poblacionales.
= ~ * ) ; 8' = 7
( * )*(6 *6 ) ( * )8 ( * )8
( ( * )
8' 7
La variable pivotal es
ESTADSTICA
DAEZEGO
Prueba de Hiptesis
Hiptesis estadstica: es una afirmacin de un conjunto de parmetros de la distribucin
poblacional. La aceptacin de una hiptesis implica tan slo que los datos no proporcionan
evidencia suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la
muestra la refuta.
Dada una muestra aleatoria X1, X2,, Xn de tamao n, definimos la regin crtica o de
rechazo C al conjunto de todos los valores del estadstico que hacen que la H0 sea
rechazada.
No rechazar H0 si w , w , , w )
Rechazar H0 si (w , w , , w )
-
-
significancia.
ESTADSTICA
DAEZEGO
> : <
Donde k es el valor conocido de . Notar que slo en H0 se coloca el signo igual, y que
la H1 refuta a la H0.
Q6 Q6
2 < |
5 5
Q6
2 : < |
5
: 6 ) : .
*6 5
5
Propiedades
- Los errores tipo 1 y 2 estn relacionados entre s. La disminucin de probabilidad de
uno resulta en el aumento de la probabilidad del otro.
- Un incremente en el tamao n de la muestra reduce simultneamente los valores de
y .
- La probabilidad de cometer error de tipo 1 puede reducirse ajustando el o los
valores crticos de la regin de rechazo.
ESTADSTICA
DAEZEGO
Tamao de la muestra
! : X > | X > |
! C: X < | X < |
2 ": < # | 6 ) : .
*6 5
5
Sigue restar miembro a miembro las dos ecuaciones que encontramos y as podremos
hallar el valor de n:
S 6S ) : * . Q "6 ) : . #
5 5
n: debemos tomar un valor entero
Aqu tambin supondremos normalidad, por ello y por tratarse de la varianza la variable
pivotal que usaremos ser la 2
: <
> : >
! : S > | S > |
ESTADSTICA
DAEZEGO
- Cociente de varianzas
En este caso tenemos dos poblaciones normales N > , > ) y N( , ) de las que se toman
dos muestras aleatorias independientes de tamao n1 y n2 respectivamente. Por lo tanto la
variable pivotal a emplear en este caso es la F, dado que estamos trabajando con cociente
de varianzas.
: > = 1
> : > 1
! : S> S < C> o S> S > C | P(S> S < C> )| + P(S> S > C )| =
1
C> = F (n> 1, n 1) =
F>* (n 1, n> 1)
C = F>* (n> 1, n 1)
- Diferencia de Medias
En este caso tenemos dos poblaciones normales N(> , > ) y N( , ) de las que se toman
dos muestras aleatorias independientes de tamao n1 y n2 respectivamente. Supondremos
que las varianzas poblacionales son desconocidas pero que son iguales, entonces la variable
pivotal es una t.
: > = 0
ESTADSTICA
DAEZEGO
P t <
| C Qt>* S 7 )
7
1 (> ) >
> v
> =
de > . Una vez obtenido el valor de procedemos a usar la ecuacin para calcular la
aceptacin, tomando el valor de C calculado anteriormente y usando tambin el valor dado
ESTADSTICA
DAEZEGO
Un primer mtodo para saber si existe relacin entre las variables es emplear un
Ahora veremos un mtodo para elegir la recta de regresin que se llama mtodo de
mnimos cuadrados.
Este mtodo implica la suma de los cuadrados de las distancias verticales de los puntos yi a
la recta sea lo mas pequea posible.
0( , K) = XVl ( + K )W
Para que D sea mnima debemos encontrar sus derivadas parciales y luego las igualaremos
a cero para encontrar los valores de a y b respectivamente. De todo el trabajo algebraico se
obtiene que:
= X K X =]K
l
( )(l ]) 8
K= =
l
( ) 8
ESTADSTICA
DAEZEGO
Estimadores para , y +x
K=
8 l
8
depende linealmente de las variables yi que se distribuyen normalmente, por lo
tanto b tambin se distribuye normal. Ahora veamos como se distribuye, tener en cuenta
que slo colocamos los resultados pasando por alto los desarrollos algebraicos.
K
: = 5 ~ (S, )
{
^ ( )
Con esta variable podemos construir intervalos de confianza y pruebas de hiptesis para la
pendiente de la recta de regresin conociendo la varianza.
EVaW = y VVaW = +
> a
( *a)
ESTADSTICA
DAEZEGO
V ) P W ) y VV ) P W )
> *a
*a
) rS Q ) rS
: ~ (S, )
Q
5 ) S
SQ
= Y ( + X )
EVe W = 0 = EVY W EV + X W
1 (x X)
VVe W = VVY W + VV + X W = + j + k
n > (x X)
] ( +K S)
: = ~ (S, )
( S )
5 + +
( S )
Esta variable nos permite hallar los lmites de confianza para el valor Y verdadero llamados
lmites de prediccin. Dichos lmites comparados con los obtenidos para + P son ms
amplios debido a las fluctuaciones por ser una variable aleatoria. Graficando los lmites en
funcin de x0 tenemos que:
LS lmite superior
LI lmite inferior
ESTADSTICA
DAEZEGO
Estimacin de la Varianza
=>V ( + PO )W
= =
2
Se demuestra que EV W = entonces es un estimador insesgado de . Luego
(=*)
~(=*)
podemos emplear la variable para calcular las variables adecuadas para
cuando desconocemos
( * )
(a *a)
S = = y Sa = =
*> *> *> *>
Donde
Intervalos de Confianza
- Para con 2 desconocida
~ (S, ) y que
* ( * )
: = ~ ( * )
5
5
( )
Dada una confianza y recordando que t tiene una distribucin simtrica, podemos plantear
el intervalo: 2 " * << * # =
Luego hacemos los reemplazos y despejes que corresponden para obtener el intervalo de .
ESTADSTICA
DAEZEGO
~ (S, )
K*
Procediendo de igual manera y recordando que : = 5
7 ( * )
Vamos a emplear nuevamente la variable pivotal t y a realizar los mismos pasos para
obtener el intervalo para para un nivel de significancia dado.
~ (S, )
] *( K S)
Todo lo mismo, la variable pivotal sigue siendo una t y : =
e S h
5
( S )
Prueba de Hiptesis
Debemos probar si algn parmetro es igual a algn valor hipottico.
- Prueba para
: =
> :
K*
La variable pivotal es la bendita t: = ~ ( * )
8 {7 ( * )
|K S | >
8
con la siguiente regin de rechazo: ( *)
7 ( * )
ESTADSTICA
DAEZEGO
- Prueba para
: =
> :
*
La variable pivotal es la bendita t: = ~ ( * )
8
( )
| S | > e *h 8 7 +
( * )
con la siguiente regin de rechazo:
Regresin Curvilnea
- Funcin Polinmica
=
la cual debemos ajustar a l = ] S + + +
++
- Funcin Potencial
] C ) K
l .
Vemos que tenemos una funcin lineal, por lo que podemos aplicar la regresin lineal
teniendo en cuenta que la tabla de datos va a ser con
- Otras funciones
] ) ] )
donde
]
] ) donde ] l
] ] ) donde ]
l
ESTADSTICA
DAEZEGO
Correlacin Simple
Al realizar una prediccin del valor de Y usando la ecuacin de mnimos cuadrados, la
misma est sujeta a errores. El grado de exactitud en la prediccin depende de la
correlacin que existe entre las dos variables. La medida usual es el coeficiente de
correlacin (si es poblacional) o r (si es muestral).
8 l
=
^8 8ll
Su estimador se define como:
Cuando r = -1 o r = 1, significa que existe un ajuste perfecto. Por otro lado cuando r = 0
significa que no existe correlacin lineal (podra ser una relacin curvilnea).
Una hiptesis til es = 0 es decir que no hay relacin entre X e Y porque seran
independientes. Entonces: S : = S
: S
= = ~ ( * )
^
K
Con esta variable se hace la prueba con la siguiente regin de rechazo dado un nivel de
significancia : | K | > *,( * )
ESTADSTICA
DAEZEGO
S : = S
: S
e
h ~ " " S
S
#, # entonces resulta
*
Partiendo de que:
1 1
2 lne>>* h 2 ln ">>* SS #
z = ~N(0,1)
7 1
n3
|z | > >*
ESTADSTICA