Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
aleatoria.
Estos
estimadores
servirn
para
inferir
las
proceso
de
estimacin
consiste
en
definir
los
mejores
Insesgamiento
ii)
Mnima varianza
iii)
Consistencia
12
22
respectivamente y si
2 2
1
tenga
Mtodo de momentos
ii)
iii)
iv)
e12
i 1
= mnimo = (Yi - )2
Frecuenci
X
1.0
1.5
a
1
2
2.0
2.5
3.0
4
5
3.5
4.0
4.5
3
2
X i fi
fi
f 1
75
3
25
fi
25
1.041
24
5.0
Sabemos que
X 1 X 2 ... X n
n
, entonces
E( X 1)+ E( X 2) + . . . + E( X
E( X ) =
n)
N
Var( X )
=
++....+
=
n
n
2
Entonces X N(,2/n)
TEOREMA CENTRAL DEL LIMITE
En un muestreo aleatorio de una poblacin arbitraria con media
y varianza 2,, si n es grande, la distribucin de X es aproximadamente
normal con media y varianza 2/n; en otras palabras
X N(,2/n)
Resumiendo tenemos:
X
/ n N(0,1)
i) X ? (,2) ===>
X
/ n N(0,1) cuando n
(es
grande)
Este
teorema
es
de
gran
importancia,
ya
que
ilustra
la
P X 24 P
/ n
10
P Z 2 P Z 1.598
2 / 10
24 23
P 555 X 575 P
225
N 565,
9
225
N 565,
n
Entonces
10 n
575 565
10 n
555 565
Z
P
Z
P a Z a
15
15
15 / n
15 / n
1 0.9906
2
= 0.0047
10 n
P -2.6 < Z < 2.6 y 15 = 2.6, entonces n = 15.21 16
INTERVALOS DE CONFIANZA
a) Intervalo de confianza para de una distribucin normal
cuando es conocida
Un intervalo de confianza es un estimador para un determinado
parmetro por intervalo, donde se trata de encontrar un segmento a, b
en el cual el parmetro est contenido con cierta probabilidad, esto es:
P a < < b = 100 (1 - ) %
donde
es
la
probabilidad
de
P X Z 2 / n X Z 2 / n 1001
504
510
497
512
514
505
493
496
506
502
509
496
= 0.1, entonces
5
5
P X Z 0.1 / 2
X Z 0.1 / 2
(1 0.1)100 90%
16
16
5
90%
4
5
5
P 501.694 <
lmite inferior
Interpretacin:
Para
= 0.05 tenemos
5
5
2
2
5
5
5
5
5
P 503.75 Z 0.01 503.75 Z 0.01
4
2
2
5
99%
4
2.5758
P X tn 1, / 2 S / n X t n 1, / 2 S/ n 1001
P t > tn-1, /2
Ejemplo:
Calcular el intervalo de confianza para el problema anterior
considerando que es desconocida.
S = 6.2021
= 0.10
/2 = 0.05
6.2021
6.2021
P 503.75 t15,0.05
503.7 t15,0.05
90%
4
4
= n-1=15
6.2021
6.2021
P 503.75 1.7531
503.75 1.7531
90%
4
4
10.77
9.49
10.08
11.37
9.67
11.68
11.28
11.39
10.63
9.74
9.46
9.72
10.42
7.99
9.56
n = 20
= 0.1
= n-1 = 19
X = 10.4 S = 1.016
1.016
1.016
P 10.4 1.7291 x
10.4 1.7291 x
90%
20
20
Programa SAS
data a;
input x @@;
cards;
10.46 10.77 11.68
10.20
9.49 11.28
12.46 10.08 11.39
10.21 11.37 10.63
11.39
9.67
9.74
proc means mean std
proc means mean std
proc means mean std
run;
9.46
9.72
10.42
7.99
9.56
clm alpha=0.1;
clm alpha=0.05;
clm alpha=0.01;
(os)
parmetro
probabilidades.
Ejemplo:
> 0
<3
10
Juegos de hipotesis para
(s)
de
cualquier
distribucin
de
Rechazar Ho
No rechazar Ho
tipo I
Decisin correcta
media
de
desconocida pero
dos
poblaciones
normales
con
varianza
12 12 2
(homogeneidad de varianzas).
2.
3.
4.
5.
6.
1) Ho : = 0 vs
2) Ho : < 0 vs
3) Ho : > 0 vs
2. Elegir
3) Valores de Z/2
para el juego
para el juego 2 y 3
4) Estadstico de prueba
Zc
X X n
/ n
a) Para el juego 2
Rechazar Ho si Zc > Z
b) Para el juego 3
Rechazar Ho si Zc < - Z
o Zc < - Z/2
Ejemplo:
A
continuacin
se
presentan
los
datos
obtenidos
por
un
superiores
ton/ha
(P<0.1)
Juegos
de
hiptesis
1) Ho : = 0
vs
2) Ho : < 0
vs
3) Ho : > 0
vs
Estadstica de prueba
tc
X X n
S
S/ n
Ejemplo:
Un metalurgista hizo 4 determinaciones del punto de fusin del
manganeso, estas fueron: 1269, 1 271, 1263 y 1265. Es importante
probar el hecho de que el fabricante del manganeso indicaba que el
punto de fusin es 1260. La prueba de hiptesis es entonces:
Ho: = 1260
Ha: 1260
vs
= 0.05
X = 1267
S=3.65148
tc
X
S/ n
1267 1260
3.65148
3.834
Conclusion
Rechazar Ho si tc > t(,n-1) o si tc < -t(,n-1)
3.834 > 3.1824
Se encontr que el punto de fusin del manganeso es diferente de
1260c (P<0.05).
Cambiando =0.01
Ho: = 1260
Ha: 1260
vs
= 0.01
/2=0.005
X = 1267
S=3.65148
T Calculada:
tc
X
S/ n
X
S
1267 1260
3.65148
3.834
T Tablas:
t(/2, n-1) = t(0.005,3)= 5.84 (tablas de t)
Conclusion
Rechazar Ho si tc > t(,n-1) o si tc < -t(,n-1)
3.834 < 5.84
Se encontr que el punto de fusin del manganeso es de 1260c
(P>0.01).
Ejemplo:
Los propagandistas de cierta marca de cigarrillos sostienen que el
contenido promedio de nicotina de sus productos es menor de 0.7 mg
por cigarrillo. Suponiendo una distribucin normal para el contenido de
nicotina, su aseveracin es que < 0.7. Queremos entonces probar:
Ho: > 0.7
S = 0.0653
tc
30 0.6920 0.7
0.671
0.0653
0.69
0.64
0.81
0.73
0.76
0.64
0.59
0.74
0.63
0.70
0.60
0.65
0.71
0.61
0.79
0.62
0.61
0.77
0.68
0.60
0.76
1) Ho : 2 =
Juegos
de
hiptesis
2) Ho : 2 <
3) Ho :
02
02
>
vs
Ha: 2
02
(dos colas)
vs
Ha: 2 >
02
(cola derecha)
02
vs
Ha: <
2
02
(cola izquierda)
X c2
n 1 S2
2
0
c2 (2 / 2,n 1)
Rechazar Ho si
__________________________
o si
c2 (2 / 2,n 1)
c2 (2,n 1)
Para el juego 2.
Rechazar Ho si
Para el juego 3.
c2 (21 ,n 1)
Rechazar Ho si
__________________________
MUESTRAS ALEATORIAS
__________________________
12
22
12
) y (2,
22
). Supuesto
12
22
= 2.
1) Ho : 1 = 2
vs
2) Ho : 1 > 2
vs
3) Ho : 1 < 2
vs
Pasos:
1. Elegir la hiptesis a probar.
2. Elegir
3. Estadstica a prueba
tc
X1 X 2
1
1
Sp
n1 n 2
S p2
S p S p2
n1 n 2 2
=desv.
Estndar
ponde-rada de
S X2
*Encontrar frmula general.
Las reglas de decisin son:
S X1
o si tc < -t(/2,n1 + n2
2)
Para el juego 2.
Para el juego 3.
Ejemplo:
Mediante 2 procesos se manufactur cable de alambre; se desea
determinar si los procesos tienen diferentes efectos en la resistencia y
en la
ruptura
de laboratorio
vs
Ha: 1 2
= 0.05
X1 = 8.17 S1 =5.366
X 2 = 11.28 S 2 =5.238
S p2
Sp =
; n1 = 6,
; n2 = 7
5.29 =2.3
PROCESO 2
14
9
13
12
13
8
10
n2 = 7
t Calculada
tc
8.17 11.28
2.43
1 1
2.3
6 7
t Tablas
t(/2, n1+ n2 -2) = t(0.025,11) = 2.201 =-2.01
Conclusion
Rechazar Ho si tc > t(/2,n1 + n2-2) o si tc < -t(/2,n1 + n2 2).
-2.43>-2.01
Se encontr que los procesos de manufactura de alambre son diferentes
(P<0.05).
Cual es ms resistente?
En este caso es aquella cuya media muestral es mayor.
Respuesta: Proceso 2; X 2 =
11.28
ANALISIS DE COVARIANZA
MUESTRA APAREADA. Se dice que se tiene una muestra
apareada cuando se toman mediciones de dos variables a un solo
individuo que a su vez conforma una muestra aleatoria.
1 n
D1 ;
n i 1
2
SD
1 n
D1 D 2
N 1 i 1
Ha: D k
Diferencias de las medias = D 0
2. Ho: D < k = k
vs
Ha: D > k
3. Ho: D > k = k
vs
Ha: D < k
2
N D , D
/n,
2
D N D , D / n ,
tc
n D k
SD
Ho: D = 0
tc
x
157
158
163
160
161
126
114
148
150
124
y
67
61
89
74
69
78
60
78
72
68
Ha: D 0;
vs
Dx-y
90
97
74
86
92
48
54
70
78
56
D x 74.5
SD = 17.26
= 0.01
74.5 10
13.64
17.26
como tc > t(/2, 9) se rechaza Ho con = 0.01
t(/2, 9) = 3.2498
Conclusin en el Contexto.
Se encontr que el nmero de pulsaciones por minuto en los atletas es
diferente antes y despus de un entrenamiento (P<0.01).
REGRESION LINEAL SIMPLE
Recta Y = 0 + 1 X
MODELO DE LINEA RECTA
Y
Efecto
(peso)
X
Causa
(alimento)
Existen relaciones de
causalidad
2
2
di2 Yi Yi Yi 0 1Xi
i 1
Minimizando L tenemos:
dL
d 0
dL
d 1
Yi 0 1Xi 2 Y X
i 0 1
2
d 0
Yi 0 1Xi 2 Y X
i 0 1
2
d 1
Igualando a cero
2 Yi 0 1X
=0
2 X i Yi 0 1X
=0
Xi Yi nX Y
Xi2 nX 2
0 Y 1X
0 y 1
0
Estima a 1
de
mnimos
Ejemplo:
Efecto de la edad en la presin sangunea.
Se seleccionaron mujeres de alrededor de los 40 aos de edad
para estudiar la relacin de la presin sistlica de la sangre con la edad.
X = edad
42
Y = Presin en
mmHg
130
XY = 100990
1 = 0.7451
46
115
X = 66.2
42
71
80
74
70
80
148
160
156
162
151
156
Y = 149.8
X2 = 46270
rxy = 0.4805
85
72
162
158
= 100.4694
X i Yi n X Y
2
i
nX 2
0 Y 1 X
= 100.4694 + 0.7451 Xi
Finalmente se tiene el siguiente modelo: Y
Conclusin: Se encontr que cada que se aumenta un ao en la edad de
una mujer (de alrededor de 40 aos) la presin sistlica se incrementa
en 0.7451 mmHg.
Nota:
10. La regresin sirve para hacer predicciones, conociendo X y Y
11. Se utiliza en: clculo de dosis ptimas, curvas de respuestas,
superficies de respuestas, etc.
12. Interpolaciones.
0 = La ordenada al origen generalmente no tiene una interpretacin en
Tiene
2
rXY
<1
2
rXY
1.3
1.3
1.3
.76
.81
.78
1.7
1.7
1.7
.48
.50
.45
Finalmente tenemos
XiYi = 9.645
X = 0.8
Y = 1.21
Xi2
1
= 15.48
Xi Yi nX Y
X i Yi nX 2
1 = -0.8290
1X
0 Y
= 1.8732 0.8290 Xi
Y
2.0
absorcin
intestinal
1.0
0.33
0.7
Cantidad de vitamina
1.3
B12
1.7
ingeri
da
de 1.87% en el intestino.
vs
Ha: 1 1*
Ho: 1 > 1*
vs
Ha: 1 < 0*
Ho: 1 < 0*
vs
Ha: 1 > 0*
ESTADISTICO DE PRUEBA
S 1
*
to 1 1
S 1
Yi2 nY 2 1 XY nXY
n2
XY 2 nX 2
Valor de tablas
t(/2,n-2)
(dos colas)
t(,n-2)
(una cola)
1* = cualquier constante.
ULTIMA TAREA
1.
2.
3. Suponga que el peso neto por cerdo de una piara tiene una media de
70 kg y una desviacin estndar de 20 kg. Se toma una muestra de 20
cerdos y su peso respectivo. Cul es la probabilidad de que la media
muestral se encuentre entre 60 y 80 kg? Suponga distribucin normal
de los pesos.
a) De qu tamao tendra que ser la muestra para que la probabilidad
calculada sea de 0.90
4.
5. Defina lo siguiente:
a) Hiptesis estadstica
b) Nivel de significancia
c) Error tipo I y Error tipo II
6. Una empresa produce un nuevo bactericida comercial, que contiene
un componente especfico de 200 ppm ()
Un laboratorio le propone un nuevo producto cuyo componente
especfico contiene mayor concentracin en ppm y a la empresa le
interesara el producto, si tuviera al menos 300 ppm.
Se realiza un muestreo del nuevo producto con 25 observaciones y
se sabe que = 20 y se supone que es la misma para el nuevo
producto.
45
34
36
45
34
30
23
10
22
23
33
21
56
18
44
21
33
67
44
23
Incremento
Peso
12
2.4
14
3.0
10
5.9
11
3.9
20
6.6
8
2.5
7
4.3
Encontrar la ecuacin de regresin lineal simple que mejor se ajuste a
los datos.
Bibliografa:
Chao L.L. 1975. Estadstica para las ciencias administrativas. 2
Edicin. McGraw-Hill. Mxico.
Infante G.S. y Zrate De L.G. Mtodos estadsticos.
Prez V.