Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Hctor Varela V.
Parmetros poblacionales
Media :
Varianza :
Desv. Est. :
Proporcin :
Hctor Varela V.
Estimadores puntuales
Muestra aleatoria simple
x1 , x2 ,..., xn
= X
2 = S 2 =
n
2
(x X )
i
i =1
n 1
= S = S 2
Las estadsticas de muestras se aproximan a los parmetros
poblacionales
Hctor Varela V.
MUESTRA
F re q u e n c y
10
0
80
Hctor Varela V.
85
90
S X2
SX
95
x1 , x2 ,, xn
m.a.s.
C
Datos dicotmicos
1
xi =
0
n
xi
p = i =1 =
n
Hctor Varela V.
p Pr ob(C )
n
7
18
=
= 3
6
Hctor Varela V.
Caracterstica X
1
2
3
3
4
5
5
=
3
2
Muestras de Tamao 2
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Hctor Varela V.
elementos
AB
AC
AD
AE
AF
BC
BD
BE
BF
CD
CE
CF
DE
DF
EF
suma
Xi
1+2= 3
1+3= 4
1+3= 4
1+4= 5
1+5= 6
2+3= 5
2+3= 5
2+4= 6
2+5= 7
3+3= 6
3+4= 7
3+5= 8
3+4= 7
3+5= 8
4+5= 9
1,5
2,0
2,0
2,5
3,0
2,5
2,5
3,0
3,5
3,0
3,5
4,0
3,5
4,0
4,5
k : N de muestras
de tamao 2
3,0
Frequency
2,5
2,0
N
=
k =
15
n
1,5
1,0
0,5
0,0
1,5
2,0
2,5
3,0
C1
=
Promedio de los promedios
3,5
=
X
4,0
4,5
X=
i
Promedio es un estimador
insesgado de
45
= 3
15
2
2
X
i
2
X
= =
=
Varianza de los promedios
X
k
3
Hctor Varela V.
10
Muestras de Tamao 4
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Hctor Varela V.
elementos
suma
Xi
ABCD
ABCE
ABCF
ABDE
ABDF
ABEF
ACDE
ACDF
ACEF
ADEF
BCDE
BCDF
BCEF
BDEF
CDEF
1+2+3+3= 9
1+2+3+4= 10
1+2+3+5= 11
1+2+3+4= 10
1+2+3+5= 11
1+2+4+5= 12
1+3+3+4= 11
1+3+3+5= 12
1+3+4+5= 13
1+3+4+5= 13
2+3+3+4= 12
2+3+3+5= 13
2+3+4+5= 14
2+3+4+5= 14
3+3+4+5= 15
2,25
2,50
2,75
2,50
2,75
3,00
2,75
3,00
3,25
3,25
3,00
3,25
3,50
3,50
3,75
11
Frequency
2,5
k : N de muestras
de tamao 4
= 15
2,0
1,5
1,0
0,5
0,0
2,25
2,50
2,75
3,00
C2
3,25
3,50
3,75
=
Promedio de los promedios
Promedios de
las Muestras
=
X
=
Varianza de los promedios
Hctor Varela V.
X=
2
=
X
45
= 3
15
k X2 1
=
k
6
2
i
12
1.
2.
x =
x
n
Hctor Varela V.
13
Intervalos de confianza
Porqu preocuparse de los intervalos de confianza?
Las estadsticas muestrales tales como el promedio y la desviacin
estndar son solamente estimaciones de y poblacional y estn
basados solamente en una muestra.
Puesto que, en estas estimaciones existe variabilidad de muestra a
muestra, se puede cuantificar la incerteza usando Intervalos de
Confianza basados en estadsticas muestrales.
Los Intervalos de Confianza reflejan la variacin de muestra a
muestra de nuestros puntos de estimacin.
Si por ejemplo, se calculan Intervalos de Confianza (IC) del 95%,
stos se interpretan como tal;
Aproximadamente 95 de 100 IC (intervalos de confianza)
contendrn el parmetro de la poblacin, o
Se est 95% cierto que el parmetro de la poblacin est
contenido en el intervalo.
Hctor Varela V.
14
Media poblacional
Hctor Varela V.
15
s
s
X + t/2, n-1
) = 1
n
n
t ( n 1)
1
t 2 ,( n 1)
Hctor Varela V.
t 2 ,( n 1)
16
Hctor Varela V.
17
X - t/2, n-1
s
s
X + t/2, n-1
n
n
s
= Error estndar (SE)
n
t/2, n-1
X - t /2, n-1
Hctor Varela V.
s
n
s
= Error de estimacin
n
s
n
X + t /2, n -1
18
z(1 2 )
S 2
n =
d0
Hctor Varela V.
19
Hctor Varela V.
20
Tamao Potencia
de la
del Potencia
Diferencia muestra objetivo
real
0,1
334
0,5 0,500757
Hctor Varela V.
21
( n 1) S
Pr(
2
X
2
( n 1,1 2)
0.12
0.1
(n 1) S
2
X
2
( n 1, 2)
) =1
2
( n1)
0.08
0.06
0.04
0.02
0
0
Hctor Varela V.
(2n1, 52)
10
215
( n 1,1 2)
20
25
30
22
Hctor Varela V.
23
Hctor Varela V.
24
n=
( )
z(1
d0
n
Si
> 0.05
N
N : Tamao poblacional
n0 =
n
Si
0.05
N
Hctor Varela V.
n
n
1+
N
calculado
25
Ejemplo
Un rea de suelo en estudio, est dividida en 130 cuadrantes
1
2
5
3
6
12
4
7
13
8
14
21
9
15
22
31
10
16
23
32
43
11
17
24
33
44
18
25
34
45
56
19
26
35
46
57
20
27
36
47
58
68
28
37
48
59
69
78
29
38
49
60
70
79
87
30
39
50
61
71
80
88
95
40
51
62
72
81
89
96
102
108
41
52
63
73
82
90
97
103
109
113
117
121 122
125 126 127
129 130
42
53
64
74
83
91
98
104
110
114
118
123
128
54
65
75
84
92
99
105
111
115
119
124
55
66
76
85
93
100
106
112
116
120
26
67
77
86
94
101
107
Actual Power
0,500095
n = 93
n
93
= = 0, 7154 > 0, 05
N 130
El tamao de muestra est dado por
n
93
n0
=
=
= 54, 21 55cuadrantes
n 1, 7154
1+
N
Hctor Varela V.
27
Pruebas de Hiptesis
Un problema de estimacin incluye un parmetro poblacional , para
el cual no se tiene una nocin preconcebida de su valor
En tales casos, con base en una muestra aleatoria simple se obtiene
una aproximacin (estimacin) a este valor (puntualmente y por
intervalos de confianza)
Ahora bien, si se tiene una conjetura de su valor, significa que se est
estableciendo una hiptesis respecto del parmetro
Es decir, se est proponiendo una teora respecto del valor (o los valores)
del parmetro
Esta teora debe ser contrastada con la realidad mediante una muestra
aleatoria simple de la poblacin
Hctor Varela V.
28
Pruebas de Hiptesis
Las pruebas de hiptesis se realizan en todos los mbitos en los cuales
puede contrastarse la teora con la realidad
Probar una hiptesis implica tomar una decisin al comparar la muestra
observada respecto de la conjetura para el parmetro poblacional
(realidad)
Una prueba estadstica consiste en verificar una hiptesis respecto de
uno o ms valores de los parmetros
Es decir, probar su validez indicando (antes de tomar la muestra) qu
grado de evidencia es necesario para no rechazar la conjetura
Hctor Varela V.
29
Entrada A
Entrada B
Proceso
Productos o servicios
Entrada C
30
Hiptesis
En toda prueba estadstica participan dos hiptesis o teoras
La hiptesis propuesta por el observador y una negacin de esta
hiptesis
La primera, se denomina hiptesis alternativa o hiptesis de
investigacin, denotada por HA
La segunda, se denomina hiptesis nula y se denota por H0
El propsito del test de hiptesis es demostrar el fundamento de la
hiptesis alternativa, si tal fundamento se justifica
O decidir si los datos tienden a refutar la hiptesis nula
Hctor Varela V.
31
32
Planteamiento de hiptesis
Hiptesis nulas
H 0 : 0 (conocido)
H 0 : 1 2
Hiptesis alternativas
H 0 : 0 (bilateral )
H 0 : 1 2 (bilateral )
H 0 : 0 (unilateral )
H 0 : 1 2 (unilateral )
H 0 : 0 (unilateral )
H 0 : 1 2 (unilateral )
Hctor Varela V.
33
P=
(Re chazar H 0 / H 0 verdadera ) error de tipo I
se debe establecer antes de capturar los datos
P=
( No rechazar H 0 / H 0 falsa ) error de tipo II
Hctor Varela V.
34
Muestra / Pruebas
(Decisin)
VERDAD
Poblacin / Realidad
NO RECHAZAR Ho
Ho
VERDADERA
Decisin
correcta
Ho
FALSA
Error tipo II
Hctor Varela V.
RECHAZAR Ho
Error tipo I
Decisin
correcta
35
36
37
1
El error de tipo II y la potencia del test dependen de la hiptesis
alternativa
Por lo tanto, de la magnitud de la diferencia entre el valor del parmetro
en la hiptesis nula y el valor del parmetro en la hiptesis alternativa
Hctor Varela V.
38
Entradas X
Hctor Varela V.
Continuas
Cualitativas/
Categorizadas
Continuas
Regresin Lineal
Regresin no
lineal
Regresin
Logstica
Cualitativas/
Categorizadas
Comparaciones
de medias,
medianas,
varianzas, DOE
Comparaciones
de proporciones.
Pruebas chicuadrado
39
Hip. nula
H 0 : 0
Hip. Alt
H A : 0
Hip. Alt1
H A : 0
Hip. Alt 2
H A : 0
Hctor Varela V.
40
x1 , x2 ,, xn m.a.s. de la poblacin
Estadstico de prueba de H0
( X 0 ) n
t( n1)
t0
S
Hctor Varela V.
41
H 0 : 0 vs H A : 0
t ( n 1)
1
2
t( n1;1 2)
t( n1;1 2)
Rechazar H0 si
t0
( X 0 ) n
t( n1;1 2)
S
Rechazar H0 si
O si,
t0
( X 0 ) n
t( n1;1 2)
S
p valor
p=
valor Pr ob(t( n 1) t0 ) + Pr ob(t( n 1) t0 )
Hctor Varela V.
42
H 0 : 0 vs H A : 0
t ( n 1)
t( n1;1 )
Rechazar H0 si
Rechazar H0 si
t0
( X 0 ) n
t( n1;1 )
S
p valor
p valor
= Pr ob(t( n 1) t0 )
Hctor Varela V.
43
H 0 : 0 vs H A : 0
t ( n 1)
t( n1;1 )
Rechazar H0 si
t0
( X 0 ) n
t( n1;1 2)
S
Rechazar H0 si
p valor
p=
valor Pr ob(t( n 1) t0 )
Hctor Varela V.
44
EJEMPLO
Se enviaron a 14 laboratorios soluciones estandarizadas que se
prepararon con un contenido de oxgeno disuelto de 1.2 mg/L. Se
solicit a los laboratorios que midieran la concentracin de oxgeno
disuelto usando el mtodo de titulacin de Winkler. Las
concentraciones reportadas por los laboratorios en mg/L estn en el
archivo OD.MTW.
En promedio miden los laboratorios 1.2 mg/L, o existe algn sesgo?.
H 0 : = 1.2
v/s
H A : 1.2
Hctor Varela V.
45
OD.MTW
Seleccionar la
hiptesis alternativa
Hctor Varela V.
46
T=
x 0
s/ n
1,2
= 1,39643
0,30538
14
Variable
OD
Error
estndar
de la
N
Media Desv.Est. media
14
1,3643 0,2453 0,0656
IC de 95%
(1,2227. 1,5059)
T
2,51
P
0,026
47
Hctor Varela V.
48
=
H 0 : d 0=
d Media de las diferencias
H A : d 0
pareadas en la poblacin
H A : d > 0
H A : d < 0
Hctor Varela V.
49
( xi , yi )
Muestra de pares;
i = 1,2,, n
Estadstico de prueba de H0
t0 =
t0 ~ t-student (n - 1)
Sd
n
di ( xi yi )
=i 1 =i 1
=
d =
,
n
n
Hctor Varela V.
2
d
d
(
)
i
=i 1
=
Sd
n 1
50
Estudio Interlaboratorio
El archivo T-pareado.MTW contiene mediciones de oxgeno
disuelto obtenidas en 14 laboratorios. Cada laboratorio realiz
las mediciones usando el mtodo Winkler (titulacin) y el mtodo
electrodo. predicen diferentes concentraciones de oxgeno
disuelto los dos mtodos?
H 0 : d = 0 vs H A : d 0
d= media de las diferencias de los mtodos Winkler y electrodo
Hctor Varela V.
51
Hctor Varela V.
52
Winkler
Electrodo
Diferencia
N
14
14
14
Media
1,3929
1,7214
-0,329
Error
estndar
de la
Desv.Est. media
0,3050 0,0815
0,3068 0,0820
0,494
0,132
Hctor Varela V.
53
Homogeneidad de Varianzas
Para comparar medias de dos poblaciones, se debe verificar
que las varianzas poblacionales son iguales
Hiptesis
H0 : = 2
2
1
H A : 1 2
2
H A : 1 > 2
2
H A : 1 < 2
2
Hctor Varela V.
Estadstico de prueba de H0
S12
F0 = 2
S2
54
Ejemplo
H 0 : A2 = B2
H 0 : A2 B2
Hctor Varela V.
Balde A
Balde B
T Llenado
T Llenado
22
25
24
29
27
23
22
23
21
20
22
23
19
24
20
29
21
21
26
19
23
11
24
28
20
21
30
17
17
23
55
Baldes.MTW
56
Hctor Varela V.
57
Estadsticas
Variable N Desv.Est. Varianza
Balde A 15
2,658
7,067
Balde B 15
5,057 25,571
Relacin de deviaciones estndar = 0,526
Relacin de varianzas = 0,276
IC para
relacin de
varianza
(0,093. 0,823)
(0,058. 1,119)
Pruebas
Mtodo
Prueba F (normal)
Prueba de Levene (cualquiera continua)
Hctor Varela V.
GL1 GL2
14
14
1 28
Estadstica
de prueba
0,28
3,67
Valor P
0,022
0,066
58
Hip. nula
H 0 : 1 2
H 0 : 1 2 0
Hip. Alt
H A : 1 2
H A : 1 2 0
Hip. Alt1
H A : 1 2
H A : 1 2 0
Hip. Alt 2
H A : 1 2
H A : 1 2 0
Supuestos
Muestras aleatorias independientes
Distribuidas aproximadamente normales
Con varianzas iguales
Hctor Varela V.
59
Estadstico de prueba de H0
x1 , x2 , , xn m.a.s. de N ( 1 , )
2
y1 , y2 , , ym m.a.s. de N ( 2 , 2 )
Independientes
t0
Hctor Varela V.
X Y
(n 1) S (m 1) S
nm2
2
X
2
Y
1 1
n m
t( nm2)
60
Ejemplo
H 0 : 1 2 0
H A : 1 2 0
Diesel.MTW
Hctor Varela V.
Marca A Marca B
4,2
4,4
3,1
3,2
4,8
4,9
5,9
5,9
5,8
5,8
6,4
6,5
2,2
2,2
4,3
4,5
5,7
5,7
3,3
3,6
3,8
3,8
2,7
2,8
2,5
2,6
3,5
3,4
3,7
3,8
61
Chequear Supuestos
Tests de normalidad:
Marca A: p-value = 0.456
Marca B: p-value = 0.586
Suponer que los datos son normales
Hctor Varela V.
62
Hiptesis alternativa
Hctor Varela V.
63
N
Marca A 15
Marca B 15
Error
estndar
de la
Media Desv.Est.
media
4,13
1,33
0,34
4,21
1,32
0,34
64
Si se rechaza la hiptesis
H 0 : 1 2 0
t
'
0
X Y
S X2
SY2
Hctor Varela V.
65
Ejemplo
Para el caso de los tiempos de llenados de baldes, se encontr que
existe evidencia de varianzas diferentes. Y se desea comparar los
tiempos medios de llenado en cada balde
Baldes.MTW
Para varianzas
desiguales
Hctor Varela V.
66
N
Marca A 15
Marca B 15
Media
4,13
4,21
Error
estndar
de la
Desv.Est. media
1,33
0,34
1,32
0,34
67
ANALISIS DE VARIANZA
El anlisis de varianza es til cuando se desea comparar las
medias de un solo factor en dos o ms niveles
Hctor Varela V.
Qu pasa si la varianza de la
respuesta aumenta? Existe una
diferencia entonces?
68
Anlisis de varianza
Hiptesis
H 0 : 1 = 2 = ...... =
HA: Alguna diferencia existe entre las medias poblacionales
Hctor Varela V.
69
Toma de muestras
y
y
11
21
,y
,y
12
22
, ...... , y
1n
1
, ...... , y
2 n2
m.a.s. de N ( , 2 )
1
m.a.s. de N ( , 2 )
2
k1
,y
k2
, ...... , y
knk
m.a.s. de N ( , 2 )
k
Independientes
Hctor Varela V.
70
Clculos previos
k ni
Y.. = yij ,
i =1 j =1
Y=
k ni
yij
i =1 j =1
Hctor Varela V.
Yi. =
Y..
= ,
n
ni
yij ,
j =1
Yi =
ni
yij
j =1
ni
k
= ni
i =1
Yi.
=
ni
71
Variacin
Total
STC
Suma Total
de Cuadrados
Variaciones
entre grupos
SCE
Suma de Cuadrados
entre grupos
Variaciones dentro de
grupos o debida al
ruido experimental
SCD
Suma de Cuadrados
dentro de grupos
o
Suma de Cuadrados
del Error
Hctor Varela V.
72
73
Tabla ANOVA
Fuente de Variacin
S. C.
Grados de
libertad
Cuadrados
Medios
F Obs.
Factor
(entre grupos)
SCE
k-1
CME
CME/CMD
Valor-p
Error
(dentro de grupos)
SCD
n-k
CMD
Total
STC
n-1
k:
n:
F:
P:
Hctor Varela V.
N de grupos.
N total de observaciones
Estadstico de prueba de H0
valor-p
74
Homogeneidad de Varianzas
Muchos test estadsticos para diferencia entre medias
asumen que las varianzas son iguales.
Se debe verificar si las varianzas son iguales.
Hctor Varela V.
Test de Bartlett
75
Ejemplo
Se recolectaron muestras de agua en cuatro lugares distintos de un ro para
determinar si la cantidad de oxgeno disuelto, esto es, una medida de la
contaminacin del agua, vara de un lugar a otro. Los lugares 1 y 2 se escogieron
antes de pasar por una planta industrial, uno cerca de la orilla y el otro a mitad
del ro, el lugar 3 se tom adyacente a la descarga de agua industrial de la planta
y el lugar 4 se tom ro abajo a mitad del ro. Se seleccionaron cinco muestras de
agua en cada lugar, pero se perdi una muestra del lugar 4 en el laboratorio. Los
datos se presentan en la siguiente tabla (a mayor contaminacin menor es la
lectura de oxgeno disuelto).
Lugar
1
2
3
4
Hctor Varela V.
Contenido de oxgeno
disuelto
5.9
6.3
4.8
6.0
6.1
6.6
4.3
6.2
6.3
6.4
5.0
6.1
5.9
6.5
4.7
5.8
5.8
6.4
5.1
76
H 0 : 1 = 2 = 3 = 4
v/s
Hctor Varela V.
77
Lugar
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
Oxgeno Disuelto.MTW
Datos apilados
Hctor Varela V.
78
H 0 : 12 = 22 = 32 = 42
Estadsticas > Anova > Prueba de varianzas iguales
Hctor Varela V.
79
N
5
5
5
4
Inferior
0,078302
0,060191
0,164417
0,084143
Desv.Est.
0,148324
0,114018
0,311448
0,170783
Superior
0,61536
0,47303
1,29212
1,02416
Hctor Varela V.
80
Comparacin de medias
Los comandos para el anlisis de varianza con Minitab dependen de la
disposicin de los datos en la planilla
Datos en una columna y el factor en otra.
Hctor Varela V.
81
H 0 : =
=
=
4
1
2
3
Fuente GL
SC
CM
F
P
Lugar
3 7,8361 2,6120 63,66 0,000
Error
15 0,6155 0,0410
Total
18 8,4516
Nivel
1
2
3
4
N
5
5
5
4
Media
6,0800
6,4400
4,7800
6,0250
Desv.Est.
0,1483
0,1140
0,3114
0,1708
82
Hctor Varela V.
83
N
5
5
4
5
Media Agrupacin
6,4400 A
6,0800 A B
6,0250
B
4,7800
C
Superior -------+---------+---------+---------+-0,7296
(--*--)
-0,9304 (--*--)
0,3370
(---*--)
-------+---------+---------+---------+--1,2
0,0
1,2
2,4
84
Inferior
-2,0296
-0,8070
Centro
-1,6600
-0,4150
Hctor Varela V.
85
Chequear residuos
Re siduo= Yij Yi
Hctor Varela V.
86
Hctor Varela V.
87
Hctor Varela V.
88
Estadsticas no paramtrica
Los tests de hiptesis desarrollados hasta aqu deben
satisfacer supuestos. Ahora bien, si alguno de los
supuestos no se satisface se debe acudir a los test no
paramtricos o de libre distribucin
Los tests no paramtricos son aplicables a pruebas de
hiptesis cuando las distribuciones son no normales
Hctor Varela V.
89
H 0 : Mediana 1 = Mediana 2
90
(n = 5)
(m = 6)
1.5 1.8 1.9 2.1 2.5 2.6 2.7 3.4 3.6 3.7 3.9
Rangos
Hctor Varela V.
9 10
11
91
Estadstico de prueba de H0
n
= R1i
i =1
(Wilcoxon)
n ( n + 1)
U =W
2
Uso de
software
estadstico
Hctor Varela V.
(Mann - Whitney)
Se rechaza H0 si p value
No se rechaza H0 p value >
92
Ejemplo
El archivo Stock.MTW registra datos de concentraciones segn
dos tipos de stock. El cobre toral (Cut) no satisface los supuestos
de normalidad para comparar las concentraciones medias por el
test-t para muestras independientes
Hctor Varela V.
93
Stock.MTW
Columnas
no apiladas
Hctor Varela V.
94
No diferencia significativa
Hctor Varela V.
95
m.a.s. de Poblacin 1
Hctor Varela V.
96
ni
i =1
2
k
R
12
i 3( n + 1)
K=
n( n + 1)
n
i =1 i
Hctor Varela V.
2
( k 1)
97
Ejemplo
El archivo Rechazo.MTW registra datos de tiempos de reproceso de
ctodos. Los tiempos de instalacin de sellos no satisfacen los
supuestos estndares para comparar tiempos medios por turnos
mediante anlisis de varianza
Hctor Varela V.
98
Turno
1
2
3
General
N
16
24
24
64
Mediana
0,3550
0,3500
0,4750
Clasificacin
del promedio
28,4
26,0
41,8
32,5
Z
-1,02
-2,16
3,08
H = 9,63 GL = 2 P = 0,008
H = 9,69 GL = 2 P = 0,008 (ajustados para los vnculos)
Hctor Varela V.
diferencias significativas
99