Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADISTICA
Prof. Ing.
Elaborado por:
Briceo Eraine C.I 20.712.536
Definicin de Hiptesis
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o
ms poblaciones. Muchos problemas de ingeniera, ciencia, y administracin, requieren que se
tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta
proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia
estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de
hiptesis.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se
centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir
si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal
como
Ho;
= 50 cm/s
H1;
La proposicin Ho;
proposicin H1;
50 cm/s
conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular
una hiptesis alternativa unilateral, como en
Ho;
= 50 cm/s Ho;
= 50 cm/s
H1;
> 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras
diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del
parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo
de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta
informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si
esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse
hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible
en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba
de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la
hiptesis del investigador.
= 50 cm/s
50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un estimador
de la media verdadera de la poblacin. Un valor de la media muestral
valor hipottico
es
realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula H o. Por otra parte, una media
muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa
H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula H o;
entonces se acepta la hiptesis alternativa H1;
Los valores de
= 50 cm/s, y que si
<48.5
>51.5,
50 cm/s.
que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5
51.5
forman la regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben
el nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la
hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la
regin crtica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente
propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede
observarse un valor del estadstico de prueba
nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del
5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia
sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50
cm/s, aunque la media muestral
Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.
El error tipo II error
falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes
que determinan si la decisin final es correcta o errnea.
Decisin
Ho es verdadera
Ho es falsa
Aceptar Ho
No hay error
Error tipo II
Rechazar Ho
Error tipo I
No hay error
1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno
por lo general tiene como resultado un aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir
4. Si la hiptesis nula es falsa,
de forma simultnea.
aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor
Pasos para establecer un ensayo de hiptesis
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como el
tipo de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere evaluar
el universo de donde proviene la muestra. En este punto se determina el tipo de ensayo
(unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el
cual se obtiene dependiendo del valor de
funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis deber
Caractersticas de la hiptesis
1.-Debe referirse a una situacin real, social realizable.
2.-Las variables de la hiptesis deben ser comprensibles, estar bien definidas y ser lo ms
concretas posibles.
3.-La relacin entre variable propuesta por una hiptesis deben ser claras y ser lo ms
concretas posibles.
4.-Los trminos de la hiptesis y la relacin planteada entre ellos deben ser observables y
medibles.
5.-La hiptesis debe estar relacionada con tcnicas disponibles para probarlas.
> - 1.645
/ n
2. proporciones.
Aqu S=P, la proporcin de xitos en una muestra; s= p= P, donde P es la proporcin de
xitos en la poblacin y n es el tamao de la muestra.
s= p= pq/n donde q= 1 p
La variable tipificada viene dada por
Z= P- p
pq/n
En el caso de que P= X/n, donde X es el nmero real de xitos en una muestra, se convierte en
Z= X np
n.pq
Diferencia de medias
x1 X2 = 0
x1 - x2 = 21 + 22
n1
n2
x1 X2
Diferencia de proporciones
p1 P2 = 0
p1 P2 = p (1 p) (1 + 1)
n1
n2
Z= P1 P2 0 = P1 P2
p1 P2
p1 P2
1. medias
Para ensayar la hiptesis Ho de que una poblacin normal tiene media utilizamos.
T= x - n 1 = x - n
S
Diferencia de medias
T= x1 - x2
1 + 1
n1
n1 + n 2
n2
2. Varianzas
Para ensayar la hiptesis Ho de que una poblacin normal tiene varianza 2consideramos la
variable aleatoria.
X2= ns2 = (n 1) 2
2
Relaciones de varianza
F = S21/ 21
22/ 22
Problemas de hiptesis
20
3. Verificacin.
Valor obtenido de la media de la muestra: 18.5.
4. Decisin
Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.
2) El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la
produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin.
Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media
300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote
producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el
tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo
sigue siendo Normal con la misma desviacin tpica:
Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de
significacin del 2%?
1. Enunciamos las hiptesis nula y alternativa:
H0 : 300
H1 : < 300
2. Zona de aceptacin
= 0.02; 1- = 0. 98;
P(1.96)= 0. 98;
z = 1.96 .
= 0.05
z = 1.96.
100
3. Verificacin.
Valor obtenido de la media de la muestra: 2320.
4. Decisin
Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.
Distribucin Normal
En estadstica y probabilidad se
llama distribucin
normal, distribucin
de
etc.
La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por
Distribucin
de
probabilidad
alrededor
la
media en una
(, 2).
distribucin
de
Luego, el 5,48% del lote (548 lmparas) no llegarn probablemente a durar 60 meses
2. El consumo medio bimestral de energa elctrica en una ciudad es de 59 Kwh., con una
desviacin tpica de 6 Kwh. Se supone que se distribuye segn una distribucin normal.
a) Cuntos Kwh. tendra que consumir bimestralmente para pertenecer al 5% de la
poblacin que ms consume?. b) Si usted consume 45 Kwh. qu % de la poblacin
consume menos que usted?
a) Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el
0,95 (95%), por lo que por arriba estara el 5% restante. Este valor corresponde a t =
1,645. Ahora calculamos la variable normal X equivalente a ese valor de la normal
tipificada:
Por lo tanto, tendra usted que consumir ms de 67,87 Kwh. bimestralmente para pertenecer al
5% de la poblacin que ms consume
b) Vamos a ver en que nivel de la poblacin se situara usted en funcin de los 45 Kwh.
consumidos.
Distribucin t de student
En probabilidad y estadstica,
probabilidad que
surge
del
la distribucin
problema
t (de
Student)
de estimar la media de
es
una distribucin
de
unapoblacin normalmente
Donde
Z es una variable aleatoria distribuida segn una normal tpica (de media nula
y varianza 1).
V es una variable aleatoria que sigue una distribucin con
grados de libertad.
Z y V son independientes
1-a
0.75
0.80
0.85
0.90
0.95
0.975
0.99
0.995
1.000
1.376
1.963
3.078
6.314
12.706
31.821
63.657
0.816
1.061
1.386
1.886
2.920
4.303
6.965
9.925
0.765
0.978
1.250
1.638
2.353
3.182
4.541
5.841
0.741
0.941
1.190
1.533
2.132
2.776
3.747
4.604
0.727
0.920
1.156
1.476
2.015
2.571
3.365
4.032
0.718
0.906
1.134
1.440
1.943
2.447
3.143
3.707
0.711
0.896
1.119
1.415
1.895
2.365
2.998
3.499
0.706
0.889
1.108
1.397
1.860
2.306
2.896
3.355
0.703
0.883
1.100
1.383
1.833
2.262
2.821
3.250
10
0.700
0.879
1.093
1.372
1.812
2.228
2.764
3.169
11
0.697
0.876
1.088
1.363
1.796
2.201
2.718
3.106
12
0.695
0.873
1.083
1.356
1.782
2.179
2.681
3.055
13
0.694
0.870
1.079
1.350
1.771
2.160
2.650
3.012
14
0.692
0.868
1.076
1.345
1.761
2.145
2.624
2.977
15
0.691
0.866
1.074
1.341
1.753
2.131
2.602
2.947
16
0.690
0.865
1.071
1.337
1.746
2.120
2.583
2.921
17
0.689
0.863
1.069
1.333
1.740
2.110
2.567
2.898
18
0.688
0.862
1.067
1.330
1.734
2.101
2.552
2.878
19
0.688
0.861
1.066
1.328
1.729
2.093
2.539
2.861
20
0.687
0.860
1.064
1.325
1.725
2.086
2.528
2.845
21
0.686
0.859
1.063
1.323
1.721
2.080
2.518
2.831
22
0.686
0.858
1.061
1.321
1.717
2.074
2.508
2.819
23
0.685
0.858
1.060
1.319
1.714
2.069
2.500
2.807
24
0.685
0.857
1.059
1.318
1.711
2.064
2.492
2.797
25
0.684
0.856
1.058
1.316
1.708
2.060
2.485
2.787
26
0.684
0.856
1.058
1.315
1.706
2.056
2.479
2.779
27
0.684
0.855
1.057
1.314
1.703
2.052
2.473
2.771
28
0.683
0.855
1.056
1.313
1.701
2.048
2.467
2.763
29
0.683
0.854
1.055
1.311
1.699
2.045
2.462
2.756
30
0.683
0.854
1.055
1.310
1.697
2.042
2.457
2.750
40
0.681
0.851
1.050
1.303
1.684
2.021
2.423
2.704
60
0.679
0.848
1.046
1.296
1.671
2.000
2.390
2.660
120
0.677
0.845
1.041
1.289
1.658
1.980
2.358
2.617
0.674
0.842
1.036
1.282
1.645
1.960
2.326
2.576
Ejemplo: Los valores de las matriculas de estudiantes en una universidad privada tienen un
comportamiento aproximadamente normal, donde el promedio es de 2.100.000. Se seleccionan 8
liquidaciones, siendo los valores los siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000,
2.250.000, 1.950.000, 2.050.000, 2.350.000. Determine la probabilidad de que:
El promedio sea menor de 2.000.000.
El promedio se encuentre entre 2.000.000 y 2.200.000
El promedio sea mayor o igual a 2.500.000
Solucin manual:
Sea X = Liquidacin matriculas.
m = 2.100.000 ; s = ?
=2.098.750 s=168.644.8085 n=8
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
La probabilidad se encuentra entre 0.9 y 0.95, segn la tabla T que se encuentra ms
adelante, no obstante, al t ser negativo, la probabilidad est entre 0.1 y 0.05, es decir, los valores
complementarios..
Para buscar en la tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se encuentra
entre los valores mencionados. De ah que sea importante utilizar el Excel, que nos permite
calcular la probabilidad exacta.
b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( 2.000.000).
Luego de tipificar, se tiene:
P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92
Existe una alta probabilidad de que el promedio de las matriculas se encuentre entre 2.000.000 y
2.200.000.
Propiedades
1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos
la altura en metros o en centmetros el coeficiente de correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es
positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la
covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e
inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
Ejercicio
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
186
85
189
85
190
86
192
90
193
87
193
91
198
93
201
103
203
100
205
101
Y/X
100
50
25
14
18
22
xi
yi
fi
xi fi xi2 fi yi fi yi2 fi xi yi fi
100
14
100
10 000 14
196
1 400
100
18
200
20 000 36
648
3 600
50
14
50
2 500 14
196
700
50
18
150
7 500 54
972
2 700
50
22
50
2 500 22
484
1 100
25
22
50
1 250 44
968
1 100
10
600
43 750 184
3 464 10 600