Sei sulla pagina 1di 25

Universidad Nororiental Privada

Gran Mariscal de Ayacucho


Facultad de Ingeniera
Escuela de Ingeniera de Mantenimiento
Ncleo Anaco - Estado Anzotegui.

ESTADISTICA

Prof. Ing.

Elaborado por:
Briceo Eraine C.I 20.712.536

Anaco, 02 de FEBRERO de 2016.

Definicin de Hiptesis
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o
ms poblaciones. Muchos problemas de ingeniera, ciencia, y administracin, requieren que se
tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta
proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia
estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de
hiptesis.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se
centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir
si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal
como
Ho;

= 50 cm/s

H1;
La proposicin Ho;
proposicin H1;

50 cm/s

= 50 cm/s, se conoce como hiptesis nula, mientras que la

50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis

alternativa especifica valores de

que pueden ser mayores o menores que 50 cm/s, tambin se

conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular
una hiptesis alternativa unilateral, como en
Ho;

= 50 cm/s Ho;

= 50 cm/s

H1;

< 50 cm/s H1;

> 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras
diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del
parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo
de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta
informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si
esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse
hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible
en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba
de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la
hiptesis del investigador.

La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia


muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a H o, se contina
creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis
por prueba de hiptesis son rechazar Ho o no rechazar Ho.
Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio de
combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s.
Esto es, se desea probar:
Ho;
H1;

= 50 cm/s
50 cm/s

Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un estimador
de la media verdadera de la poblacin. Un valor de la media muestral
valor hipottico

que este prximo al

= 50 cm/s es una evidencia de que el verdadero valor de la media

es

realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula H o. Por otra parte, una media
muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa
H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
51.5, entonces no se rechaza la hiptesis nula H o;
entonces se acepta la hiptesis alternativa H1;
Los valores de

= 50 cm/s, y que si

<48.5

>51.5,

50 cm/s.

que son menores que 48.5 o mayores que 51.5 constituyen la regin

crtica de la prueba, mientras que todos los valores que estn en el intervalo 48.5

51.5

forman la regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben
el nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la

hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la
regin crtica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente
propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede
observarse un valor del estadstico de prueba

que cae en la regin crtica. En este caso, la

hiptesis nula Ho ser rechazada en favor de la alternativa H1cuando, de hecho, Ho en realidad es


verdadera. Este tipo de conclusin equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hiptesis nula H o cuando sta es verdadera.
Tambin es conocido como

nivel de significancia.

Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del
5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia
sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50
cm/s, aunque la media muestral

caiga dentro de la regin de aceptacin. En este caso se acepta

Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.
El error tipo II error

se define como la aceptacin de la hiptesis nula cuando sta es

falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes
que determinan si la decisin final es correcta o errnea.

Decisin

Ho es verdadera

Ho es falsa

Aceptar Ho

No hay error

Error tipo II

Rechazar Ho

Error tipo I

No hay error

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno
por lo general tiene como resultado un aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir
4. Si la hiptesis nula es falsa,

de forma simultnea.

es un mximo cuando el valor real del parmetro se

aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor
Pasos para establecer un ensayo de hiptesis
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como el
tipo de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere evaluar
el universo de donde proviene la muestra. En este punto se determina el tipo de ensayo
(unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el
cual se obtiene dependiendo del valor de

(Error tipo I o nivel de significancia) o en

funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis deber

ser argumentada correctamente para tomar la decisin, la cual estar en funcin de la


hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.

Caractersticas de la hiptesis
1.-Debe referirse a una situacin real, social realizable.
2.-Las variables de la hiptesis deben ser comprensibles, estar bien definidas y ser lo ms
concretas posibles.
3.-La relacin entre variable propuesta por una hiptesis deben ser claras y ser lo ms
concretas posibles.
4.-Los trminos de la hiptesis y la relacin planteada entre ellos deben ser observables y
medibles.
5.-La hiptesis debe estar relacionada con tcnicas disponibles para probarlas.

Ensayos especiales de significacin para grandes muestras


Para muestras grandes, las distribuciones mustrales de muchos estadsticos son
distribuciones normales (o al menos casi normales) con media s y desviacin tpica s.
1. medias
Aqu S=X, la media muestral; s= x= , media poblacional; s= x= / n, donde es la
desviacin tpica poblacional y n es el tamao de la muestra. La variable tipificada viene dada
por:
Z= x - n
/ n

Cuando es necesario se utiliza la desviacin muestral observada S , para estimar .


Utilizando un ensayo de dos colas, aceptaramos Ho (o al menos no lo rechazaramos) al nivel
0.05 si para una muestra especifica de tamao n con media x.
-1.96 x - 1.96
/ n
Y lo rechazaramos por el contrario.
Para ensayar la hiptesis de que la media poblacional es mayor que utilizaramos aun la
hiptesis nula Ho de que es igual a .
x -

> - 1.645

/ n
2. proporciones.
Aqu S=P, la proporcin de xitos en una muestra; s= p= P, donde P es la proporcin de
xitos en la poblacin y n es el tamao de la muestra.
s= p= pq/n donde q= 1 p
La variable tipificada viene dada por
Z= P- p
pq/n
En el caso de que P= X/n, donde X es el nmero real de xitos en una muestra, se convierte en
Z= X np

n.pq

Diferencia de medias

x1 X2 = 0

x1 - x2 = 21 + 22
n1

n2

Con la variable tipificada dada por


Z= X1 - X2 0 = X1 - X2
x1 - X2

x1 X2

Diferencia de proporciones
p1 P2 = 0

p1 P2 = p (1 p) (1 + 1)
n1

n2

Con la variable tipificada dada por

Z= P1 P2 0 = P1 P2
p1 P2

p1 P2

Ensayos especiales de significacin para pequeas muestras


En el caso de pequeas muestras (n < 30) podemos formular ensayos de hiptesis y significacin
utilizando distribuciones adems de la normal.

1. medias
Para ensayar la hiptesis Ho de que una poblacin normal tiene media utilizamos.
T= x - n 1 = x - n
S

Donde x es la media de una muestra de tamao n.

Diferencia de medias
T= x1 - x2

donde = n1 s21 + n2 s22

1 + 1
n1

n1 + n 2
n2

2. Varianzas
Para ensayar la hiptesis Ho de que una poblacin normal tiene varianza 2consideramos la
variable aleatoria.

X2= ns2 = (n 1) 2
2

Relaciones de varianza
F = S21/ 21
22/ 22
Problemas de hiptesis

1) Se cree que el nivel medio de protrombina en una poblacin normal es de 20 mg/100 ml de


plasma con una desviacin tpica de 4 miligramos/100 ml. Para comprobarlo, se toma una
muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la
hiptesis, con un nivel de significacin del 5%?
1. Enunciamos las hiptesis nula y alternativa:
H0 : =20 mg/100 ml
H1 : 20 mg/100 ml
2. Zona de aceptacin
Para = 0.05, le corresponde un valor crtico: z/2 = 1.96.
Determinamos el intervalo de confianza para la media:
(20 -1.96 . 4 20 + 1.96 . 4) = 18.77 ; 21.23
20

20

3. Verificacin.
Valor obtenido de la media de la muestra: 18.5.
4. Decisin
Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.
2) El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la
produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin.
Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media
300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote
producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el
tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo
sigue siendo Normal con la misma desviacin tpica:

Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de
significacin del 2%?
1. Enunciamos las hiptesis nula y alternativa:
H0 : 300
H1 : < 300
2. Zona de aceptacin
= 0.02; 1- = 0. 98;

P(1.96)= 0. 98;

z = 1.96 .

Determinamos el intervalo de confianza:


(300 2.33 . 30 ; ) = 290.98;
60
3. Verificacin.
= 290
4. Decisin
Rechazamos la hiptesis nula H0. Con un nivel de significacin del 2%.
3) Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que
se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin
normal de duracin media 2400 horas, con una desviacin tpica igual a 300. Se toma una
muestra de 100 lmparas producidas por este mtodo y esta muestra tendr una duracin
media de 2320 horas. Se puede aceptar la hiptesis de validez del nuevo proceso de
fabricacin con un riesgo igual o menor al 5%?
1. Enunciamos las hiptesis nula y alternativa:
H0 : = 2400
H1 : 2400
2. Zona de aceptacin

= 0.05

z = 1.96.

Determinamos el intervalo de confianza para la media:


(2400 1.96 . 300 ; 2400 + 1.96 . 300 ) = 2341.2 ; 2458.8
100

100

3. Verificacin.
Valor obtenido de la media de la muestra: 2320.
4. Decisin
Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

Distribucin Normal
En estadstica y probabilidad se

llama distribucin

normal, distribucin

de

Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable


continua que con ms frecuencia aparece aproximada en fenmenos reales.
La importancia de esta distribucin radica en que permite modelar numerosos fenmenos
naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de
este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que
en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada
observacin se obtiene como la suma de unas pocas causas independientes.
Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la
normal son:

caracteres morfolgicos de individuos como la estatura;

caracteres fisiolgicos como el efecto de un frmaco;

caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de


individuos;

caracteres psicolgicos como el cociente intelectual;

nivel de ruido en telecomunicaciones;

errores cometidos al medir ciertas magnitudes;

etc.
La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por

ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando


la distribucin de la poblacin de la cual se extrae la muestra no es normal. 1 Adems, la
distribucin normal maximiza la entropa entre todas las distribuciones con media
y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a
una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es
la ms extendida en estadstica y muchos tests estadsticos estn basados en una "normalidad"
ms o menos justificada de la variable aleatoria bajo estudio.
En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de
probabilidades continuas y discretas.
Algunas propiedades de la distribucin normal son:

Distribucin

de

probabilidad

alrededor

la

media en una

(, 2).

distribucin

de

1. Es simtrica respecto de su media, ;


2. La moda y la mediana son ambas iguales a la media, ;
3. Los puntos de inflexin de la curva se dan para x = y x = + .
4. Distribucin de probabilidad en un entorno de la media:

1. en el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el


68,26% de la distribucin;
2. en el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la
distribucin;
3. por su parte, en el intervalo [ -3, + 3] se encuentra comprendida,
aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran
utilidad para el establecimiento de intervalos de confianza. Por otra parte, el
hecho de que prcticamente la totalidad de la distribucin se encuentre a tres
desviaciones tpicas de la media justifica los lmites de las tablas empleadas
habitualmente en la normal estndar.
Ejemplos de distribucin normal
1. La vida media de una lmpara, segn el fabricante, es de 68 meses, con una desviacin
tpica de 5. Se supone que se distribuye segn una distribucin normal En un lote de
10.000 lmparas. a) Cuntas lmparas superarn previsiblemente los 75 meses?. b)
Cuntos lmparas se estropearn antes de 60 meses?
a) t = (75 -68)/5 = 1,4

P (X > 75) = (t > 1,4) = 1 - P (t 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de las lmparas (808 lmparas) superarn los 75 meses

b) t = (60 -68)/5 = -1,6

P (X 60) = (t -1,6) = P (t> 1,6) = 1 - P (t 1,6) = 0,0548

Luego, el 5,48% del lote (548 lmparas) no llegarn probablemente a durar 60 meses

2. El consumo medio bimestral de energa elctrica en una ciudad es de 59 Kwh., con una
desviacin tpica de 6 Kwh. Se supone que se distribuye segn una distribucin normal.
a) Cuntos Kwh. tendra que consumir bimestralmente para pertenecer al 5% de la
poblacin que ms consume?. b) Si usted consume 45 Kwh. qu % de la poblacin
consume menos que usted?
a) Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el
0,95 (95%), por lo que por arriba estara el 5% restante. Este valor corresponde a t =
1,645. Ahora calculamos la variable normal X equivalente a ese valor de la normal
tipificada:

1,645 = (X -59)/6 X = 67,87

Por lo tanto, tendra usted que consumir ms de 67,87 Kwh. bimestralmente para pertenecer al
5% de la poblacin que ms consume

b) Vamos a ver en que nivel de la poblacin se situara usted en funcin de los 45 Kwh.
consumidos.

Calculamos el valor de la normal tipificada correspondiente a 45 Kwh.


t = (45 -59)/9 = -2.333

P (X 45) = P (t -2,333) = P (t > 2,333) = 1 - P (t 2,333) = 1 - 0,9901 = 0,0099

Luego, tan slo un 1,39% de la poblacin consume menos que usted.

Distribucin t de student
En probabilidad y estadstica,
probabilidad que

surge

del

la distribucin

problema

t (de

Student)

de estimar la media de

es

una distribucin

de

unapoblacin normalmente

distribuida cuando el tamao de la muestra es pequeo.


Aparece de manera natural al realizar la prueba t de Student para la determinacin de las
diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la
diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una
poblacin y sta debe ser estimada a partir de los datos de una muestra.
Caractersticas
La distribucin t de Student es la distribucin de probabilidad del cociente

Donde
Z es una variable aleatoria distribuida segn una normal tpica (de media nula
y varianza 1).
V es una variable aleatoria que sigue una distribucin con

grados de libertad.

Z y V son independientes

Si es una constante no nula, el cociente

es una variable aleatoria que sigue

la distribucin t de Student no central con parmetro de no-centralidad

TABLA DE LA DISTRIBUCION t - Student

1-a

0.75

0.80

0.85

0.90

0.95

0.975

0.99

0.995

1.000

1.376

1.963

3.078

6.314

12.706

31.821

63.657

0.816

1.061

1.386

1.886

2.920

4.303

6.965

9.925

0.765

0.978

1.250

1.638

2.353

3.182

4.541

5.841

0.741

0.941

1.190

1.533

2.132

2.776

3.747

4.604

0.727

0.920

1.156

1.476

2.015

2.571

3.365

4.032

0.718

0.906

1.134

1.440

1.943

2.447

3.143

3.707

0.711

0.896

1.119

1.415

1.895

2.365

2.998

3.499

0.706

0.889

1.108

1.397

1.860

2.306

2.896

3.355

0.703

0.883

1.100

1.383

1.833

2.262

2.821

3.250

10

0.700

0.879

1.093

1.372

1.812

2.228

2.764

3.169

11

0.697

0.876

1.088

1.363

1.796

2.201

2.718

3.106

12

0.695

0.873

1.083

1.356

1.782

2.179

2.681

3.055

13

0.694

0.870

1.079

1.350

1.771

2.160

2.650

3.012

14

0.692

0.868

1.076

1.345

1.761

2.145

2.624

2.977

15

0.691

0.866

1.074

1.341

1.753

2.131

2.602

2.947

16

0.690

0.865

1.071

1.337

1.746

2.120

2.583

2.921

17

0.689

0.863

1.069

1.333

1.740

2.110

2.567

2.898

18

0.688

0.862

1.067

1.330

1.734

2.101

2.552

2.878

19

0.688

0.861

1.066

1.328

1.729

2.093

2.539

2.861

20

0.687

0.860

1.064

1.325

1.725

2.086

2.528

2.845

21

0.686

0.859

1.063

1.323

1.721

2.080

2.518

2.831

22

0.686

0.858

1.061

1.321

1.717

2.074

2.508

2.819

23

0.685

0.858

1.060

1.319

1.714

2.069

2.500

2.807

24

0.685

0.857

1.059

1.318

1.711

2.064

2.492

2.797

25

0.684

0.856

1.058

1.316

1.708

2.060

2.485

2.787

26

0.684

0.856

1.058

1.315

1.706

2.056

2.479

2.779

27

0.684

0.855

1.057

1.314

1.703

2.052

2.473

2.771

28

0.683

0.855

1.056

1.313

1.701

2.048

2.467

2.763

29

0.683

0.854

1.055

1.311

1.699

2.045

2.462

2.756

30

0.683

0.854

1.055

1.310

1.697

2.042

2.457

2.750

40

0.681

0.851

1.050

1.303

1.684

2.021

2.423

2.704

60

0.679

0.848

1.046

1.296

1.671

2.000

2.390

2.660

120

0.677

0.845

1.041

1.289

1.658

1.980

2.358

2.617

0.674

0.842

1.036

1.282

1.645

1.960

2.326

2.576

Ejemplo: Los valores de las matriculas de estudiantes en una universidad privada tienen un
comportamiento aproximadamente normal, donde el promedio es de 2.100.000. Se seleccionan 8
liquidaciones, siendo los valores los siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000,
2.250.000, 1.950.000, 2.050.000, 2.350.000. Determine la probabilidad de que:
El promedio sea menor de 2.000.000.
El promedio se encuentre entre 2.000.000 y 2.200.000
El promedio sea mayor o igual a 2.500.000
Solucin manual:
Sea X = Liquidacin matriculas.

m = 2.100.000 ; s = ?
=2.098.750 s=168.644.8085 n=8
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
La probabilidad se encuentra entre 0.9 y 0.95, segn la tabla T que se encuentra ms
adelante, no obstante, al t ser negativo, la probabilidad est entre 0.1 y 0.05, es decir, los valores
complementarios..

Para buscar en la tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se encuentra
entre los valores mencionados. De ah que sea importante utilizar el Excel, que nos permite
calcular la probabilidad exacta.
b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( 2.000.000).
Luego de tipificar, se tiene:
P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92

Existe una alta probabilidad de que el promedio de las matriculas se encuentre entre 2.000.000 y
2.200.000.

c) P( >2.500.000)= P(t> 6.70) = 1- P(t< 6.70)= 1-1=0


Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de 3.49 y
corresponde a 0.995, es claro, entonces, que para valores mayores de 3.49, la probabilidad ser
de 1.

Por lo tanto, la probabilidad de que el promedio de matrcula sea superiora a 2.500.000 es


cero.
Correlacin
La correlacin estadstica determina la relacin o dependencia que existe entre las dos
variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra.
En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin
entre ellas.
Coeficiente de correlacin
El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades
1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos
la altura en metros o en centmetros el coeficiente de correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es
positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la
covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e
inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.

5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y


directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas
variables hay dependencia funcional.

Ejercicio
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) Pesos (Y)

Calcular el coeficiente de correlacin.

186

85

189

85

190

86

192

90

193

87

193

91

198

93

201

103

203

100

205

101

Correlacin positiva muy fuerte.

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:

Y/X

100

50

25

14

18

22

Obtener e interpretar el coeficiente de correlacin lineal.

Convertimos la tabla de doble entrada en una tabla simple.

xi

yi

fi

xi fi xi2 fi yi fi yi2 fi xi yi fi

100

14

100

10 000 14

196

1 400

100

18

200

20 000 36

648

3 600

50

14

50

2 500 14

196

700

50

18

150

7 500 54

972

2 700

50

22

50

2 500 22

484

1 100

25

22

50

1 250 44

968

1 100

10

600

43 750 184

Es una correlacin negativa dbil.

3 464 10 600

Potrebbero piacerti anche