Sei sulla pagina 1di 12

FACULTAD DE INGENIERIA DE SISTEMAS

EJERCICIOS DISTRIBUCION X2, PRUEBAS DE


HIPTESIS; CORRELACIN Y REGRESIN

1. Para 7 grados de Libertad, Hallar :

A.- P (X 2 < 20.3)

P (X 2 < 20.3) = 0.995

B. - P (X 2 > 2.83)

P (X 2 > 2.83) = 1- P (X 2 > 2.83) 1- 0.10 = 0.90


P (X 2 > 2.83) = 0.90

2. RESOLVER:
A) Si = 0.05 , hallar X 2 /2 y X 2 1- /2 para Filas=4; columnas=3

V= (4-1) (3-1) V= 6
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

= 0.05 /2 = 0.025 1- /2 = 0.975

X2/2 (V) = X20.025 (6) = 1.24 X21-/2 (V) = X20.975 (6) = 14.4

TEMA: HIPTESIS DE LA MEDIA LA PROPORCION Y DIFERENCIA DE


MEDIAS (En Excel)

3. Connie Rodrguez, la Decana de los Estudiantes del Mistate College, se


pregunta acerca de las distribuciones de calificacin en el nivel universitario.
Ha escuchado rumores de que las calificaciones de la Escuela de Comercio
estn por debajo de las calificaciones de la Escuela de Artes y Ciencias. Un
rpido muestreo aleatorio arroj las siguientes calificaciones:

EC : 2.86 2.77 3.18 2.80 3.14 2.87 3.19 3.24 2.91 3.00 2.83
EA : 3.35 3.32 3.36 3.41 3.37 3.45 3.43 3.44 3.17 3.26 3.18
Estos datos indican que existe una base fundada para los rumores?
Establezca y pruebe hiptesis apropiadas a un nivel =0.01

SOLUCIN:

X=rendimiento de la escuela de Comercio


Y= rendimiento de la escuela de Artes

Ho: UX = UY
Ha: UX < UY

media de X = 2.98090909 V=n+m-2 V= 11+11-2 V= 20


media de Y= 3.34
des. Tip X= 0.17552519 =0.01 1-=0.99 t0.99 (20)=2.528
des. Tip Y= 0.09889388

2
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

Prueba t para dos muestras suponiendo varianzas iguales

P Variable 2
Media 2,980909091 3,34
Varianza 0,030809091 0,00978
Observaciones 11 11
Varianza agrupada 0,020294545
Diferencia hipottica de las medias 0
Grados de libertad 20
Estadstico t -5,91147818
P(T<=t) una cola 4,40061E-06
Valor crtico de t (una cola) 2,527977003
P(T<=t) dos colas 8,80123E-06
Valor crtico de t (dos colas) 2,84533971

TOMA DE DECISIN: Se rechaza la hiptesis nula pues el estadstico -5,91 se


encuentra fuera de la zona de aceptacin.

RESPUESTA: Las calificaciones de la escuela de Comercio si estn por debajo


de la escuela de Artes.

4. Segn datos de investigaciones realizadas hace 10 aos, un estudio


demostr que la tasa de desercin estudiantil en una universidad Pblica era
del 35%; luego un estudio actualizado del ao 2012 se encuentra que la tasa
es del 40%, probar con un nivel de significacin de 5% que la tasa de
desercin difiere del parmetro anterior.

SOLUCION:

Hiptesis:

H0: U1= U2
Ha: U1 U2
3
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

Nivel de significancia: =0.5 Z0.975 = 1.96

Hallando n:

Z0.975 = 1.96, e= 5, p=0.4,

Reemplazando:

n= 369

Estadstico:

P= 0.4, p= 0.35 , n=369

Reemplazando en: Zc = P-p / p (1-p)/n

Zc= 2.02

Grfica:

TOMA DE DECISIN: El valor del estadstico Zc =2.02 y se encuentra fuera de la


zona de la aceptacin de la hiptesis nula.
RESPUESTA:
La tasa de desercin estudiantil actual si difiere de la tasa de desercin de hace 10
aos.

4
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

5. En 2005, una investigacin en 50 Hospitales revel una tasa de ocupacin


media de 73.6% , con una desviacin estndar de 18.2% . Otra investigacin
efectuada en 75 hospitales municipales en 2007 , encontr una tasa de
ocupacin promedio de 68.9% con una desviacin estndar de 19.7.Aun nivel
del = 0.10 , podemos llegar a la conclusin de que la tasa de ocupacin
promedio aument significativamente

SOLUCION:

Datos: n1=50, 1 =73.6, 1 =18.2


N2=75, 2 =68.9, 2 = 19.7

Hiptesis:

Ho= U1 = U2
Ha = U1 U2

Reemplazando en ZC = (1- 2) / (12/n1) + (22/n2)


ZC=1.38

AHORA SI =0.10 Z0.95 =1.65

TOMA DE DECISIN: el valor Zc= 1.38 se encuentra dentro de la zona de


aceptacin por lo tanto se acepta la hiptesis nula.

RESPUESTA: la tasa de ocupacin no ha variado significativamente.

5
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

TEMA: HIPTESIS DE INDEPENDENCIA (Pruebas de Hiptesis utilizar


X2)(En Excel o SPSS)

6. VISA CARD estudi la frecuencia con que los consumidores de diferentes


rangos de edades usan tarjetas plsticas (de dbito y de crdito) al pagar
sus compras (Asciate Press-Enero 2006), a continuacin se presenta datos
de 300 consumidores divididos en cuatro grupos de edades:

GRUPO DE EDAD
Forma de
pago 18 -24 25-34 35-44 45 y mas
Plstico 21 27 27 36
Efectivo-
Cheque 21 36 42 90

a) Probar con = 0.10 si la forma de pago es independiente de la edad


del consumidor

b) Que consecuencia tiene este resultados para la empresa?

SOLUCIN:

HO =Forma de pago Y no depende de la edad X HO = y x

Ha = Forma de pago Y si depende de la edad X Ha = y R x (+-)

V = (4-1) (2-1) V=3

=0.10 /2 =0.05 1- /2 = 0.95

X2/2 (V) = X20.05 (3) = 0.352 X21-/2 (V) = X20.95 (3) = 7.81

6
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

GRUPO DE EDAD
Forma de pago 18 -24 25-34 35-44 45 y mas
Plstico 21 27 27 36 111
Efectivo-Cheque 21 36 42 90 189
42 63 69 126 300

15,54 23,31 25,53 46,62


26,46 39,69 43,47 79,38

Frec.
Frec. Observ.
Esper.
21,00 15,54 1,92
27,00 23,31 0,58
27,00 25,53 0,08
36,00 46,62 2,42
21,00 26,46 1,13
36,00 39,69 0,34
42,00 43,47 0,05
90,00 79,38 1,42
CHI CUADRADO 7,95

TOMA DE DESICIN: se rechaza la hiptesis nula pues el valor pues el valor 7.95
se encuentra fuera de la zona de aceptacin.

RESPUESTA: la forma de pago si depende de la edad.

c) Que consecuencia tiene este resultado para la empresa?


La consecuencia que tiene para la empresa es que tendr que
disear estrategias de forma de pago por edad principalmente en
los mayores de 45 aos.

7. Un estudio del Public Interest Research Group (PIRG) de estado de


Washington, indica que el 46% de los estudiantes universitarios de tiempo
completo, trabaja 25 o ms horas por semana El estudio proporciona datos
sobre el efecto del trabajo sobre las calificaciones (USA to day , 17 abril del
ao 2012). En este estudio de 200 estudiantes que conformaban la muestra
se elabor la siguiente tabla de contingencia:

7
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

Efectos sobre las calificaciones


Horas trabajadas
por semana Positivo Ninguno Negativo
1-15 horas 26 50 14
16-24 horas 16 27 17
25-34 horas 11 19 20

a) Realice la prueba de independencia si el efecto de las calificaciones es


independiente de las horas trabajadas por semana, utilice = 0.10, asimismo
halle el calor de p y diga para que sirve este valor. Utilice los porcentajes de
regln para conocer el efecto de las horas de trabajo sobre las calificaciones.

SOLUCIN:

Grupo Etario: con las mismas caractersticas.

HO =Las calificaciones y no dependen de las horas trabajadas x HO = y x

Ha =Las calificaciones y dependen de las horas trabajadas x Ha = y R x (+-)

V = (3-1) (3-1) V=4

=0.10 /2 =0.05 1- /2 = 0.95

X2/2 (V) = X20.05 (4) = 0.711 X21-/2 (V) = X20.95 (4) = 9.49

Efectos sobre las calificaciones


Horas TOTAL
Positivo Ninguno Negativo
trab.xsemana FILAS
1-15 horas 26 50 14 90
16-24 horas 16 27 17 60
25-34 horas 11 19 20 50
53 96 51
TOTAL COLUMNAS 200

8
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

23,85 43,2 22,95


15,9 28,8 15,3
13,25 24 12,75

Frec. Observ. Frec. Esper.

26 23,85 0,19
50 43,2 1,07
14 22,95 3,49
16 15,9 0,00

27 28,8 0,11
17 15,3 0,19
11 13,25 0,38
19 24 1,04
20 12,75 4,12
CHI CUADRADO 10,60

TOMA DE DECISIN: Se rechaza la hiptesis nula pues el valor obtenido de chi2


10,60 est fuera de la zona de aceptacin.

RESPUESTA: Las calificaciones si dependen de las horas trabajadas.

TEMA: DISPERSION, CORRELACIN Y REGRESIN SIMPLE (En Excel)

8. Un estudio hecho por el departamento de Transporte de Atlanta, Georgia,


acerca del efecto de los precios de los boletos de los autobuses sobre el
nmero de pasajeros produjo los siguientes resultados:

Precio del boleto (soles) 25 30 35 40 45 50 55 60


Pasajeros por 100 millas 800 780 780 660 640 600 620 620

a) Represente grficamente el diagrama de dispersin, asimismo, Halle r y r2 e


interprete los valores hallados

b) Desarrolle la ecuacin de estimacin lineal que mejor describa los datos.


Muestre el grfico respectivo

c) Intrprete lo valores de los coeficientes de regresin segn el problema.

d) Pronostique el nmero de pasajeros por 100 millas si el precio del boleto


fuera de 50 soles
9
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

a)
Precio Pasajeros x 100
Boleto millas
25 800
30 780
35 780
40 660
45 640
50 600
55 620
60 620

900
800
700
600 y = -6.2381x + 952.62
R = 0.8246
500
400
300
200
100
0
0 10 20 30 40 50 60 70

COEFICIENTE DE DETERMINACIN: R2 = 0,8246

Indica que el nmero de pasajeros por 100 millas se debe en un


82,46% por el precio de los boletos.
.

COEFICIENTE DE CORRELACIN: R= -0.90

Alta y negativa.

b) ECUACION LINEAL:

Y= -6.2381x +952,62

c) INTRPRETE LO VALORES DE LOS COEFICIENTES DE REGRESIN


SEGN EL PROBLEMA.

y = -6,2381x + 952,62
R = 0,8246

10
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

Interpretacin: Por el incremento de 1 sol en los precios de los boletos la cantidad


de pasajeros disminuye en una cantidad 6,2381

D) PRONOSTIQUE EL NMERO DE PASAJEROS POR 100 MILLAS SI EL


PRECIO DEL BOLETO FUERA DE 50 SOLES.

EL NMERO DE PASAJEROS POR CADA 100 MILLAS SI EL


BOLETO CUESTA S/. 50 ES:

Y=6.2381 (50) +952,62 Y= 640.715

9. El Instituto Nacional de Ciencias de la Salud Ambientales (NIEHS, por sus


siglas en ingls) ha estudiado las relaciones estadsticas entre muchas
variables diferentes y el resfriado comn. Una de las variables que estn
examinando, es el uso de pauelos faciales y el nmero de das de sntomas
de resfro mostrados por siete personas en un periodo de 12 meses. Qu
relacin, si la hay , parece existir entre las dos variables? Indica esto algn
efecto casual?

Pauelos faciales 2000 1500 500 750 600 900 1000


Sntomas de resfro 60 40 10 15 5 25 30

a) Cul es la variable dependiente y cul es la variable


independiente
b) Represente grficamente el diagrama de dispersin, asimismo
,Halle r y r2 interprete los valores hallados
c) Desarrolle la ecuacin de estimacin lineal que mejor describa
los datos. Muestre el grfico respectivo
d) Interprete lo valores de los coeficientes de regresin desde el
punto de vista geomtrico y segn el problema.
e) Diga si podra tratarse de una correlacin espuria.

Sntomas de
resfro Pauelos Faciales
60 2000
40 1500
10 500
15 750
5 600
25 900
30 1000

11
ESTADISTICA INFERENCIAL
TAREA SEMANA 05 Ejercicios

2500

2000 y = 27.516x + 308.5


R = 0.9602

1500

1000

500

0
0 10 20 30 40 50 60 70

a)
VARIABLE DEPENDIENTE: pauelos faciales

VARIABLE INDEPENDIENTE: sntomas de resfro

b)
COEFICIENTE DE DETERMINACIN: R2=0,9602

Nos indica que el 96% de uso de pauelos se debe a los sntomas del resfriado.

COEFICIENTE DE CORRELACIN:

R= 0,9798 alta y positiva.

c)
ECUACION DE ESTIMACIN LINEAL: Y= 27,51X+308,5

d)
INTERPRETACION: Por el incremento de una unidad del sntomas de resfri se
incrementa en 27.51 los pauelos faciales, los puntos tienen un tendencia de una recta
con pendiente positiva.

e)
RELACION ESPURIA: Podra tratarse de una relacin espuria pues no existe una
teora que explique la relacin entre ambas variables.

12