Sei sulla pagina 1di 11

MUESTREO

1) A continuación se tiene información del ingreso mensual de 150 estudiantes del


curso Estadística II en la carrera de Administración y Negocios Internacionales de la
UAP, durante el presente año.
Ingresos Ingresos Ingresos
código código código
mensuales mensuales mensuales
100290889 889 100292935 2935 110292935 1930
100293284 3284 100292064 2064 110292064 1062
100086134 6134 100291621 1621 110291621 2624
100291755 1755 100290994 994 110290994 896
100292922 2922 100291345 1345 110291345 1548
100293001 3001 100293239 3239 110293239 3030
100293434 3434 100293281 3281 110293281 3082
100292046 2046 100277259 7259 110277259 5254
100292300 2300 100292750 2750 110292750 1752
100293655 3655 100291635 1635 110291635 2634
100293119 3119 100293351 3351 110293351 4356
100292160 2160 100293035 3035 110293035 2038
100291488 1488 100292773 2773 110292773 3779
100292503 2503 100293044 3044 110293044 2045
100293949 3949 100293286 3286 110293286 1282
100290858 858 100292481 2481 110292481 3480
100292014 2014 100293656 3656 110293656 4654
100291823 1823 100291885 1885 110291885 4880
100291945 1945 100293418 3418 110293418 2410
100291234 1234 100293365 3365 110293365 2360
100291868 1868 100290681 681 110290681 882
100292025 2025 100293322 3322 110293322 3820
100292133 2133 100291310 1310 110291310 1613
100293270 3270 100291140 1140 110291140 1842
100293338 3338 100293346 3346 110293346 3940
100291435 1435 100293467 3467 110293467 3068
100293253 3253 100292968 2968 110292968 2862
100292417 2417 100293240 3240 110293240 3044
100293275 3275 100293252 3252 110293252 3454
100292833 2833 100291399 1399 110291399 1896
100291734 1734 100293091 3091 110293091 3990
100293040 3040 100291773 1773 110291773 1870
100291450 1450 100290849 849 110290849 946
100086051 6051 100292371 2371 110292371 2670
100290848 848 100293951 3951 110293951 3050
100293438 3438 100283772 3772 110283772 3670
100292440 2440 100291593 1593 110291593 1895
100293154 3154 100293399 3399 110293399 3994
100293219 3219 100293274 3274 110293274 3670
100291098 1098 100295748 5748 110295748 5846
100293053 3053 100293948 3948 110293948 3044
100292061 2061 100293267 3267 110293267 3866
100291392 1392 100293495 3495 110293495 4490
100293266 3266 100292521 2521 110292521 3520

1TA20141DUED
100291148 1148 100293950 3950 110293950 3554
100293184 3184 100292487 2487 110292487 2785
100291323 1323 100293038 3038 110293038 3836
100291986 1986 100292113 2113 110292113 2610
100292937 2937 110293038 3034 110293038 3536
100291509 1509 110292113 2110 110292113 2810

a) Usando la tabla de números aleatorios y con un arranque (6,7), hallar una muestra
piloto que represente el 5% de la población.
Población =150 estudiantes
Muestra = 5% de la población (150) =7 estudiantes
Estudiantes elegidos para la muestra según tabla de números aleatorios con
arranque (6,7):
Nota: Se elige 7 estudiantes porque los números aleatorios del texto no arroja
valores para la elección de un octavo estudiante.

Ingresos
aleatorio
mensuales
N° ≤ 150
1 028 2417
2 003 6134
3 044 3266
4 037 2440
5 120 2360
6 110 2634
7 64 3044

b) Hallar el tamaño óptimo de la muestra y la muestra adecuada.

1) Procediendo a calcular el tamaño de la muestra, mediante la fórmula:

𝑛0
𝑛= 𝑛
1 + 𝑁0

𝑍∗𝑠
Donde 𝑛0 =( ) y 𝐸 = 𝑒 ∗ 𝑥̅
𝐸

Asumiendo un nivel de confianza del 95% (Z=1.96)


Asumiendo un error de muestreo del 5% (e) :
Conociendo que la media de la muestra es 3185
Conociendo que la desviación estándar es 1344.87
Entonces conjugando las fórmulas de no y E obtenemos:
𝑧∗𝑠
𝑛0 = ( )
𝑒 ∗ 𝑥̅

2TA20141DUED
1.96 ∗ 1344.87
𝑛0 = ( )
0.05 ∗ 3185

𝑛0 = 16.55

Entones el tamaño óptimo de la muestra vendría dado por la aplicación de la


fórmula:

16.55
𝑛=
16.55
1+
150

𝒏 = 𝟏𝟒. 𝟗 ≈ 𝟏𝟓 𝒊𝒏𝒈𝒓𝒆𝒔𝒐𝒔 𝒎𝒆𝒏𝒔𝒖𝒂𝒍𝒆𝒔

c) Construir una muestra de 20 alumnos utilizando el procedimiento de muestreo


aleatorio sistemático. ¿Qué alumnos debo incluir en la muestra?

1) Hallando la muestra aleatoria piloto:

5% * N = 0.05 * 150 = 7.5


2) Calculando el tamaño de la muestra:

n = 15 (valor hallado en el ítem anterior)


3) Determinando la frecuencia de selección:
𝑁 150
𝑘= 𝑘= 𝑘 = 10
𝑛 15
4) Seleccionando el primer sujeto aleatoriamente (el mínimo ≤ 150 y posteriores
cada 10)

Ingresos

mensuales
1 003 6134
2 013 1488
3 023 2133
4 033 1450
5 043 1392
6 053 1621
7 063 2773
8 073 1310
9 083 849
10 093 3495
11 103 2624
12 113 3779
13 123 1613
14 133 6134
15 143 1488

3TA20141DUED
CONTRASTE DE HIPÓTESIS

2) La Empresa de Transportes SIEMPRE UNIDOS SA, ha adquirido un lote de llantas


aro 22.5 ‘’ de la distribuidora LLANTAS MOBIL SAC. El Transportista tiene dudas de
la afirmación hecha por el distribuidor de que la vida útil de los neumáticos es al
menos 28,000 km. Para verificar la afirmación se prueba una muestra de estas
llantas en los ómnibus de la empresa, obteniéndose los siguientes resultados en
miles de kilómetros:

25.6 27.1 31.1 26.5 26.5 28.3 29.4 27.1 27.1 28.3
27.4 29.7 29.5 27.7 27.1 31.2 29.5 29.7 31.2 31.2
27.3 25.8 26.5 27.3 31.2 28.0 26.0 25.8 26.4 28.0
29.6 26.4 26.4 25.8 27.5 27.9 26.9 26.4 28.0 27.9
23.4 28.0 29.0 28.8 27.3 27.5 27.8 28.0 29.6 27.5
a) ¿Es correcta la sospecha de la compañía de transportes en base a estos datos
y a un nivel de significancia de 0,05?

Planteamiento de hipótesis

𝐻0 : 𝜇 ≥ 28 000

𝐻1 : 𝜇 < 28 000

Nivel de significancia: 𝛼 = 0.05

Tipo y diseño de la prueba:

Determinando la media y desviación estándar con la hoja de cálculo:

𝑥̅ = 27.86 𝑠 = 1.681 𝑠 2 = 2.83

Determinando el estadístico de prueba:

𝑥̅ − 𝜇
𝑍= 𝜎
√𝑛

27.86 − 28
𝑍=
1.681
√50

4TA20141DUED
𝑍 = −0.589

Decisión estadística: Como el “z” calculado (-0.589) cae en la zona de


aceptación, se acepta la hipótesis nula, por consiguiente, la afirmación del
distribuidor se acepta como cierta al verificarse que los neumáticos tienen una
vida útil de al menos 28 000 Km.

b) Se sospecha que la varianza poblacional es superior a 3000 ¿es correcta esta


sospecha a un nivel de significancia del 0,05?

Planteamiento de hipótesis

𝐻0 : 𝜎 2 ≤ 3 000

𝐻1 : 𝜎 2 > 3 000

Nivel de significancia: 𝛼 = 0.05

Tipo y diseño de la prueba:

Estimando la varianza poblacional con la distribución Ji cuadrado

(𝑛 − 1) ∗ 𝑠 2
𝑋2 =
𝜎2

(50 − 1) ∗ 2.83
𝑋2 =
3000

𝑋 2 = 0.0462

Decisión estadística: Como el “X2” calculado (0.0462) cae en la zona de


aceptación, se acepta la hipótesis nula, por consiguiente, la sospecha de que la
varianza poblacional es superior a los 3000 es falsa.

5TA20141DUED
c) Obtener el intervalo de confianza a un nivel del 95% para la varianza y el
promedio de la vida útil a un nivel de significancia del 0,05.

Cálculo del intervalo de confianza al 0.05 de nivel de significancia.

𝜎
𝜇 = 𝑥̅ ± 𝑧 ∗
√𝑛

2.83
𝜇 = 27.86 ± 1.96 ∗
√50

𝜇 = 27.86 ± 0.7844
𝜇 = 27.86 ± 0.7844

𝟐𝟕. 𝟎𝟕𝟓𝟔 ≤ 𝝁 ≤ 𝟐𝟖. 𝟔𝟒𝟒𝟒

CHI CUADRADO

En la encuesta telefónica realizada el pasado curso por los alumnos los resultados
fueron muy dispares, mientras algunos realizaron las cuatro entrevistas programadas
otros no consiguieron cumplimentar ninguna de ellas. La distribución del número de
entrevistas conseguidas por los 57 alumnos que participaron en el proyecto fue la
siguiente:

Nº entrevistas Nº alumnos
0 6
1 16
2 24
3 9
4 2
total 57

A un nivel de confianza del 90% ¿Puede afirmarse que estas diferencias han sido
debidas al azar? O por el contrario están motivadas por alguna otra causa.

Planteamiento de hipótesis:

Hipótesis nula: Los resultados obtenidos siguen una distribución binomial.

Hipótesis alternativa: Los resultados obtenidos no siguen una distribución Binomial.

Tipo de prueba: Test Ji-cuadrado de bondad de ajuste.

6TA20141DUED
Estadístico de prueba: estimando el valor de P a partir de los datos de la muestra.

Estimando valores

Considerando el total de llamadas programadas: 57 * 4 = 228


Llamadas con éxito: (1*16) + (2*24) + (3*9) + (4*2) = 99
Proporción de éxito 99/228 = 0,4342

Por consiguiente, las probabilidades aplicando la función de probabilidad de la


distribución Binomial es:

4
P(x=0) = ( ) 0.43420 ∗ 0.56584 = 0.1025
0
4
P(x=1) = ( ) 0.43421 ∗ 0.56583 = 0.3146
1
4
P(x=2) = ( ) 0.43422 ∗ 0.56582 = 0.3621
2
4
P(x=3) = ( ) 0.43423 ∗ 0.56581 = 0.1853
3
4
P(x=4) = ( ) 0.43424 ∗ 0.56580 = 0.0355
4

El resto de los cálculos necesarios para obtener el valor del estadístico aparecen
ordenados en la tabla siguiente:

xi ni pi npi ni-npi (ni-npi)2 (ni-npi)2/npi


0 6 0.1025 5.84 0.16 0.03 0.005
1 16 0.3146 17.93 -1.93 3.72 0.207
2 24 0.3621 20.64 3.36 11.29 0.547
3 9 0.1853 10.56 -1.56 2.43 0.230
4 2 0.0355 2.02 -0.02 0 0
57 0.989
El estadístico tiene 5 sumandos, pero como hemos estimado un parámetro, debemos
buscar en las tablas de la Ji-cuadrado con 3 grados de libertad. El valor de la variable
que deja por debajo una probabilidad de 0,9 es 6,25.

7TA20141DUED
Como el valor del estadístico 0,989 es menor que el valor crítico, 6,25 se acepta la
hipótesis nula.

Por consiguiente, los resultados obtenidos por los alumnos pueden ser fruto del azar.

DISEÑO DE EXPERIMENTOS

En la siguiente tabla, se tiene la calificación de una prueba a personas con diferentes


grados de escolaridad, lo que se intenta es probar si existe o no diferencia entre el grado
escolar (variable nominal) y el promedio de la calificación (variable numérica).

GRADO GRADO
Nº CALIFICACIÓN Nº CALIFICACIÓN
ESCOLAR ESCOLAR
1 67.15 DOCTORADO 33 39.56 ESTUDIANTE
2 64.36 DOCTORADO 34 39.07 ESTUDIANTE
3 60.91 ESTUDIANTE 35 38.71 DOCTORADO
4 55.38 ESTUDIANTE 36 34.95 ESTUDIANTE
5 53.91 ESTUDIANTE 37 34.27 ESTUDIANTE
6 53.34 MAESTRÍA 38 34.27 ESTUDIANTE
7 52.15 ESTUDIANTE 39 67.63 DOCTORADO
8 51.86 ESTUDIANTE 40 62.77 DOCTORADO
9 51.12 DOCTORADO 41 60.88 ESTUDIANTE
10 50.63 ESTUDIANTE 42 56.55 ESTUDIANTE
11 50.35 MAESTRÍA 43 51.76 ESTUDIANTE
12 48.38 MAESTRÍA 44 53.63 MAESTRÍA
13 47.07 DOCTORADO 45 50.77 ESTUDIANTE
14 44.09 MAESTRÍA 46 50.89 ESTUDIANTE
15 43.41 ESTUDIANTE 47 48.66 DOCTORADO
16 43.23 MAESTRÍA 48 52.67 ESTUDIANTE
17 41.82 ESTUDIANTE 49 47.98 MAESTRÍA
18 41.57 ESTUDIANTE 50 48.23 MAESTRÍA
19 41.21 MAESTRÍA 51 46.83 DOCTORADO
20 40.82 ESTUDIANTE 52 45.52 MAESTRÍA
21 40.79 ESTUDIANTE 53 43.28 ESTUDIANTE
22 33.09 ESTUDIANTE 54 41.03 MAESTRÍA
23 32.18 ESTUDIANTE 55 41.53 ESTUDIANTE
24 58.49 ESTUDIANTE 56 43.38 ESTUDIANTE
25 56.18 ESTUDIANTE 57 39.98 MAESTRÍA
26 51.46 ESTUDIANTE 58 39.42 ESTUDIANTE
27 53.41 MAESTRÍA 59 38.45 ESTUDIANTE
28 53.76 ESTUDIANTE 60 39.80 ESTUDIANTE
29 50.90 ESTUDIANTE 61 37.09 ESTUDIANTE
30 49.49 DOCTORADO 62 41.13 DOCTORADO
31 50.07 ESTUDIANTE 63 34.42 ESTUDIANTE
32 48.55 MAESTRÍA 64 40.28 ESTUDIANTE

8TA20141DUED
1) Formando la base de datos
DOCTORADO ESTUDIANTE MAESTRIA
67.15 60.91 53.35
64.37 55.39 50.35
51.13 53.92 48.39
47.07 52.16 44.09
49.50 51.87 43.24
38.71 50.63 41.22
67.64 43.42 53.42
62.77 41.82 48.56
48.66 41.57 53.63
46.83 40.82 47.99
41.14 40.80 48.23
33.10 45.52
32.18 41.04
58.50 39.99
56.19
51.47
53.77
50.90
50.08
39.57
39.07
34.95
34.28
34.27
60.88
56.50
51.77
50.77
50.89
52.67
43.29
41.54
43.39
39.43
38.45
39.80
37.10
34.42
40.29

2) Estableciendo las hipótesis nula y alterna

H0: No existe diferencia entre el grado escolar y el promedio de la calificación.


H1: Existe diferencia entre el grado escolar y el promedio de la calificación.

Si probabilidad ≤ 0.05 se rechaza H0


Si probabilidad > 0.05 se acepta H0

Análisis de varianza de un factor


RESUMEN
Grupos Cuenta Suma Promedio Varianza
Doctorado 11 584.968474 53.17895218 109.1445947
Estudiante 39 1782.83129 45.71362283 70.28908195
Maestría 14 659.0099847 47.07214176 22.03297075

9TA20141DUED
ANÁLISIS DE VARIANZA
Origen de Suma de Grados Promedio Valor crítico
F Probabilidad
las variaciones cuadrados de libertad de los cuadrados para F
Entre grupos 479.054466 2 239.527233 3.608710196 0.033018211 3.147791213
Dentro de los grupos 4048.859681 61 66.37474886
Total 4527.914147 63

Decisión estadística: Toda vez que la probabilidad obtiene un valor de 0.033


(aproximado a milésimos) el cual es menor al 0.05 referencial, se rechaza la hipótesis
nula, por consiguiente se concluye que: Efectivamente existe diferencia entre el grado
escolar y el promedio de la calificación alcanzada, es decir que ambas variables se
hallan relacionadas.

REGRESIÓN Y CORRELACIÓN

3) Los residentes de un pueblo pequeño del interior del país están preocupados sobre
el incremento en los costos de la vivienda en la zona. El alcalde considera que los
precios de la vivienda fluctúan con los valores de la tierra. Los datos sobre 20 casas
vendidas recientemente y el costo del terreno sobre el cual se construyeron se
observan en la siguiente tabla en miles de dólares. Se trata el costo de las casas
como la variable dependiente.

Valor de Costo de Valor de Costo de


la tierra la casa la tierra la casa
7,0 67,0 3,8 36,0
6,9 63,0 8,9 76,0
5,5 60,0 9,6 87,0
3,7 54,0 9,9 89,0
5,9 58,0 10,0 92,0
3,3 45,0 7,6 82,0
5,2 64,0 8,5 93,0
6,4 74,0 7,8 82,0
4,2 64,0 8,8 93,0
6,8 74,0 7,9 82,0
6,4 82,0 6,9 80,0
4,7 78,4 7,4 76,2

a) Muestre el diagrama de dispersión.

10TA20141DUED
120.0

y = 6.4367x + 29.24
100.0 R² = 0.7087

80.0

60.0

40.0

20.0

0.0
0.0 2.0 4.0 6.0 8.0 10.0 12.0

Figura 01. Diagrama de esparcimiento entre las variables precios de vivienda y


costos de terrenos

b) Determine la recta de regresión y el coeficiente de determinación.

y = 6.4367 x + 29.24 Modelo de regresión lineal

r2 = 0.7087 Coeficiente de determinación

c) Determine el coeficiente de correlación.

r = 0.8418266

11TA20141DUED