Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TRABAJO FINAL
Trabajo que como parte del curso de ESTADÍSTICA INFERENCIAL presentan los
alumnos
2. Objetivo:
Se desea saber qué sistema operativo es usado frecuentemente para
desarrollar una aplicación que se usara para los estudiantes de la UTP.
3. Modelo De Encuesta:
Elaborar una base de datos con un mínimo de 2 variables
(1cualitativa nominal y 1 cuantitativa continua) que puede estar
relacionada de preferencia con alguna de las actividades de la carrera que
está estudiando. La base de datos deberá tener 60 unidades de análisis.
4.4. Variables:
Edad, género, carrera, estado laboral, uso de Smartphone, horas de uso
diario de Smartphone, Sistema operativo de Smartphone.
35-38 1
INTERVALO DE EDADES
32-35 2
29-32 2
26-29 11
23-26 12
20-23 14
17-20 18
0 5 10 15 20
FRECUENCIA ABSOLUTA
9-10 3
INTERVAKI DE H.U.S.
8-9 8
7-8 9
6-7 13
5-6 16
4-5 8
3-4 3
0 5 10 15 20
FRECUENCIA ABSOLUTA
GENERO fi Fi ni Ni hi*100% Hi*100%
M 35 35 0,58 0,58 58% 58%
F 25 60 0,42 1,00 42% 100%
TOTAL 60 1,00 100%
F 25
GENERO
M 35
0 10 20 30 40
FRECUENCIA ABSOLUTA
WINDOWS PHONE 3
S.O.S.
IOS 14
ANDROID 43
0 10 20 30 40 50
FRECUENCIA ABSOLUTA
6. Medidas de tendencia central:
6.1. Media
EDAD
EDAD
7.1. Varianza
Variable:
X: horas de uso de Smartphone por los estudiantes de la UTP
H.U.S. Xi fi Fi ni Ni Xi*fi ((Xi-X)^2)*fi
3.0 - 4.0 3.5 3 3 0.05 0.05 11 24.94
4.0 - 5.0 4.5 8 11 0.13 0.18 36 28.38
5.0 - 6.0 5.5 16 27 0.27 0.45 88 12.48
6.0 - 7.0 6.5 13 40 0.22 0.67 85 0.18
7.0 - 8.0 7.5 9 49 0.15 0.82 68 11.22
8.0 - 9.0 8.5 8 57 0.13 0.95 68 35.84
9.0 - 10.0 9.5 3 60 0.05 1.00 29 29.14
TOTAL 60 1.00 383 142.18
Tabla. Datos agrupados de 60 estudiantes de la UTP.
DATOS:
n= 60
1
x=𝑛∑ Xi*fi =6.38
1
s2 =𝑛−1∑ ((Xi-X)^2)*fi =2.41 s = 1.55
Z 𝛼⁄2=1.645
𝑠 𝑠
𝐼𝐶 = 𝑥 − 𝑍𝛼⁄2 ≤ 𝜇 ≤ 𝑥 + 𝑍𝛼⁄2
√𝑛 √𝑛
1.55 1.55
𝐼𝐶 = 6.38 − 1.645 ≤ 𝜇 ≤ 6.38 + 1.645
√60 √60
IC =6.051≤ 𝜇 ≤6.709
Conclusión:
Para la media de uso de smartphone por los estudiantes se tiene un intervalo
de confianza de 6.051 a 6.709 con un nivel de confianza de 0.9
Variable:
X: tiempo de uso de Smartphone por los estudiantes de la SLN
((Xi-
H.U.S. Xi fi Fi ni Ni Xi*fi
X)^2)*fi
3.0 - 5.0 4.0 9 9 0.30 0.30 36 29.16
5.0 - 7.0 6.0 15 24 0.50 0.80 90 0.60
7.0 - 9.0 8.0 6 30 0.20 1.00 48 29.04
9.0 - 11.0 10.0 0 30 0.00 1.00 0 0.00
11.0 - 13.0 12.0 0 30 0.00 1.00 0 0.00
ny= 30
1
y=𝑛∑ Yi*fi =5.8
1
s2 =𝑛−1∑ ((Yi-Y)^2)*fi =2.25 s = 1.50
Z 𝛼⁄2=2.05
IC =0.196≤ 𝜇𝑁 − 𝜇𝐶 ≤1.744
Conclusión:
La diferencia de medias del tiempo de uso de smartphone por los estudiantes
de las sedes lima norte y lima centro está comprendida entre 0.196 y 1.744
con un nivel de confianza de 0.96.
8.3 Prueba de hipótesis para la media de una población
El director de la UTP menciona que sus alumnos pasan en promedio 5.5
horas en su smartphone, para lo cual se toma una muestra de 60 estudiantes
obteniendo una media muestral de 6.38 h con una desviación estándar
muestral de 1.55. ¿Esto sugiere que los alumnos usan su Smartphone más
de 4.5 horas a un nivel de significancia de 0.05?
Variable:
X: tiempo de uso de Smartphone por los estudiantes de la UTP
DATOS:
n= 60
1
x=𝑛∑ Xi*fi =6.38
1
s2 =𝑛−1∑ ((Xi-X) ^2)*fi =2.41 s = 1.55
c) Estadístico de prueba
𝑋− 𝜇
𝑍𝑐 =
𝑆
√𝑛
6.38 − 5.5
𝑍𝑐 =
1.55
√60
𝑍𝑐 = 4.398
d) Regla crítica
e) Regla de decisión
𝑍𝑐 ≥ 𝑍𝑎/2 𝑣 𝑍𝑐 ≤ − 𝑍𝑎/2
f) Conclusión
Se concluye que el tiempo de uso de Smartphone entre los
estudiantes es de 5.5 horas a un nivel de significancia de 0.05.
8.4 Prueba de hipótesis para dos medias poblacionales
Pruebe la hipótesis de que no hay diferencia en el tiempo promedio de uso
de Smartphone de las dos sedes. Se estima que las poblaciones se
distribuyen de forma aproximadamente normal. Se usará un nivel de
significancia de 0.05.
Variable:
X: tiempo de uso de Smartphone por los estudiantes de la SLN
((Xi-
H.U.S. Xi fi Fi ni Ni Xi*fi
X)^2)*fi
3.0 - 5.0 4.0 9 9 0.30 0.30 36 29.16
5.0 - 7.0 6.0 15 24 0.50 0.80 90 0.60
7.0 - 9.0 8.0 6 30 0.20 1.00 48 29.04
9.0 - 11.0 10.0 0 30 0.00 1.00 0 0.00
11.0 - 13.0 12.0 0 30 0.00 1.00 0 0.00
Variable:
Y: tiempo de uso de Smartphone por los estudiantes de la SLC
H.U.S. Yi fi Fi ni Ni Yi*fi ((Yi-Y)^2)*fi
4.5 - 5.5 5.0 8 8 0.27 0.27 40 24.97
5.5 - 6.5 6.0 7 15 0.23 0.50 42 4.11
6.5 - 7.5 7.0 5 20 0.17 0.67 35 0.27
7.5 - 8.5 8.0 4 24 0.13 0.80 32 6.08
8.5 - 9.5 9.0 6 30 0.20 1.00 54 29.93
Datos:
nx= 30
1
x=𝑛∑ Xi*fi =5.8
1
s2 =𝑛−1∑ ((Xi-X)^2)*fi =2.03 s = 1.42
ny= 30
1
y=𝑛∑ Yi*fi =5.8
1
s2 =𝑛−1∑ ((Yi-Y)^2)*fi =2.25 s = 1.50
a) Plantear las hipótesis
Ha: 𝜇𝑁 = 𝜇𝐶
Ho: 𝜇𝑁 ≠ 𝜇𝐶
c) Estadístico de prueba
(𝑥𝑁 − 𝑥𝐶 ) − (𝜇𝑁 − 𝜇𝐶 )
𝑍𝑐 =
𝑆 2 𝑥𝑁 𝑆 2 𝑥𝐶
√ +
𝑛𝑁 𝑛𝐶
(5.8 − 6.77) − 0
𝑍𝑐 =
√2.25 + 2.03
30 30
𝑍𝑐 = −2.56
d) Regla crítica
e) Regla de decisión
𝑍𝑐 ≥ 𝑍𝑎/2 𝑣 𝑍𝑐 ≤ − 𝑍𝑎/2
f) Conclusión
Se concluye que el tiempo de uso de Smartphone entre las dos sedes
no es diferente a un nivel de significancia de 0.05.
8.5 Intervalo de confianza para la proporción de una población
En una muestra aleatoria de n=60 estudiantes de la UTP, se encuentra que
x=35 son del género masculino. Calcule un intervalo de confianza del 95 %
para la proporción real de los estudiantes que son de la UTP y que además
son del género masculino.
DATOS:
x = estudiante de la UTP del género masculino
pX = proporción de estudiantes de la UTP que son del género masculino
pX = 35/60 = 0.58
qX= (1 - 0.58) = 0.42
n= 60
N.C. = 95 %
Z 𝛼/2 = 1.96
𝑝𝑥 𝑞𝑥 𝑝𝑥 𝑞𝑥
𝐼𝐶 = 𝑝𝑥 − 𝑍𝛼⁄2 √ ≤ 𝜋 ≤ 𝑝𝑥 + 𝑍𝛼⁄2 √
𝑛 𝑛
0.58 ∗ 0.42 0.58 ∗ 0.42
𝐼𝐶 = 0.58 − 1.96√ ≤ 𝜋 ≤ 0.58 + 1.96√
60 60
𝐼𝐶 = 0.58 − 0.12 ≤ 𝜋 ≤ 0.58 + 0.12
𝑰𝑪 = 𝟎. 𝟒𝟔 ≤ 𝝅 ≤ 𝟎. 𝟕𝟎
DATOS:
x = estudiante de la UTP sede Lima Centro que es mujer
y = estudiante de la UTP sede Lima Norte que es mujer
px = proporción de estudiante de la UTP sede Lima Centro que son mujeres
py = proporción de estudiante de la UTP sede Lima Norte que son mujeres
px = 12/30 = 0.40 py = 13/30 = 0.43
qx= (1 - 0.40) = 0.60 qy= (1 - 0.43) = 0.57
nx= 30 ny = 30
N.C. = 90 %
Z 𝛼/2 = 1.64
𝑝𝑥 𝑞𝑥 𝑝𝑦 𝑞𝑦 𝑝𝑥 𝑞𝑥 𝑝𝑦 𝑞𝑦
𝐼𝐶 = (𝑝𝑥 − 𝑝𝑦 ) − 𝑍𝛼⁄2 √ + ≤ 𝜋𝑥 − 𝜋𝑦 ≤ (𝑝𝑥 − 𝑝𝑦 ) + 𝑍𝛼⁄2 √ +
𝑛𝑥 𝑛𝑦 𝑛𝑥 𝑛𝑦
0.40 ∗ 0.60 0.43 ∗ 0.57 0.40 ∗ 0.60 0.43 ∗ 0.57
𝐼𝐶 = (0.40 − 0.43) − 1.64√ + ≤ 𝜋𝑥 − 𝜋𝑦 ≤ (0.40 − 0.43) + 1.64√ +
30 30 30 30
𝐼𝐶 = (−0.03) − 0.21 ≤ 𝜋𝑥 − 𝜋𝑦 ≤ (−0.03) + 0.21
𝑰𝑪 = −𝟎. 𝟐𝟒 ≤ 𝜋𝑥 − 𝜋𝑦 ≤ 𝟎. 𝟏𝟖
DATOS:
x = estudiante de la UTP que es del género masculino
pX = proporción de estudiantes de la UTP que son del género masculino
px = 35/60 = 0.58
p0 = 0.44
n= 60
N.S. = 0.05
a) Plantear la hipótesis
H0: px ≤ 0.44
Ha: px > 0.44
b) Especificar nivel de significancia
N.S. = 𝛼 = 0.05
c) Establecer la estadística de prueba
𝑝𝑥 − 𝑝0
𝑍𝑐 =
√𝑝0 (1 − 𝑝0 )
𝑛
0.58 − 0.44
𝑍𝑐 =
√0.44(1 − 0.44)
60
0.14
𝑍𝑐 =
0.064
𝑍𝑐 = 0.19
d) Región crítica
Ha: px > p0
𝑍𝛼 = 1.64
e) Regla de decisión
𝑍𝑐 = 2.18 𝑣𝑠 𝑍𝛼 = 1.64
𝑍𝑐 = 2.18 > 𝑍𝛼 = 1.64
Rechazar H0: px ≤ 0.44
f) Conclusión
Hay un crecimiento significativo en la proporción de estudiantes de la
UTP que son del género masculino
8.8 Prueba de hipótesis para las proporciones de dos poblaciones.
En un estudio sobre el sistema operativo de Smartphone que usan los
estudiantes de la UTP, se seleccionan dos grupos de estudiantes de la UTP
de entre 17 y 38 años de edad que usan Smartphone, y a cada uno se le
preguntó si utilizaba el sistema operativo Android u otro. Se seleccionó un
grupo de estudiantes de la UTP menores de 23 años y otro de estudiantes de
la UTP con 23 años a más. Se obtuvo que 23 de 32 estudiantes de la UTP
menores de 23 años usan el sistema operativo Android en sus smartphone’s,
en comparación con 20 de 28 estudiantes de la UTP con 23 años a más.
¿Podemos concluir que la proporción de estudiantes de la UTP menores de
23 años que usan Android es significativamente mayor que la proporción de
estudiantes de la UTP con 23 años a más que también lo usan? Usar un nivel
de significancia de 0.01.
DATOS:
x = estudiante de la UTP menor de 23 años que usa el S.O. Android
y = estudiante de la UTP con 23 años a más que usa el S.O. Android
pX = proporción de estudiantes de la UTP menores de 23 años que usan el S.O.
Android
py = proporción de estudiantes de la UTP de 23 años a más que usan el S.O.
Android
px = 23/32 = 0.72 py = 20/28 = 0.71
nx = 32 ny = 28
N.S. = 0.01
a) Plantear la hipótesis
H0: px ≤ py
Ha: px > py
b) Especificar nivel de significancia
N.S. = 𝛼 = 0.01
c) Establecer la estadística de prueba
𝑝𝑥 − 𝑝𝑦 ∑𝑥 + ∑𝑦
𝑍𝑐 = 𝑃=
𝑛𝑥 + 𝑛𝑦
1 1
√𝑃(1 − 𝑃)(𝑛 + 𝑛 )
𝑥 𝑦
23 + 20 43
𝑃= = = 0.72
32 + 28 60
0.72 − 0.71
𝑍𝑐 =
√0.72(1 − 0.72)( 1 + 1 )
32 28
0.01
𝑍𝑐 =
0.12
𝑍𝑐 = 0.83
d) Región crítica
Ha: px > py
𝑍𝛼 = 2.32
e) Regla de decisión
𝑍𝑐 = 0.83 𝑣𝑠 𝑍𝛼 = 2.32
𝑍𝑐 = 0.83 < 𝑍𝛼 = 2.32
Aceptar H0: px ≤ py 0.72 ≤ 0.71
f) Conclusión
La proporción de estudiantes de la UTP menores de 23 años que usan
Android no es significativamente mayor que la proporción de
estudiantes de la UTP con 23 años a más que también lo usan.
8.9 Intervalo de confianza para la varianza de una población.
El director de la UTP necesita conocer la variabilidad del promedio de horas diarias
dedicadas al uso del Smartphone. Para ello utiliza una muestra de 30 personas y
comprueba que la desviación muestral es 1.64. Supongamos que la distribución es
normal. Calcule un intervalo de confianza del 95% para la varianza poblacional.
Datos
n =60
gl =60-1=59
S = 1.64
S 2 = 2.69
b)Región crítica
α
𝑥 2 (1 − ; n − 1) = 𝑥 2 (0.975; 29) = 45.722
2
α
𝑥 2 ( ; n − 1) = 𝑥 2 (0.025; 29) = 16.047
2
(n − 1)𝐒 𝟐 (n − 1)𝐒 𝟐
α ≤ 𝜎2 ≤ α
𝑥 2 (1 − 2 ; n − 1) 𝑥 2 (2 ; n − 1)
1.706 ≤ 𝜎 2 ≤ 4.861
c)Conclusión:
Por lo tanto diremos, que con un 95% de confianza el intervalo para la
variabilidad del promedio de horas diarias dedicadas al uso del
Smartphone esta entre 1.706 y 4.861.
8.10 Intervalo de confianza para la razón de dos varianzas
poblacionales
El decano de la UTP quiere conocer y comparar la variabilidad promedio de horas
diarias dedicadas al uso del Smartphone. Para ello se toma dos muestras A y B.
Se sabe que el promedio diario se distribuye normalmente. Dos muestras
aleatorias de 30 personas de A y la otra de 30 de B, revelaron los siguientes
promedios de horas diarias:
A B
7.0 7.0 5.5 5.0
5.5 9.0 6.5 6.0
9.0 6.0 6.0 6.5
7.5 8.5 7.0 5.5
5.0 7.0 5.5 3.5
5.0 6.0 8.0 4.0
5.0 7.5 8.5 4.0
4.5 4.5 7.0 3.5
6.5 5.0 4.5 3.0
5.0 6.0 6.0 6.5
6.0 9.0 5.0 6.5
5.5 8.0 4.0 5.0
8.5 8.0 7.0 5.0
5.0 8.5 5.5 4.5
6.0 7.0 8.0 4.0
Muestar A Muestra B
S 2 =2.161 S 2 =2.041
n=30 n=30
V=30-1=29 V=30-1=29
a) 𝛼 /2= 0,025
1-𝛼/2= 0,975
b) Región crítica
f (𝛼/2;V1;V2)=f(0.025;29;29) =1.861
f (𝛼/2;V2;V1)=f(0.025;29;29) =1.861
𝐒 𝟐 (𝐀) 𝟏 𝟐. 𝟏𝟔𝟏 𝟏
( )( )=( )∗( ) = 𝟎. 𝟓𝟔𝟗
𝐒 𝟐 (𝐁) 𝐟 (α/2; V1; V2) 𝟐. 𝟎𝟒𝟏 𝟏. 𝟖𝟔𝟏
𝜎 2 (𝐀)
𝟎. 𝟓𝟔𝟗 ≤ ( 2 ) ≤ 𝟏. 𝟕𝟓𝟖
𝜎 (𝐁)
c) Conclusión:
Con un nivel de confianza del 95% el intervalo se encuentra entre 0.569 y 1.758,
lo que quiere decir que las dos varianzas no son iguales.
8.11 Prueba de hipótesis para la varianza de una población
Un estudiante de la UTP desea contrastar las varianza poblacional del promedio
de horas diarias dedicadas al uso del Smartphone, y conoce que la varianza es
1.252. Otro estudiante con una muestra de 30 personas obtiene una varianza 2.041.
Considerando este promedio de horas diarias como una muestra aleatoria de una
población normal .Considere la hipótesis nula de que la varianza poblacional del
promedio de horas es 2.55, frente a la alternativa bilateral con 𝛼=0,05.
Datos:
σ2=1.252
S 2 =2.041
n=30
v=30-1=29
a)
H0: σ2 =2.55
Ha: σ2 ≠ 2.55
b)
𝛼=0.05
𝛼 /2= 0.025
1-𝛼/2= 0,975
c) Estadístico de prueba
α
𝑥 2 ( ; n − 1) = 𝑥 2 (0.025; 29) = 16,097
2
α
𝑥 (1 − ; n − 1) = 𝑥 2 (0.975; 29) = 45.722
2
2
2
(𝑛 − 1) × 𝒔𝟐 29 × 2.041
𝑥 = = = 47.351
𝛔𝟐 1.252
d) Región crítica
e) Regla de decisión
Como 𝑥 2 > 45,722 , rechazamos la hipótesis nula (H0) la cual significa que la
variaza es diferente de 2.55
H0: 𝛔𝟐 =2.55 (se rechaza)
Ha: 𝛔𝟐 ≠ 2.55 (se acepta)
f) Conclusión:
Con un nivel de significación de 5% la varianza poblacional del promedio de horas
diarias del uso de un Smartphone es diferente a 2.55.
8.12 Prueba de hipótesis para la razón de dos varianzas poblaciones.
Muestar A Muestra B
S 2 =5.523 S 2 =2.908
n=30 n=30
V=30-1=29 V=30-1=29
a)
H0= σ2(A) ≤ σ2(B)
Ha=σ2(A) > σ2(B)
b)
𝛼=0,05
𝛼/2= 0,025
c) Estadístico de prueba
f(0,05; 29; 29) = 1,861
d) Región crítica
𝐒 𝟐 (𝐀) 𝟓. 𝟓𝟐𝟑
𝑭= 𝟐
= = 𝟏. 𝟗𝟎𝟒
𝐒 (𝐁) 𝟐. 𝟗𝟎𝟖
e)Regla de decisión:
1.904 > 1.861 se rechaza Ho
f)Conclusión:
Como f calculado es 1.904 cae en la region critica rechazamos la hipotesis nula y
concluimos que los valores del grupo A , tienen mayor variacion.
8.13 Prueba de bondad da ajuste. (Para una distribución Binomial o
Poisson )
8.14 Prueba de independencia.