Sei sulla pagina 1di 3

Inferencia Estadı́stica

Tarea 3 (Estadı́stica Descriptiva)


Semestre 2019-2
Usar R
1. A continuación se presenta un diagrama de tallo y hoja que muestra los puntajes obtenidos
por estudiantes en un examen final de un curso de sociologı́a.
Diagrama de tallo y hoja
Calificaciones
2 57
3 244
4 1179
5 03368
6 012447
7 223556899
8 00457
9 0036

a) Encuentre la mediana de las calificaciones.


b) Encuentre los cuartiles Q1 y Q3 .
c) ¿Qué proporción de los estudiantes obtuvo calificaciones menores que 70, 80 y 100?
d) Dé una interpretación con los resultados obtenidos.

2. Se muestran el número de pasajeros en un tour de minibús en Hollywood.


9 12 10 11 11 7 12 6 11 4 10 10 11 9 10 7 10 8 8 9 8 9 11 9 8 6 10 6 8 11

a) Encuentra la mediana muestral.


b) Encuentre la media muestral.
c) Encuentre la varianza muestral y la desviación estándar.
d) Encuentre el coeficiente de asimetrı́a γ1 .
e) Encuentre el coeficiente de curtosis γ2 .
f) Encuentre la moda.
g) Dé una interpretación con los resultados obtenidos.

3. Conside el siguiente conjunto de datos que se obtuvo de una recaudación detallada de compras
de pasta dental durante varios años. Los tiempo de uso (en semanas) por onza de pasta dental
para un hogar tomado de un panel de consumidores fueron
.74 .45 . 80 .95 .84 .82 .89 .75 .76 .81 .85 .75 .89 .76 .89 .99 .71 .77 .55 .85 .77 .87

a) Grafique un diagrama de puntos de los datos.


b) Encuentre la frecuencia relativa de los tiempos de uso que no exceden .80.
2

c) Calcule la media y la desviación estándar.


d) Calcule la mediana y los cuartiles.
e) Calcule los coeficientes γ1 y γ2 .
f) Dé una interpretación con los resultados obtenidos.

4. Se tiene el siguiente resumen estadı́stico obtenido de un conjunto de datos:


x̄ = 80.5 s = 10,5 mediana = 84.0 Q1 = 75.5 Q3 = 96.0
Aproximadamente, ¿Qué proporción de las observaciones están:

a) por debajo de 96.0?


b) por arriba de 84.0?
c) en el intervalo (59.5, 101.5)?
d) en el intervalo (75.5, 96.0)?
e) en el intervalo (49.0, 112.0)?

Establezca cual de sus respuestas está basada en el supuesto de una distribución en forma de
campana.
5. Las siguientes 20 pérdidas por vientos fuertes (en millones de doláres) se recopilaron en un
año:
1 1 1 1 1 2 2 3 3 4 6 6 8 10 13 14 15 18 22 25

a) Construya una ojiva basándose en fronteras de clase en 0.5, 2.5, 8.5, 15,5 y 29.5.
b) Construya un histograma usando las mismas fronteras que en la parte a).

6. Conteste lo siguiente:

a) Desarrolle fórmulas similares a la que se hicieron en clase para µ2 (el segundo momento
central), para µ3 y µ4 . Finalmente, dé una fórmula explı́cita para los coeficientes de
asimetı́a γ1 y curtosis γ3 . Y explique como se interpretan éstos últimos.
b) Defina, describa, explique y ejemplifique en que consiste y como se utiliza el diagrama
de caja y brazos, conocido también como boxplot.

7. Se recolectaron 50 mediciones de lluvia ácida en Wisconsin.


3.58 3.80 4.01 4.01 4.05 4.05
4.12 4.18 4.20 4.21 4.27 4.28
4.30 4.32 4.33 4.35 4.35 4.41
4.42 4.45 4.45 4.50 4.50 4.50
4.50 4.51 4.52 4.52 4.52 4.57
4.58 4.60 4.61 4.61 4.62 4.62
4.65 4.70 4.70 4.70 4.70 4.72
4.78 4.78 4.80 5.07 5.20 5.26
5.41 5.48

a) Calcule la mediana y los cuartiles


3

b) Encuentre el 90vo percentil.


c) Determine la mediana y la desviación estándar.
d) Grafique los datos en un diagrama de caja y brazos (boxplot).
e) Determine los intervalos x̄ ± s, x̄ ± 2s y x̄ ± 3s
f) ¿Qué proporción de medidas yacen en los intervalos anteriores?
g) Compare sus resultados con la guı́a empı́rica para distribuciones en forma de campana,
e interprete.
h) Haga un histograma con los datos.

8. Los tiempos en los que ganaron los nadadores de la competencia de estilo libre en los juegos
Olı́mpicos de 1964 a 2008 aparecen en la siguiente tabla:
Tiempos donde ganaron en minutos y segundos.
Año Tiempo
1964 4:12.2
1968 4:09.0
1972 4:00.27
1976 3:51.93
1980 3:51.31
1984 3:51.23
1988 3:46.95
1992 3:45.00
1996 3:47.97
2000 3:40.59
2004 3:43.10
2008 3:41.86

a) Dibuje un diagrama de puntos y etiquete los puntos de acuerdo al orden del tiempo.
b) Explique porqué no es razonable agrupar los datos en una distribución de frecuencia.

Potrebbero piacerti anche