Sei sulla pagina 1di 5

UNIVERSIDAD NACIONAL DE JUJUY – FACULTAD DE INGENIERÍA Trabajo Práctico

N° 1
PROBABILIDAD Y ESTADÍSTICA 2017

TEMA: ESTADÍSTICA DESCRIPTIVA - AED

TRABAJO PRÁCTICO Nº1:


TEMAS:
 Población y Muestra. Parámetros y Estadísticos.
 Descripción Estadística de una Variable. Tipos de Datos. Variables categóricas o cualitativas o atributos. Variables numéricas o
cuantitativas: Discretas y Continuas. Escalas de Medición de Variables Cualitativas y Numéricas: Escala Nominal y Escala Ordinal.
Escala de Intervalo y Escala de Razón.
 Datos cualitativos:
Organización y resumen de datos cualitativos. Distribuciones de frecuencias absolutas, relativas y porcentuales.
Representaciones gráficas de datos cualitativos. Gráficos de barras, de tortas y de puntos.
Tablas de Contingencia.
 Datos cuantitativos o numéricos:
Organización y resumen de datos numéricos agrupados y sin agrupar. Distribuciones de frecuencias absolutas, relativas, porcentuales
y acumuladas.
Representaciones gráficas de datos numéricos sin agrupar.
Representaciones gráficas de datos numéricos agrupados: Histogramas y polígonos de frecuencias absolutas, relativas y porcentuales.
Polígono porcentual acumulado u ojiva.
EJERCICIOS
1º) En los siguientes ejemplos, determinar:
a) Cuál es la /s variable/s en estudio y de qué tipo es cada una de ellas. b) Cual es la muestra y cuál es la población de la que proviene.
1.1.-En un vivero se midió la altura de ocho abedules a las tres semanas de darle un determinado fertilizante.
1.2.-Se capturaron 30 truchas hembras y se las peso, luego se determino el número de huevos que contenían.
1.3.-Se telefoneo a 10 localidades de los pueblos andinos para informarse sobre el número de enfermos de hepatitis.
1.4.-Se analizaron los saldos de 200 cuentas corrientes de empresas en el banco R.
1.5.-Se realizo un estudio del nivel de ingreso de la población de San Pedro de Jujuy en base a una muestra de 4000 residentes.
2°) Clasifique las siguientes variables e indique el nivel de medición
a) Color de ojos
b) Número de accidentes producidos en un determinado mes
c) Número de bacterias de cierto tipo, por mililitro
d) Número de incendios producidos en una localidad
e) Velocidad de un vehículo al pasar por un determinado punto
f) El tiempo que le tomara atender a un paciente a un doctor.
g) Razas de perros
h) Temperaturas medidas en un observatorio
i) Numero de rescates realizados por bomberos en una ciudad.
j) Centímetros de lluvia en una ciudad
k) Numero de materias aprobadas por año.
l) Número de pétalos de una flor.
m) Ingresos familiares anuales por salarios

3°) Suponga que se obtiene información sobre discordancias en paquetes de circuitos: componentes con fallas, 126; componentes
incorrectos, 210; soldadura insuficiente, 67; exceso de soldadura, 54; componente faltante, 131.Obtenga las frecuencias absolutas y
relativas. Realice el grafico más conveniente. Construya un diagrama de Pareto. Saque conclusione.
a) Convierta los datos en porcentajes y construya.
(1) Un gráfico de barras. (2) Un gráfico de tortas.
b) ¿Cuál de estas gráficas prefiere usar aquí? ¿Por qué?
4°) Considere los datos siguientes acerca del tipo de dolencia (J= inflamación de las articulaciones, F= fatiga, B= dolor de espalda, M=
debilidad muscular, C=tos, N= irritación de la nariz, O=otra) de sembradores de árboles. Obtenga las frecuencias absolutas y relativas para
las distintas categorías y grafique de la manera másconveniente( datos artículo “Phycologicaleffects of work stress and pesticideexposure
en treeplantingby British Columbia SilvicultureWorkers ) Ergonomics, 1993.

1
O O N J C F B B F O J O O M O F F O O N O N J F J B O C J O J J F N O B M O J M O B O F J O O B N C O OO M B F J O F N
Resuma la información anterior en una tabla de distribución de frecuencias.
a) Construya un gráfico adecuado. Construya el diagrama de Pareto. Cite conclusiones
b) Calcule y comente alguna medida de resumen de estos datos.

5°) Se entrevistaron a 16 familias en un pueblo de Jujuy, donde se les pregunto:¿Cuál es el número de miembros que integran su familia?,
dando los siguientes resultados:
3 4 5 1 4 3 2 5
5 4 7 2 4 5 3 4
Construya una tabla de distribución de frecuencias para datos no agrupados y realice los gráficos correspondientes.
6º) Se tienen las edades de los ingresos de pacientes en una guardia de un hospital de una ciudad durante una semana.
23 24 33 33 45 31 36 42 27
22 31 27 31 36 34 25 58 39
24 26 18 43 41 42 45 43 22
42 35 33 27 24 40 35 45 22
Construya la tabla de distribución de de frecuencias para datos no agrupados y realice los gráficos necesarios
a) ¿Cuántos tallos fueron medidos en total?
7°) La tabla siguiente contiene la distribución de frecuencias de
b) ¿Qué tamaños de tallos es más frecuente encontrar?
la longitud de tallos de una especie de arbusto dominante del
c) Construya el polígono de frecuencias acumuladas porcentual
Monte Pampeano.
(ojiva). A partir del polígono de frecuencias conteste lo
Largo Frecuencia Porcentaje siguiente: ¿Qué porcentaje (aproximado) de tallos es menor que
Frecuencia Porcentaje
[cm] acumulada acumulado 32 cm? La mitad de los tallos es menor o igual a qué valor?
10-15 6 1.2 6 1.2 d) Discuta la veracidad de la siguiente afirmación:
15-20 35 7.0 41 8.2 "aproximadamente el 83% de los tallos miden menos de 35 cm".
20-25 93 18.6 134 26.8 e) Discuta y argumente la efectividad de una técnica mecánica
25-30 155 31.0 289 57.8 para el control de los arbustos (desarbustizado) en la cual, por
30-35 130 26.0 419 83.8 motivos operativos, la barra de corte trabaja a 40 cm del nivel
35-40 57 11.4 476 95.2 del suelo.
40-45 24 4.8 500 100.0
Sobre la base de esta tabla, responda las siguientes preguntas.

8°)Los siguientes datos representan los recibos de impuestos de ventas trimestrales (en $) presentados al administrador del municipio de
Gmoserville para el período que finaliza en marzo de 1994 tomados de una muestra de 50 establecimientos de negocios en esa localidad:
10,30 - 11,10 - 9,60 - 9,00 - 14,50 -13,00 - 6,70 - 11,00 - 8,40 - 10,30 - 13,00 - 11,20 - 7,30 - 5,30 - 12,50 - 8,00 - 11,80 - 8,70 - 10,60 -
9,50 - 11,10 - 10,20 - 11,10 - 9,90 - 9,80 -11,60 - 15,10 - 12,50 - 6,50 - 7,50 - 10,00 - 12,90 - 9,20 - 10,00 - 12,80 -12,50 - 9,30 - 10,40 -
12,70 - 10,50 - 9,30 - 11,50 - 10,70 - 11,60 - 7,80 - 10,50 - 7,60 - 10,10 - 8,90 - 8,60
a)Construya una distribución de frecuencias, frecuencias relativas, relativas porcentuales, acumulativas porcentuales.
b) Grafique el Histograma y el Polígono de Frecuencias relativas
c) Grafique la Ojiva

9°)Un profesional de las ciencias naturales desea mostrar gráficamente en un congreso sus resultados que apoyan la hipótesis que una
determinada industria esta contaminando el agua de un arroyo al cual evacua sus efluentes. Sus datos consisten en 60 muestras de agua.
Treinta (30) tomadas aguas arriba del establecimientoy las otras 30 , aguas abajo. A continuación se indican los valores de concentración
de uno de los metales pesados encontrados en las muestras de agua den ambos sitios de muestreo:
Sitio 1:
8 10 6 9 4 7 5 12 8 7
8 7 12 5 6 9 7 10 6 8
6 4 5 9 8 11 8 6 12 9

Sitio 2:
9 12 8 15 12 10 7 12 10 14
12 13 10 12 9 12 7 13 15 10
9 14 10 10 13 12 12 15 11 9

a) Represente los datos de manera que se visualice claramente lo


que el profesional desea poner de manifiesto
b) Compare y cite conclusiones.

2
10°) Se le pregunto a las personas que asisten a un centro sanitario sobre el grado de satisfacción respecto de la atención de dicho
centro siendo sus respuestas las siguientes:
Respuestas
Sexo No Satisfecho Satisfecho Muy Total
Satisfecho
Hombre 201 369 55 625
Mujer 263 498 114 875
Total 464 867 169 1500
a) Construya una tabla con porcentajes de filas.
b) Construya una tabla con porcentajes de columnas
c) Realice los gráficos correspondientes ¿Qué concluiría de este estudio?
11°) Analice la variación conjunta del espesor de la cascara de naranjas y el contenido de jugo de las mismas (en cm3)
Orden observado 1 2 3 4 5 6 7 8 9 10
Espesor(X en mm) 7 6 5 6 5 6 4 3 2 2
Jugo(Y en cm3) 2 3 4 5 5 5 6 6 7 9
a) Construya la tabla de contingencia para los datos.
b) Grafique los datos en un diagrama de dispersión

ESTADISTICA DESCRIPTIVA
TEMAS
Propiedades de los datos numéricos: tendencia central, dispersión y forma.
 Medidas de tendencia central de datos numéricos: media aritmética, moda, mediana, rango medio, eje medio.
 Medidas de dispersión de datos numéricos: rango, rango intercuartílico, varianza, desviación estándar, coeficiente de
variación.
 Curtosis. Coeficiente de Curtosis. Asimetría. Coeficientes de asimetría.
 Medidas de Posición No Central: Cuartiles. Percentiles.

12°) Los siguientes datos representan el numero de bovinos que nacieron vivos en 30 estancias en el sur del país.
20 21 22 23 21 24 23 24 22 22 22 23 21 23 22
23 23 22 24 24 25 25 23 21 25 20 20 24 22 23
a) Calcule la media, la mediana, el rango medio y el eje medio. Observando la distribución del número de bovinos. ¿Qué medidas
descriptivas parecen mejores y cuáles parecen peores? ¿y por qué?
b) ¿De qué manera sería útil esta información para el dueño de la estancia? Analice.
c) Calcule el rango, la varianza y desviación estándar
d) determine el tipo de asimetría que tiene la distribución.

13°) Se realizo un examen parcial a 44 alumnos cuyos resultados se exponen en el siguiente cuadro de frecuencias.
Nota (X) 1 2 3 4 5 6 7 8 9 10 Total
Cantidad de alumnos(fi) 2 5 7 14 6 5 2 0 2 1 44
A fin de describir la distribución de las notas de los alumnos. A tal fin:
a) Defina la variable bajo estudio y diga que tipo es.
b) Indique los valores de las cuatro medidas de tendencia central: la nota mediana, nota promedio , rango medio y eje medio.
Compárelas.
c) ¿Para describir la tendencia central del conjunto de notas qué medida elegiría: la media o la mediana? ¿Por qué?
d) ¿Qué porcentaje de notas se encuentran en el intervalo x  s?
e) Calcular la varianza, la desviación estándar y el coeficiente de variación.
f) ¿Cuál es el valor del sexto decil?
g) ¿Cuál es el valor del percentil 25, 50 y 75?

PERCENTILES
Definición: el 100k-ésimo percentil pk es un valor tal, que al menos el 100k% de las observaciones están en ese valor o por
debajo de él, y al menos el 100(1-k)% están en ese valor o por encima de él.
Nótese que el primer cuartil q1 = p0,25 , el tercer cuartil q3 = p0,75 y que la mediana es p0,50.
El procedimiento para encontrar el valor de cualquier percentil p k a partir de los datos ordenados, es el siguiente:
1) Encontrar la posición “i” del percentil mediante el cálculo de nk.
Si nknoes un entero, entonces i es el siguiente entero más grande.
Si nk es un entero, entonces i es igual a nk + 0,5 ;
2) Si i es un entero, cuéntese desde la observación más pequeña hasta hallar el i-ésimo valor.
Si i no es un entero, entonces contiene una fracción igual a 1/2, con lo que el valor de pk es el promedio de las
observaciones ordenadas nk y(nk+1).

14°) En elejercicio 8º) referidoa los impuestos de ventas trimestrales (en $) de 50 establecimientos de negocios
a) Calcule la Media, Mediana, Moda, Rango Medio y Eje Medio para esta población. Márquelas en el histograma hallado en el TP
N° 1.
b) Determine los Cuartiles 1º y 3º.
c) Calcule el Rango, Rango Intercuartil, Varianza, Desviación Estándar, y Coeficiente de Variación para esta población.
d) El Coeficiente de Asimetría de Pearson. Interprete. (Trabaje con Excel)
e) El Coeficiente de Curtosis de Fisher. Interprete. (Trabaje con Excel)
f) ¿Qué proporción de estos negocios tienen recibos de impuestos de ventas trimestrales:
1) Dentro de 1 desviación estándar de la media?
2) Dentro de 2 desviación estándar de la media?
g) ¿Está sorprendido por los resultados de e)? Compare y contraste sus resultados con lo que esperaría basándose en la regla
empírica.
15°) Una empresa de taxis registró los siguientes kilometrajes recorridospor sus 8 automóviles para cubrir viajes en la sucursal de
la zona A el último mes:
5516 7820 3010 8294 5232 5780 6548 4500
El titular de la empresa opina que el rendimiento de dicha sucursal es algo irregular y que podría ser optimizado lanzando una
campaña publicitaria en dicha zona. Para compara se basa en los registros de la sucursal B, que el mes pasado arrojo un promedio
de 7600 km y un desvió estándar de 1200 km.
a) Indique cual de las dos sucursales tiene kilometraje más homogéneo y si la opinión del titular es aceptable.
16°) Los siguientes datos representan la cantidad de autos que llegan a una caseta de peaje durante intervalos de 10 minutos cada
uno.
a) Calcule la media, la mediana y la moda.

26 21 26 18 58 16 24 20 22 34 22 24 15 27 33 30 19 31 27 33
¿Cuál de las tres le parece mejor medida de la tendencia central de los datos? Justifique
b) Hallar la varianza, la desviación estándar. c) Estudie la simetría y la curtosis
17°) Los siguientes datos corresponden al número de días de trabajo perdidos por enfermedad durante el cuarto trimestre del año
por los 35 empleados de una gestoría:
2 1 0 1 1 3 0 0 2 7 5 0 1 3 0 0 4 1
2 4 0 5 3 0 6 0 4 0 2 6 2 3 0 1 1
a) Estudiar la asimetría y curtosis de la variable que mide el número de días de trabajo perdidos por enfermedad por esos 35
empleados
b) ¿Qué porcentaje de empleados se encuentran en el intervalo x  s ?

18°) En el ejercicio 9º) referido al estudio de los investigadores


Determine el máximo y el mínimo y calcule las medidas de tendencia central: media, moda y rango medio y las medidas de
dispersión. Varianza muestral, desviación estándar, rango y coeficiente de variación para el sitio 1 y 2 de la toma de datos.
Compare los máximos, los mínimos, la tendencia central y la dispersión y cite conclusiones.
a) Ubique las medidas de tendencia central halladas en los histogramas construidos en el ejercicio 12ª) Analice
19°) Unos grandes almacenes disponen de un aparcamiento para sus clientes. Los siguientes datos que se refieren al número de
horas que permanecen en el estacionamiento una serie de coches:
442453635321373151725247362241643345432432443664554551744365
a) Defina correctamente la variable. Indique si es numérica ó categórica y en que escala se mide. Los datos, ¿constituyen una
muestra o una población?
b) Determine los cuártales, la mediana, el percentil 32 y el percentil 74 de los datos e intérprete.
c) ¿Cuántas autos estacionan en el intervalo x  s y cuántos en el intervalo?

ANALISIS EXPLORATORIO DE DATOS (AED)


TEMAS:
Técnicas básicas del AED: Diagrama de Tallo y Hoja (stem and leaf). Resúmenes Numéricos ( lettervalues).
Diagramas Tipo Caja (box-plot). Aplicaciones.

20°) Una empresa de colectivos urbanos registro la cantidad de pasajeros transportados durante 50 viajes ; con el siguiente
resultado:
55 54 52 54 53 54 52 55 54 55 55 55 53 54 53 55 57 58 56 53 54 55 56 55 54
53 56 59 54 56 55 56 55 55 57 52 56 55 54 53 53 55 53 53 54 53 56 55 54 5 5
a) Construya un diagrama de tallo y hoja. Comente acerca de la distribución.

4
b) Elabore un resumen de cinco números y construya un diagrama de caja (box-plot) (No se olvide de buscar las observaciones
alejadas y muy alejadas). Comente acerca de la distribución.
c) En ambos diagramas analice las medidas de tendencia central y dispersión.
21°) En elejercicio 8º) referido a los impuestos de ventas trimestrales de 50 establecimientos de negocios, organice los datos en
un diagrama de tallo y hojas. Compare el diagrama con el histograma y el polígono de frecuencias construidos en el ejercicio
8º).Elabore el resumen de los cinco números y construya el diagrama de caja (box .plot)
22°) En el ejercicio 17º) referidoal número de días de trabajo perdidos por enfermedad durante el cuarto trimestre del año por los
35 empleados de una gestoría:
a) Construya un diagrama de tallo y hoja y cite conclusiones
b) Elabore unresumen de cinco números Construya un diagrama tipo caja.
c) En ambos diagramas analice las medidas de tendencia central y dispersión halladas en el ejercicio 22º)
23°) La tabla siguiente muestra el gasto mensual en fotocopias (en pesos) de 70 alumnos de escuelasecundaria del mismo colegio:
15 350 525 50 210 360 550 100 370 550 110 215 380 575
115 215 400 600 115 220 410 600 115 220 410 650 120 225
430 700 125 245 455 700 140 250 475 730 140 250 480 760
150 275 500 800 150 280 500 900 165 280 500 1000 285 510
1000 185 300 510 1190 200 300 520 200 325 520 215 175 210
a) Construya un diagrama de tallo y hoja y cite conclusiones
b) Determine el resumen de cinco números y construya un diagrama tipo caja.
c) En ambos diagramas analice las medidas de tendencia central y dispersión

Potrebbero piacerti anche