Sei sulla pagina 1di 11

GUÍA DE EJERCICIOS – ESTADÍSTICA DESCRIPTIVA

Área Matemáticas- Análisis Estadístico


Módulo Básico de Ingeniería (MBI)

Resultados de aprendizaje
Aprender el correcto uso de la calculadora científica en modo estadístico, además de la
determinación de medidas de tendencia central y dispersión en datos tabulados

Contenidos
1. Estadística Descriptiva en datos tabulados
2. Cálculo de Media Aritmética, Desviación estándar, Mediana, Coeficiente de Variación y
Percentil

Debo saber
En seguida se muestran algunas definiciones que son necesarias se tengan claras antes de empezar
a trabajar en los contenidos:

 Población: Conjunto de todas las observaciones realizadas en las unidades de observación


pertenecientes a un Universo.

 Muestra: Subconjunto de la población, se elige de acuerdo a un plan de muestreo. Su


tamaño depende de los parámetros a estimar, pruebas de hipótesis e información
especializada

 Marca de clase ( ): Corresponde a la mitad del intervalo para ello se deben sumar
sus dos límites y dividirlo por dos, en otras palabras corresponde al promedio de dichos
valores. A continuación se muestra la fórmula de la marca de clase:

xi 1  xi Donde i  1,..., k
xm 
2

 Frecuencia absoluta o Frecuencia ( ): Número de veces que aparece un determinado valor


en un estudio estadístico.

 Frecuencia absoluta acumulada ( ): Es la frecuencia acumulada hasta un valor


determinado de la variable.

 Frecuencia relativa ( ): Es la proporción entre la frecuencia absoluta de un determinado


intervalo con respecto al total de observaciones

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 1
 Tamaño de muestra ( ): Corresponde a la suma de las frecuencias absolutas, es decir al
número total de datos
 Media aritmética o promedio ( ̅ ): Se define como la suma de los datos dividida por la
cantidad de ellos. Entonces para un grupo de n observaciones se tiene
n

x1  x2  .....  xn x i
x  i 1
n n
Donde xi : Valor de la variable x en la iésima-observación; n : Tamaño de la muestra

 Mediana ( ): Aquel valor de la observación que supera no más que el 50% de las
observaciones cuando estas han sido ordenada según magnitud. Se presentan dos casos:
Observaciones sin tabular y tabuladas.

o Mediana para observaciones sin tabular

 n impar , es la observación del lugar x n 1


2

xn  xn
1
 n par , es la observación del lugar 2 2

o Mediana para observaciones tabuladas

Para la determinación de este caso se debe determinar el intervalo que contiene a


n/2, o bien el que supera dicho valor. Realizado lo anterior se aplica la siguiente
fórmula de cálculo.
n 
  N i 1 
Me  xi 1  Ci   2 
 ni 
 
 
Donde xi 1 es el límite inferior del intervalo que contiene la mediana; N i 1 es la
frecuencia acumulada del intervalo anterior a Ni ; Ci a la amplitud del intervalo i ;
ni es el número de observaciones en el intervalo i

 Moda: Corresponde al valor que presenta mayor frecuencia en una serie de datos. En datos
tabulados o tablas de frecuencia el modo corresponderá a aquel intervalo que presente el
mayor número de observaciones ( ni ).
 1 
Mo  xi 1  Ci  
 1   2 

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 2
Donde xi 1 es el límite inferior de la clase modal; Ci es la amplitud del intervalo de clase;
1 es la diferencia entre la ni de la clase modal y la ni de la clase anterior; 2 es la
diferencia entre la ni de la clase modal y la ni de la clase posterior.

 Desviación estándar o típica (Sx): Dado que la unidad de medida de la varianza es un


número al cuadrado (Ejemplo: cm2, edad2, etc). Se debe obtener la raíz cuadrada de la
varianza para conseguir una medida de la dispersión en la misma unidad de medida de la
variable, y a esta expresión se le denomina Desviación estándar.

Dentro de esta medida de dispersión, se debe tener en cuenta que dos desviaciones
estándar, las cuales corresponden a la desviación estándar poblacional y la desviación
estándar muestral.

La desviación estándar poblacional será empleada cuando se trabaje con la totalidad de los
datos, es decir con la población. Su fórmula se encontrará dada por:

 x  x 
n
2

 n
 i 1
n

Por otra parte, la desviación estándar muestral se empleará cuando se esté en presencia de
una muestra. Su fórmula se encuentra dada por:

 x  x 
n
2

Sx   n 1
 i 1
n 1

Cuando se tienen muchas observaciones, se recomienda utilizar la siguiente fórmula:

2
 n 
  Xi 
Xi 2   i 1 
n n

 n
 Xi 2
 n( x ) 2
S  i 1
 i 1
n 1 n 1

 Coeficiente de variación ( ): Corresponde a una medida de dispersión, que expresa la


desviación estándar como una proporción de la media, por lo que es una medida
independiente de la medida de medición. Su fórmula se encuentra dada por:

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 3
Sx
CV ( x) 
x
Donde S x corresponde a la desviación estándar muestral; x es la media aritmética.

 Porcentaje de variación ( ): Corresponde a el coeficiente de variación multiplicada por


cien
Sx
%CV ( x)   100
x

 Percentil: Son aquellas observaciones que dividen los datos en 100 partes iguales, se
denota con la expresión Pp, donde p = 1,2,…,99. Para calcular un determinado percentil se
debe identificar la frecuencia acumulada que iguala o supera al valor que representa la
posición que se quiere buscar, de esta forma se identifica el intervalo i con que se
trabajará. Posteriormente se utiliza la siguiente fórmula:

 n p 
  N i 1 
Pp  xi 1  Ci   100 
 ni 
 
 

Donde N i corresponde a la frecuencia acumulada que primero supera o iguala a n  p ; Ni 1


100
es la frecuencia acumulada anterior a N i ; xi 1 es límite inferior del intervalo
percentílico; Ci es la amplitud del intervalo i ; ni es el número de observaciones en el
intervalo i .

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 4
2. Método de ingresar los datos a la Calculadora
Lo primordial en este punto es el correcto empleo de la calculadora científica que se tenga
disponible, la cual no debe ser programable. Por lo tanto, a continuación se muestran los pasos
necesarios, en las calculadoras más comunes, para determinar las sumatorias y parámetros
estadísticos necesarios.

 Calculadora CASIO fx-82MS

SHIFT CLR 1 = : Para borrar la memoria Estadística de la calculadora

Para datos unidimensionales: MODE 2 : Seleccionar Modo Estadístico

INGRESAR SHIFT , INGRESAR M+ : Para ingresar los datos unidimensionales

SHIFT 1 1 : Sumatoria de los SHIFT 2 1 : Media de los datos ingresados

SHIFT 1 2 : Sumatoria de los SHIFT 2 1 : Desviación Estándar Poblacional

SHIFT 1 3 : Tamaño de la muestra SHIFT 2 3 : Desviación Estándar Muestral

 Calculadora CASIO fx-570

SHIFT 9 1 = : Para borrar la memoria Estadística de la calculadora

SHIFT MODE 4 1 : Para mostrar la columna de frecuencia

Para datos unidimensionales: MODE 3 1 : Seleccionar Modo Estadístico

INGRESAR INGRESAR : Para ingresar los datos unidimensionales

SHIFT 1 4 1 : Sumatoria de los SHIFT 1 5 2 : Media de los datos ingresados

SHIFT 1 4 2 : Sumatoria de los SHIFT 1 5 3 : Desviación Estándar Poblacional

SHIFT 1 5 1 : Tamaño de la muestra SHIFT 1 5 4 : Desviación Estándar Muestral

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 5
Ejercicio 1: La utilización de materiales sintéticos tales como: nylon, poliéster y látex en la
producción de telas, ha provocado debates acerca de la calidad y resistencia de estas fibras
comparadas con las fibras naturales. Es por esta razón que investigadores analizan la resistencia de
las telas con el objeto de mostrar cuál de los tipos de fibras es más conveniente implementar en la
elaboración de sus productos.
Para realizar la comparación de ambos productos textiles se seleccionan 57 unidades de telas
elaboradas con fibra sintética y 40 elaboradas con fibra natural, a las cuales se les registró su
resistencia a la tracción, en kilogramos, obteniendo la siguiente información:

Resistencia a la Tracción Fibra Sintética Fibra Natural


175 – 185 4 6
185 – 195 8 6
195 – 205 12 15
205 – 215 15 9
215 – 225 9 3
225 – 235 9 1
Total
El objetivo de este estudio es elegir el material más eficiente, para lo cual se utilizan tres criterios:
a) Resistencia a la tracción más homogénea.
b) Al menos el 18% de los productos textiles deben tener una resistencia a la tracción
comprendida entre el promedio más una desviación estándar y la máxima resistencia a la
tracción obtenida.
c) La mediana de la resistencia a la tracción obtenida sea mayor.

Criterio de selección del sistema utilizado: Si cumple criterio a) se asignan 7 puntos, si cumple
criterio b) 3 puntos y si cumple criterio c) se asignan 5 puntos. Se elige el producto textil que
obtiene mayor puntaje.
Utilizando medidas estadísticas adecuadas, determinar el puntaje obtenido para cada producto
textil utilizado. En base a los resultados, indique cual es el material más eficiente, justificando su
respuesta.

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 6
Solución: Lo primero que se debe realizar en cada uno de los ejercicios que se desarrollen es definir
la(s) variable(s) que se empleará(n). Esta definición deberá contar con la unidad de medida con que
se está trabajando. A continuación se definen las variables:

Sean: “Resistencia a la tracción de telas elaboradas con fibras sintéticas, en kilogramos”


“Resistencia a la tracción de telas elaboradas con fibras naturales, en kilogramos”

Posteriormente, como se quiere determinar cuál de los dos materiales es más eficiente, se procede
a analizar cada uno de los puntos en cuestión.

Primero se establecerá cuál de las variables es más homogénea, para ello se empleará el coeficiente
de variación debido a que el tamaño de muestra de las variables es distinta. A continuación se
expone la tabla que contiene la información necesaria que se ingresará a la calculadora:
Tasa de
rendimiento
175 – 185 180 4 6
185 – 195 190 8 6
195 – 205 200 12 15
205 – 215 210 15 9
215 – 225 220 9 3
225 – 235 230 9 1
∑ ∑
Al emplear los pasos definidos al inicio del documento (Método de ingresar los datos a la
Calculadora) se obtiene la desviación estándar y media aritmética, las cuales son respectivamente:

̅ ̅

En seguida se determinan los coeficientes de variación respectivos:

( )
̅

( )
̅

Como es sabido, mientras menor sea el valor de coeficiente de variación, la variable será menos
variable, por ende más homogénea. En conclusión, como el ( ) es menor que ( ), la
resistencia a la tracción obtenida por las telas elaboradas por fibras naturales es más homogénea
que las elaboradas por fibras sintéticas. Es decir, se le otorgan los 7 puntos a las telas elaboradas
por fibras naturales.

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 7
El segundo punto en cuestión hace referencia que al menos el 18% de los productos textiles deben
tener una resistencia a la tracción comprendida entre el promedio más una desviación estándar y la
máxima resistencia a la tracción obtenida, por lo tanto procede a determinar dicho valor de
entrada:

̅
̅

En seguida, para obtener la proporción se emplea la fórmula de percentil antes descrita:


Tasa de
 n p 
rendimiento   N i 1 
175 – 185 4 4 Pp  xi 1  Ci   100 
185 – 195 8 12  ni 
 
195 – 205 12 24  
205 – 215 15 39
215 – 225 9 48 ( )
225 – 235 9 57

 n p 
Tasa de   N i 1 
rendimiento Pp  xi 1  Ci   100 
 ni 
175 – 185 6 6  
 
185 – 195 6 12
195 – 205 15 27
( )
205 – 215 9 36
215 – 225 3 39
225 – 235 1 40

Un punto muy importante corresponde a los resultados de obtenidos para cada tipo de tela, ya
que se debe tener en cuenta que dicho valor comprende a la proporción que se encuentra bajo el
valor ingresado, es decir gráficamente representa:

80,23% 84,16%

222,4814 212,4035
Sin embargo, la proporción que se debe poner a prueba corresponde a su complemento, es por ello
que se procede calcularlo:

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 8
En base a los resultados obtenidos, se establece que las telas elaboradas con fibras sintéticas
cumplen con el segundo criterio, por lo que se adjudica los 3 puntos.

El tercer punto en cuestión corresponde a una comparación de medianas, por lo que se procede a
determinarlas. Para esto se debe calcular el intervalo que contenga n/2, o bien el que
inmediatamente supere dicho valor, obteniéndose para ambos casos:

Luego en base a los resultados se debe identificar el intervalo que contiene la mediana
Tasa de
rendimiento
175 – 185 4 4
185 – 195 8 12
195 – 205 12 24
𝑀𝑒 (𝑥) 𝑃50
205 – 215 15 39
215 – 225 9 48 𝑀𝑒(𝑥)
225 – 235 9 57

Tasa de
rendimiento
175 – 185 6 6
185 – 195 6 12
195 – 205 15 27
205 – 215 9 36 𝑀𝑒(𝑦) 𝑃50
215 – 225 3 39
225 – 235 1 40 𝑀𝑒(𝑦)

En base a los resultados, la mediana de la resistencia a la tracción de las telas elaboradas con fibras
sintéticas es mayor en comparación a las elaboradas con fibras naturales. En consecuencia se le
otorgan los 5 puntos a las telas elaboradas con fibras sintéticas.

Finalmente la puntuación se encontrará dada por la siguiente tabla resumen:


Fibra Sintética Fibra Natural
Resistencia más homogénea – 7 puntos
Al menos 18% entre ̅ y máximo obtenido 3 puntos –
Mediana mayor 5 puntos –
8 puntos 7 puntos

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 9
Respuesta: La tasa de rendimiento obtenida al realizar trabajos de planificación simulada mediante
sistema no automatizado posee mayor puntuación, por lo que es el sistema más eficiente.

Ejercitación Propuesta.-

Ejercicio 2.-
Investigadores de Purdue University analizan la tasa de rendimiento obtenida al realizar trabajos de
planificación simulada mediante: un sistema automatizado y un sistema no automatizado. Para
cada uno de los sistemas utilizados se toman muestras de los trabajos realizados, registrando en
cada caso su tasa de rendimiento (definida de acuerdo a la calidad del producto), obteniendo la
siguiente información:

Tasa de rendimiento No Automatizado Automatizado


173,5 – 182,5 4 6
182,5 – 191,5 8 6
191,5 – 200,5 12 15
200,5 – 209,5 15 9
209,5 – 218,5 9 3
218,5 – 227,5 9 1
Total

El objetivo de este estudio es elegir el sistema más eficiente, para ello se utilizan tres criterios:
a) Tasa de rendimiento más variable
b) Al menos el 18,5% de los trabajos deben tener un rendimiento comprendido entre la
mínima tasa de rendimiento obtenida y el promedio menos una desviación estándar.
c) La mediana de la tasa de rendimiento obtenida sea menor.

Criterio de selección del sistema utilizado: Si cumple criterio a) se asignan 7 puntos, si cumple
criterio b) 3 puntos y si cumple criterio c) se asignan 6 puntos. Se elige el sistema que obtiene
menor puntaje.
Utilizando medidas estadísticas adecuadas, determine el puntaje obtenido para cada sistema
utilizado. En base a los resultados, indique cual es el sistema más eficiente, justificando su
respuesta.

Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP


Primera Edición - 2017 10
11 Primera Edición - 2017
Servicios Académicos para el Acompañamiento y la Permanencia - PAIEP
Solución:
𝐶𝑉(𝑥) ; 𝐶𝑉(𝑦)
𝑃(𝑥 < 𝑥̅ 𝑆 )𝑥 ; 𝑃 𝑥 < 𝑦̅ 𝑆𝑦
𝑀𝑒(𝑥) ; 𝑀𝑒(𝑦)
El sistema más eficiente corresponde al Automático.