Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Por
Ederman Luna Hermosilla
73227193
551122A_612
Tutor
María Camila González
Junio-2019
Medidas de dispersión
Parámetros estadísticos que indican como se alejan los datos respecto de la media aritmética.
Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más
utilizadas son el rango, la desviación estándar y la varianza.
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la diferencia
entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x (1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la
media.
Donde:
disvalores de la variable.
n: número total de datos
Desviación estándar
La desviación estándar mide el grado de deserción de los datos con respecto a la media, se
denota como s para una muestra o como σ para la población. Se define como la raíz cuadrada
de la varianza según la expresión:
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide
entre n; también existe la fórmula de desviación típica donde el denominador es n pero se
prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe
menor dispersión, el incremento de los valores de la desviación estándar indica ina mayor
variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto
a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto
a la media. Su expresión matemática es:
Concepto:
Método matemático que modeliza la
relación entre una variable dependiente Y,
las variables independientes Xi y un término
aleatorio ε.
Diagramas de caja
Los diagramas de caja son una forma útil de graficar datos divididos en cuatro cuartiles, cada
uno con igual cantidad de valores. El diagrama de caja no grafica frecuencia ni muestra las
estadísticas individuales, pero en ellos podemos ver claramente dónde se encuentra la mitad
de los datos. Es un buen diagrama para analizar la asimetría en los datos.
A continuación, te dejamos algunas palabras que debes tener en cuenta cuando graficas
diagramas de caja:
• Q1 – Cuartil 1, la mediana de la mitad menor de los datos.
• Valores extremos – Los valores más pequeños y los más grandes de los datos.
Comencemos haciendo un diagrama de caja de la puntuación en el examen de geometría:
90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72
Paso 1: ordena los datos de menor a mayor.
53 65 68 69 70 72 79 83 84 85 87 89 90 94
Paso 2: encuentra la mediana de los datos.
Llamado también cuartil 2 (Q2).
Paso 3: encuentra la mediana de los datos menores que Q2.
Este sería el cuartil menor (Q1).
Paso 4: encuentra la mediana de la data mayor que Q2.
Este sería el cuartil mayor (Q3).
Paso 7: dibuja una caja de Q1 a Q3 divididas por una recta en Q2. Luego extiende los
"bigotes" por cada lado de la caja hacia los valores extremos.
Tarea 1: Los porcentajes de rentabilidad de los fondos de la inversión de diez grandes
empresas fueron:
10 + 10,9 + 11,5 + 14,9 + 18,1 + 20,5 + 25,5 + 26 + 26,5 + 28,2 + 28,9 + 34,4
̅=
X
12
255,4
= = 21,2833333
12
a) La varianza
∑𝑛𝑖=1( 𝑥 − 𝑥𝑖 )2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 =
𝑛
∑𝑛𝑖=1( 𝑥 − 𝑥𝑖 )2 7274692
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = = = 60.622
𝑛 12
c) c) Desviación media.
∑𝑛𝑖=1( 𝑥 − 𝑥𝑖 )
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎 =
𝑛
Tarea 2: En la siguiente aparecen los años de servicio acumulados por 360 trabajadores de
2-3 56
3-4 76
4-5 80
5-6 25
6-7 10
7-8 27
8-9 12
9-10 8
10-11 19
11-12 3
a. Histograma
b. Media
c. Mediana
d. Moda
e. Varianza
de experiencia
Tabla de frecuencias
Marca de clase: 𝑥𝑖
Frecuencia absoluta:𝑓𝑖
Frecuencia acumulada: 𝐹𝑖
Años de 𝑥𝑖 𝑓𝑖 𝐹𝑖
experiencia
0-1 0.5 10 10
1-2 1.5 34 44
a) Dibuje el histograma
Número de empleados
80
76
Empleados
56
34
25 27
19
10 10 12 8 3
0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12
Años de experiencia
b) Media
Sumamos la totalidad de los productos de frecuencia absoluta por la marca de clase de cada
intervalo
Años de 𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒙 𝒊 * 𝒇𝒊
experiencia
0-1 0.5 10 10 5
1-2 1.5 34 44 51
2-3 2.5 56 100 140
3-4 3.5 76 176 266
4-5 4.5 80 256 360
5-6 5.5 25 281 137,5
6-7 6.5 10 291 65
7-8 7.5 27 318 202,5
8-9 8.5 12 330 102
9-10 9.5 8 338 76
10-11 10.5 19 357 199,5
11-12 11.5 3 360 34,5
360 1639
1639
𝑋=
360
1639
𝑋=
360
𝑋 = 4,55
c) Mediana
d) Moda
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗𝑡
(𝑓𝑖 − 𝑓𝑖−1 ) + ((𝑓𝑖 − 𝑓𝑖+1 ) 𝑖
80−76 4 4
𝑀𝑜 = 4 + (80−76)+(80−25) ∗ 1== 4 + 4+55 ∗ 1 = 59 = 0,06
Mo= 0,06
e) Varianza
Realizamos la operación: el producto del cuadrado de la marca de clase por la frecuencia
absoluta
Años de 𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒙 𝒊 * 𝒇𝒊 𝒙𝒊 𝟐 * 𝒇𝒊
experiencia
0-1 0.5 10 10 5 2,5
1-2 1.5 34 44 51 76,5
2-3 2.5 56 100 140 350
3-4 3.5 76 176 266 931
4-5 4.5 80 256 360 1620
5-6 5.5 25 281 137,5 756,25
6-7 6.5 10 291 65 422,5
7-8 7.5 27 318 202,5 1518,75
8-9 8.5 12 330 102 867
9-10 9.5 8 338 76 722
10-11 10.5 19 357 199,5 2094,75
11-12 11.5 3 360 34,5 396,75
360 1639 9758
9758 9758
𝑣= − 4,552 = − 20,7 = 26,1
360 360
f) Desviación típica
Necesitamos:
Media: 𝑋 = 4,55
Varianza: 26,1
9758
√ − −4,552 = √27.10 − 20,7025 = √6,7025=2,529
360
años de experiencia.
Años de 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑥𝑖 * 𝑓𝑖 𝑥𝑖 2 * 𝑓𝑖 % F1%
experiencia
0-1 0.5 10 10 5 2,5 2,8 2,8
Tarea 3: La siguiente tabla refiere a los usos más comunes citados en una encuesta
Área Respuesta
Contabilidad 26%
a) Media
b) Mediana
c) Moda
d) Varianza
e) Desviación típica
Media 14%
mediana 13%
moda ningún dato se repite
varianza 0,005677551
desviación típica 0,075349526
Tarea 4: Una compañía asigna diferentes precios a un equipo de sonido particular en ocho
regiones diferentes del país. La tabla adjunta muestra el número de unidades vendidas y los
precios correspondientes (en miles de pesos).
Para poder realizar el ejercicio complementamos la tabla con los siguientes datos: producto
n= 9
a) Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se
ajuste.
𝒚 = 𝒂𝒙 + 𝒃
Para encontrar el valor de (a) y (b) procedemos a:
𝑥 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑎=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
9 (3630)(591) − (3630)(591)
𝑎=
9 (1470712) − (3630)2
(19307970) − (2145330)
𝑎=
(13236408) − (1470712)
17162640
𝑎=
11765696
𝑎 = 1.4587
∑𝑦 − 𝑎∑𝑥
𝑏=
𝑛
591 − (1.4587)(3630)
𝑏=
9
591 − (5295.1)
𝑏=
8
−4704
𝑏=
9
𝑏 = −522.66
𝒚 = 𝟏. 𝟒𝟓𝟖𝟕𝒙 − 𝟓𝟐𝟐. 𝟔𝟔
𝒚 + 𝟓𝟐𝟐. 𝟔𝟔 = 𝟏. 𝟒𝟓𝟖𝟕𝒙
𝒚 + 𝟓𝟐𝟐. 𝟔𝟔
= 𝒙
𝟏. 𝟒𝟓𝟖𝟕
𝒚 + 𝟓𝟐𝟐. 𝟔𝟔
𝒙=
𝟏. 𝟒𝟓𝟖𝟕
1) 𝒚 = 𝟓𝟓
2) 𝒚 = 𝟓𝟖
3) 𝒚 = 𝟔𝟖
4) 𝒚 = 𝟕𝟎
Precio 1: $55000
𝑦 + 522.66
𝑥=
1.4587
55 + 522.66
𝑥=
1.4587
577.66
𝑥=
1.4587
𝒙 = 396.01
Precio 2: $58
𝑦 + 522.66
𝑥=
1.4587
58 + 522.66
𝑥=
1.4587
580.66
𝑥=
1.4587
𝒙 = 398.06
Precio 3: $68
𝑦 + 522.66
𝑥=
1.4587
68 + 522.66
𝑥=
1.4587
590.66
𝑥= 𝒙 = 404.92
1.4587
Precio 4: $70
𝑦 + 522.66
𝑥=
1.4587
70 + 522.66
𝑥=
1.4587
592.66
𝑥=
1.4587
𝒙 = 406.29
ventas 55 58 68 70
precio 396,01 398,06 404,92 406,29
x y
∑(𝒙 − 𝒙
̅)(𝒚 − 𝒚
̅)
𝒓=
̅)𝟐 √∑(𝒚 − 𝒚
√∑(𝒙 − 𝒙 ̅ )𝟐
𝟏𝟑𝟑𝟏
𝒓=
√𝟔𝟔𝟏𝟐√𝟏𝟓𝟕𝟐
𝟏𝟑𝟑𝟏
𝒓=
(𝟖𝟏. 𝟑𝟏)(𝟑𝟗. 𝟔𝟒)
𝟏𝟑𝟑𝟏
𝒓=
𝟑𝟐𝟐𝟑. 𝟑
𝒓 = 𝟎. 𝟒𝟏𝟐𝟗
El valor de r contempla el valor de 0.4129 (entre 0 y 1), estaremos ante una relación
Tarea 5: Los datos de la siguiente tabla representa las alturas (X) cm. y los pesos (Y) kg.
de varios hombres.
Para poder realizar el ejercicio complementamos la tabla con los siguientes datos: producto
X Y (XY)
185 40 7400 34225
152 51,5 7828 23104
185 53,5 9897,5 34225
155 56,5 8757,5 24025
126 53,5 6741 15876
196 58 11368 38416
172 62,5 10750 29584
187 82 15334 34969
Sumatoria 1358 457,5 78076 234424
n=8,
datos
a) Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura.
𝒚 = 𝒂𝒙 + 𝒃
Para encontrar el valor de (a) y (b) procedemos a:
𝑥 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 − ∑ 𝑦𝑖
𝑎=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
∑𝑦 − 𝑎∑𝑥
𝑏=
𝑛
457.5 − (0.1064)(1358)
𝑏=
8
457.5 − (0.1064)(1358)
𝑏=
8
457.5 − (144.49)
𝑏=
8
313.01
𝑏=
8
𝑏 = 39.12
𝒚 = 𝟎. 𝟏𝟎𝟔𝟒𝒙 + 𝟑𝟗. 𝟏𝟐
5) 𝒙 = 𝟏𝟓𝟎
6) 𝒙 = 𝟏𝟓𝟑
7) 𝒙 = 𝟏𝟕𝟓
Peso 1: 150 cm
𝑦 = 0.1064𝑥 + 39.12
𝑦 = 0.1064(150 ) + 39.12
𝑦 = 15.95 + 39.12
𝑦 = 55.08 kg
Peso 2: 153 cm
𝑦 = 0.1064𝑥 + 39.12
𝑦 = 16.27 + 39.12
𝑦 = 55.39 kg
Peso 3: 175 cm
𝑦 = 0.1064𝑥 + 39.12
𝑦 = 0.1064(175) + 39.12
𝑦 = 18.62 + 39.12
𝑦 = 57.74 kg
X Y
415.375
𝑟=
√3903.5√999.96
𝟒𝟏𝟓. 𝟑𝟕𝟓
𝒓=
(𝟔𝟐. 𝟒𝟕)(𝟑𝟏. 𝟔𝟐)
𝟒𝟏𝟓. 𝟑𝟕𝟓
𝒓=
𝟏𝟗𝟕𝟓. 𝟒𝟑
𝒓 = 𝟎. 𝟐𝟏𝟎𝟐
El valor de r contempla el valor de 0.2102 (entre 0 y 1), estaremos ante una relación
estadística positiva, que es menos fuerte ya que está más cercana de 0. Esto indica que
algunos puntos están cerca de la línea, pero otros puntos están lejos de ella, lo que indica
que solo existe una relación lineal moderada entre las variables.
Referencias
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11231145&
p00=Estadistica+descriptiva
https://www.youtube.com/watch?v=TLMKv1OzUDc
https://www.shmoop.com/estadistica-basica-probabilidades/diagrama-caja.html
https://www.ecured.cu/Regresi%C3%B3n_lineal
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html