Medidas de Dispersión

Aporte Individual:
UNIDAD 2: Medidas Estadísticas y de Dispersión
Por
Ederman Luna Hermosilla
73227193
Medidas De Dispersión Y Regresión Lineal
551122A_612
Tutor
María Camila González
Universidad Nacional Abierta y a Distancia UNAD
Junio-2019
Medidas de dispersión
Parámetros estadísticos que indican como se alejan los datos respecto de la media aritmética.
Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más
utilizadas son el rango, la desviación estándar y la varianza.
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la diferencia
entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x (1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la
media.
Donde:
disvalores de la variable.
n: número total de datos
Desviación estándar
La desviación estándar mide el grado de deserción de los datos con respecto a la media, se
denota como s para una muestra o como σ para la población. Se define como la raíz cuadrada
de la varianza según la expresión:
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide
entre n; también existe la fórmula de desviación típica donde el denominador es n pero se
prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe
menor dispersión, el incremento de los valores de la desviación estándar indica ina mayor
variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto
a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto
a la media. Su expresión matemática es:
donde Xi es el dato i-ésimo y es la media de los N datos.

Coeficiente de Variación
Permite determinar la razón existente entre la desviación estándar (s) y la media. Se denota
como CV. El coeficiente de variación permite decidir con mayor claridad sobre la dispersión
de los datos.
Regresión lineal.
Permite determinar el grado de dependencia de las series de valores X e Y, prediciendo el
valor y estimado que se obtendría para un valor x que no esté en la distribución.
Concepto:
Método matemático que modeliza la
relación entre una variable dependiente Y,
las variables independientes Xi y un término
aleatorio ε.
Tipos de modelos de regresión lineal

Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Regresión lineal simple
La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas
variables que puede ser establecida por una expresión lineal, es decir, su representación
gráfica es una línea recta. Es decir, se está en presencia de una regresión lineal simple cuando
una variable independiente ejerce influencia sobre otra variable dependiente.
Ejemplo: Y = f(x)
Regresión lineal múltiple
La regresión lineal permite trabajar con una variable a nivel de intervalo o razón, así también
se puede comprender la relación de dos o más variables y permitirá relacionar mediante
ecuaciones, una variable en relación a otras variables llamándose Regresión múltiple. O sea,
la regresión lineal múltiple es cuando dos o más variables independientes influyen sobre una
variable dependiente.
Ejemplo: Y = f(x, w, z).
La correlación: también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables,
es decir, si se representan en un diagrama de dispersión los valores que toman dos variables,
el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.
Cov (x; y): la covarianza entre el valor «x» e «y».

σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
Diagramas de caja
Los diagramas de caja son una forma útil de graficar datos divididos en cuatro cuartiles, cada
uno con igual cantidad de valores. El diagrama de caja no grafica frecuencia ni muestra las
estadísticas individuales, pero en ellos podemos ver claramente dónde se encuentra la mitad
de los datos. Es un buen diagrama para analizar la asimetría en los datos.
A continuación, te dejamos algunas palabras que debes tener en cuenta cuando graficas
diagramas de caja:
• Q1 – Cuartil 1, la mediana de la mitad menor de los datos.
• Q2 – Cuartil 2, la mediana de todos los datos.
• Q3 – Cuartil 3, la mediana de la mitad mayor de los datos.
• IQR – Rango Inter cuartil, la diferencia entre Q3 y Q1.
• Valores extremos – Los valores más pequeños y los más grandes de los datos.
Comencemos haciendo un diagrama de caja de la puntuación en el examen de geometría:
90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72
Paso 1: ordena los datos de menor a mayor.
53 65 68 69 70 72 79 83 84 85 87 89 90 94
Paso 2: encuentra la mediana de los datos.
Llamado también cuartil 2 (Q2).
Paso 3: encuentra la mediana de los datos menores que Q2.
Este sería el cuartil menor (Q1).
Paso 4: encuentra la mediana de la data mayor que Q2.
Este sería el cuartil mayor (Q3).
Paso 5: encuentra los valores extremos.

Estos serían los valores más grandes y más pequeños.
Valores extremos = 53 y 94.
Paso 6: crea una recta real que contenga todos los datos.
Deja que se extienda un poco más allá de los valores extremos.
Paso 7: dibuja una caja de Q1 a Q3 divididas por una recta en Q2. Luego extiende los
"bigotes" por cada lado de la caja hacia los valores extremos.
Tarea 1: Los porcentajes de rentabilidad de los fondos de la inversión de diez grandes
empresas fueron:
28,2 18,1 34,4 28,9 26,5 26
11,5 10 10,9 20,5 25,5 14,9
Para esta población determine:
10 + 10,9 + 11,5 + 14,9 + 18,1 + 20,5 + 25,5 + 26 + 26,5 + 28,2 + 28,9 + 34,4
̅=
X
12
255,4
= = 21,2833333
12
a) La varianza
∑𝑛𝑖=1( 𝑥 − 𝑥𝑖 )2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 =
𝑛
(10 − 21,283)2 + (10,9 − 21,283)2 + (11,5 − 21,283)2 + (14,9 − 21,28)2 +

(18,1 − 21,28)2 + (20,5 − 21,283)2 + (25,5 − 21,283)2 + (26 − 21,283)2 + (26,5 − 21,283)2 +
(28,2 − 21,283)2 + (28,9 − 21,283)2 + (34,4 − 21,283)2
=
12
∑𝑛𝑖=1( 𝑥 − 𝑥𝑖 )2 7274692
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = = = 60.622
𝑛 12
b) La desviación típica o estándar
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 = √𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 = √60,622
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 = 7,78
c) c) Desviación media.
∑𝑛𝑖=1( 𝑥 − 𝑥𝑖 )
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎 =
𝑛
(10 − 21,283) + (10,9 − 21,283) + (11,5 − 21,283) + (14,9 − 21,28) +

(18,1 − 21,28) + (20,5 − 21,283) + (25,5 − 21,283) + (26 − 21,283) + (26,5 − 21,283)
+(28,2 − 21,283) + (28,9 − 21,283) + (34,4 − 21,283)
12
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎 = 6,96666
Tarea 2: En la siguiente aparecen los años de servicio acumulados por 360 trabajadores de
una gran empresa antes de su retiro voluntario:
Años de Número de empleados

experiencia
0-1 10
1-2 34
2-3 56
3-4 76
4-5 80
5-6 25
6-7 10
7-8 27
8-9 12
9-10 8
10-11 19
11-12 3
Vamos a encontrar ejercicios Para esta muestra halle
a. Histograma
b. Media
c. Mediana
d. Moda
e. Varianza
f. Qué porcentaje de empleados tiene más de 8 años de experiencia y menos de 6 años
de experiencia
Tabla de frecuencias
Marca de clase: 𝑥𝑖
Frecuencia absoluta:𝑓𝑖
Frecuencia acumulada: 𝐹𝑖
Años de 𝑥𝑖 𝑓𝑖 𝐹𝑖
experiencia
0-1 0.5 10 10
1-2 1.5 34 44
2-3 2.5 56 100
3-4 3.5 76 176
4-5 4.5 80 256
5-6 5.5 25 281
6-7 6.5 10 291
7-8 7.5 27 318
8-9 8.5 12 330
9-10 9.5 8 338
10-11 10.5 19 357
11-12 11.5 3 360
a) Dibuje el histograma
Número de empleados
80
76
Empleados
56
34
25 27
19
10 10 12 8 3
0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12
Años de experiencia
b) Media
Sumamos la totalidad de los productos de frecuencia absoluta por la marca de clase de cada
intervalo
Años de 𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒙 𝒊 * 𝒇𝒊
experiencia
0-1 0.5 10 10 5
1-2 1.5 34 44 51
2-3 2.5 56 100 140
3-4 3.5 76 176 266
4-5 4.5 80 256 360
5-6 5.5 25 281 137,5
6-7 6.5 10 291 65
7-8 7.5 27 318 202,5
8-9 8.5 12 330 102
9-10 9.5 8 338 76
10-11 10.5 19 357 199,5
11-12 11.5 3 360 34,5
360 1639
1639
𝑋=
360
1639
𝑋=
360
𝑋 = 4,55
c) Mediana
Identificamos la clase mediana:

360
= 180
2
Ahora debemos buscar el intervalo donde la frecuencia acumulada (Fi) contenga el valor
obtenido (180).
4-5 4.5 80 256
𝑁
−𝐹𝑖 −1
Buscamos los valores para agregar a la formula 𝐿𝑖 + 2
∗ 𝑡𝑖
𝑓1
Li-1 Es el límite inferior de la clase donde se encuentra la mediana=4.
N / 2 Es la semisuma de las frecuencias absolutas: 180
Fi-1 Es la frecuencia acumulada anterior a la clase mediana: 176
fi Es la frecuencia absoluta del intervalo mediano:80
ti Es la amplitud de los intervalos:1.

180−176 4
Me=4 + = 20 = 0,05
80
d) Moda
Buscamos los valores:
Li-1 Es el límite inferior de la clase donde se encuentra la mediana=4.
fi-1 Intervalo anterior al de mayor frecuencia: 176
fi El intervalo de mayor frecuencia: 80
fi+1 Intervalo posterior al de mayor frecuencia: 25
ti Es la amplitud de los intervalos:1.
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗𝑡
(𝑓𝑖 − 𝑓𝑖−1 ) + ((𝑓𝑖 − 𝑓𝑖+1 ) 𝑖
80−76 4 4
𝑀𝑜 = 4 + (80−76)+(80−25) ∗ 1== 4 + 4+55 ∗ 1 = 59 = 0,06
Mo= 0,06
e) Varianza
Realizamos la operación: el producto del cuadrado de la marca de clase por la frecuencia
absoluta
Años de 𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒙 𝒊 * 𝒇𝒊 𝒙𝒊 𝟐 * 𝒇𝒊
experiencia
0-1 0.5 10 10 5 2,5
1-2 1.5 34 44 51 76,5
2-3 2.5 56 100 140 350
3-4 3.5 76 176 266 931
4-5 4.5 80 256 360 1620
5-6 5.5 25 281 137,5 756,25
6-7 6.5 10 291 65 422,5
7-8 7.5 27 318 202,5 1518,75
8-9 8.5 12 330 102 867
9-10 9.5 8 338 76 722
10-11 10.5 19 357 199,5 2094,75
11-12 11.5 3 360 34,5 396,75
360 1639 9758
9758 9758
𝑣= − 4,552 = − 20,7 = 26,1
360 360
f) Desviación típica
Necesitamos:
Media: 𝑋 = 4,55
Varianza: 26,1
9758
√ − −4,552 = √27.10 − 20,7025 = √6,7025=2,529
360
g) Qué porcentaje de empleados tiene más de 8 años de experiencia y menos de 6
años de experiencia.
Años de 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑥𝑖 * 𝑓𝑖 𝑥𝑖 2 * 𝑓𝑖 % F1%
experiencia
0-1 0.5 10 10 5 2,5 2,8 2,8
1-2 1.5 34 44 51 76,5 9,4 12,2

2-3 2.5 56 100 140 350 15,6 27,8
3-4 3.5 76 176 266 931 21,1 48,9
4-5 4.5 80 256 360 1620 22,2 71,1
5-6 5.5 25 281 137,5 756,25 6,9 78,1
6-7 6.5 10 291 65 422,5 2,8 80,8
7-8 7.5 27 318 202,5 1518,75 7,5 88,3
8-9 8.5 12 330 102 867 3,3 91,7
9-10 9.5 8 338 76 722 2,2 93,9
10-11 10.5 19 357 199,5 2094,75 5,3 99,2
11-12 11.5 3 360 34,5 396,75 0,8 100,0
360 1639 9758 100%
De acuerdo a la gráfica, se estima que un 89.7% se encuentra en el rango de más de 8 años
de experiencia y los que tienen menos de 6.
Tarea 3: La siguiente tabla refiere a los usos más comunes citados en una encuesta
realizada a usuarios de ordenadores de pequeñas y medianas empresas.
Área Respuesta
Contabilidad 26%
Procesadores de texto 15%

Hojas de calculo 24%
Bases de datos 13%
Puntos de venta 10%
Información 4%
Otros 8%
Hallar:
a) Media
b) Mediana
c) Moda
d) Varianza
e) Desviación típica
f) Realizar el histograma correspondiente a los datos.
Media 14%
mediana 13%
moda ningún dato se repite
varianza 0,005677551
desviación típica 0,075349526
Tarea 4: Una compañía asigna diferentes precios a un equipo de sonido particular en ocho
regiones diferentes del país. La tabla adjunta muestra el número de unidades vendidas y los
precios correspondientes (en miles de pesos).
Para poder realizar el ejercicio complementamos la tabla con los siguientes datos: producto
(xy), potencia (x), y sumatorias.
Realizamos el complemento de la tabla acorde a los requerimientos:

x y (𝑿𝒀) 𝑥2
402 45 18090 161604
381 66 25146 145161
350 70 24500 122500
430 90 38700 184900
441 75 33075 194481
380 45 17100 144400
405 65 26325 164025
420 70 29400 176400
421 65 27365 177241
SUMATORIA 3630 591 239701 1470712
n= 9
a) Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se
ajuste.
𝒚 = 𝒂𝒙 + 𝒃
Para encontrar el valor de (a) y (b) procedemos a:
𝑥 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑎=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
9 (3630)(591) − (3630)(591)
𝑎=
9 (1470712) − (3630)2
(19307970) − (2145330)
𝑎=
(13236408) − (1470712)
17162640
𝑎=
11765696
𝑎 = 1.4587
∑𝑦 − 𝑎∑𝑥
𝑏=
𝑛
591 − (1.4587)(3630)
𝑏=
9
591 − (5295.1)
𝑏=
8
−4704
𝑏=
9
𝑏 = −522.66
Ecuación lineal que se aproxima a la relación precio-ventas:
𝒚 = 𝟏. 𝟒𝟓𝟖𝟕𝒙 − 𝟓𝟐𝟐. 𝟔𝟔
𝒚 + 𝟓𝟐𝟐. 𝟔𝟔 = 𝟏. 𝟒𝟓𝟖𝟕𝒙
𝒚 + 𝟓𝟐𝟐. 𝟔𝟔
= 𝒙
𝟏. 𝟒𝟓𝟖𝟕
𝒚 + 𝟓𝟐𝟐. 𝟔𝟔
𝒙=
𝟏. 𝟒𝟓𝟖𝟕
b) Determinar las ventas si el precio es de 55, 58, 68, y 70 miles de pesos.
1) 𝒚 = 𝟓𝟓
2) 𝒚 = 𝟓𝟖
3) 𝒚 = 𝟔𝟖
4) 𝒚 = 𝟕𝟎
Precio 1: $55000
𝑦 + 522.66
𝑥=
1.4587
55 + 522.66
𝑥=
1.4587
577.66
𝑥=
1.4587
𝒙 = 396.01
Precio 2: $58
𝑦 + 522.66
𝑥=
1.4587
58 + 522.66
𝑥=
1.4587
580.66
𝑥=
1.4587
𝒙 = 398.06
Precio 3: $68
𝑦 + 522.66
𝑥=
1.4587
68 + 522.66
𝑥=
1.4587
590.66
𝑥= 𝒙 = 404.92
1.4587
Precio 4: $70
𝑦 + 522.66
𝑥=
1.4587
70 + 522.66
𝑥=
1.4587
592.66
𝑥=
1.4587
𝒙 = 406.29
ventas 55 58 68 70
precio 396,01 398,06 404,92 406,29
c) Determinar R y dar una interpretación
x y
02 5 -1,33 -20,67 1,78 427,11 27,56

381 66 -22,33 0,33 498,78 0,11 -7,44
350 70 -53,33 4,33 2844,44 18,78 -231,11
430 90 26,67 24,33 711,11 592,11 648,89
441 75 37,67 9,33 1418,78 87,11 351,56
380 5 -23,33 -20,67 544,44 427,11 482,22
405 5 1,67 -0,67 2,78 0,44 -1,11
20 0 16,67 4,33 277,78 18,78 72,22
421 5 17,67 -0,67 312,11 0,44 -11,78
SUMATORI 3630 91 6612 1572 1331
A
Media 403,3 65,6
3 7
n= 9
∑(𝒙 − 𝒙
̅)(𝒚 − 𝒚
̅)
𝒓=
̅)𝟐 √∑(𝒚 − 𝒚
√∑(𝒙 − 𝒙 ̅ )𝟐
𝟏𝟑𝟑𝟏
𝒓=
√𝟔𝟔𝟏𝟐√𝟏𝟓𝟕𝟐
𝟏𝟑𝟑𝟏
𝒓=
(𝟖𝟏. 𝟑𝟏)(𝟑𝟗. 𝟔𝟒)
𝟏𝟑𝟑𝟏
𝒓=
𝟑𝟐𝟐𝟑. 𝟑
𝒓 = 𝟎. 𝟒𝟏𝟐𝟗
El valor de r contempla el valor de 0.4129 (entre 0 y 1), estaremos ante una relación
estadística positiva, según (Pearson) el valor de r se encuentra muy próximo al valor de
(0.476) que indica que:
Relación positiva moderada: Pearson r = 0.476

Algunos puntos están cerca de la línea, pero otros puntos están lejos de ella, lo que indica
que solo existe una relación lineal moderada entre las variables.
Los valores resaltados en amarillo corresponden a los puntos encontrados aplicada la
ecuación a los datos dados.
Tarea 5: Los datos de la siguiente tabla representa las alturas (X) cm. y los pesos (Y) kg.
de varios hombres.
Para poder realizar el ejercicio complementamos la tabla con los siguientes datos: producto
(xy), potencia (x), y sumatorias.
Realizamos el complemento de la tabla acorde a los requerimientos:
X Y (XY)
185 40 7400 34225
152 51,5 7828 23104
185 53,5 9897,5 34225
155 56,5 8757,5 24025
126 53,5 6741 15876
196 58 11368 38416
172 62,5 10750 29584
187 82 15334 34969
Sumatoria 1358 457,5 78076 234424
n=8,
datos
a) Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura.
𝒚 = 𝒂𝒙 + 𝒃
Para encontrar el valor de (a) y (b) procedemos a:
𝑥 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 − ∑ 𝑦𝑖
𝑎=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
8 (78076) − (1358) − (457,5)

𝑎=
8 (234424) − (1358)2
3323
𝑎= = 0,1064
31228
∑𝑦 − 𝑎∑𝑥
𝑏=
𝑛
457.5 − (0.1064)(1358)
𝑏=
8
457.5 − (0.1064)(1358)
𝑏=
8
457.5 − (144.49)
𝑏=
8
313.01
𝑏=
8
𝑏 = 39.12
Ecuación lineal que se aproxima a la relación peso-altura:
𝒚 = 𝟎. 𝟏𝟎𝟔𝟒𝒙 + 𝟑𝟗. 𝟏𝟐
b) Determinar el peso si la altura es de 150, 153 y 175 cm.
5) 𝒙 = 𝟏𝟓𝟎
6) 𝒙 = 𝟏𝟓𝟑
7) 𝒙 = 𝟏𝟕𝟓
Peso 1: 150 cm
𝑦 = 0.1064𝑥 + 39.12
𝑦 = 0.1064(150 ) + 39.12
𝑦 = 15.95 + 39.12
𝑦 = 55.08 kg
Peso 2: 153 cm
𝑦 = 0.1064𝑥 + 39.12
𝑦 = 0.1064(153 𝑘𝑔) + 39.12
𝑦 = 16.27 + 39.12
𝑦 = 55.39 kg
Peso 3: 175 cm
𝑦 = 0.1064𝑥 + 39.12
𝑦 = 0.1064(175) + 39.12
𝑦 = 18.62 + 39.12
𝑦 = 57.74 kg
c) Determinar R y dar una interpretación
X Y
185 40 15,25 -17,1875 232,5625 295,4101563 -262,109375
152 51,5 -17,75 -5,6875 315,0625 32,34765625 100,953125
185 53,5 15,25 -3,6875 232,5625 13,59765625 -56,234375
155 56,5 -14,75 -0,6875 217,5625 0,47265625 10,140625
126 53,5 -43,75 -3,6875 1914,0625 13,59765625 161,328125
196 58 26,25 0,8125 689,0625 0,66015625 21,328125

172 62,5 2,25 5,3125 5,0625 28,22265625 11,953125
187 82 17,25 24,8125 297,5625 615,6601563 428,015625
Sumatoria 1358 457,5 3903,5 999,96875 415,375
Media 169,75 57,1875

n=8,
datos
∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)

𝑟=
√∑(𝑥 − 𝑥̅ )2 √∑(𝑦 − 𝑦̅)2
415.375
𝑟=
√3903.5√999.96
𝟒𝟏𝟓. 𝟑𝟕𝟓
𝒓=
(𝟔𝟐. 𝟒𝟕)(𝟑𝟏. 𝟔𝟐)
𝟒𝟏𝟓. 𝟑𝟕𝟓
𝒓=
𝟏𝟗𝟕𝟓. 𝟒𝟑
𝒓 = 𝟎. 𝟐𝟏𝟎𝟐
El valor de r contempla el valor de 0.2102 (entre 0 y 1), estaremos ante una relación
estadística positiva, que es menos fuerte ya que está más cercana de 0. Esto indica que
algunos puntos están cerca de la línea, pero otros puntos están lejos de ella, lo que indica
que solo existe una relación lineal moderada entre las variables.
Referencias
contribuíos, E. (2011). Regresión Lineal. Obtenido de

https://www.ecured.cu/Regresi%C3%B3n_lineal
ESTADISTICA. (s.f.). Obtenido de https://sites.google.com/site/iniciacionestadistica/4-
estadistica-descriptiva/4-7-medidas-de-dispersion
Ramos, E. R. (2016). Estadística para todos. En E. R. Ramos, Análisis de datos
estadísticas. Difusora Larousse - Ediciones Pirámide.
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11231145&
p00=Estadistica+descriptiva
https://www.youtube.com/watch?v=TLMKv1OzUDc
https://www.shmoop.com/estadistica-basica-probabilidades/diagrama-caja.html
https://www.ecured.cu/Regresi%C3%B3n_lineal
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html

Medidas de Dispersión

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Medidas de Dispersión

Caricato da

Copyright:

Formati disponibili

Aporte Individual:

UNIDAD 2: Medidas Estadísticas y de Dispersión

Medidas De Dispersión Y Regresión Lineal

Universidad Nacional Abierta y a Distancia UNAD

donde Xi es el dato i-ésimo y es la media de los N datos.

Tipos de modelos de regresión lineal

Cov (x; y): la covarianza entre el valor «x» e «y».

• Q2 – Cuartil 2, la mediana de todos los datos.

• Q3 – Cuartil 3, la mediana de la mitad mayor de los datos.

• IQR – Rango Inter cuartil, la diferencia entre Q3 y Q1.

Paso 5: encuentra los valores extremos.

28,2 18,1 34,4 28,9 26,5 26

11,5 10 10,9 20,5 25,5 14,9

Para esta población determine:

(10 − 21,283)2 + (10,9 − 21,283)2 + (11,5 − 21,283)2 + (14,9 − 21,28)2 +

b) La desviación típica o estándar

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 = √𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 = √60,622

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 = 7,78

(10 − 21,283) + (10,9 − 21,283) + (11,5 − 21,283) + (14,9 − 21,28) +

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎 = 6,96666

una gran empresa antes de su retiro voluntario:

Años de Número de empleados

Vamos a encontrar ejercicios Para esta muestra halle

f. Qué porcentaje de empleados tiene más de 8 años de experiencia y menos de 6 años

2-3 2.5 56 100

3-4 3.5 76 176

4-5 4.5 80 256

5-6 5.5 25 281

6-7 6.5 10 291

7-8 7.5 27 318

8-9 8.5 12 330

9-10 9.5 8 338

10-11 10.5 19 357

11-12 11.5 3 360

Identificamos la clase mediana:

Li-1 Es el límite inferior de la clase donde se encuentra la mediana=4.

N / 2 Es la semisuma de las frecuencias absolutas: 180

Fi-1 Es la frecuencia acumulada anterior a la clase mediana: 176

fi Es la frecuencia absoluta del intervalo mediano:80

ti Es la amplitud de los intervalos:1.

Buscamos los valores:

Li-1 Es el límite inferior de la clase donde se encuentra la mediana=4.

fi-1 Intervalo anterior al de mayor frecuencia: 176

fi El intervalo de mayor frecuencia: 80

fi+1 Intervalo posterior al de mayor frecuencia: 25

ti Es la amplitud de los intervalos:1.

g) Qué porcentaje de empleados tiene más de 8 años de experiencia y menos de 6

1-2 1.5 34 44 51 76,5 9,4 12,2

de experiencia y los que tienen menos de 6.

realizada a usuarios de ordenadores de pequeñas y medianas empresas.

Procesadores de texto 15%

f) Realizar el histograma correspondiente a los datos.

(xy), potencia (x), y sumatorias.

Realizamos el complemento de la tabla acorde a los requerimientos:

Ecuación lineal que se aproxima a la relación precio-ventas:

b) Determinar las ventas si el precio es de 55, 58, 68, y 70 miles de pesos.

c) Determinar R y dar una interpretación

02 5 -1,33 -20,67 1,78 427,11 27,56

estadística positiva, según (Pearson) el valor de r se encuentra muy próximo al valor de

(0.476) que indica que:

Relación positiva moderada: Pearson r = 0.476

Los valores resaltados en amarillo corresponden a los puntos encontrados aplicada la

ecuación a los datos dados.