Sei sulla pagina 1di 22

UNIDAD 2: PASO 4 - ACTIVIDAD COLABORATIVA 2

PRESENTADO POR

JHON JAIRO TRIANA COD: 1073677863

DIANA CAROLINA CARO COD: 1.024.487.306

FLOR YADIRA MORENO COD: 1.003.913.655

LEIDY DAIANNA RODRÍGUEZ COD: 35.534.071

SERGIO ESTEBAN CARVAJAL COD: 1.112.957.751

Tutor

FREDDY YESID VILLAMIZAR ARAQUE

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

LICENCIATURA EL MATEMÁTICAS

ESTADÍSTICA DESCRIPTIVA

2019
Introducción

A través del siguiente trabajo encontraremos conceptos de medidas de dispersión,

regresión lineal, correlación lineal y diagramas de caja. También encontraremos ejercicios

resueltos donde se determina ciertos puntos como la varianza, la desviación típica y

desviación media para una población de diez grandes empresas, para la muestra se halla

histograma, media, mediana, moda, varianza, desviación típica y un porcentaje.


Contenido
Medidas de dispersión..........................................................................................................3

Regresión lineal simple.........................................................................................................5

Regresión lineal múltiple......................................................................................................5

Correlación lineal..................................................................................................................6

Diagramas de caja.................................................................................................................7

Tarea 1..................................................................................................................................8

Tarea 2................................................................................................................................10

Tarea 3................................................................................................................................14

Tarea 4................................................................................................................................15

Tarea 5................................................................................................................................17

Bibliografía.........................................................................................................................20
Medidas de dispersión

Parámetros estadísticos que indican como se alejan los datos respecto de la media

aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de

dispersión más utilizadas son el rango, la desviación estándar y la varianza como ejemplo

trabajaremos con 5, 7,9 [ CITATION unP19 \l 9226 ]

Rango ( R ) En este caso el valor obtenido será absoluto

( R )=|V MAX −V MIN|

( R )=|9−5|

( R )=4

Desviación media ( D x́)

Aquí debemos recordar la fórmula para la media aritmética o promedio el cual obtenemos

con la siguiente formula

x 1+ x 2 + x n
x́=
n

5+7+9
x́=
3

21
x́=
3

x́=7

Y la desviación media es este valor menos el valor individual en valor absoluto y así

sucesivamente dividido entre la cantidad de términos


| x1 −x́|+|x 2−x́|+ …|x n−x́|
D x́=
n

|5−7|+|7−7|+|9−7|
D x́=
3

2+ 0+2
D x́=
3

4
D x́=
3

Varianza (σ ¿ ¿2)¿ Es expresado por sigma al cuadrado, en este caso trabajamos con la

fórmula de la desviación media, pero elevando los valores al cuadrado y será dividido entre

n=valores

2 2 2
2 ( x 1− x́ ) + ( x 2− x́ ) +… ( x n− x́ )
σ =
n−1

( 5−7 )2 + ( 7−7 )2 + ( 9−7 )2


σ 2=
3−1

4+ 0+4
σ 2=
3−1

8
σ 2= =4
2

Desviación ( σ ) esto será la raíz de la varianza

2 2 2
2
σ =√ σ = 2

√ ( x1 −x́ ) + ( x2− x́ ) + … ( x n −x́ )


n−1

σ =√ 2
Regresión lineal simple

La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas
variables que puede ser establecida por una expresión lineal, es decir, su representación
gráfica es una línea recta. Es decir, se está en presencia de una regresión lineal simple
cuando una variable independiente ejerce influencia sobre otra variable dependiente.
Ejemplo: Y = f(x)

Regresión lineal múltiple

La regresión lineal permite trabajar con una variable a nivel de intervalo o razón, así
también se puede comprender la relación de dos o más variables y permitirá relacionar
mediante ecuaciones, una variable en relación a otras variables llamándose Regresión
múltiple. O sea, la regresión lineal múltiple es cuando dos o más variables independientes
influyen sobre una variable dependiente.
Ejemplo: Y = f (x, w, z).
Correlación lineal

Correlación lineal. Bajo el concepto de correlación se recogen varios procedimientos e


indicadores estadísticos utilizados para determinar el grado de asociación entre
dos variables; el más sencillo de ellos es el de correlación lineal que está basado en la
comparación de la varianza asociada de dos variables (covarianza) y las desviaciones
estándar de cada uno a través del cálculo del coeficiente r de Pearson.
Covarianza
La covarianza (cov(x,y)) de dos variables es un indicador de la relación entre ellas. Este
parámetro puede utilizarse para medir la relación entre dos variables solo si están
expresadas en la misma escala o unidad de medida.
Coeficiente de correlación de Pearson
La correlación o grado de asociación de dos variables se mide utilizando el coeficiente de
correlación de Pearson. Este coeficiente mide el grado de asociación lineal entre dos
variables. Se denota como r y su valor fluctúa en el intervalo [-1, 1].

sx: desviación estándar de la variable x.


sy: desviación estándar de la variable y.
Análisis del coeficiente de correlación
Según sea el valor del coeficiente de correlación (r) se tiene que:
si r es positivo, la relación lineal entre las variables es directa. Se dice que la correlación es
positiva.
si r es negativo, la relación lineal entre las variables es inversa. Se dice que la correlación es
negativa.
si r = 0, no existe relación lineal entre las variables, se dice que la correlación es nula.
si r = 1, existe una relación de dependencia total directa entre las variables. Es decir, si una
de ellas aumenta (o disminuye), la otra aumenta (o disminuye) en igual proporción.
si r = -1, existe una relación de dependencia total inversa entre las variables. Es decir, si una
de ellas aumenta (o disminuye), la otra disminuye o aumenta en igual proporción.
Diagramas de caja

Los diagramas de caja son una forma útil de graficar datos divididos en cuatro cuartiles,
cada uno con igual cantidad de valores. El diagrama de caja no grafica frecuencia ni
muestra las estadísticas individuales, pero en ellos podemos ver claramente dónde se
encuentra la mitad de los datos. Es un buen diagrama para analizar la asimetría en los datos.
A continuación, te dejamos algunas palabras que debes tener en cuenta cuando graficas
diagramas de caja:
Q1 – Cuartil 1, la mediana de la mitad menor de los datos.
 
Q2 – Cuartil 2, la mediana de todos los datos.
 
Q3 – Cuartil 3, la mediana de la mitad mayor de los datos.
 
IQR – Rango intercuartil, la diferencia entre Q3 y Q1.
 
Valores extremos – Los valores más pequeños y los más grandes de los datos.
Comencemos haciendo un diagrama de caja de la puntuación en el examen de geometría:
90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72
Paso 1: ordena los datos de menor a mayor.
53 65 68 69 70 72 79 83 84 85 87 89 90 94
Paso 2: encuentra la mediana de los datos.
Llamado también cuartil 2 (Q2).
Paso 3: encuentra la mediana de los datos menores que Q2.
Este sería el cuartil menor (Q1).
Paso 4: encuentra la mediana de la data mayor que Q2.
Este sería el cuartil mayor (Q3).
Paso 5: encuentra los valores extremos.
Estos serían los valores más grandes y más pequeños.
Valores extremos = 53 y 94.
Paso 6: crea una recta real que contenga todos los datos.
Deja que se extienda un poco más allá de los valores extremos.

Paso 7: dibuja una caja de Q1 a Q3 divididas por una recta en Q2. Luego extiende los
"bigotes" por cada lado de la caja hacia los valores extremos.

Esta gráfica está dividida en cuatro grupos distintos: el bigote menor, la mitad menor de la
caja, la mitad mayor de la caja y el bigote mayor (el bigote mayor no se refiere a Jorge
Negrete). Como en cada grupo hay una misma cantidad de datos, cada sección representa el
25% de los mismos.
De forma grupal los estudiantes deben resolver las siguientes tareas:
Tarea 1

Los porcentajes de rentabilidad de los fondos de la inversión de diez grandes empresas

fueron:

28,2 18,1 34,4 28,9 26,5 26 25


12,5 10 10,9 20,5 25,5 14,9 20

Para esta población determine:

a) La varianza

Hallar la media
xi
x́=∑
n

( 28,2 )+ ( 18,1 )+ (34,4 ) + ( 28,9 ) + ( 26,5 ) + ( 26 )+ ( 25 )+ (12,5 )+ (10 )+ ( 10,9 )+ ( 20,5 )+ ¿ ( 25,5 ) + ( 14,9 )+(20)
x́=
14
301.4
x́= =21.5
14
varianza:
2 2 2
2 |x 1− x́| +|x 2− x́| …|x n−x́|
σ =
n−1
( 6,7 )2+ (3,4 )2 + ( 12,9 )2+ ( 7,4 )2 + ( 5 )2 + ( 4,5 )2 +¿ ( 3,5 )2 + ( 9 )2 + ( 11,5 )2+ (10,6 )2+ (1 )2 +¿ ( 4 )2 + ( 6,6 )2 +(1,5)2
σ 2=
14−1

723,5
σ 2= =55,6534
13

b) La desviación típica

2 2 2

σ=
√ |x 1− x́| +|x 2− x́| …|x n−x́|

σ =√ 55,6534
n−1

σ =7,46
c) Desviación media.

| x1 −x́|+|x 2−x́| …|x n −x́|


D x́=
n
¿ ( 28,2 )−( 21,5 )∨+ ¿ (18,1 ) −( 21,5 )∨¿+|( 34,4 )− ( 21,5 )|+|( 28,9
+|( 26 )−( 21,5 )|+|( 25 )− ( 21,5 )|+¿|( 12,5 )−( 21,5 )|+|( 10 )−( 21,5 )|+ ¿∨( 10,9 ) −( 21,5 )∨+¿ ( 20,5 ) −( 21,
D x́=
14

(6,7 ) + ( 3,4 ) + ( 12,9 ) + ( 7,4 )+ ( 5 ) + ( 4,5 ) +¿ ( 3,5 ) + ( 9 )+ ( 11,5 ) + ( 10,6 ) + ( 1 ) +¿ ( 4 ) + ( 6,6 ) +(1,5)
D x́=
14

93,6
D x́= =6,6
14
Tarea 2

En la siguiente aparecen los años de servicio acumulados por 360 trabajadores de una gran

empresa antes de su retiro voluntario:

Años de Número de
experiencia empleados
0-1 10
1-2 34
2-3 56
3-4 76
4-5 80
5-6 25
6-7 10
7-8 27
8-9 12
9-10 8
10-11 19
11-12 3

Para esta muestra halle:

Dibuje el histograma
Media o promedio

10+34+56 +76+80+25+ 10+27+12+8+19+3 360


x́= = =30
12 12

Mediana: es el dato central, como tenemos 2 términos los sumamos y dividimos en 2

~
x=10+ 34+56+76+ 80+25+10+27 +12+ 8+19+3

~
x=25+ 10=35

~ 35
x= =17,5
2

Moda: es el dato que más repeticiones tiene

Por lo tanto, es de 4 a 5 años porque la encuesta se le realizo a 360 trabajadores y 80 de

ellos llevan de 4 a 5 años, esto nos da 4,5 años.


Varianza

10+34+56 +76+80+25+ 10+27+12+8+19+3 360


x́= = =30
12 12

Años de Número de x́ ( x 1−x́ ) ( x 1−x́ )


2

experiencia empleados X

0-1 10 30 -20 400


1-2 34 30 4 16
2-3 56 30 26 676
3-4 76 30 46 2116
4-5 80 30 50 2500
5-6 25 30 -5 25
6-7 10 30 -20 400
7-8 27 30 -3 9
8-9 12 30 -18 324
9-10 8 30 -22 484
10-11 19 30 -11 121
11-12 3 30 -27 729
∑❑ 360 30 7800

σ 2=
∑ ( x1− x́ ) 2
n−1
7800 √ 7800 10
σ 2= = = √ 78=8 , 0288
12−1 11 11

Desviación típica

σ=
√ ∑|x−x́|
n−1
σ =√ 8,0288=2,8511

Qué porcentaje de empleados tiene más de 8 años de experiencia y menos de 6 años de

experiencia.
De 360 trabajadores 42 tienen más de 8 años de experiencia, por tanto:
360 100 42∗100
= =11,66 %
42 x 360

De 360 trabajadores 281 tienen menos de 6 años de experiencia, por tanto:


360 100 281∗100
= =78,05 %
281 x 360

Número de empleados

10-11.;11-12.;
5%3;10;
19;0-1; 1%3%
9-10.; 8; 2% 1-2.; 34; 9%
8-9.; 12; 3%

7-8.; 27; 8%

6-7.; 10; 3% 2-3.; 56; 16%

5-6.; 25; 7%

3-4.; 76; 21%


4-5.; 80; 22%

0-1 1-2. 2-3. 3-4. 4-5. 5-6. 6-7. 7-8. 8-9. 9-10. 10-11. 11-12.

El porcentaje de empleados que tiene más de 8 años de experiencia es el 11%

El porcentaje de empleados que tiene menos de 6 años de experiencia es el 89%


Tarea 3

La siguiente tabla refiere a los usos más comunes citados en una encuesta realizada a

usuarios de ordenadores de pequeñas y medianas empresas.

Área Respuesta
Contabilidad 26%
Procesadores de texto 15%
Hojas de calculo 24%
Bases de datos 13%
Puntos de venta 10%
Información 4%
Otros 8%

Media
Al ser una variable cualitativa nominal la que se está evaluando, no es posible
calcular la media aritmética.
Mediana
Al ser una variable cualitativa nominal la que se está evaluando, no es posible
calcular la mediana.
Moda
La moda viene dada por la variable con mayor porcentaje de uso, en este caso
“contabilidad” ya que posee un 26% y es el más alto.
Varianza
Al ser una variable cualitativa nominal la que se está evaluando, no es posible
calcular la varianza.

Desviación típica
Al ser una variable cualitativa nominal la que se está evaluando, no es posible
calcular la desviación típica.
Realizar el histograma correspondiente a los datos.
Tarea 4

Una compañía asigna diferentes precios a un equipo de sonido particular en ocho regiones

diferentes del país. La tabla adjunta muestra el número de unidades vendidas y los precios

correspondientes (en miles de pesos).

Ventas 402 381 350 430 441 380 405 420 421
Precio 45 66 70 90 75 45 65 70 65

Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se ajuste.

Ventas Precio X2 XY
402 45 2025 18090
381 66 4356 25146
350 70 4900 24500
430 90 8100 38700
441 75 5625 33075
380 45 2025 17100
405 65 4225 26325
420 70 4900 29400
421 65 4225 27365
3630 591 40381 239701

n=9
Y =mx+b
n ∑ xy−∑ x ∑ y 10(239701)−(591)(3630)
m= 2
= =4,6155 ≈ 4,62
n ∑ x 2−( ∑ x ) 10(40381)− (591 )2

b=
∑ y−m ∑ x = 3630−4,62(561)=115,3533 ≈115,35
n 9
Ecuación: y=4,62 x +115,35

Determinar las ventas si el precio es de 55, 58, 68, y 70 miles de pesos.

Se remplaza el valor de x de la ecuación obtenida por los precios solicitados así:


y=4,62 (55 )+ 115,35=369,45
y=4,62 (58 )+ 115,35=383,31
y=4,62 ( 68 )+ 115,35=429,51
y=4,62 (70 )+ 115,35=438,75

Determinar R y dar una interpretación

x́=
∑ x = 561 =62 , 33
n 9

ý=
∑ y = 3630 =403 , 33
n 9

Ventas Precio x−x́ y− ý ¿ ¿ ( x− x́ )( y− ý )


402 45 -17,33 -1,33 300,3289 1,7689 23,0489
381 66 3,67 -22,33 13,4689 498,6289 -81,9511
350 70 7,67 -53,33 58,8289 2844,0889 -409,0411
430 90 27,67 26,67 765,6289 711,2889 737,9589
441 75 12,67 37,67 160,5289 1419,0289 477,2789
380 45 -17,33 -23,33 300,3289 544,2889 404,3089
405 65 2,67 1,67 7,1289 2,7889 4,4589
420 70 7,67 16,67 58,8289 277,8889 127,8589
421 65 2,67 17,67 7,1289 312,2289 47,1789
3630 591     1672,2001 6612,0001 1331,1001

R=
∑ ( x− x́ ) ( y− ý ) =
1331,1001
=0,40031 ≈ 0,4
√ ∑ ( x−x́ ) √ 2
∑ ( y −ý ) √ 1672,2001 √ 6612,0001
2

Como el coeficiente de correlación lineal es positivo nos indica que las magnitudes son
directamente proporcionales.

Tarea 5

Los datos de la siguiente tabla representan las alturas (X) cm. y los pesos (Y) kg. de varios

hombres.

Y 40 51,5 53,5 56,5 53,5 58 62,5 82


X 185 152 185 155 126 196 172 187
Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura.

Peso 40 51,5 53,5 56,5 53,5 58 62,5 82 457.5


Altur 185 152 185 155 126 196 172 187 1358
a
x2 3422 2310 3422 2402 1587 3841 2958 3496 23442
5 4 5 5 6 6 4 9 4
xy 7400 7828 9897, 8757, 6741 1136 1075 1533 78076
5 5 8 0 4
Total

n=8
y=ax+ b
n ∑ xy−∑ x ∑ y 8 ( 78076 ) −(457,5)(1358) 624608−621285 3323
a= 2
= 2
= = =0,1064109 ≈
2
n ∑ x −( ∑ x ) 8 ( 234424 )−(1358) 1875392−1844164 31228

b=
∑ y−a ∑ x = 457,5−0,11(1358) = 457,5−149,38 = 308,12 =38,515
n 8 8 8
y=0,11 x+38,515

Determinar el peso si la altura es de 150, 153 y 175 cm.

Reemplazamos los valores en la ecuación:

y=0,11 ( 150 )+ 38,515=16,5+38,515=55,015


y=0,11 ( 153 )+ 38,515=16,83+38,515=55,345
y=0,11 ( 175 )+ 38,515=19,25+38,515=57,765

Determinar R y dar una interpretación

x́=
∑ x = 1358 =169,75
n 8

ý=
∑ y = 457,5 =57,187
n 8
Peso(y) 40 51,5 53,5 56,5 53,5 58 62,5 82 457,5

Altura( 185 152 185 155 126 196 172 187 1358
x)
x−x́ 15,25 -17,75 15,25 -14,75 -43,75 26,25 2,25 17,25

y− ý -17,187 -5,687 -3,687 -0,687 -3,687 0,813 5,313 24,813

¿ 232,56 315,06 232,56 217,56 1914,06 689,06 5,062 297,56 3903,5


25 25 25 25 25 25 5 25
¿ 295,39 32,342 13,594 0,472 13,594 0,661 28,22 615,68 999,96
3 8 5 9
( x− x́ )( y− ý- ) 100,94 -56,227 10,133 161,306 21,341 11,95 428,02 415,37
262,102 4 4 5 4

R=
∑ ( x− x́ ) ( y− ý ) = 415,374
=
415,374
=
415,374
≈ 0,2
√ ∑ ( x−x́ ) √∑ ( y −ý ) √ 3903,5 √999,969 (62,478)(31,622) 1975,68
2 2
Bibliografía

Ramos, E. R. (2016). Estadistica para todos. Madrid: Difusora Larousse - Ediciones

Pirámide.

unProfesor. (13 de Noviembre de 2019). Youtube. Obtenido de

https://www.youtube.com/watch?v=2it1aEsA0Yk

Potrebbero piacerti anche