Sei sulla pagina 1di 17

Unidad 3: Paso 4 - Descripción de la información

Gleny Yaritza Jaimes Reatiga


Código: 1098771708
Número del curso: 204040_32

TUTOR(A)
Claudia Lorena Betancur Murillo

ESTADISTICA DESCRIPTIVA

BUCARAMANGA

Universidad Nacional Abierta y a Distancia


2019
INTRODUCCION

El siguiente trabajo se realizo con el fin de trabajar y conocer, sobre la regresión lineal
simple que trata de explicar la relación que existe entre la variable respuesta y una única
variable explicativa X, además se darán ejemplos basados en hechos reales donde se pueda
entender y conocer con mas exactitud
Además, se trabajará sobre regresión múltiple cuando se estudia la posible relación entre
varias independiente y otra dependiente
JUSTIFICACION

Las técnicas estadísticas bivariantes permiten el análisis conjunto de dos características de


los individuos de una población con el propósito de detectar posibles relaciones entre ellas.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo
valor a un conjunto de valores. ... Las medidas de tendencia central más utilizadas son: media,
mediana y moda. Las medidas de dispersión en cambio miden el grado de dispersión de los
valores de la variable.
OBJETIVOS

 Identificar cada una de las variables con el finde identificar su correlación}


 Trabajar con cada uno de los datos, y variables propuestas con el fin de desarrollar
con éxito el laboratorio propuesto en la actividad.
 Participar activamente en el foro colaborativo con el fin de evidenciar el aprendizaje
adquirido a lo largo del curso
DESARROLLO DE LA ACTIVIDAD

EJERCICIO NUMERO 1

Mapa conceptual

https://www.mindomo.com/mindmap/481dc85cfe3f4519bdf4db5414308eb3

EJERCICIO NUMERO 2
Diagrama de dispersión.

El diagrama de dispersión es una herramienta que ayuda a identificar la posible relación entre
dos variables. Representa la relación entre dos variables de forma gráfica, lo que hace más
fácil visualizar interpretar los datos.
Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de
diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos
variables para un conjunto de datos.

Representa la relación entre dos variables de forma gráfica, lo que hace más fácil visualizar
e interpretar los datos.

Calculando la correlación de dos variables, permite cuantificar el grado de relación entre


ambas, así como su signo.

-Correlación lineal simple.


Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación
lineal simple se usa para determinar la dirección y la magnitud de dicha relación. La
dirección de la relación se refiere a si ésta es positiva o negativa. La magnitud de la relación
o grado de relación entre las variables se refiere a la fuerza de la relación que existe entre
las variables. Se trata de expresar cuantitativamente el grado de relación que existe entre
las variables en estudio.

Coeficiente de determinación R2

El coeficiente de determinación se define como la proporción de la varianza total de la


variable explicada por la regresión. El coeficiente de determinación, también llamado
R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender
explicar.

Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.


Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que
estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado
estará el modelo y, por tanto, menos fiable será.

Correlación positiva

Relación entre dos variables que muestra que ambas aumentan o disminuyen
simultáneamente.

Correlación negativa

Una relación lineal negativa queda representada gráficamente por una línea recta de
pendiente negativa Relación entre dos variables que muestra que una variable disminuye
conforme otra aumenta.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una
medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables,
es decir, si se representan en un diagrama de dispersión los valores que toman dos variables,
el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.

La podemos definir como el número que mide el grado de intensidad y el sentido de la


relación entre dos variables.

EJERCICIO NUMERO 3

X: % % Población ocupada con ingreso de hasta 2 salarios mínimos


Y: % Ocupantes en viviendas sin energía eléctrica
ingreso de hasta 2 salarios mínimos
X Y

38,27 0,72
33,26 0,31
36,12 0,51
50,34 0,89
33,35 0,95
41,64 0,70
46,82 1,02
36,66 1,00
25,13 1,16
52,51 2,83
63,73 3,03
45,34 1,61
34,35 0,37
58,82 1,84
30,12 0,82
53,52 0,58
54,18 2,07
30,25 0,33
54,71 39,51
48,11 5,29
42,14 0,98
31,48 0,71
29,52 0,39
41,68 0,57
50,67 0,57
49,75 0,93
56,18 12,82
45,65 4,65
50,00 0,98
29,70 0,62
66,18 21,20
65,02 4,23
55,19 0,51
51,25 1,72
44,81 1,31
34,65 0,41
31,33 0,41
66,99 4,38
20,93 0,04
62,55 1,49
59,94 0,64
52,34 4,80
44,82 2,66
30,10 0,64
38,52 1,22
40,80 0,96
43,32 0,32
45,27 2,08
42,78 4,31
29,98 0,68
35,09 0,36
47,06 2,52
39,46 0,85
46,05 0,66
33,14 1,09
67,38 23,91
51,97 0,40
36,32 3,40
40,37 1,65
49,21 1,21
62,06 50,62
62,04 4,04
29,89 0,51
45,91 2,13
49,91 3,50
46,20 1,17
23,46 0,33
60,28 10,53
63,79 2,40
28,74 0,45
55,07 1,71
36,99 0,89
32,15 0,36
40,35 0,34
44,97 2,94
40,46 13,87
36,37 0,65
39,41 1,22
46,59 0,99
55,71 3,48
64,79 1,13
37,60 0,46
28,43 0,57
55,39 5,81
33,36 2,35
33,83 2,53
44,94 6,76
45,96 0,80
48,52 4,97
46,74 0,53
49,81 1,38
62,08 0,46
27,96 0,54
40,16 1,95
41,94 0,78
41,69 1,07
19,02 0,24
24,17 0,25
62,32 5,83
47,02 4,66
26,79 0,33
44,78 0,22
36,55 0,36
52,94 2,90
32,25 0,56
58,01 2,61
33,21 0,64
45,01 1,89
37,41 1,65
40,25 0,75
Diagrama de dispersión

% Ocupantes en viviendas sin energía eléctrica


60.00
%Oupantes en viviendas sin energia

50.00

40.00
electrica

30.00

20.00

10.00

0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00
% Pblacion ocupada con ingreso de hasta 2 salarios minimos

Tipo de asociación sin relación


Modelo Matemático: y = 0,2328x - 7,1663
Correlación R cuadrado: R² = 0,1535
Confiabilidad del modelo: 0,15x 100 : 15 NO ES CONFIABLE
Grado de correlacion apartir de dos variables a partir del coeficiente de
determinacion: 0,38 HAY UNA CORRELACION MINIMA

EJERCICIO NUMERO 4

X1: % Ocupantes en viviendas sin energía eléctrica % Ocupantes en viviendas sin


energía
X2: % Ocupantes en viviendas sin agua de acueducto
X3: % Viviendas con algún nivel de hacinamiento
Y: Población total(habitantes)
X1 X2 X3 Y1

0,72 15,36 39,90 21 206


0,31 1,49 36,09 23 241
0,51 0,50 30,91 21 714
0,89 0,57 35,21 5 545
0,95 0,68 42,13 14 648
0,70 4,56 29,17 57 340
1,02 0,29 37,33 8 896
1,00 8,60 32,32 72 812
1,16 4,40 37,37 17 545
2,83 3,67 51,93 6 655
3,03 2,10 38,35 5 400
1,61 3,00 25,30 4 115
0,37 4,35 34,24 57 717
1,84 6,46 33,57 8 276
0,82 2,15 29,46 57 559
0,58 0,78 41,79 38 291
2,07 7,50 32,30 12 664
0,33 0,70 35,14 64 269
39,51 28,26 54,56 6 820
5,29 15,03 41,64 10 029
0,98 2,72 34,96 21 475
0,71 6,63 42,79 39 020
0,39 1,19 26,77 100 534
0,57 0,95 32,51 26 174
0,57 1,52 29,83 18 091
0,93 0,86 31,13 5 933
12,82 8,36 49,52 17 322
4,65 5,44 22,60 2 171
0,98 42,29 34,17 17 795
0,62 0,91 32,35 48 839
21,20 30,95 49,39 3 771
4,23 1,19 43,24 5 814
0,51 2,99 36,19 21 132
1,72 1,37 19,74 2 082
1,31 3,61 34,33 51 396
0,41 0,98 34,60 18 632
0,41 9,89 31,67 23 845
4,38 12,51 31,35 4 323
0,04 0,09 20,40 672 641
1,49 5,73 44,86 10 284
0,64 1,35 26,46 6 084
4,80 10,39 41,80 8 781
2,66 9,49 36,79 23 428
0,64 1,79 48,67 41 060
1,22 29,66 33,34 19 005
0,96 3,42 33,30 31 948
0,32 1,10 41,05 22 881
2,08 4,30 34,18 18 634
4,31 22,95 41,65 9 545
0,68 4,00 43,32 42 164
0,36 3,88 37,91 13 218
2,52 2,37 30,73 5 515
0,85 3,53 36,33 153 817
0,66 1,15 21,75 5 499
1,09 2,43 43,76 21 321
23,91 33,69 39,94 2 517
0,40 1,52 20,32 3 755
3,40 1,33 29,11 14 245
1,65 4,44 34,39 13 225
1,21 3,70 27,27 6 034
50,62 44,83 54,56 18 084
4,04 3,64 30,79 3 574
0,51 6,10 32,84 92 967
2,13 6,88 43,58 30 097
3,50 8,01 30,01 12 119
1,17 3,26 44,08 48 408
0,33 2,29 33,98 255 681
10,53 8,55 35,27 11 623
2,40 26,49 27,51 8 691
0,45 9,68 44,48 138 226
1,71 15,39 39,87 3 176
0,89 2,56 40,16 6 647
0,36 9,34 36,70 65 219
0,34 2,56 26,82 15 454
2,94 4,52 38,81 3 762
13,87 14,35 43,41 3 405
0,65 3,41 30,48 26 306
1,22 6,12 29,95 31 166
0,99 2,69 42,05 14 011
3,48 13,05 31,12 5 755
1,13 0,97 30,89 3 726
0,46 0,17 36,86 34 829
0,57 2,88 36,49 69 031
5,81 14,08 38,13 14 410
2,35 4,29 27,21 37 986
2,53 10,31 48,07 18 096
6,76 9,63 30,22 16 847
0,80 4,14 31,46 16 573
4,97 2,17 31,68 3 511
0,53 2,59 26,02 7 051
1,38 6,53 33,97 40 105
0,46 2,80 29,80 10 837
0,54 3,72 28,92 136 123
1,95 3,98 43,52 40 697
0,78 0,84 29,51 9 088
1,07 0,62 35,65 20 857
0,24 2,26 37,11 416 626
0,25 3,03 32,94 608 114
5,83 4,92 36,38 9 591
4,66 14,44 42,84 35 050
0,33 9,10 37,03 478 689
0,22 0,74 27,18 5 930
0,36 0,36 35,30 7 256
2,90 6,47 24,42 4 435
0,56 14,86 37,68 21 871
2,61 1,87 35,31 4 234
0,64 1,49 37,16 6 316
1,89 1,74 36,45 34 182
1,65 6,62 40,43 17 325
0,75 2,94 28,17 13 737
MUNICIPIOS
1000000.00 y = -2026.5x + 51881

Poblacion total de habitante


R² = 0.0172
500000.00

0.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00
-500000.00
Axis Title

% Ocupantes en viviendas sin agua de acueducto


% Viviendas con algún nivel de hacinamiento
Población total(habitantes)
Linear (Población total(habitantes))
Linear (Población total(habitantes))

Coeficiente de correlación múltiple 0,192072294


Coeficiente de determinación R^2 0,045991763
R^2 ajustado 0,003833986
Error típico 79,9057310
Observaciones 110
CONCLUSIONES

 En estadística, el coeficiente de correlación de Pearson es una medida lineal entre dos


variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de
Pearson es independiente de la escala de medida de las variables.
 En estadística la regresión lineal o es un modelo matemático usado para aproximar la
relación de dependencia entre una variable dependiente Y, las variables
independientes Xᵢ y un término aleatorio ε. Este modelo puede ser expresado como:
donde: variable dependiente, explicada o regresando.
 El coeficiente de determinación se define como la proporción de la varianza total de
la variable explicada por la regresión. El coeficiente de determinación, también
llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que
pretender explicar.
BIBLIOGRAFIA

 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F.,
MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-109).
Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&tm=147
1981556569

 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística


1. Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109). Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=6&docID=11230886&tm=1471
982022168

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151
– 158). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México


City: Cengage Learning. (pp 675 – 686). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

 Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados. México City: Cengage Learning.(pp 686 – 695).Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

Potrebbero piacerti anche