Sei sulla pagina 1di 15

ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES

Paso 4: descripción de la información

MONICA ANDREA MEDINA TORRES


CC. 1121716731
Grupo: 204040_98
Número de teléfono: 3144282149

Jacqueline Mendez
Tutor

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ECSAH – BARRANCABERMEJA
2019
Introducción

En el presente documento del curso estadística descriptiva se encuentran las actividades

desarrolladas de la guía de actividades, en la actividad 1 a partir de las lecturas de la unidad

3 se elabora un mapa conceptual con las medidas estadísticas Bivariantes de regresión para

enfatizar sobre conceptos y su utilidad.

En la actividad 2 se definen los conceptos de diagrama de dispersión, correlación lineal

simple, coeficiente de determinación R2, correlación positiva, correlación negativa, ¿Qué

es el coeficiente de correlación lineal y qué nos ayuda a medir?

En la actividad 3 el laboratorio de regresión y correlación lineal, se resuelve

seleccionando dos variables cuantitativas de la base de datos denominada indicadores

socioeconómicos 115 municipios más vulnerables por pobreza, violencia y ausencia del

estado en Colombia, realizar el diagrama, determinar el tipo de relación, el modelo

matemático, determinar el grado de correlación, relacionar la información obtenida con el

problema, establecer 3 nuevos valores independientes y hallarlos en el modelo matemático.

En la actividad 4 se selecciona una variable cuantitativa dependiente y varias variables

cuantitativas independientes en la base de datos indicadores socioeconómicos 115

municipios y se realiza el diagrama de dispersión, se calcula la recta de regresión y el

coeficiente de correlación para probar estadísticamente su relación relacionando sus

resultados con la información obtenida de la problemática. Finalmente, las conclusiones

con el aprendizaje significativo.


Justificación

Esta investigación se realiza para calcular diferentes aspectos y analizar los resultados

en un archivo de Excel e interpretarlos en el trabajo escrito en Word, a partir de la base de

datos “Indicadores socioeconómicos 115 municipios (2019) 16-4” en Colombia. La

información de este estudio es realizada por el DANE entre mayo 28 y junio 10 de 2015.

Las lecturas del curso estadística descriptiva son usadas para asociar datos encontrados en

el desarrollo estadístico que se realiza en Excel con las dos variables seleccionadas para el

laboratorio, X=% población ocupada con ingreso de hasta dos salarios mínimos, Y=

población de 15 años o más sin educación básica primaria completa.; y tres variables para

la actividad 4, X1=% población ocupada con ingreso de hasta dos salarios mínimos, X2=

lugar que ocupa en el contexto nacional, Y=% de viviendas con piso de tierra. se realiza el

diagrama de dispersión, calcula la recta de regresión y, relacionan, analizan, interpretan

concluyendo con criterios según datos obtenidos de los 115 municipios más vulnerables y

abandonados por el estado colombiano.


Objetivos

Objetivo general

Aplicar las medidas estadísticas Bivariantes analizando cada una de las variables

seleccionadas de la base de datos indicadores socioeconómicos 115 municipios en

Microsoft Excel, se asocian con los conceptos propuestos en la unidad 3.

Objetivos específicos

 Leer las lecturas

 Realizar un mapa mental con las medidas Bivariantes de regresión.

 Elegir las variables de la base de datos para desarrollar las actividades de

laboratorio y guía de actividades.

 Hacer un análisis y conclusiones con la información obtenida aplicarlo a la

situación estudiada.
Mapa Mental.
Definiciones de Conceptos:

-Diagrama de dispersión:

El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de


correlación consiste en la representación gráfica de dos variables para un conjunto de datos.
En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se
afectan entre sí o qué tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de
acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

-Correlación lineal simple:


Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación
lineal simple se usa para determinar la dirección y la magnitud de dicha relación. La
dirección de la relación se refiere a si ésta es positiva o negativa.

-Coeficiente de determinación R2:


El R cuadrado es una herramienta estadística (un estadístico) que se utiliza en modelos
estadísticos como en una regresión para predecir futuros resultados. Por ejemplo, a los
inversores permite hacer predicciones sobre el crecimiento o variación de un dato
determinado según como se correlaciona con otras variables. El R cuadrado es el indicador
que nos permitirá conocer cómo de bien se pueden predecir esos resultados.
El R2 es el porcentaje de variación de la variable de respuesta que explica su relación con
una o más variables predictoras. Por lo general, mientras mayor sea el R2, mejor será el
ajuste del modelo a sus datos. El R2 siempre se encuentra entre 0 y 100%. El R-cuadrado
también se conoce como el coeficiente de determinación o determinación múltiple (en la
regresión lineal múltiple).

-Correlación positiva y correlación negativa:


Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso.A
valores altos de una de ellas le suelen corresponder valor bajos de la otra y
viceversa.Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta
covariación extrema.Si r= -1 hablaremos de correlación negativa perfecta lo que supone
una determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación
funcional perfecta entre ambas(una relación lineal de pendiente negativa).
Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo.A
valores altos de una le corresponden valores altos de la otra e igualmente con los valores
bajos.Cuánto más próximo a +1 esté el coeficiente de correlación más patente será esta
covariación.Si r = 1 hablaremos de correlación positiva perfecta lo que supone una
determinación absoluta entre las dos variables (en sentido directo):Existe una relación
lineal perfecta ( con pendiente positiva).

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


Es una medida estadística que cuantifica la dependencia lineal entre dos variables, es decir,
si se representan en un diagrama de dispersión los valores que toman dos variables, el
coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.
El Coeficiente de correlación es una medida que permite conocer el grado de asociación
lineal entre dos variables cuantitativas (X, Y).
Un diagrama dispersión no nos da certeza de que tan débil o fuerte es la relación lineal,
necesitamos una medida que nos de la fuerza de la asociación y la dirección que toma esta
relación.
Para esto sirve el coeficiente de correlación que está dado por la siguiente formula.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal


A partir de la base de datos “Indicadores socioeconómicos 115 municipios (2019) 16-4”,
desarrollar el Laboratorio denominado Regresión y correlación, el cual se encuentra en el
Entorno de aprendizaje práctico, en la carpeta Guía para el uso de recursos educativos. El
laboratorio lo puede desarrollar con el programa Infostat o Excel. Donde el estudiante
deberá realizar lo siguiente:

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.

X=% población ocupada con ingreso de hasta dos salarios mínimos.

Y= población de 15 años o más sin educación básica primaria completa.


b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
relación entre las variables.

Relación inversa, Correlación lineal con tendencia negativa.

c. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y=428,51 x +3660 8
r 2=0,2593

r 2= No es confiable con un resultado obtenido de 0,2593 es debil la relación.

Población de 15 años o más sin Educación básica primaria completa= -628,51 +


36608 % Población

d. Determine el grado de correlación de las dos variables.

Coeficiente De Correlación -0,509197155


e. Relacionar la información obtenida con el problema.

Correlación mínima por el valor obtenido -0,509197155 entre las dos variables es
débil, a medida que él % Población ocupada con ingreso de hasta 2 salarios
mínimos aumenta disminuye la población de 15 años o más sin educación básica
primaria completa en los 115 municipios más vulnerables de Colombia.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a través


del modelo matemático calculado.

X Y

11,5 29380,135
52,32 3724,3568
73,25 -9430,3575

Actividad 4. Regresión y correlación múltiple.

A partir de la base de datos suministrada “Indicadores socioeconómicos 115 municipios


(2019) 16-4”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables


cuantitativas independientes del estudio de investigación.

X1=% población ocupada con ingreso de hasta dos salarios mínimos.

X2= lugar que ocupa en el contexto nacional.

Y=% de viviendas con piso de tierra.


b. Realizar el diagrama de dispersión de dichas variables.

% Población ocupada con ingreso de hasta 2 salarios


mínimos, Lugar que ocupa en el contexto nacional, % de
viviendas con piso de tierra
40
35
30
25
20
Y

15
10
5
0
0 20 40 60 80 100 120
Muestra percentil

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Resumen.XEstadísticas de la regresión
Coeficiente de correlación múltiple 0,4932832
Coeficiente de determinación R^2 0,2433283
R^2 ajustado 0,2298163
Error típico 4,4168378
Observaciones 115

XANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
  libertad cuadrados cuadrados F de F
18,008318
Regresión 2 702,629 351,3145 7 1,65508E-07
Residuos 112 2184,94711 19,5084564

Total 114 2887,57611      


Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
a Intercepción 4,9150204 4,65815767 1,05514255 0,29363094 -4,314521952 14,1445627 -4,31452195 14,1445627
b1 Variable X 1 0,2111214 0,03650487 5,78337512 6,7338E-08 0,138791647 0,2834511 0,13879165 0,2834511
b2 Variable X 2 -0,0098358 0,00477191 -2,0611819 0,04160114 -0,019290685 -0,00038085 -0,01929068 -0,00038085

d. Relacionar la información obtenida con el problema.

Correlación mínima, resultado obtenido 0,4932 la relación entre las tres variables %
Población ocupada con ingreso de hasta 2 salarios mínimos, Lugar que ocupa en el
contexto nacional y % de viviendas con piso de tierra de los 115 municipios de más
vulnerables de Colombia es muy débil la relación.

r 2= No es confiable con un resultado obtenido de 0,2433 es nula la relación entre


variables.

Correlación lineal con tendencia positiva


Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o
situación estudiada.

Desarrollado el estudio de las variables se puede analizar e interpretar la información

obtenida de los 115 municipios más vulnerables por pobreza, violencia y ausencia del

estado en Colombia.

En el ejercicio del laboratorio se identifica una variable independiente X= % Población

ocupada con ingreso de hasta 2 salarios mínimos y una variable dependiente Y= Población

de 15 años o más sin Educación básica primaria completa; el tipo de relación q hay entre

las variables es Relación inversa, Correlación lineal con tendencia negativa.. El modelo

matemático de las variables permitió predecir el efecto de una variable sobre la otra que no

era confiable, con un resultado obtenido de 0,2793; el coeficiente de correlación entre las

variables es mínima por el valor obtenido -0,509197155 entre las dos variables es débil. A

medida que él % Población ocupada con ingreso de hasta 2 salarios mínimos aumenta

disminuye la población de 15 años o más sin educación básica primaria completa en los

115 municipios más vulnerables de Colombia.

El segundo ejercicio de la guía de actividades se identifica dos variables independientes

X1= % Población ocupada con ingreso de hasta 2 salarios mínimos, X2= Lugar que ocupa

en el contexto nacional y una variable dependiente Y= % de viviendas con piso de tierra;

Es una Correlación lineal con tendencia Positiva y aunque el coeficiente de correlación

múltiple es de 0,493283189 correlación mínima, de los 115 municipios de más vulnerables

de Colombia es muy débil la relación. El coeficiente de determinación R^2= 0,243328305,

No es confiable y nula la relación entre variables.


Conclusiones

Este trabajo realizado nos permite comprender que la estadística es muy amplia y

variada, aprendí nuevos conceptos que me ayudaron a identificar y analizar la situación

estudiada, y como realizar una regresión y correlación lineal o múltiple de las variables de

la base de datos indicadores socioeconómicos 115 municipios, para probar estadísticamente

su relación.

Como psicóloga en formación el estudio de la estadística es esencial para valorar la

información obtenida de una investigación que se lleve a cabo. Aunque es una materia que

causa miedo en los estudiantes de psicología es importe el interés y entusiasmo por

aprender cómo se realiza un análisis de datos y así en el futuro aplicarlo de manera

adecuada.
Referencias Bibliográficas

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 –

158).

 http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1

929abe203c8219 

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning. (pp 675 – 686).

 http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11

ede116134cfce41

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados.

México City: Cengage Learning.(pp 686 – 695).

http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575112db86a0eb4

6dae86bbaf74cb9   

Ortegon Pava, M. (03,10,2018). Regresión y Correlación lineal. [Archivo de video].

http://hdl.handle.net/10596/20621

  Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX:

Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-109).


http://site.ebrary.com/lib/unadsp/reader.action?

ppg=12&docID=10365616&tm=1471981556569

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1.

Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109).

http://site.ebrary.com/lib/unadsp/reader.action?

ppg=6&docID=11230886&tm=1471982022168

https://www.aiteco.com/diagrama-de-dispersion/

http://www.mathematicsdictionary.com/spanish/vmd/full/p/positivecorrelation.htm

http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/GuiaSPSS/17corlin.pdf

Potrebbero piacerti anche