Sei sulla pagina 1di 15

Paso 4: descripcion de la informacion

Lina Fernanda Martínez Hernández

Universidad nacional abierta y a distancia


Estadística descriptiva 100105_356
Programa administración de empresas
Tunja Boyacá
2019

*Edgar Gabriel Díaz


INTRODUCCION
El presente trabajo está conformado por cada uno de los temas sugeridos y teniendo en cuenta

cada una de las ideas referente al punto de vista acerca del laboratorio de regresión y

correlación lineal el cual es el tema tratado en la presente unidad.

El trabajo está conformado por un análisis de correlación lineal simple de dos variables

cuantitativas seleccionas en el foro colaborativo.

Finalmente se encuentra un análisis de correlación múltiple de variables seleccionadas; las

cuales son realizadas teniendo en cuenta cada una de las referencias propuestas en el entorno

correspondiente.
JUSTIFICACION
La estadística descriptiva es una ciencia que analiza series de datos los cuales dependiendo

de la herramienta utilizada podemos graficar dicha información calculada e interpretada.

La presente actividad está basada en fortalecer el conocimiento, esto con el fin de identificar

factores claves en la investigación de un determinado problema, el cual en este caso lo vemos

en un tema de interés como lo es el Desempleo en Colombia y con el estudio de estos temas

vamos a tener la capacidad de relacionar los temas con las ayudas estadísticas vistas en la

presente unida, lo anterior mediante la relación entre dos variables cuantitativas del problema

estudiado.

Aplicando la temática vista en la unidad se lograrán determinar la relación entre una variable

dependiente y variables independientes, calcular recta de regresión y el coeficiente de

correlación para probar estadísticamente su relación, cada uno de los participantes realizara

el diagrama de dispersión para cada variable tratada según el documento” desempleo

en Colombia”.
OBJETIVOS
 Realizar mapa mental las medidas
estadísticas Bivariantes de regresión y
correlación, y demás temas conceptos.
• Calcular la recta de regresión y coeficiente de correlación para probar

estadísticamente su relación

• Realizar diagrama de dispersión de cada variable

• Identificar una variable dependiente e independiente acerca del estudio de

investigación

• Determinar la relación entre la variable dependiente y la variable independiente


Actividad 1. Mapa Mental
Descripción de la Actividad Individual:

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y


correlación.
correlación.

Medidas estadísticas bivariantes de Coeficiente de


Coeficiente de determinación regresión y correlación correlación

Análisis de regresión para Término usado en el análisis de


denotar la proporción relativa regresión para designar la fuerza de la
de la variación total en la Análisis de correlación relación lineal entre las variables de
variable de criterio. Análisis de regresión criterio y predictivas.

Técnica estadística
usada para medir la Técnica estadística usada para derivar
Puede explicarse cercanía de la una ecuación que relaciona una variable
mediante la ecuación de relación lineal entre de criterio con una o más variables de
regresión ajustada. dos o más variables predicción.
en una escala de
intervalo.
Análisis de regresión simple. Análisis de regresión múltiple

Cuando se usa Cuando se


solo una utilizan dos o
variable de más variables.
predicción

Actividad 2. Definición de Conceptos.


Descripción de la Actividad Individual:
𝑌̂ = + = −2,11 × 108 + 4609211,446
Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.
Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a
su valor medio.
A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase
de estadística del colegio: rango, varianza, desviación, covarianza, coeficiente de
correlación, etc. El diagrama de dispersión, también conocido como grafico de dispersión o
grafico de correlación consiste en la representación gráfica de dos variables para un
conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo
que tanto se afectan entre sí o que tan independientes son una de la otra. En este sentido,
ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la
relación que exista entre ellas, definimos su tipo de correlación.
-Correlación lineal simple.
El concepto de relación o correlación se refiere al grado de variación conjunto existente
entre dos o más variables. En este apartado nos vamos a centrar en el estudio de un tipo
particular de relación llamada lineal y nos vamos limitar a considerar únicamente dos
variables (simple).

-Coeficiente de determinación R2
nos indica cuanto de la variación total en Y se debe a la variación en X , su principal
propósito es predecir futuros resultados o probar una hipótesis , es importante tener en
cuenta que el resultado del coeficiente de terminación R2 oscila entre 0 y 1. Cuanto más
cerca de 1 se situé su valor , mayor será el ajuste del modelo a la variable que estamos
intentando explicar. Por el contrario, si su resultado se encuentra más cerca de cero, menos
ajustado estará al modelo y menos confiable será.
-Correlación positiva y correlación negativa
Correlación positiva.
se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y
directa, de manera que un cambio en una variable predice el cambio en la otra variable. En
ese caso, se dice que la correlación es positiva perfecta, es decir, amabas variables varían al
mismo tiempo. Este tipo de correlación es directamente proporcional.
Hay correlación positiva cuando las dos variables se correlaciona en sentido directo. Por lo
que a valores altos de una corresponden valores altos de la otra e igualmente con los valores
bajos.
Correlación negativa.
se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta
o inversa, es decir, cuando una variable cambia, la otra se modifica hacia lo contrario.
entonces cuando una posee variable valores altos, la otra posee valores bajos y mientras este
valor esté más cerca de -1 más evidencia será esta covariacion.
Se dice que hay correlación negativa perfecta cuando r=-1. este tipo de correlación es
inversamente proporcional. Entonces hay correlación negativa cuando las dos varibles se
correlaciona en sentido inverso.
𝑌̂ = + = −2,11 × 108 + 4609211,446
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
En estadística, el coeficiente de correlación es una medida lineal entre dos variables
aleatorias cuantitativas. a diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables. De manera menos formal, podemos
definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para
medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y
continuas.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal


Descripción de la Actividad Individual:

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el cual se encuentra en


el Entorno de aprendizaje práctico, en la carpeta Guía para el uso de recursos educativos. El
laboratorio lo puede desarrollar con el programa Infostat o Excel.

De optar por el uso del programa Infostat, lo podrá descargar en el entorno de aprendizaje
practico, carpeta: Laboratorios Estadística Descriptiva: Infostat tutoriales, enlace descarga
del Infostat.

Cada estudiante en el orden de participación escogerá un paquete de ejercicios y socializará a


sus compañeros en el foro la elección; posteriormente al desarrollo, deberá subirlo al foro paso
4– Descripción de la información, en un archivo en Word utilizando el siguiente protocolo para
nombrar el archivo: Nombre Apellido_lab_Regresión y Correlación Lineal.

Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 4. Regresión y correlación Lineal.


Descripción de la Actividad Individual:
𝑌̂ = + = −2,11 × 108 + 4609211,446
A partir de la base de datos suministrada: Desempleo en Colombia_2019 (16-4), cada
estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas
e identificar la variable dependiente e independiente.
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre
las variables.
- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?
- Determine el grado de correlación de las dos variables.
- Relacionar la información obtenida con el problema.

Cada estudiante desarrollará el laboratorio; posteriormente, deberá subirlo al foro paso 4.


Descripción de la Información, en un archivo denominado: Nombre Apellido_lab_Regresión
y Correlación Lineal

VARIABLES
A partir de la base de datos suministrada, cada estudiante debe:
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas.
Variables analizadas: Tasa de empleo (%) y Producción Millones
Con la ayuda de Excel se obtuvieron los siguientes resultados:
∑𝑥 = 10725
∑𝑦 = 8.364.942.064
∑𝑥𝑦 = 4,67443 × 1011
∑𝑥
2 = 591473,2847
∑𝑦
2 = 4,14574 × 1017
𝑦̅ = 42897138,79

𝑌̂ = + = −2,11 × 108 + 4609211,446


𝑛 = 195
𝑏 = 4609211,446
𝑎 = −2,11 × 108
𝑆𝑒 = 1,06 × 107
𝑆𝑒𝑦
2 = 2,86 × 1014
𝑅
2 = 0,606
Conforme a lo anterior podemos encontrar la recta que se ajusta a los datos:
𝑌̂̂ = 𝑎 + 𝑏𝑥 ; b=
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑛∑𝑥
2 − (∑ 𝑥)
2
;𝑎=
∑ 𝑌̂ − 𝑏 ∑ 𝑥
𝑛
Donde:
𝑏: 𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎
𝑎: 𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝒀
𝑥: 𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑌̂: 𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑛: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Por tanto
𝑌̂̂ = 𝑎 + 𝑏𝑥 = −2,11 × 108 + 4609211,446𝑥
𝑅
2=1−
𝑆𝑒2
𝑆𝑒𝑦
2=1−
(1,06 × 107
)
2
2,86 × 1014 = 0,606
𝑅
2 = 0,6 → 𝑟 = √0,6 = 0,77

𝑌̂ = + = −2,11 × 108 + 4609211,446


- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de

asociación entre las variables.

Produccion Millones
80.000.0
00 y = 5E+06x -
70.000.0 2E+08
00 R² = 0,6096
Producción Millones

60.000.0
00
50.000.0
00
40.000.0
00
30.000.0 0,00 10,00 20,00 30,00 40,00 50,00
00 60,00 70,00
20.000.0 Tasa de empleo
00
10.000.0
00
-

r confirma además el grado de relación entre las variables: Tasa de empleo (%) está

directamente relacionado (en un 77%) con la Producción Millones.

- Encuentre el modelo matemático que permite predecir el efecto de una

variable sobre la otra. ¿Es confiable?

𝑌̂̂ = 𝑎 + 𝑏𝑥 = −2,11 × 108 + 4609211,446�

𝑌̂ = + = −2,11 × 108 + 4609211,446


𝑟 = 0,77

Lo cual nos permite concluir que el modelo de regresión lineal ajustado tiene un

alto grado

de confiabilidad.

- Determine el porcentaje de explicación del modelo y el grado de relación de las

dos

variables.

El 𝑅

afirma además que el modelo explica el 60% de la información.

- Relacionar la información obtenida con el problema.

Como se puede observar el diagrama nos muestra que la producción aumenta

conforme a la

Tasa de empleo (%) aumenta, esto básicamente nos indica que las dos variables se

encuentran relacionadas y concuerdan satisfactoriamente con la realidad de la

problemática.

𝑌̂ = + = −2,11 × 108 + 4609211,446


TASA DE DESEMPLEO Y EMPLEO

12000, y = 4,7238x +
00 0,0255
R² =
10000, 0,9997
00
Tasa de empleo

8000,00

6000,00

4000,00

2000,00
0,00
0,00 500,00 1000,00 1500,00
2000,00 2500,00
Tasa de
desempleo

y = 4,7238x + 0,0255 Modelo Matemático

R² = 0,9997 99.97 % confiable

0,999849989 Grado de correlación

empleo y desempleo
Personas Sin Empleo Lineal (Personas Sin Empleo)
9.000.000
8.000.000 y = -0,2198x +
1E+07
cantidad personas y

7.000.000
R² =
6.000.000 0,2379
5.000.000
4.000.000
3.000.000
2.000.000
1.000.000
-
- 20.000.000 40.000.000
60.000.000
personas sin empleo
y = -0,2198x + 1E+07 𝒂𝒂𝒊
R² = 0,2379 𝒓𝒈𝒂𝒓 48,7749936 𝒈𝒓𝒂 𝒓𝒓𝒂𝒊
ANEXO LABORATORIO

CONSLUSION LABORATORIO

Se manejaron machas variables y se logró aprender el concepto de correlación y regresión y


se pudo aplicar de manera exitosa.

CONCLUSIÓN VARIABLES CUANTITATIVAS

Las variables salieron siendo muy relacionadas las unas con las otras y fue fructífero

el resultado ya que se pudo cumplir con el objetivo como el saber la variedad del empleo y el

desempleo según con su tasa también.


CONCLUSIONES

Este trabajo dio a entender muy bien los conceptos de regresión y correlación y aprendí a

implementarlos. Aparte aprendí a manejar de una manera diferente Word y Excel lo cual es

satisfactorio.

Vi también la gran relación que pueden tener dos variables cuantitativas y el porcentaje de

estas.

Potrebbero piacerti anche