Sei sulla pagina 1di 15

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

CURSO
ESTADISTICA DESCRIPTIVA

TUTOR

EDGAR GABRIEL DIAZ

ESTUDIANTE
BRAYAN EMILIO BENAVIDES PANTOJA CODIGO: 1085279847

GRUPO
100105_58

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


ESCUELA DE CIENCIAS BASICAS TECNOLOGIA E INGENIERIA
INGENIERIA DE SISTEMAS
PASTO NARIÑO
JULIO 2019
Introducción

La estadística descriptiva es una parte de las estadísticas que estudia fenómenos


mediante la recolección, organización en tablas y la interpretación de datos.
La interpretación de los datos se puede realizar mediante gráficos estadísticos o
cálculo de parámetros estadísticos, en el presente trabajo analizamos la información la
información mediante los gráficos estadísticos.

Uno de los gráficos más importantes para analizar fenómenos es la regresión y la


correlación lineal simple, que nos permite conocer la relación entre 2 variables,
podemos observar cómo se comporta una variable y debida al comportamiento de una
variable x.
Justificación

Cuando realizamos un estudio estadístico lo hacemos para obtener conclusiones sobre


una problemática que afecta a una población, en este caso la problemática es el
desempleo en Colombia, y los gráficos estadísticos son herramientas que nos permiten
analizar una gran cantidad de datos y hallar relaciones entre diferentes variables.

Por este motivo en el presente trabajo se analizaran diferentes variables que inciden en
el desempleo en Colombia mediante los diagramas de dispersión y hallaremos el
modelo matemáticos que predice el comportamiento de las variables estudiadas en la
problemática de
Objetivos

General:

Determinar la relación entre 2 o más variables de la problemática a partir de la


correlación y la regresión lineal simple.

Específicos:

-Desarrollar el laboratorio de regresión y correlación

-Identificar variables cuantitativas que puedan estar correlacionadas y probar


estadísticamente dicha relación.

-Encontrar el modelo matemático que permite predecir el efecto de una variable sobre
otra y comprobar su confiabilidad.
Actividad a desarrollar

Mapa mental punto 1


Punto 2
Diagrama de dispersión.

Se emplea cuando una o varias variables está bajo el control del experimentador. Si
existe un parámetro que se incrementa o disminuye de forma sistemática por el
experimentador, se le denomina parámetro de control o variable independiente y
habitualmente se representa a lo largo del eje horizontal (eje de las abscisas). La
variable medida o dependiente usualmente se representa a lo largo del eje vertical (eje
de las ordenadas). Si no existe una variable dependiente, cualquier variable se puede
representar en cada eje y el diagrama de dispersión mostrará el grado de correlación
(no causalidad) entre las dos variables.

Correlación lineal simple.


Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros.
Son de la forma: 𝑌𝑖 = 𝐵0 + 𝐵1 𝑋𝑖 + 𝐸𝑖

Donde 𝐸𝑖 es el error asociado a la medición del valor 𝑋𝑖 y siguen los supuestos de


modo que 𝐸𝑖
La correlación, también conocida como coeficiente de correlación lineal (de Pearson),
es una medida de regresión que pretende cuantificar el grado de variación conjunta
entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que
el conjunto de puntos representados se aproxima a una recta.

Coeficiente de determinación R2
En estadística, el coeficiente de determinación, denominado R² y pronunciado R
cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo
principal propósito es predecir futuros resultados o probar una hipótesis. El coeficiente
determina la calidad del modelo para replicar los resultados, y la proporción de
variación de los resultados que puede explicarse por el modelo.
Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las
más comunes se refieren a la regresión lineal. En este caso, el R² es simplemente el
cuadrado del coeficiente de correlación de Pearson, lo cual es sólo cierto para la
regresión lineal simple. Si existen varios resultados para una única variable, es decir,
para una X existe una Y, Z... el coeficiente de determinación resulta del cuadrado del
coeficiente de determinación múltiple. En ambos casos el R² adquiere valores entre 0
y 1. Existen casos dentro de la definición computacional de R² donde este valor puede
tomar valores negativos.

Correlación positiva y correlación negativa


Correlación positiva
Se habla de una correlación positiva cuando una relación entre una variable y otra es
lineal y directa, de manera que un cambio en una variable predice el cambio en la otra
variable. En ese caso, se dice que la correlación es positiva perfecta, es decir, ambas
variables varían al mismo tiempo. Este tipo de correlación es directamente
proporcional. Hay correlación positiva cuando las dos variables se correlacionan en
sentido directo. Por lo que, a valores altos de una le corresponden valores altos de la
otra e igualmente con los valores bajos.
Correlación negativa
Se habla de una correlación negativa cuando la relación entre una variable y otra es
opuesta o inversa, es decir, cuando una variable cambia, la otra se modifica hacia lo
contrario. Entonces, cuando una posee variable valores altos, la otra posee valores
bajos.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
En estadística, el coeficiente de correlación de Pearson es una medida lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de
Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson
como un índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas y continuas.
Desarrollo punto 3
1.1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se
Les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después.

X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables

140

120 y = 6,1062x + 88,128


R² = 0,987
Tension

80

60

40

20

RTA: El tipo de asociación del diagrama de dispersión es LINEAL, entre más consumo
de sal mayor tensión arterial tendrán.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
El modelo matemático es:
y = 6,1062x + 88,128
R² = 0,987

Se pude decir que el grado de confiabilidad es alto ya que el valor de R es cercano a 1.

C. Determine el grado de relación de las dos variables. R² = 0,987


R= √0.987
R= 0.9934
Correlación excelente.

D. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión


arterial esperada?

Para calcular la tensión arterial esperada, debemos reemplazar el valor de x en la


ecuación.

y = 6,1062(5.6) + 88,128
y= 122.3227
Por lo tanto la tensión arterial esperada para una dosis de sal de 4.8 administrada será
de 122.3227

1.4 En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se
ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido
en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó
dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van
adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción.

Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
La variable dependiente y es el tiempo para tallar la pieza y la variable
independiente x es el número de días.

50

Y TIEMPO MEDIDO PARA TALLAR UNA PIEZA


45
40
35
30
25
20
15 R² = 0,7963

10

0 10 20 30 40 50 60 70
X NUMERO DE DIAS

El tipo de relación es inversa ya que indica que entre más días de trabajo, menos
tiempo usan par tallar una pieza.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
y = -0,3566x + 42,569 R² =
0,7963

Puede ser confiable porque tiene un porcentaje de 79.96%

c. Determine el grado de correlación de las dos variables.


R² = 0,7963
R= √0.7963 R=
0.8923
Por lo tanto existe una correlación aceptable.

d. Que tiempo deberá tardarse un empleado cuando lleven 90 días? y = -0,3566x +

42,569
y = -0,3566(90) + 42,569

y= 74,663
Por lo tanto un empleado que lleve 80 días debe tardarse 74 minutos tallando una pieza.
2.2 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que
permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 niños y realiza las mediciones respectivas.
A continuación se presentan los resultados:

Estatur 12 124 107 118 112 110 115 104 110 116
a 0
(cm)
Peso ( 24 23 19 24 21 19 22 16 20 23
kg)

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables

30

y = 0,386x - 22,751
25
R² = 0,8329

20
Peso en KG

15

10

100 105 110 115 120 125

Variable independiente X la estatura y dependiente Y el peso.


El tipo de relación entre las variables es directa ya que la línea de tendencia indica que
a mayor estatura mayo peso.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. Es confiable?
y = 0,386x - 22,751 R² =
0,8329

Si es confiable, la confiabilidad de los datos de del 83.29%


c. Determine el grado de correlación de las dos variables. R² = 0,8329
R= √0.8329 R=
0.9126
Por lo tanto existe una correlación excelente.

D. Cuál es el peso que debería tener un estudiante que mida 128 cm? y = 0,386x -22,751
y = 0,386(128) - 22,751
Y= 26,657 Por lo tanto un estudiante que tenga un estatura de 128 cm deberá pesar 27 kg
aproximadamente.
Conclusiones
-Con la regresión lineal podemos relacionar una variable (conocida como variable
dependiente) con una o más variables independientes por medio de una ecuación lineal.
-En la regresión lineal simple una sola variable independiente explica el comportamiento de
la variable independiente.
-El coeficiente de correlación indica el nivel de asociación entre la variable dependiente e
independiente en el modelo matemático de la regresión lineal, puede ser negativa o positiva
y un valor cercano a 1 indica si efectivamente el modelo corresponde a una línea recta.
-Cuando analizamos las variables de cantidad de empresas y la variable personas con
empleo podemos determinar que al aumentar el número de empresas aumenta el número de
personas con empleo y con esto se disminuye el desempleo en Colombia.
Una política que incentive la creación de empresas en Colombia garantiza que la tasa de
desempleo disminuya.
Referencias Bibliográficas

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico Nacional.
Recuperado de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do
cID=10436604&tm=1489456194304

Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX: Instituto
Politécnico Nacional, (2010). ProQuest ebrary. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do
cID=10365616&tm=1489456296586

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1. Distrito
Federal, MÉXICO: Grupo Editorial Patria. Recuperado de
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&d
ocID=11230886&tm=1489456400673

Potrebbero piacerti anche