Sei sulla pagina 1di 26

ESTADISTICAS DESCRIPTIVA

MEDIDAS ESTADISTICAS BIVARIANTES

Tutor:
LUIS ROBINSON CAMELO CABALLERO

GRUPO: 100105A-614

Presentado por
HERNANDO DURAN
Cód. 73.577.550

Universidad nacional abierta y a


Distancia (UNAD)

Fecha:

28/11/2019
INTRODUCCION
En nuestra vida cotidiana normalmente nos encontramos con situaciones que tenemos que resolver o entender,
también de alguna forma encontrar una solución práctica y lógica. Es por esto y otras situaciones que
necesitamos establecer modelos que nos permitan explicar dicha relación.
La estadística descriptiva en todo su esplendor abarca modelos de aprendizaje e interpretación que nos
permiten comprender la magnitud de los problemas detallándolos en tiempos, espacios, cantidad, géneros, ect
En este trabajo abordaremos un sin números de temas relacionados con las medidas Bivarientes que en
conjunto con la socialización de la temática del desempleo en Colombia, nos permitirán asimilar
adecuadamente toda la temática , para que así se pueda aplicar correctamente en cualquier caso
JUSTIFICACION
La estadística es el método de recolectar, elaborar, analizar e interpretar datos numéricos; es un apoyo del
método científico y su aplicación a un problema determinado ha de tomarse en cuenta en las diferentes etapas
del proceso de investigación desde la planeación hasta la presentación de los resultados.

Los modelos estadísticos tienen por objeto; descubrir los hechos que proporcionan la información, darles su
tratamiento, analizándolos y obteniendo conclusiones así, describir las características principales de los datos es
el fin primario y el fin último es extraer conclusiones.
OBJETIVOS
Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una situación mediante el análisis
de las medidas estadísticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadísticas bivariantes, asociadas a una situación
específica.
3. Determinar la relación entre dos o más variables inscritas en una situación específica a partir del análisis
de regresión lineal simple y múltiple.

Objetivos Específicos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno de los ejercicios.
2. Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades colaborativas que
permitan determinar el tipo de asociación entre las variables escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple crear modelos
matemáticos que permita predecir el efecto de una variable sobre la otra para determinar su fiabilidad.
MAPA MENTAL

MAPA MENTAL MEDIDAS


BIVARIABLES DE
REGRESION Y
CORRELACION

CORRELACION: Relación mutua,


mide e indica el grado y los
valores de una variable al
relacionarse con otra variable

REGRESION: Derivar una


ecuación que relaciona con mas
Cada una se representa por variables de predicción.
medio de un gráfico,
iniciando en cada uno de los
vértices correspondientes Todas estas teorías son
importantes, porque las
matemáticas son inútiles sin
una teoría que las sustente.

La linealidad en los parámetros es la MEDIDAS BIVARIABLES


mas relevante en el contexto de la Se debe realizar una selección
teoría de la regresión y la correlación. adecuada inicialmente de la
DE REGRESION Y CORRELACION información con la cual se va a
trabajar para evitar manipular los

Técnicas Estadísticas utilizadas


para solucionar problemas

La variables
explicativa se trata
Existe algo llamado distribución
de forma simétrica
di variante, el cual estudia dos
En el sistemas Cartesiano (x,y) se variables formando pares de
observan los valores de las variables cada individuo
que se quieren representar , asociando
cada par con las frecuencias
correspondientes , a ello se le
denomina diagrama de dispersión o Algunas Formulas:
nube de puntos
Se usan los métodos de los  Regresión Lineal :y= a + bx
mínimos cuadrados  Logarítmica: y= a +bl n(x)
 Exponencial y=a c (b x)
 Cuadrática y=a+ b x +cx 2
Conceptos básicos asociados a Regresión y Correlación

1. Diagrama de dispersión.

El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos


asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada
conjunto). El diagrama muestra estos pares como una nube de puntos.

Las relaciones entre los conjuntos asociados de datos se infieren a partir de la


forma de las nubes.

  Una relación positiva entre x y y significa que los valores crecientes de x están
asociados con los valores crecientes de y.

Una relación negativa significa que los valores crecientes de x están asociados con
los valores decrecientes de y. 

2. Correlación lineal simple.

Es una técnica estadística que establece una ecuación para estimar el valor
desconocido de una variable, a partir del valor conocido de otra variable,

3. Coeficiente de determinación R2

Se define como la proporción de la varianza total de la variable explicada por la


regresión. El coeficiente de determinación, también llamado R cuadrado, refleja
la bondad del ajuste de un modelo a la variable que pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila
entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del
modelo a la variable que estamos intentando explicar. De forma inversa, cuanto
más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable
será.

4. Correlación positiva y correlación negativa

Correlación Negativa
Se define como la relación entre dos variables perfectamente lineal, pero
inversa, de tal manera que un cambio en una variable permite predecir
perfectamente el cambio en la otra. Sin embargo, las dos variables se mueven en
direcciones opuestas.

Correlación Positiva

Es una relación entre dos variables perfectamente lineal y directa, de tal manera
que un cambio en una variable permite predecir perfectamente el cambio en la
otra. Las dos variables se mueven en la misma dirección.
5. ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Es una medida estadística que cuantifica la dependencia lineal entre dos


variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que
el conjunto de puntos representados se aproxima a una recta.
Nos ayudan a medir el grado de relación que tienen dos variables.
Laboratorio denominado Regresión y Correlación lineal
1.1. Peso-Altura. Un colegio del distrito de Bogotá desea realizar un estudio de
crecimiento dentro de su población estudiantil, para lo que se ha construido desde
una muestra la siguiente de información del peso (en kg.) y la altura (en cm.) de
20 jóvenes:

Peso Altura

(Kg) (cm)
1 61 150
2 63 143
3 60 146
4 74 160
5 58 143
6 63 145
7 64 149
8 74 158
9 74 150
10 66 150
11 63 153
12 61 151
13 64 151
14 69 147
15 64 142
16 77 164
17 76 162
18 80 163
19 79 152
20 68 144
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.
170

165

160

155

150
Peso

145
Linear ()
140

135

130
55 60 65 70 75 80 85
ALTURA

Es una variable cuantitativa

b) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

y=0.7938 x−52.382

R2=0.59646∗100=59.46 %

Confiabilidad del Modelo= 59.46%

c) Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
Si existe relación entre las variables, porque el peso depende de la altura

Coeficiente De Determinación =0.5946*100=59.46% Mínima

Coeficiente de Correlación √ 0.5946=0.77 Regular

d) ¿Cuál es el peso esperado de un estudiante que mide 172 cm?

172=0.7483 x +100.34

x=(172−100.34)/0.7483

x=95.76 kg Peso esperadodel Estudiante

d.2 Estatura-Peso. Una Nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la estatura de sus
estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas.
A continuación, se presentan los resultados:

Estatura 120 124 107 118 112 110 115 104 110 116
(cm)
Peso (kg) 24 23 19 24 21 19 22 16 20 23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables
30 Altura - Peso
25 24 24
P 22 23 23
E 20 20 21
19 19
S
O 15 16
(
K 10
g
) 5

0
100 105 110 115 120 125
Estatura (cm)

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

y=0.386 x −22.751
R2=0.8329
Este modelo matemático es confiable ya R2 está cerca de 1 lo que demuestra un grado
de confiabilidad.

c. Determine el grado de correlación de las dos variables.

Al estar el 0.832 algo retirado del 1 positivo la correlación lineal es aceptable.

d. d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm?

Remplazamos la ecuación:

y=0.386 ¿

1.2. %-Umbral. Los investigadores están estudiando la correlación entre la obesidad y


la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada. Obsérvese
que ambas, X e Y, son variables aleatorias
y (umbral de reflejo
% Sobrepeso. de flexión
nociceptiva)

89 2,00
90 3,00
75 4,00
30 4,50
51 5,50
75 7,00
62 9,00
45 13,00
90 15,00
20 14,00

1. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

y (umbral de reflejo de flexión nociceptiva)


16
14
12
10
8
6
4
2
y (umbral de reflejo de flexión nociceptiva)
0
10 20 30 Linear
40 (y (umbral
50 de reflejo
60 de flexión
70 nociceptiva))
80 90 100
y=−0.0629 x +11.642
R2=0.1115

Con el umbral de reflejo se observa una pendiente negativa con un coeficiente


de relación de 0.33 determinándose como una relación nula entre las dos variables; a
medida que aumenta el umbral de reflejo disminuye el porcentaje de sobrepeso.
2. Ajuste un modelo matemático que permita predecir el efecto de una variable
sobre la otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra y=


-0.0629x + 11.642, el modelo no es confiable porque el coeficiente de determinación
R2 está muy lejos de 1.

3. Determine el porcentaje de explicación del modelo y el grado de relación de las


dos variables.
La ecuación no hace una buena estimación entre las variables debido a que el
coeficiente de determinación R2 explica el 11.15% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variables, que es
el 33.39%.

4. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 40?
y=0.0629∗40∗+11.642
y=9.13

Análisis de correlación simple de las variables cuantitativas seleccionadas

Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación


entre las variables.
Personas Con Empleo Personas Sin Empleo
22.905.884,8 6.196.09
6 8
22.633.063,5 5.198.27
5 1
22.857.080,0 4.804.36
5 9
23.376.411,3 5.947.68
3 8
23.671.992,4 5.604.76
5 3
21.473.211,2 4.761.69
6 5
23.186.196,0 5.620.98
0 5
23.893.307,6 3.916.39
1 8
22.307.726,6 4.916.11
0 7
23.939.286,5 3.060.31
2 5
23.362.050,4 5.350.75
2 5
24.331.610,8 4.759.24
8 7
22.031.648,2 5.366.47
6 6
23.608.656,2 4.619.93
3 6
24.378.744,7 5.465.65
7 7
21.573.823,6 5.931.37
3 7
24.041.190,4 6.305.31
6 5
22.408.871,3 5.780.58
2 7
23.528.440,0 4.700.34
8 9
23.191.147,7 4.411.97
4 6
21.719.995,3 6.795.09
4 5
22.692.008,3 4.334.48
0 1
21.853.621,8 4.756.75
2 8
22.859.622,3 4.663.24
7 5
20.439.221,9 4.927.82
7 8
22.749.316,2 4.469.69
6 9
22.445.700,3 5.452.18
4 0
21.737.090,8 4.968.00
0 4
21.702.052,6 5.759.84
6 5
23.076.293,0 5.057.68
2 9
21.622.855,7 5.580.76
5 3
23.142.532,4 5.552.70
5 5
22.102.876,3 5.231.04
8 9
23.867.796,3 4.331.10
0 8
24.831.238,9 5.136.04
8 7
23.907.470,1 5.613.94
8 1
21.518.327,1 5.428.69
3 1
22.415.690,3 6.365.46
7 4
22.208.341,4 4.491.12
9 0
24.327.565,6 4.866.72
5 3
23.352.442,3 5.253.74
3 0
22.954.629,9 5.633.91
0 9
21.714.340,3 5.139.32
8 5
24.084.614,8 4.099.76
7 9
22.410.704,7 4.007.24
6 9
24.853.469,3 3.609.57
1 8
22.914.599,0 4.130.43
6 5
23.150.002,5 5.749.36
1 0
21.546.610,5 5.886.89
8 1
23.134.706,5 6.751.40
0 0
22.918.609,9 5.037.54
2 1
24.796.029,7 4.826.14
1 1
23.106.254,3 4.221.13
2 6
24.116.304,8 6.155.75
0 2
25.084.415,4 5.902.43
7 8
22.821.136,6 6.535.05
8 4
23.454.282,8 5.002.36
8 1
25.120.019,0 6.276.87
3 7
25.631.923,8 6.277.05
5 8
25.875.492,9 3.934.61
7 0
24.798.904,0 7.874.20
2 4
24.104.123,8 4.618.04
2 4
25.860.976,8 5.717.26
2 2
24.286.634,7 5.919.24
9 7
23.881.290,9 5.708.95
0 0
24.597.153,0 4.463.29
4 8
25.394.513,2 6.758.29
4 8
25.632.770,3 6.339.25
9 9
26.954.657,8 3.803.83
3 1
27.412.734,1 4.647.37
0 3
26.230.534,1 4.076.34
2 8
24.331.808,1 5.975.91
9 2
25.173.301,4 7.446.91
6 8
26.198.121,2 7.245.56
8 0
24.986.402,0 5.983.21
0 8
25.080.166,8 4.508.96
9 3
26.461.532,8 5.267.50
8 6
27.141.452,2 5.365.36
3 9
27.075.290,5 6.171.70
2 6
24.953.596,9 4.549.02
8 0
27.621.374,0 5.560.41
7 5
28.532.907,5 3.652.40
0 0
27.910.917,1 4.303.56
4 2
28.118.482,5 3.305.11
5 8
26.947.192,2 5.887.55
5 7
26.215.086,9 4.374.15
3 6
25.507.694,4 3.617.06
4 1
25.900.881,5 6.305.00
1 5
26.340.399,2 4.601.42
1 5
28.158.400,3 5.723.53
8 6
26.181.267,0 4.475.82
4 3
26.228.013,5 3.176.74
9 0
25.352.081,7 4.399.78
5 5
29.015.896,2 4.079.01
8 4
28.420.607,1 4.921.42
0 1
27.502.543,8 3.123.97
4 6
25.598.611,3 4.933.86
5 4
26.478.275,1 5.975.06
5 0
25.925.625,1 3.914.58
0 6
28.181.208,3 3.709.23
5 0
27.576.279,2 4.100.31
9 5
25.840.229,4 3.538.96
8 8
26.942.517,1 5.076.04
8 7
27.618.196,1 4.495.21
6 9
26.629.580,2 2.855.27
3 7
28.853.711,0 2.282.95
8 3
26.655.756,5 5.348.56
7 9
29.330.791,3 3.511.24
4 1
25.507.729,8 6.651.75
1 3
26.580.437,5 6.201.07
0 6
26.442.375,6 4.946.35
3 7
28.893.727,1 3.199.33
3 6
27.054.682,5 2.847.99
1 1
28.489.488,4 4.696.32
2 2
27.023.046,6 4.300.72
8 5
27.065.196,3 5.534.03
2 9
27.691.364,0 4.147.80
8 5
28.298.742,2 2.858.37
0 4
28.924.043,8 3.807.73
9 2
28.189.923,3 5.011.16
5 0
26.363.799,4 5.811.73
8 9
27.398.395,5 4.747.34
7 6
28.015.561,0 4.084.24
8 9
27.672.239,1 5.119.93
3 2
28.504.829,6 3.039.34
3 0
29.767.001,9 2.872.66
7 9
29.345.325,5 3.814.95
8 4
27.469.436,6 4.341.96
0 4
29.321.141,7 4.137.14
3 0
29.569.462,9 4.336.80
8 7
29.790.513,4 2.632.00
1 0
27.732.046,9 4.145.01
5 0
27.433.631,1 5.418.40
5 0
27.595.016,9 6.221.52
2 5
26.330.194,0 5.495.70
0 6
28.444.237,0 3.639.46
2 1
26.997.177,8 3.663.09
4 1
29.903.007,2 4.577.32
8 0
26.619.709,9 3.737.78
4 6
27.831.718,2 5.368.86
9 0
29.303.245,3 5.385.00
3 2
29.186.148,2 4.675.01
1 9
30.489.715,7 3.658.58
8 8
27.494.113,7 3.028.41
3 0
Desempleo En Colombia
9,000,000

8,000,000
P
e7,000,000
r
s
o6,000,000
n
a
s 5,000,000
Personas Sin Empleo
S
i 4,000,000 Linear (Personas Sin Empleo)
n
E3,000,000
m
p2,000,000
l
e
o1,000,000

-
15,000,000.00 20,000,000.00 25,000,000.00 30,000,000.00 35,000,000.00
Personas con Empleo

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

y=0.7938 x−52.382

R2=0.59646∗100=59.46 %

Confiabilidad del Modelo= 59.46%

- Determine el grado de correlación de las dos variables.

La correlación de estas dos variable es de -0,41289595


Lo que significa que están bien correlacionadas
- Relacionar la información obtenida con el problema.
Lo que significa que están bien correlacionadas, ya que a medida que suba el número
de personas con empleo , bajara el número de personas desempleadas.
CONCLUSIONES
Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un diagrama de
dispersión y aplicar conceptos, fórmulas de relación y correlación que permita el despeje de las ecuaciones y
datos para obtener un resultado.

Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlación es confiable para los
tipos de datos.

Hallamos los comportamientos que tienen tendencia lineal y determinamos el grado de correlación entre las
variables.
REFERENCIAS BIBLIOGRAFICAS

https://www.medwave.cl › link.cgi › Medwave › Series › MBE04

https://www.emagister.com › Comunidad_Emagister_66885_66885

https://soniaalexandra45.files.wordpress.com › medidas-estadisticas
Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical Descriptive.   Cengage
Learning Paraninfo, S.A. (pp 41-50). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0

Potrebbero piacerti anche