Sei sulla pagina 1di 17

ESTADISTICA DESCRIPTIVA (PASO 4)

POR
LEYTON URREGO
CÓDIGO 71619030

TUTOR
RAMIRO HERNADEZ POLANCO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

MAYO 2019
INTRODUCCIÓN
En este trabajo se desarrolla de gama de serie de ejercicios el fin de aplicar
algunos conceptos y procedimientos propios de la estadística descriptiva y
además se desarrolla un laboratorio práctico.
Justificación
Con el siguiente trabajo se pondrá en práctica conceptos y procesos de la Estadística
Descriptiva, tomando en cuenta algunos requerimientos establecidos para tal fin, con
relación a las medidas de tendencia central y el análisis de variables cuantitativas.

Objetivo
Aplicar conceptos y procedimientos estadísticos para procesar datos de forma agrupada y
agrupada, a la vez que se aplica la correlación lineal y la regresión

Objetivos Específicos
 Estudiar los algunos conceptos de la estadística descriptiva

 Obtener conclusiones con base en el proceso estadístico de regresión y correlación

 Representar gráficamente datos


SOLUCIÓN LABORATORIO

Realizar el Laboratorio de diagramas estadísticos.


Cada estudiante deberá resolver tres ejercicios según las opciones ofrecidas en la
siguiente tabla, para ello deberán compartir su elección en el foro del entorno de
aprendizaje Colaborativo Paso 2– organización y presentación, identificándolos de
la siguiente tabla, donde anexará su nombre a la opción de grupo de ejercicios
escogido:
Opció Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante
n
1 1.1. Revolución T 2.1. Peso Oz 3.3. Importaciones Leyton Urrego
2 1.2. Estudiantes U 2.1. Peso Oz 3.1. Peso P
3 1.1. Revolución T 2.2. Salario I 3.1. Peso P
4 1.3. Prueba B. 2.3. Octanaje C 3.2. Altura E
5 1.2. Estudiantes U 2.2. Salario I 3.2. Altura E

EJERCICIOS

1. Para los ejercicios del índice 1, según su elección anterior se requiere


lo siguiente:

a. Construya una gráfica de barras.


b. Construya un diagrama circular
c. ¿A qué tipo de variable corresponden los datos?
d. Mencione dos conclusiones a partir del gráfico.

1.1 Revolución T. En una encuesta se preguntó a 180 empresarios cual creían que
sería la próxima revolución tecnológica. Los resultados fueron los siguientes:
Razón
Nuevas formas de producción energética 40
Inteligencia artificial 32
Relacionada con la ciencia de la mente humana 11
Biotecnología, medicina o genética 7
Nanotecnología y/o nuevos materiales 66
Una nueva oleada de la revolución informática 21
Otras razones 3
a. Construya una gráfica de barras.

¿Cual será la próxima revolución tecnológica?

Otras razones

Una nueva oleada de la revolución informática

Nanotecnología y/o nuevos materiales

Biotecnología, medicina o genética

Relacionada con la ciencia de la mente humana

Inteligencia artificial

Nuevas formas de producción energética

0 10 20 30 40 50 60 70

b. Construya un diagrama circular

Nuevas formas de producción energética

Inteligencia artificial

Relacionada con la ciencia de la mente


humana
Biotecnología, medicina o genética

Nanotecnología y/o nuevos materiales

Una nueva oleada de la revolución


informática
Otras razones

c. Tipo de variable: Cualitativa Nominal

d. Mencione dos conclusiones a partir del gráfico


1. Con base en los datos de la tabla, 66 de los empresarios (36,67%) creen
que la próxima revolución tecnológica será por la nanotecnología y/o
nuevos materiales, ya que es la opción con mayor frecuencia
2. El 42 de los encuestados (23,33%) creé que la revolución industrial se dará
por las nuevas formas de producir energía.

Para verificar las conclusiones anteriores se realiza la tabla de frecuencias,


dándole a las distintas variables (7) una letra en su orden de la A a la G:

2. Para los ejercicios del índice 2, según su elección inicial se requiere lo


siguiente:

a. Construya una tabla de distribución de frecuencias y un histograma de


frecuencias para los datos.
b. Realizar un polígono de frecuencias.
c. Mencione dos conclusiones a partir del gráfico.

2.1. Peso Oz. En el departamento de control de calidad de una empresa se tiene


una lista de valores, correspondientes al peso en onzas de treinta unidades
de cierto producto alimenticio, producido para ser empacado en cajas que
deben contener 16 onzas de este. Estos valores se encuentran contenidos
en la siguiente tabla.
OBSERVACIONES MUESTRALES
16,2 15,8 16,3 16,4 15,6 16,9
15,7 16,2 16,8 15,8 15,8 15,6
16,4 15,9 15,9 16,0 16,1 16,0
15,4 15,9 16,3 15,2 15,9 16,8
15,7 16,0 16,0 16,6 15,6 16,3

Ls=15,2
Li= 16,9
a) Tabla de distribución de frecuencias, datos no agrupados

Peso (0z) fs Fs fr Fr f% F%
15,2 1 1 0,0333 0,0333 3,33 3,33
15,4 1 2 0,0333 0,0667 3,33 6,67
15,6 3 5 0,1000 0,1667 10,00 16,67
15,7 2 7 0,0667 0,2333 6,67 23,33
15,8 3 10 0,1000 0,3333 10,00 33,33
15,9 4 14 0,1333 0,4667 13,33 46,67
16 4 18 0,1333 0,6000 13,33 60,00
16,1 1 19 0,0333 0,6333 3,33 63,33
16,2 2 21 0,0667 0,7000 6,67 70,00
16,3 3 24 0,1000 0,8000 10,00 80,00
16,4 2 26 0,0667 0,8667 6,67 86,67
16,6 1 27 0,0333 0,9000 3,33 90,00
16,8 2 29 0,0667 0,9667 6,67 96,67
16,9 1 30 0,0333 1 3,33 100
Ttl 30 1 100
b) Polígono de frecuencia e histograma
Tabla de frecuencia datos agrupados

Li 15,2
Ls 16,9
Rango 1,7
No. Intervalos 6
Amplitud 0,284

𝐈𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬 = 1 + 3,3Log(n) = 1 + 3,3Log(30) = 5,88 ≈ 6

Intervalos
Li Ls
15,2 15,5
15,5 15,8
15,8 16,1
16,1 16,3
16,3 16,6
16,6 16,9

Peso (0z) Mc fa Fa fr Fr f% F%
[15,2-15,5) 15,3 2 2 0,0667 0,0667 6,67 6,67
[15,5-15,8) 15,6 5 7 0,1667 0,2333 16,67 23,33
[15,8-16,1) 15,9 11 18 0,3667 0,6000 36,67 60,00
[16,1-16,3) 16,2 3 21 0,1000 0,7000 10,00 70,00
[16,3-16,6) 16,5 5 26 0,1667 0,8667 16,67 86,67
[16,6-16,9] 16,8 4 30 0,1333 1,0000 13,33 100,00
Ttl 30 1 100

Histograma
c. Conclusiones:
1. El peso que más se registra está es el 25,9 y 16 Oz
2. De manera agrupada, en el intervalo de 15,8 a 16,1 Oz es donde más
datos se reúnen.

3.Para los ejercicios del índice 3, según su elección inicial se requiere lo


siguiente:

3.3 Importaciones. Las importaciones de un grupo de proveedores de


motocicletas aparecen en la siguiente distribución de frecuencias.

Importaciones No de
(millones US) proveedores

2a5 6
5a8 13
8 a 11 20
11 a 14 10
14 a 17 1

a. Construya un polígono de frecuencias para la variable categoría.

Tabla de frecuencias

Peso (0z) Mc fa Fa fr Fr f% F%
[2-5) 3,5 6 6 0,1200 0,1200 12,00 12,00
[5-8) 6,5 13 19 0,2600 0,3800 26,00 38,00
[8-11) 9,5 20 39 0,4000 0,7800 40,00 78,00
[11-14) 12,5 10 49 0,2000 0,9800 20,00 98,00
[14-17] 15,5 1 50 0,0200 1,0000 2,00 100,00
Ttl 50 1 100
Polígono:

Histograma:

b. Consigne dos conclusiones a partir del gráfico.


 La mayor cantidad de proveedores está en el intervalo de 8 a 11 millones en
importaciones.
 Es menos probable que se den importaciones entre 14 y 17 millones
1.1. Sal-Tensión. Se quiere estudiar la asociación entre consumo de sal y
tensión arterial. A una serie de voluntarios se les administra distintas dosis
de sal en su dieta y se mide su tensión arterial un tiempo después.

X (sal) Y (Tensión)

1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de


asociación entre las variables

Consumo de sal frente la tensión


140
120
120 115 113
109
102
98
100
Tensión Arterial

y = 6.1062x + 88.128
80
R² = 0.987

60

40

20

0
0 1 2 3 4 5 6
consumo de sal
Conclusión: Las relación entre las variables es directamente
correlacionada, a medida que aumenta el consumo de sal aumenta las cifras
tensión arterial; No existe una constante proporcional.

b. Encuentre el modelo matemático que permite predecir el efecto


de una variable sobre la otra. Es confiable?

Es posible afirmar que la ecuación de la recta es confiable porque R² está


cercano a 1 y tiene un grado alto de confiabilidad

En el modelo de regresión lineal, se tiene lugar cuando la dependencia es de


tipo lineal, y permite conocer el efecto que una variable X causa sobre otra Y;
o si es significativa la dependencia lineal entre esas dos variables.

Se entiende que el modelo matemático que sirve para explicar y predecir la


variable dependiente (Y) a partir de valores observados en la independiente (X),
es el modelo de regresión lineal simple.

c. Determine el grado de relación de las dos variables.

Se procede a hallar XY, χ² - y2

X (sal) Y (Tensión) XY χ² y2
1,6 98 156,8 2,56 9.604
2,3 102 234,6 5,28 10.404
3,3 109 359,7 10,89 11.881
4,2 113 474,6 17,64 12.796
4,6 115 529 21,16 13.225
5 120 600 25 14.400
21 657 2354,7 82,53 72.310

6 ∗ 2354,7 − (21)(657)
b=
6 ∗ 82,53 − (21)2

3312
b=
54,18

b = 6,11
657 − (6,11 ∗ 21)
a=
6

528,69
a=
6

a = 88,11

Medida de datos

657
ȳ= = 109,5
6

21
x= = 3,5
6

ȳ = 6,11 X + 88,11

√𝟕𝟐𝟑𝟏𝟎 − (88,11)(657) − (6,11)(𝟐𝟑𝟓𝟒, 𝟕)


S= = 2,93
6−2

Se calcula el coeficiente de determinación y el coeficiente de correlación:

72310
S y2 = − 109,52 = 61,416
6

2,93
R2 = 1 − = 0,952
61,4

r = √R2 = 0,98

R//: El grado de relación es de 0,98.

d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál


es la tensión arterial esperada?

Se despeja la siguiente ecuación lineal:


ȳ = (6,11 )𝑋 + 88,11
ȳ = (6,11 )(5,6) + 88,11 = 122,326
R//: La tensión arterial será de 122 si se le administra una dosis de sal de
5,6.
Mapa mental

Regresión y
Correlación
Lienel

Definir brevemente los conceptos básicos asociados a Regresión y

Correlación como:

-Diagrama de dispersión.

Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo


de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los
valores de dos variables para un conjunto de datos.
-Correlación lineal simple.

Bajo el concepto de correlación se recogen varios procedimientos e indicadores


estadísticos utilizados para determinar el grado de asociacoón entre dos variables;
el más sencillo de ellos es el de correlación lineal que está basado en la
comparación de la varianza asociada de dos variables (covarianza) y las
desviaciones estándar de cada uno a través del cálculo del coeficiente r de Pearson.

-Coeficiente de determinación R2

El R Cuadrado se define como la proporción de la varianza total de la variable


explicada por la regresión. El R Cuadrado, también llamado coeficiente de
determinación, refleja la bondad del ajuste de un modelo a la variable que pretender
explicar.

-Correlación positiva y correlación negativa

Si la correlación es positiva, las variables son directamente proporcionales, pero si


el signo es negativo, esto indica que las variables tendrán comportamientos
inversamente proporcionales

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Es una medida lineal entre dos variables aleatorias cuantitativas. A diferencia de la


covarianza, la correlación de Pearson es independiente de la escala de medida de
las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson


como un índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas y continuas.

Potrebbero piacerti anche