Sei sulla pagina 1di 11

Informe Base de Datos big Lucy

Presentado por:
Sebastian Triviño Urrego

Jony Romero Guerrero

Docente de Modelos Estadísticos y Probabilidad

Universidad Cooperativa de Colombia


Facultad de Ingeniería
Programa Administración y desarrollo de aplicaciones informáticas
Bogotá D.C.
2019
Introducción
Este informe se realizado con el fin de adquirir información correspondiente a una base de
datos big Lucy y otra base de datos que fue asignada a cada uno de los estudiantes de esta
materia, de la cual se obtiene diferente tipo de información la cual fue representada por
cuadros y algunas con graficas representativas, todo fue elaborado en Excel utilizando las
diferentes herramientas que brinda este programa, se utilizaron formulas de este programa y
formulas obtenidas en clase.
Formulas obtenidas en clase
En las fórmulas obtenidas en clase se realizaron diferentes cálculos los cuales fueron
fundamentales para la comparación de la base de datos big Lucy y la personal.
Promedio
 Tabla N°1

Formulas Obtenidas
Promedio de incode 429,50
Promedio de taxes 11,82
Promedio de employees 63,22

 Tabla N°2

Formulas Obtenidas
Promedio de incode 430,83
Promedio de taxes 11,99
Promedio de employees 63,44

En las tablas representativas se observa unos datos obtenidos con las formulas dadas la
tabla N°1 es representaría de big Lucy la tabla N°2 es mi base de datos.
 En el promedio incode de las dos bases de datos se observas que en la taba N°2 en
comparación de la tabla N°1 el promedio es las más alto debido a la cantidad de
datos.
 El promedio de taxes de las dos bases de datos se observa que en la tabla N°2
siendo comparada con la tabla N°1 la diferencia de esta es solo de unos números.
 El promedio de employees de las dos bases de datos se observa que en la tabla N°1
siendo comparada con la tabla N°2 su resultado es muy igualitario a la tabla N°1
esto quiere decir que el employees en las dos bases de datos es igualitario.
En las siguientes tablas se representa la varianza.
 Tabla N°1

Varianza tabla N1
Income 70697,94
Taxes 296,58

 Tabla N°2

Varianza tabla N°2


Income 6,23
Taxes 11,99
 En la varianza de incode de la tabla N°1 siendo comparada con la tabla N°2 se
observa que la varianza de la tabla N°1 es más, que en la tabla N°2 ya que la tabla
N°1 tiene mas datos que la tabla N°2.
 En la varianza de taxes de la tabla N°1 es comparada con la tabla N°2 se observa
que en la tabla N°1 la varianza es mas alta que en la tabla N°2 ya que esta tiene más
datos.
En la siguiente tabla es representada la Moda de las dos bases de datos
 Tabla N°1

Moda Income 550 Moda Taxes 0,5

 Tabla N°2

Moda Incode 550 Moda Taxes 0,5

 En la moda Income y taxes de la tabla N°1 y N°2 se observa que la moda de estos
dos datos es la misma, esto ocurre cuando dos o mas datos se repiten.
En las siguientes tabas se representan los Cuartiles y rango intercuartílico
 Tabla N°1

Cuartil N°1 230 Rango Intercuartílico


Cuartil N°2 388 158
Cuartil N°3 570 182
 Tabla N°2

Cuartil N°1 226 Rango Intercuartílico


Cuartil N°2 388 162
Cuartil N°3 570 182

 El cuartil de la N°1 comparado al de la tabla N°2 el primer valor varia por cuatro
dígitos en el primer cuartil, en los dos últimos cuartiles se observa que estos tienen
el mismo valor en el segundo y tercer cuartil, ya que a los datos que se le realizaron
los cuartiles tenían valores similares. Estos datos fueren repartidos en cuatro partes
del mismo valor, los cuartiles son utilizados para evaluar la dispersión y la
tendencia de un conjunto de datos.
En las siguientes tablas de representa la desviación estándar
 Tabla N°1

Des. Estándar
Income 265,89
Taxes 17,22
Employees 32,81

 Tabla N°2

Des. Estándar
Income 16,42
Taxes 4,23
Employees 5,75

 En la desviación estándar es una medida de dispersión, que indica que tan dispersos
esta los datos con respecto a la medida, en la tabla N°1 y N°2 se observa que los
resultados obtenidos en las tablas son diferentes en la tabla N°1 los valores son más
altos que los valores de la tabla N°2 esto es debido a que los valores de las dos
bases de datos son desiguales.
En la siguiente tabla se representa el coeficiente de variación.
 Tabla N°1

C.V Income 61,91


C.V Taxes 145,66

 Tabla N°2

C.V Income 3,81


C.V Taxes 35,31

 En las tablas se obtiene información sobre el coeficiente de variación las dos tablas
en la cual podemos observar que los valores de Incode, Taxes de las dos tablas son
diferentes tienen variación de resultados ya que esto se debe a la cantidad de datos,
que tienen las dos bases de datos, esto quiere decir que la medida estándar de las
dos tablas es desigual.
En la siguiente tabla se refleja el resultado de la covarianza.
 Tabla N°1

Covarianza
Income taxes 4197,37
 Tabla N°2

Covarianza
Income taxes 4410,89

 En las tablas se observa la covarianza entre Income y taxes se tiene que los valores
de la tabla N°2 referente a la tabla número N°1 tiene un nivel de desigualdad alto
esto quiere decir que la relación lineal de la tabla N°2 es mas alta que la tabla N°1.
En la siguiente tabla se representa el sesgo
 Tabla N°1

Sesgo Income 1,40


Sesgo Taxes 5,18

 Tabla N°2

Sesgo Income 6400,29


Sesgo Taxes 409,32

 El sesgo obtenido en las tablas se observa que los resultados varían debido a que en
las bases de datos la cantidad de información es muy variada debido a esto se
obtiene la diferencia de resultados.
En la siguiente tabla se representa el coeficiente de correlación
 Tabla N°1

Coeficiente de correlación
Income Employees -937,69

 Tabla N°2

Coeficiente de correlación
Income Employees -3474,31

 En el coeficiente de correlación de la de la tabla N°1 es inferior a la tabla N°2 esto


quiere decir que la medición estándar es mayor en la taba N°1 que en la N°2 esto es
debido a la cantidad de datos obtenidos en las dos bases de datos.
Fórmulas de Excel
En este trabajo se realizaron unos cálculos con las fórmulas proporcionadas por Excel,
con estas formulas se trabajaron con dos bases de dos big Lucy y una personal.

 Tabla N°1

Promedio Income 429,50


N.º Datos 85296
Promedio taxes 11,82
N.º Datos 85296
Promedio Employees 63,22
N.º Datos 85296

 Tabla N°2

Promedio Income 430,83


N.º Datos 7822
Promedio taxes 11,99
N.º Datos 7822
Promedio Employees 63,44
N.º Datos 7822

 En el promedio incode de la tabla N°1 es más bajo que en la tabla N°2 esta
diferencia es mínima, estos resultados fueron realizados con las fórmulas de Excel.
 El número de datos en las dos tablas es diferente debido a la cantidad de datos que
tienen la base de datos.
 El promedio de taxes de las dos bases de datos se observa que en la tabla N°2
siendo comparada con la tabla N°1 la diferencia de esta es solo de unos números.
 El promedio de employees de las dos bases de datos se observa que en la tabla N°1
siendo comparada con la tabla N°2 su resultado es diferente por unos datos esto
quiere decir que en las dos bases de datos los Employees tienen datos similares.
En las siguientes tablas se representan los resultados del rango

 Tabla N°1

Rango Income
Valor mínimo 1
Valor máximo 2510
Rango Taxes
Valor mínimo 1
Valor máximo 305
Rango Employees
Valor mínimo 1
Valor máximo 263

 Tabla N°2

Rango Income
Valor mínimo 1
Valor máximo 2510
Rango Taxes
Valor mínimo 0,5
Valor máximo 305
Rango Employees
Valor mínimo 1
Valor máximo 263

 En el rango de las dos bases de datos se observa que los resultados son iguales
debido a que los datos que tienen cada una de las bases de datos son similares
puesto que tienen resultados iguales.
En las siguientes tablas se observan los resultados de la mediana

 Tabla N°1

Mediana Income 388


Mediana Taxes 6
Mediana Employees 62

 Tabla N°2

Mediana Income 388


Mediana Taxes 6
Mediana Employees 62

 En la mediana de las bases de datos se observa que la mediana de las dos bases de
datos es igual puesto que los valores que tienen estas dos bases de datos son
similares debido a esto los resultados son iguales.
En las siguientes tablas se observa la desviación estándar
 Tabla N°1

Desviación Estándar
Income 265,89
Taxes 17,22
Employees 32,81

 Tabla N°2

Desviación Estándar
Income 269,49
Taxes 17,92
Employees 33,03

 En la desviación estándar es una medida de dispersión, que indica que tan dispersos
esta los datos con respecto a la medida, en la tabla N°1 y N°2 se observa que los
resultados obtenidos en las tablas asilan por el mismo rango esto es debido a que los
valores de las dos bases de datos son similares.
En la siguiente tabla se representa la varianza
 Tabla N°1

Varianza
Income 70694,94
Taxes 296,58
Employees 1076,21

 Tabla N°2

Varianza
Income 72624,65
Taxes 321,20
Employees 1091,24
 En la varianza de incode de la tabla N°1 siendo comparada con la tabla N°2 se
observa que la varianza de la tabla N°1 es menor que en la tabla N°2 ya que la tabla
N°2 tiene más datos que la tabla N°1.
 En la varianza de taxes de la tabla N°1 es comparada con la tabla N°2 se observa
que en la tabla N°2 la varianza es más alta que en la tabla N°1 ya que esta tiene más
datos.
En la siguiente tabla se representa la covarianza
 Tabla N°1

Covarianza
Income Taxes 4197,37
Income Employees 5611,24

 Tabla N°2

Covarianza
Income Taxes 4410,90
Income Employees 5814,21

 En las tablas se observa la covarianza entre Income y taxes los valores de la tabla
N°2 referente a la tabla número N°1 tiene un nivel de desigualdad alto esto quiere
decir que la relación lineal de la tabla N°1 es más alta que la tabla N°2.
En la siguiente tabla se representa el coeficiente de correlación

 Tabla N°1

Coeficiente de correlación
Income Taxes 0,916673235

 Tabla N°2

Coeficiente de correlación
Income Taxes 0,91326456

 En el coeficiente de correlación de la de la tabla N°2 es inferior a la tabla N°1 esto


quiere decir que la medición estándar es mayor en la taba N°2 que en la N°1 esto es
debido a la cantidad de datos obtenidos en las dos bases de datos.

Conclusión
 Se pudo realizar diferentes cálculos en Excel obteniendo nuevo conocimiento de
esta herramienta.
 Con las formulas obtenidas en clase se pudo realizar cálculos con los cuales se
realizaron una comparación entre dos bases de datos.
 Con las fórmulas de Excel pude observar los resultados obtenidos con las fórmulas
dadas en clase.

Potrebbero piacerti anche