Sei sulla pagina 1di 12

TRABAJO DE MINERIA DE DATOS

VENTAS

INTEGRANTES:

2018
Contenido

1 ITRODUCCIÓN 3

2 ANALISIS DE REQUQERIMIENTOS 3

3 MODELO CONCEPTUAL 3

4 NIVEL DE GRANULIDAD 4

5 CMODELO LOGICO DEL DW 4

6 INTEGRACION DE DATOS 4

7 MODELO RELACIONAL 4

8 CREACION DEL CUBO DE CONOCIMIENTO 5

9 DIMENSIONES O ATRIBUTOS. 5
1 INTRODUCCIÓN
HEFESTO es una metodología propia, cuya propuesta está fundamentada en una muy amplia
investigación, comparación de metodologías existentes, experiencias propias en procesos de
confección de almacenes de datos. Cabe destacar que HEFESTO está en continua evolución, y se
han tenido en cuenta, como gran valor agregado, todos los feedbacks que han aportado quienes han
utilizado esta metodología en diversos países y con diversos fines.

2 ANALISIS DE REQUERIMIENTOS

Se analizarán estas preguntas a fin de identificar cuáles serán los indicadores y perspectivas que
serán tomadas en cuenta para la construcción del DW. Finalmente se confeccionará un modelo
conceptual en donde se podrá visualizar el resultado obtenido en este primer paso.

 Unidades vendidas de cada producto.

 Monto total de ventas de cada producto

 Ventas de cada producto a cada cliente.

 Promedio de ventas por cliente.

Indicadores:
• Cantidad de Productos vendidos.

• total de un producto vendido.

• Venta de productos por cliente.

• venta de productos por trabajador.

Perspectiva:

• Productos

• clientes

• empleados

• pedido

• pedido por detalle

3 Modelo conceptual

clientes
unidades
vendidas

Productos
cantidad
monto
total de
ventas
Lapsos
4 NIVEL DE GRANULIDAD

Categories (
CategoryID INTEGER NOT NULL identity(1,1),
CategoryName VARCHAR(15) NOT NULL,
Description varchar (100),
Picture varbinary(max),
CONSTRAINT PK_Categories PRIMARY KEY (CategoryID)
);

Customers (
CustomerID VARCHAR(5) NOT NULL,
CompanyName VARCHAR(40) NOT NULL,
ContactName VARCHAR(30),
ContactTitle VARCHAR(30),
Address VARCHAR(60),
City VARCHAR(15),
Region VARCHAR(15),
PostalCode VARCHAR(10),
Country VARCHAR(15),
Phone VARCHAR(24),
Fax VARCHAR(24),
CONSTRAINT PK_Customers PRIMARY KEY (CustomerID)
);

CREATE TABLE Employees (


EmployeeID INTEGER NOT NULL identity(1,1),
LastName VARCHAR(20) NOT NULL,
FirstName VARCHAR(10) NOT NULL,
Title VARCHAR(30),
TitleOfCourtesy VARCHAR(25),
BirthDate DATETIME,
HireDate DATETIME,
Address VARCHAR(60),
City VARCHAR(15),
Region VARCHAR(15),
PostalCode VARCHAR(10),
Country VARCHAR(15),
HomePhone VARCHAR(24),
Extension VARCHAR(4),
Photo varbinary(max),
Notes varchar (500),
ReportsTo INTEGER,
PhotoPath VARCHAR(255),
Salary FLOAT,
CONSTRAINT PK_Employees PRIMARY KEY (EmployeeID)
);

CREATE TABLE OrderDetails (


OrderID INTEGER NOT NULL,
ProductID INTEGER NOT NULL,
UnitPrice DECIMAL(10,4) NOT NULL DEFAULT 0,
Quantity int NOT NULL DEFAULT 1,
Discount real NOT NULL DEFAULT 0,
CONSTRAINT PK_Order_Details PRIMARY KEY (OrderID, ProductID)
);

CREATE TABLE Orders (


OrderID INTEGER NOT NULL identity(10248,1),
CustomerID VARCHAR(5),
EmployeeID INTEGER,
OrderDate DATETIME,
RequiredDate DATETIME,
ShippedDate DATETIME,
ShipVia INTEGER,
Freight DECIMAL(10,4) DEFAULT 0,
ShipName VARCHAR(250),
ShipAddress VARCHAR(250),
ShipCity VARCHAR(250),
ShipRegion VARCHAR(250),
ShipPostalCode VARCHAR(250),
ShipCountry VARCHAR(250),
CONSTRAINT PK_Orders PRIMARY KEY (OrderID)
);

CREATE TABLE Products (


ProductID INTEGER NOT NULL identity(1,1),
ProductName VARCHAR(40) NOT NULL,
SupplierID INTEGER,
CategoryID INTEGER,
QuantityPerUnit VARCHAR(20),
UnitPrice DECIMAL(10,4) DEFAULT 0,
UnitsInStock int DEFAULT 0,
UnitsOnOrder int DEFAULT 0,
ReorderLevel int DEFAULT 0,
Discontinued BIT NOT NULL DEFAULT 0,
CONSTRAINT PK_Products PRIMARY KEY (ProductID)
);
5 MODELO LOGICO DEL DW

Para los esquemas en estrella y copo de nieve, se realizará lo siguiente:

• Se le deberá asignar un nombre a la tabla de hechos que represente la información


analizada, área de investigación, negocio enfocado, etc.

• Se definirá su clave primaria, que se compone de la combinación de las claves primarias


de cada tabla de dimensión relacionada.

• Se crearán tantos campos de hechos como indicadores se hayan definido en el modelo


conceptual y se les asignará los mismos nombres que estos. En caso que se prefiera,
podrán ser nombrados de cualquier otro modo.

El Data Mart se diseña con estructura multidimensional, cada objeto de análisis es una

tabla de hechos enlazada con diversas tablas de dimensiones. Si se diseña siguiendo el

Modelo en Estrella habrá prácticamente una tabla para cada dimensión

Data Mart va dirigido a un área funcional, problema en particular, departamento, tema o grupo de
necesidades.

Dentro de las ventajas de aplicar un Data Mart, se han seleccionado las

siguientes:

Son simples de implementar.

Conllevan poco tiempo de construcción y puesta en marcha.

Permiten manejar información confidencial.

Reflejan rápidamente sus beneficios y cualidades.

Reducen la demanda del depósito de datos.


6 INTEGRACION DE DATOS

Las realizaciones de estas tareas pueden contener una lógica realmente compleja en algunos
casos. Afortunadamente, en la actualidad existen muchos softwares que se pueden emplear a
tal fin, y que nos facilitarán el trabajo.
Se debe evitar que el DW sea cargado con valores faltantes o anómalos, así como
también se deben establecer condiciones y restricciones para asegurar que solo se utilicen
los datos de interés.

6.1 VISTAS Y CARGA INICIAL

1) CREATE VIEW `Alphabetical list of products`


AS
SELECT Products.*,
Categories.CategoryName
FROM Categories
INNER JOIN Products ON Categories.CategoryID = Products.CategoryID
WHERE (((Products.Discontinued)=0));

2) CREATE VIEW `Current Product List`


AS
SELECT ProductID,
ProductName
FROM Products
WHERE Discontinued=0;
3) CREATE VIEW `Customer and Suppliers by City`
AS
SELECT City,
CompanyName,
ContactName,
'Customers' AS Relationship
FROM Customers
UNION
SELECT City,
CompanyName,
ContactName,
'Suppliers'
FROM Suppliers
ORDER BY City, CompanyName;

4) CREATE VIEW `Invoices`


AS
SELECT Orders.ShipName,
Orders.ShipAddress,
Orders.ShipCity,
Orders.ShipRegion,
Orders.ShipPostalCode,
Orders.ShipCountry,
Orders.CustomerID,
Customers.CompanyName AS CustomerName,
Customers.Address,
Customers.City,
Customers.Region,
Customers.PostalCode,
Customers.Country,
(Employees.FirstName + ' ' + Employees.LastName) AS Salesperson,
Orders.OrderID,
Orders.OrderDate,
Orders.RequiredDate,
Orders.ShippedDate,
Shippers.CompanyName As ShipperName,
`Order Details`.ProductID,
Products.ProductName,
`Order Details`.UnitPrice,
`Order Details`.Quantity,
`Order Details`.Discount,
(((`Order Details`.UnitPrice*Quantity*(1-Discount))/100)*100) AS ExtendedPrice,
Orders.Freight
FROM Customers
JOIN Orders ON Customers.CustomerID = Orders.CustomerID
JOIN Employees ON Employees.EmployeeID = Orders.EmployeeID
JOIN `Order Details` ON Orders.OrderID = `Order Details`.OrderID
JOIN Products ON Products.ProductID = `Order Details`.ProductID
JOIN Shippers ON Shippers.ShipperID = Orders.ShipVia;

5) CREATE VIEW `Order Subtotals` AS


SELECT `Order Details`.OrderID,
Sum((`Order Details`.UnitPrice*Quantity*(1-Discount)/100)*100) AS Subtotal
FROM `Order Details`
GROUP BY `Order Details`.OrderID;
6) CREATE VIEW `Products by Category` AS
SELECT Categories.CategoryName,
Products.ProductName,
Products.QuantityPerUnit,
Products.UnitsInStock,
Products.Discontinued
FROM Categories
INNER JOIN Products ON Categories.CategoryID = Products.CategoryID
WHERE Products.Discontinued <> 1;

Anexo proceso de creación de vistas en sql server


7 MODELO RELACIONAL

8 CREACION DEL CUBO DE CONOCIMIENTO


El cual hace referencia a la información mas relevante, selecciona las tablas la cual está
contenida dicha información a procesar.
9 DIMENSIONES O ATRIBUTOS
De la tabla de dimensión “CLIENTE”, se tomará el campo “Cliente” para la creación

del atributo denominado:

• “Clientes”.

De la tabla de dimensión “PRODUCTO”, se tomará el campo “Marca” para la


creación

del atributo denominado:

• “Marcas”.

De la tabla de dimensión “PRODUCTO”, se tomará el campo “Producto” para la

creación del atributo denominado:

• “Productos”.

De la tabla de dimensión “FECHA”, se tomará el campo “Año” para la creación del

atributo denominado:

• “Años”.

De la tabla de dimensión “FECHA”, se tomará el campo “Trimestre” para la creación

del atributo denominado:

• “Trimestres”.

De la tabla de dimensión “FECHA”, se tomará el campo “Mes” para la creación del

atributo denominado:

• “Meses”.

Anexo proceso de creación de dimensiones de el cubo de conocimiento

Potrebbero piacerti anche