Sei sulla pagina 1di 14

23/07/2014

Tema 4 - Data warehouse e data


mining
Professor Me. Jeferson
Bussula Pinheiro

Objetivos

• Entender os conceitos de data warehouse


(dw) e data mining.

O que é Data Warehouse?

• Data warehouse é um depósito de dados


digitais que serve para armazenar
informações detalhadas relativamente a
uma empresa.

1
23/07/2014

Por que usar Data Warehouse?

• Aumento drástico do formato eletrônico.


• Barateamento do custo de armazenamento.
• Aumento de
disponibilidade de
recursos
computacionais.

Geração de informações

• Para auxiliar na tarefa da geração de


informações de auxílio à tomada de
decisões foi criado o conceito de data
warehouse (depósito
de dados).

Estrutura de um Data Warehouse

• Dados inseridos e extraídos rapidamente.


• Base de dados mapeada especialmente
para o DW.
• Estrutura especial e
separada.
Obs.:
Performance

2
23/07/2014

Organização de um Data Warehouse

• Um data warehouse deve ser orientado por


assuntos.

Missão de um Data Warehouse

• Analise de dados históricos.


• Após os dados ingressarem no DW, os
dados não podem ser alterados.
• Os dados devem ser
comparáveis ao longo
do tempo.

Inserção no Data Warehouse

• Instruções SQL
• Tratamento dos dados, conforme regra de
negócio.,
• Este conjunto de
instruções foi chamado
de ETL (extraction,
transformation e
loading, ou seja,
extração, transformação
e carregamento)

3
23/07/2014

Projeto lógico do Data Warehouse

• Modelagem dimensional
• Tabela principal e auxiliares
• Chaves e relacionamentos
• Este modelo é
conhecido como
esquema estrela (star
schema)

Continuando
Data Warehouse e
Data Mining

Importância da tecnologia

Estas tecnologias são extremamente


importantes para o mundo atual, no qual a
velocidade e precisão das informações para o
processo de
tomada de decisão
são primordiais.

4
23/07/2014

Projeto lógico do Data Warehouse

• Devido a sua estrutura baseada em fatos e


dimensões variando ao longo do tempo, a
cada um dos conjuntos de dados dá-se o
nome de cubo.

Projeto lógico do Data Warehouse

• Para facilitar este tipo de análise, é utilizada


uma ferramenta conhecida como OLAP
(Online Analytical Processing), especialmente
projetadas para
trabalhar com data
warehouse.

5
23/07/2014

Recursos de drill-up e drill-down.

• Drill-up e drill-down são formas de se


navegar em dados que estão agrupados.

O que é Data Mining?

• Data mining é um processo no qual,


utilizando-se uma base de dados.
• Esta ferramenta
consegue encontrar
padrões que podem
ser úteis na geração
de conhecimento.

Utilizando Data mining

• A base de dados centralizada gerada pelo


data warehouse pode ser utilizada também
para realização de data mining.
• Encontrar padrões em
bases de dados,
através de inteligência
artificial, redes neurais
e métodos estatísticos.

6
23/07/2014

Identificação de padrão

• A extração de conhecimento em base de


dados ou então knowledge discovery in
database (KDD).

Agora é sua Vez


Data Warehouse e
Data Mining

7
23/07/2014

Questão 01
Dentro do contexto de data mining, defina o
que é um “padrão”. Dê um exemplo de
padrão e uma decisão que possa ser tomada
baseada neste padrão.
R: Identificação da
probabilidade de um
segurado contrair um
sinistro.

Questão 02

A identificação de um padrão é parte de um


contexto maior, conhecido como:
( ) OLTP – Online Transaction Processing
( ) MIS – Management
Information System
(X) KDD – Knowledge
Discovery in Database
( ) SGBD – Sistema
Gerenciados de Banco de
Dados
( ) N.DA

Questão 03

A analise de dados históricos está ligado a


Data warehouse ou a Data mining?
( ) Data mining
(X) Data warehouse

8
23/07/2014

Questão 04

Qual o relacionamento existente entre data


mining e data warehouse? Como eles se
relacionam com o knowledge discovery in
database?

Resposta questão 04
Os dados armazenados em um data
warehouse são uma excelente fonte a ser
utilizada por ferramentas de mineração de
dados, devido a todas as informações
relevantes sobre um
determinado tema
estar agrupadas em
um mesmo local.
Obs.:
Observar a performance.

Questão 05

Defina OLAP (Online Analytical Processing).


R: É uma ferramenta especialmente projetada
para trabalhar com data warehouse.
Com OLAP, é possível
fatiar estes dados de
uma forma intuitiva,
além de utilizar os
recursos de drill-up e
drill-down.

9
23/07/2014

Questão 06

Classifique como drill-up (u) ou drill-down (d)


cada uma das alterações de ponto de vista a
seguir:

a) ( d) De [mês do ano] para [dias do mês]


b) ( u) De [apartamento] para [prédio]
c) ( u) De [funcionário] para [setor]
d) ( u) De [modelo do veículo] para [fabricante]
e) ( d) De [unidade federativa] para [cidade]
Obs.:
Atenção nos
relacionamentos.

Finalizando

10
23/07/2014

Data Warehouse

• Mantém o histórico de dados, mesmo se os


sistemas transacionais não os fizerem.

Data Warehouse

• Integra os dados de vários sistemas,


permitindo uma visão consolidada de toda a
operação.

Data Warehouse

• Melhora a qualidade dos dados, criando


uma padronização de códigos e descrições
e identificando e corrigindo dados ruins.

11
23/07/2014

Data Warehouse

• Apresenta as informações da organização


de forma consistente.

Data Warehouse

• Fornece um único modelo de dados para


toda a organização, independente da fonte.

Data Warehouse

• Reestrutura os dados de modo a satisfazer


as necessidades dos usuários do negócio.

12
23/07/2014

Data Warehouse

• Reestrutura os dados para melhorar o


desempenho de consulta, mesmo para
consultas analíticas complexas, sem afetar
os sistemas em
operação.

Data Warehouse

• Agrega valor às aplicações de negócio


operacional, principalmente a gestão de
relacionamento com clientes (CRM)

Data mining

• É o processo de explorar grandes


quantidades de dados à procura de padrões
consistentes.

13
23/07/2014

OLAP

• Utilizada para analisar grandes volumes de


informações nas mais diversas perspectivas
dentro de um Data Warehouse (DW).

14

Potrebbero piacerti anche