Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Kamila T. Lyra
Karina C. S. Nishimura
Thiago P. Colonhezi
William S. Soares
Sumrio
Data Mining, Data Warehousing e OLAP....................................................................................2
Introduo................................................................................................................................2
Data warehousing.....................................................................................................................2
Data mining..............................................................................................................................2
OLAP.......................................................................................................................................2
Data warehousing
OLAP
Com o surgimento de sistemas para gerenciamento de diversas reas do
mercado, surgiu a necessidade de se gerar relatrios com dados sobre o
foco de gesto ou modelo de negocio da empresa. Ento, quando existia a
necessidade de se produzir um relatrio era necessrio a solicitao para o
ncleo de informtica da empresa. Um
Data mining
Minerao de dados o processo de explorar grandes quantidades de dados procura de
padres consistentes, como regras de associao ou sequncias temporais, para detectar
relacionamentos sistemticos entre variveis, detectando assim novos subconjuntos de
dados utilizando as seguintes etapas bsicas:
1.
2.
3.
4.
Explorao
Construo do modelo
Definio do padro
Validao e verificao
Software WEKA
Mestrado
Doutorado
Mestrado
Doutorado
Graduacao
Graduacao
Mestrado
Mestrado
Doutorado
Idade
>30
<=30
<=30
>30
<=30
>30
>30
<=30
>30
Classe
Renda superior a
R$ 50.000,00
Sim
Sim
Nao
Sim
Nao
Nao
Sim
Nao
Sim
Aps o classificador ser construdo, inicia-se a etapa de teste, que visa avaliar a sua
acurcia atravs do emprego de um conjunto de dados de teste. O conjunto de teste
contm observaes que tambm so selecionadas aleatoriamente a partir da base de
dados. No entanto, estas observaes devem ser diferentes das que foram selecionadas
para compor o conjunto de treinamento. A acurcia do classificador representa a
porcentagem de observaes do conjunto de teste que so corretamente classificadas por
ele. Caso a acurcia seja alta, o modelo de classificao considerado eficiente e pode
ser utilizado para classificar novos casos.
Diversas tcnicas podem ser utilizadas para a construo de classificadores, tais como
redes neurais, mtodos Bayesianos e rvores de deciso, entre outros. As rvores de
deciso tm sido muito utilizadas pelos softwares de minerao de dados. Isto
justificado pelo fato delas possurem uma representao intuitiva, que torna o modelo de
classificao fcil de ser interpretado.
OLAP
Caractersticas.
Uma das caractersticas que devem estar presentes em ferramentas OLAP a
capacidade de efetuar algumas operaes, como:
drill Across: ocorre quando o usurio pula um nvel intermedirio dentro de
uma mesma dimenso. Por exemplo, a dimenso tempo composta por ano,
semestre, trimestre, ms e dia. A operao Drill Across executada
quando o usurio passa de ano direto para trimestre ou ms;
drill Down: ocorre quando o usurio aumenta o nvel de detalhe da
informao, diminuindo a granularidade (A granularidade determina quais os
tipos de consultas podem ser feitas no DW. Ela influencia diretamente na
velocidade do acesso s informaes e no volume de dados
armazenados );
drill Up: o contrrio do Drill Down, ocorre quando o usurio aumenta a
granularidade, diminuindo o nvel de detalhamento da informao;
drill Throught: ocorre quando o usurio passa de uma informao contida em
uma dimenso para uma outra. Por exemplo: Inicia na dimenso do tempo e no
prximo passo analisa a informao por regio;
dlice and Dice: uma das principais caractersticas de uma ferramenta OLAP.
Como a ferramenta OLAP recupera o microcubo (No OLAP, as informaes so
armazenadas em cubos multidimensionais, que gravam valores quantitativos e
medidas, permitindo visualizao atravs de diversos ngulos. Estas medidas
so organizadas em categorias descritivas, chamadas de dimenses e formam,
assim, a estrutura do cubo), surgiu a necessidade de criar um mdulo, que se
convencionou de Slice and Dice, para ficar responsvel por trabalhar esta
informao. Ele serve para modificar a posio de uma informao, trocar
linhas por colunas de maneira a facilitar a compreenso dos usurios e girar o
cubo sempre que tiver necessidade.
o software cliente que voc precisa para acessar bancos de dados criados com o
Servios OLAP do Microsoft SQL Server verso 7.0, Servios OLAP do Microsoft
SQL Server verso 2000 (8.0), e Microsoft SQL Server Analysis Services verso
2005 (9.0).
O software cliente
banco de dados OLAP ou no arquivo de cubo offline. Aps criar uma fonte de
dados OLAP, voc pode basear os relatrios nela e retornar os dados OLAP
para o Excel na forma de um relatrio de Tabela Dinmica ou de Grfico
Dinmico ou em uma funo de planilha convertida em um relatrio de Tabela
Dinmica.
Microsoft Query
de
campo
de dimenso podem
Dados
ser
de
origem
usados
OLAP,
campos
somente
tipos
de
dados
de
origem
no
possuem
campos
de
comando Mostrar
Pginas
do
Filtro
de
Voc
pode
ento
classific-los
ou
reorganiz-los
Os
servidores
OLAP
fornecem
valores
resumidos