Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
de Dados
Material Teórico
Data Warehouse e Data Mining
Revisão Técnica:
Prof. Me. Douglas Almendro
Revisão Textual:
Profa. Esp. Kelciane da Rocha Campos
Data Warehouse e Data Mining
• Business Intelligence
• Data Warehouse
• Ferramentas OLAP
• Data Mining
OBJETIVO DE APRENDIZADO
· O aluno deverá, ao final deste módulo, entender a importância de
Data Warehouse e de Data Mining no ambiente corporativo. Além
disso, deverá ter uma noção das principais características destes
termos e sua importância na tomada de decisões.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja uma maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.
Mantenha o foco!
Evite se distrair com
as redes sociais.
Seja original!
Nunca plagie
trabalhos.
Não se esqueça
de se alimentar
Assim: e se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como o seu “momento do estudo”.
No material de cada Unidade, há leituras indicadas. Entre elas: artigos científicos, livros, vídeos e
sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você também
encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados.
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discussão,
pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato
com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e aprendizagem.
UNIDADE Data Warehouse e Data Mining
A empresa Catho, localizada em Barueri, São Paulo, conta com um site que contém
classificados de empregos. Funciona intermediando contratações de candidatos por
parte de outras empresas.
A empresa Birst é uma multinacional que atua no ramo de BI (Inteligência de Negócios)
na nuvem. Seu primeiro grande contrato no mercado brasileiro foi com a Catho.
Acesse o texto completo deste artigo - COMPUTER WORLD. Catho migra data warehouse
Explor
8
Explor Business Inteligence (BI): BI é um termo utilizado para descrever um conjunto amplo, coeso
e integrado de ferramentas e processos utilizados para captar, coletar, integrar, armazenar e
analisar dados para a geração e a apresentação de informações que deem suporte à tomada
de decisões (ROB; CORONEL, 2011).
Business Intelligence ou Inteligência de Negócios refere-se ao processo de coleta,
organização, análise, compartilhamento e monitoramento de informações que oferecem
suporte a gestão de negócios. É o conjunto de teorias, metodologias, processos, estruturas e
tecnologias que transformam uma grande quantidade de dados brutos em informação útil
para tomadas de decisões estratégicas.
Explor
Imagine que você, gestor(a) de uma empresa, tenha recebido uma proposta
de parceria que lhe despertou certo interesse, porém precisará dar uma resposta
rápida desta parceria para que não corra o risco de perder para a concorrência
uma excelente oportunidade. Entretanto, a resposta fornecida não deve ser fruto
de um ato impulsivo, mas deve estar pautada em análises que se farão a partir
de ferramentas de Inteligência de Negócio, para que a decisão seja correta no
contexto da realidade da empresa.
9
9
UNIDADE Data Warehouse e Data Mining
Data Warehouse
Bill Inmon, conhecido como o “pai” do Data Warehouse, define o termo
como um conjunto de dados integrados, orientado por assunto, variável
no tempo e não volátil que fornece suporte à tomada de decisões (INMON;
KELLEY, 1994 apud ROB; CORONEL, 2011).
»» Não Volátil: uma vez inserido um dado no data warehouse, ele nunca será
removido. Os dados no data warehouse representam um histórico da empresa.
10
Podemos notar que o data warehouse é uma ferramenta muito importante
para análises de que a alta gestão de uma empresa necessita para gerenciar o
crescimento da organização ao longo do tempo. A partir das análises realizadas, é
possível corrigir falhas e criar estratégias para que a empresa continue evoluindo
em seus negócios, tendendo sempre ao sucesso que tanto almeja.
Data Mart é um termo utilizado para definir uma pequena porção de um data warehouse.
Nele são armazenados subconjuntos e dados necessários para um departamento ou
equipe de trabalho, por exemplo.
Batch significa lote. Um arquivo batch, por exemplo, é utilizado para realizar tarefas de
Explor
8. O data warehouse contém dados com vários níveis de detalhes: dados atuais
em detalhes, dados antigos em detalhes, dados levemente resumidos e dados
altamente consumidos;
11
11
UNIDADE Data Warehouse e Data Mining
Metadados são dados que descrevem outros dados, ou seja, informações úteis para
Explor
Acesse o site da Oracle e conheça mais sobre sua ferramenta de Data Warehouse
Explor
https://goo.gl/RhrJhU
Acesse o site da Microsoft e conheça mais sobre o Azure SQL Data Warehouse
Explor
https://goo.gl/qTaagI
12
Por meio de OLAP, os dados podem ser analisados sob variados pontos de vistas.
Os gestores de uma empresa recebem dados a respeito de determinado assunto e
podem realizar comparações que contribuirão para a tomada de decisões.
Em 1993, Codd criou um conjunto de regras que definem este termo OLAP
(OLAP.COM, 2017).
Uma matriz esparsa é aquela em que a maioria dos seus elementos tem valor
igual a zero.
13
13
UNIDADE Data Warehouse e Data Mining
https://goo.gl/RhrJhU
14
Explor
Acesse o site da Microsoft e conheça mais sobre o SQL Server 2008 Analysis Services:
https://goo.gl/j3Hs8M
Data Mining
Data Mining ou Mineração de Dados refere-se, em geral, ao processo
de analisar grandes bancos de dados de forma semiautomática para
encontrar padrões úteis a partir dos dados (SILBERSCHATZ; KORTH;
SUDARSHAN, 2012).
Rede Neural Artificial se baseia na estrutura neural de seres humanos para que possam
Explor
Imagine que você, gestor(a) de uma loja de calçados, necessita ter o conheci-
mento de quais são os cintos que as pessoas compram juntamente com um deter-
minado sapato. Desta forma, você pode colocar estes cintos bem próximos a tal
sapato na prateleira em que ele se encontrar.
» Quais são os livros que costumam ser comprados juntos? A empresa pode
sugerir outros livros para a pessoa que compra determinada obra;
15
15
UNIDADE Data Warehouse e Data Mining
Acesse o site da Oracle Data Mining 12c e conheça um pouco mais desta ferramenta:
Explor
https://goo.gl/VVz5hZ
A Microsoft possui o SQL Server Data Mining, que inclui vários algoritmos
padrão como redes neurais, regressão logística e regressão linear, árvores de
decisão, entre outros. Todos os modelos têm visualizações integradas para ajudar
os usuários a desenvolverem, refinarem e avaliarem seus modelos.
Acesse o site da Microsoft e conheça um pouco mais sobre a ferramenta SQL Server Data
Explor
Mining: https://goo.gl/DbgTlN
Casos de Sucesso
1. Alemanha e a vitória na Copa do Mundo 2014 (KNOWSOLUTION.
COM.BR, 2017): o assunto Business Intelligence veio à tona em nível
mundial, mostrando que a solução pode auxiliar em alcance de objetivos
nos mais diversos ramos de desempenho e busca de resultados. O software
desenvolvido na Alemanha analisava dados extraídos numericamente, como
velocidade de corrida e número de passes. Também escaneava comporta-
mentos individuais de atletas e do time como um todo. Para adquirir esses
dados, foram utilizadas oito câmeras que rastreavam os movimentos de to-
dos os jogadores, milhões de pontos de dados por minuto, devidamente
registrados e organizados para uma melhor compreensão dos envolvidos. Os
relatórios foram passados aos jogadores e à comissão técnica. Com a utiliza-
ção deles, o grupo preparou-se para executar mais rapidamente as jogadas,
envolver as outras equipes e reter a bola.
16
Figura 3. Solução desenvolvida pela Federação Alemã de Futebol.
17
17
UNIDADE Data Warehouse e Data Mining
Em Síntese Importante!
Data Warehouse, OLAP e Data Mining são três áreas da ciência da computação que
são altamente interligadas e comercializadas sob o título de Business Intelligence. As
funcionalidades destas três áreas se complementam entre si (TEOREY; LIGHTSTONE;
NADEAU, 2007).
BI é um termo utilizado para descrever um conjunto amplo, coeso e integrado de
ferramentas e processos utilizados para captar, coletar, integrar, armazenar e analisar
dados para a geração e a apresentação de informações que deem suporte à tomada de
decisões (ROB; CORONEL, 2011).
Data Warehouse é um conjunto de dados integrado, orientado por assunto, variável no
tempo e não volátil que fornece suporte à tomada de decisões (INMON; KELLEY, 1994
apud ROB; CORONEL, 2011).
Por meio de OLAP, os dados podem ser analisados sob variados pontos de vistas. Os
gestores de uma empresa recebem dados a respeito de determinado assunto e podem
realizar comparações que contribuirão para a tomada de decisões.
A ideia por trás de um Data Mining é extrair conhecimento a partir de um banco de
dados. O computador deve ser capaz de localizar correlações nos dados e apresentar
hipóteses promissoras para que o usuário leve em consideração (TEOREY; LIGHTSTONE;
NADEAU, 2007).
18
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Sites
Computerworld
https://goo.gl/0EK1
Microsoft
https://goo.gl/jtMlS4
OFICINADANET. O que é business intelligence?
https://goo.gl/0qr8CA
OLAP
https://goo.gl/3crsAO
ORACLE
https://goo.gl/PgYH6e
19
19
UNIDADE Data Warehouse e Data Mining
Referências
COMPUTERWORLD. Catho migra data warehouse para a nuvem da Birst.
2015. Disponível em: <http://computerworld.com.br/catho-migra-e-automatiza-
data-warehouse-na-nuvem-da-birst>. Acesso em: 15 jan. 2018.
INMON, Bill; KELLEY, Chuck. The twelve rules of data warehouse for a client/ serv-
er world. Data Management Review, maio de 1994, p. 6-16.
20