Sei sulla pagina 1di 2

Faculdades Opet

Pós-graduação em Desenvolvimento Web


Disciplina do “Uso Estratégico da Informação”
Prof. Jackson Luis Schirigatti - jschirigatti@delsoftsistemas.com.br
Aluno: Leidmar Magnus Festa - leidmar@gmail.com

DATA MINING: CONCEITUAÇÃO


Resenha sobre a obra "Data Mining: Overview and Optimization Opportunities" de 1998,
BRADLEY, Paul. S. ; FAYYAD, Usama M. e MANGASARIAN, Olvi. L.

1 CREDENCIAIS DOS AUTORES


Paul S. Bradley está atualmente lecionando no departamento de Ciência da Computação na
University of Wisconsin e também atuando como pesquisador da Microsoft. Escreveu vários artigos
em parceria com O. L. Mangasarian, dentre os quais podemos destacar "Feature Selection via
Convace Minimization and Support Vector Machines" e "Optimization Methods in Massive
Datasets".
Usama M. Fayyad é Ph.D. pela University of Michigan desde 1991 e formou-se em Ciência da
Computação com ênfase em Engenharia por esta mesma universidade. Desde 2008 desempenha a
função de chefe executivo da Open Insights, LLC, Bellevue no estado de Washington - EUA, 2008.
Desempenhou entre os anos de 2004 a 2008 a função de presidente executivo da Yahoo!Inc. em
Sunnyvale no estado da Califórnia – EUA.
Olvi L. Mangasarian é Ph.D. pela Harvard University desde 1959. É professor emérito de
matemática e ciência da computação no Departamento de Matemática da University of California,
San Diego, onde atua também como cientista. Possui mais de 151 publicações dentre as quais
destacamos: "Privacy-Preserving Support Vector Machine Classification via Random Kernels",
"Knowledge-Based Breast Cancer Prognosis" e "Optimization in Data Mining".

2 RESUMO DA OBRA
Os autores introduzem sua obra informando que trata-se de um apanhado geral sobre as pesquisas e
aplicações em Knowledge Discovery in Data (KDD) e Data Mining (mineração de dados), a qual
tem como objetivo principal contribuir para que a comunidade de desenvolvedores possa otimizar
suas pesquisas.

Existe uma abordagem inicial sobre a evolução das simples transações em uma única base de dados
para Warehouses, nas quais a partir de fontes variadas de dados é iniciado um processo de remoção
de redundâncias e inconsistências. Deste processo resultam repositórios organizados de dados (Data
Marts e Data Warehouses).Após isso chega a evolução para KDD e Data Mining que nos fornece
meios para o bom entendimento dos dados coletados. Merece destaque o fato de que a partir dos
warehouses são selecionados dados que passarão pelo processo de data mining – do qual surgirão
os padrões e modelos.

A KDD "é o processo de identificação de estruturas de dados válidas, novas, que potencialmente
podem ser utilizadas e bem entendidas". Este processo implica no cumprimento de vários passos e
iterações: desde a preparação dos dados, a busca por padrões até o refinamento final. Já a Data
Mining é um dos passos dentro do processo da KDD, o qual realiza a identificação dos padrões e
modelos. Isso tudo pode ser observado na Ilustração 1. Existem vários métodos de mineração de
dados, alguns dos mais comuns são: modelo preditivo, análise de cluster e a sumarização de dados
os quais são abordados em forma de problemas matemáticos e logo após relacionados com alguns
casos de estudo seguidos dos desafios que esta área de pesquisa apresenta.

Ilustração 1: Visão geral sobre os passos do processo de KDD e o enquadramento do Data Mining

Concluindo, é necessário destacar que Data Mining e KDD são linhas de pesquisa promissoras no
quesito criação de informação em grandes bases de dados. Comercialmente, podemos dizer que "é
um dos passos mais importantes para transformar um sistema de banco de dados que apenas
atende os propósitos básicos em um sistema que é utilizado para tomar decisões estratégicas". Mas
um aspecto mais motivador ainda é a possibilidade da evolução para uma nova categoria de
métodos que mesclam estatísticas, bases de dados, otimização, análise de dados automatizada,
redução e muitas outras técnicas. Toda esta mescla pode produzir novos algoritmos e metodologias
preparadas para trabalhar em grandes bases de dados utilizando escalonamento e paralelismo.

3 DEMAIS REFERÊNCIAS BIBLIOGRÁFICAS

Currículo Fayyad: http://www.acm.org/sigs/elections/SIGKDD/SIGKDD_All.pdf


Currículo Mangasarian: http://pages.cs.wisc.edu/~olvi/
NAVEGA, Sérgio ; "Princípios Essenciais do Data Mining" - Intelliwise Research and Training,
2002.
CHEN, Ming-Syan; HAN, Jiawei ; YU, Philip S. ; "Data Mining: An Overview from Database
Perspective" – 2001.
SCHIRIGATTI, Jackson L.; "Gestão da Informação III - Data mining e descoberta de
conhecimento em BD" - Pós Graduação Opet, 2009.

Potrebbero piacerti anche