Sei sulla pagina 1di 3

DATA WEREHOUSE Um Data Warehouse um conjunto de dados baseado em assuntos, integrado, no voltil, e varivel em relao ao tempo, de apoio s decises

s gerenciais. Data Warehouse um grande repositrio de dados modelado de forma a agilizar a consulta e seleo dos dados de acordo com os interesses do negcio e das necessidades de gesto de conhecimento. Tem tambm como caracterstica conter dados no volteis e estar referenciando um perodo de tempo previamente estabelecido. As suas principais caractersticas so assim as seguintes: O datawarehouse orientado para os sujeitos, o que significa que os dados recolhidos devem ser orientados para o ofcio e por conseguinte ser organizados por tema O datawarehouse composto de dados integrados, o que quer dizer que uma limpeza preliminar dos dados necessria com vista a uma racionalizao e normalizao Os dados do datawarehouse so no volteis o que significa que um dado entrando no armazm fica assim para sempre e no deve ser suprimido Os dados do datawarehouse devem historiados e, por conseguinte, datados. Tipos de Datawarehouse: Marketing - Avalia a performance comercial de um produto ou servio a partir de diversas perspectivas diferentes Financeiro - Monitoram a performance comercial em termos financeiros Comportamental - Contm informaes individuais a respeito de cada cliente e seus comportamentos. Data Warehousing o processo de gerenciar as informaes chaves para a tomada de decises das empresas, atravs de uma modelagem conceitual dos fatos de negcio, de sua modelagem fsica, do processo de extrao dos dados dos sistemas existentes, limpeza, transformao e armazenamento destes dados em um SGBD ( Sistema Gerenciamento de Banco de Dados). O data warehouse pode ser uma deciso estratgica, mas no pode ser encarado com imediatismo, ou seja, no apenas algo que se realiza aos poucos, mas tambm um processo contnuo de atualizao e consolidao dos dados corporativos. Por isso, os investimentos em um sistema desse tipo no devem e nem podem ser feitos de uma nica vez, mas de forma gradual ao longo do tempo.

DATA MINING Minerao dos dados : usa complexas pesquisas em grandes volumes de dados para explorar e identificar relacionamentos entre variveis que antes eram previamente independentes. Isso permite que as organizaes gerenciem relacionamentos de causa e efeito mais eficientemente, e antecipem polticas para isso. Conhecido tambm como minerao de dados. Sua funo principal a varredura de grande quantidade de dados a procura de padres e deteco de relacionamentos entre informaes gerando novos sub-grupos de dados. Usado comumente em grandes bancos de dados. Por enquanto podemos pensar que Data Mining como um agregador e organizador de dados. A formao de sub-grupos de dados feito pelo Data Mining atravs da execuo de algoritmos capazes de conhecer e aprender mediante a varredura dessas informaes. Baseado em sistemas de redes neurais, esses dados so examinados e pensados, gerando uma nova informao associativa com outros dados. A formao de estatsticas tambm uma de suas funes. Nmeros estatsticos so gerados trazendo resultados comparativos e levando a uma tomada de deciso inteligente. gigantesco o resultado desse processamento, uma das mais fortes a formao de hipteses e principalmente regras de dados a serem apresentados ao usurio. Falaremos como isso exibo um pouco mais pra frente. Que dados o Data Mining avalia? Grandes corporaes no sobrevivem sem um perfeito sistema de gesto. Perfeito pelo motivo de que hoje em dia milhares de informaes so processadas diariamente. Na rotina de pequenas e mdias empresas essas informaes ficam perdidas e esquecidas. Esses sistemas de gesto armazenam em seus bancos de dados os acontecimentos do dia-a-dia: estoques, pedidos, compras, oramentos, contbil, financeiro, jurdico, ps-venda, relacionamento com cliente, vendas entre outros. Todos esses departamentos geram informaes independentes. A funo principal de um Business Intelligence trabalhar todo esse histrico de acontecimentos inseridos diariamente e garantir que no final das contas todos os dados sejam visualizados como um todo, trazendo informaes concretas, consistentes e decisivas, basicamente atravs da ao do Data Mining. Pra onde vai? Essa minerao de informao na base de dados do sistema resulta -como j mencionado- em novas informaes mais detalhadas e principalmente organizada (dependendo muito do algoritmo sendo executado). O Data Mining alimenta uma base de dados j comentada aqui no Alvo Conhecimento: o Data Warehouse, base nica e totalmente estruturada para garantir a tomada de deciso em nvel de usurio, atravs de relatrios customizados. Saiba mais sobre Data Warehouse aqui. Como feita a minerao? Essa varredura nos dados histricos requer que eles sejam filtrados a fim de desconsiderar o que especfico sobre algum assunto e valorizar tudo que for generalizado dentro do sistema, ou dados genricos. Se por acaso

uma faculdade recebe muitos pedidos de descontos num determinado dia, significa que houve uma procura comum, e no uma regra sobre pedir descontos em um dia especifico. O que quero dizer que no h ma associao entre pedido de desconto e dia especfico como uma regra. O que importa para o Data Mining que em um determinado dia houve um padro de acontecimentos, e isso ele ira considerar. simples, para localizar os padres de um sistema, basta iniciarmos naqueles que se repetem. Por qu? Como diz na Wikipdia: O crebro dos seres humanos utiliza-se de processos similares, pois muito do conhecimento que temos em nossa mente , de certa forma, um processo que depende da localizao de padres.

DATA MART O termo Datamart (literalmente, loja de dados) designa um subconjunto do datawarehouse que contm os dados do datawarehouse para um sector especfico da empresa (departamento, direco, servio, gama de produto, etc.). Fala-se assim, por exemplo, de DataMart Marketing, DataMart Comercial, B.I Business Intelligence um termo criado pelo Gartner Group, no incio da dcada de 90, para descrever o processo de acesso e explorao de dados estruturados contidos geralmente no Data Werehouse. OLTP OLAP O objectivo do OLAP (On-Line Analytical Processing) permitir uma anlise multidimensional em bases de dados volumosas para realizar uma anlise especfica dos dados ( o objecto de um questionamento especfico). Graas ao OLAP, os utilizadores podem criar representaes multidimensionais (chamadas hypercubesou cubos OLAP) de acordo com os critrios que definem, para simular situaes.

ETL

Potrebbero piacerti anche