Sei sulla pagina 1di 8

A NOVA GERAO DE SISTEMAS DE APOIO DECISO

Carlos Alberto Ferreira Bispo


Professor da Academia da Fora Area Estrada de Agua S/N - Pirassununga - SP Caixa Postal 1062 - CEP 13630-000 - cafbispo@sc.usp.br

Prof. Dr. Edson Walmir Cazarini


Professor da Escola de Engenharia de So Carlos (USP) Av. Dr. Carlos Botelho, 1465 - So Carlos - SP - CEP 13560-970 - cazarini@sc.usp.br

Abstract This article approaches which are the new tools for Decision Support Systems that they are giving great pulses in the business. We expose basic concepts of the Data Warehouse, of the OLAP (On-Line Analytical Processing) and of the Data Mining, so that they serve, its advantages in the use as strategy of business, and the difficulties of implementation these new technologies. rea: 10.4 - Sistemas de Apoio Deciso Key Words: Decision Support System, EIS (Executive Infornation Systems), Business Intelligence.

1. Introduo A concorrncia acirrada, a maior exigncia de qualidade por parte dos clientes e as dificuldades econmicas que as empresas esto enfrentando esto forando as empresas a se modernizarem, a serem mais criativas e mais eficientes na soluo dos seus problemas. Neste ponto, as Tecnologias da Informao esto dando uma boa contribuio para os gerentes conseguirem enfrentar os seus constantes desafios. Algumas das Tecnologias da Informao se transformaram em ferramentas estratgicas para obter sucesso no gerenciamento dos negcios. Entre as Tecnologias da Informao, uma nova categoria de Sistemas de Apoio Deciso est surgindo nesta ltima dcada deste milnio. So os sistemas que esto sendo chamados pelos americanos de business intelligence. Os mais importantes so os que vo ser abordados neste artigo, que so o data warehouse, o OLAP e o data mining. O data warehouse um banco de dados, ou armazm de dados como est sendo chamado devido as suas caractersticas, que serve para dar suporte s necessidades gerenciais de informaes. Faz-se necessrio um banco de dados exclusivo para os gerentes pelo fato de que as necessidades de informaes deles so diferentes das necessidades de informaes do ambiente operacional da empresa. O OLAP (On-Line Analytical Processing) uma ferramenta para efetuar certos tipos de anlises que s so possveis atravs desta ferramenta, como por exemplo uma viso

multidimensional do negcio, onde os dados so analisados e comparados por diversos ngulos, possibilitando uma melhor compreenso do prprio negcio. O data mining um sistema que permite a descoberta de informaes escondidas no banco de dados utilizando tcnicas sofisticadas de procura, como algoritmos de Inteligncia Artificial e tcnicas estatsticas avanadas. Desta forma, possvel se descobrir fatos e informaes que podem ser usados como estratgias nos negcios. 2. A evoluo da Tecnologia da Informao A Informtica e a Tecnologia da Informao evoluram muito nas ltimas dcadas. Assim como os conceitos administrativos, os modelos de negcios e o prprio mercado. Porm, somente recentemente, as duas tecnologias citadas puderam dar um melhor auxlio no mundo dos negcios. A automao das atividades administrativas e a automatizao dos processos produtivos trouxeram grandes benefcios para a rea operacional, assim como trouxe bons retornos financeiros aos investimentos realizados. Porm, especificamente para a rea de negcios e para a alta gerncia da empresa, somente nos ltimos anos que a Tecnologia da Informao comeou a trazer benefcios nesta rea. J possvel hoje a um alto gerente, diante de algum evento adverso, poder ter acesso rpido a informaes precisas e confiveis que lhe permitiro tomar as providncias cabveis em resposta quele evento. Felizmente, hoje com a nova gerao de ferramentas de apoio deciso, os gerentes possuem boas ferramentas para lhes proporcionar o suporte necessrio nos processos decisrios para que enfrentem a concorrncia acirrada e as adversidades que ocorrem freqentemente em seus negcios. 3. Data Warehouse Podemos definir o data warehouse como um grande banco de dados voltado para dar o suporte necessrio nas decises de usurios finais, geralmente gerentes e analistas de negcios. Os dados que compem o data warehouse so derivados dos diversos bancos de dados operacionais utilizados na empresa, e esto armazenados em um local diferente dos referidos bancos de dados operacionais. Segundo TAURION (1997) ao reunir informaes dispersas nos diversos bancos de dados operacionais da empresa que podem estar em plataformas distintas, o data warehouse permite que sejam feitas consultas e anlises bastante eficazes, transformando dados esparsos em informaes antes inacessveis ou subaproveitadas. Essas informaes podem ser convertidas em estratgias para os negcios. Um dos grandes benefcios proporcionados pelo data warehouse a diminuio do tempo que os gerentes levam para obter as informaes necessrias aos seus processos decisrios com a eliminao de tarefas operacionais como pesquisa e identificao dos dados necessrios. O data warehouse contm somente os dados necessrios aos gerentes para realizarem as referidas tarefas. O objetivo do data warehouse deve ser o de satisfazer as necessidades de anlises de informaes dos seus usurios, como por exemplo, monitorar e comparar dados de

transaes atuais com as passadas e prever tendncias futuras, permitindo tomar as medidas cabveis ainda a tempo de eventuais correes ou aperfeioamentos. Utilizar os bancos de dados dos aplicativos operacionais para se realizar uma anlise ou uma consulta muito mais trabalhoso, e ainda pode interferir na performance do aplicativo. Outros problemas tambm podem ocorrer com esta prtica, como enfrentar problemas oriundos da redundncia de dados dispersos pelos diversos aplicativos, ou encontrar dados que no esto no formato adequado para se realizar as anlises necessrias. A grande vantagem de um data warehouse permitir a tomada de decises baseadas em fatos (TAURION, 1998). O data warehouse deve tornar-se uma ferramenta imprescindvel para os gerentes conseguirem administrar seus negcios nas prximas dcadas. Como o ambiente de negcios est se tornando cada vez mais dinmico, extremamente necessrio que as regras de negcios sejam incorporados s aplicaes, que as estruturas dos sistemas se ajustem aos negcios, e que o tempo de resposta dos sistemas seja cada vez menor. 4. OLAP Segundo FIGUEIREDO (1998) os sistemas OLAP ajudam os analistas e os gerentes a sintetizarem as informaes sobre a empresa atravs de comparaes, vises personalizadas, anlises estatstica, previses e simulaes. So implementados para ambientes multiusurio e arquitetura cliente/servidor e oferecem respostas rpidas e consistentes s consultas iterativas executadas pelos usurios, independentemente da complexidade da consulta. Segundo FORSMAN (1997) um sistema OLAP aumenta a produtividade dos gerentes da organizao inteira, a sua flexibilidade significa que os gerentes podem se tornarem mais auto-suficientes. Permitem aos gerentes modelar problemas que seriam impossveis usando sistemas menos flexveis, com um tempo de resposta longo, ou incompatveis com a estrutura analtica dos negcios. Sistemas OLAP podem ser usados em diversas funes organizacionais. Departamentos de Finanas usam OLAP para planejar oramentos e realizar anlises financeiras. O Departamento de Vendas o utiliza nas anlises e estimativas de vendas. O Departamento de Marketing o utiliza em pesquisas e anlises de mercado, estimativas, anlises de clientes e segmentao de mercado. A Manufatura o utiliza para o planejamento, anlises da produo e anlises de falhas ou defeitos. Porm, os sistemas OLAP somente sero realmente teis, se conseguirem fornecerem as informaes necessrias, de um modo absolutamente confivel, e com um tempo de resposta compatvel com as necessidades de quem est necessitando dessas informaes. Segundo FORSMAN (1997), RADEN (1995) e FIGUEIREDO (1998) as aplicaes OLAP necessitam ter as seguintes caractersticas: Permitir a viso multidimensional dos dados; Possuir inteligncia de tempo; Fazer a atualizao do banco de dados; Realizar clculos complexos ; Criar agregaes e consolidaes; Fazer previso, anlise de tendncias, otimizao e anlises estatsticas; Construir cenrios a partir de suposies e frmulas aplicadas pelos analistas aos dados histricos disponveis;

Fazer clculos e manipular dados atravs de diferentes dimenses;

CODD et al. (1998) criaram, em 1993, doze regras que servem para avaliar produtos OLAP. Na verdade, essas regras so propriedades que os sistemas OLAP devem apresentar. Essas regras logo se espalharam pelo mercado e hoje servem como referncia para desenvolvedores de sistemas e usurios. Infelizmente, no nos possvel, neste espao, descrever e discutir as seguintes doze regras: 1.Viso Conceitual Multidimensional, 2. Transparncia, 3. Acessibilidade, 4. Desempenho, 5. Arquitetura Cliente/Servidor, 6. Dimensionalidade genrica, 7. Manipulao dinmica da matriz esparsa , 8. Suporte multiusurio, 9. Irrestritas operaes dimensionais cruzadas, 10. Manipulao intuitiva de dados, 11. Relatrios flexveis, 12. Dimenses e nveis de agregao ilimitados Existem dois tipos de tecnologias OLAP, o ROLAP e o MOLAP. O ROLAP - Relational OLAP - trabalha com banco de dados relacionais e com a linguagem SQL para realizar as suas consultas e anlises. A grande vantagem do ROLAP de trabalhar com bancos de dados que possuem um modelo (relacional) que conhecida por todos. Outra vantagem o limite de armazenamento de dados a prpria capacidade dos dispositivos de armazenamento, ou seja, praticamente ilimitada. A desvantagem do ROLAP quando se deseja realizar anlises multidimensionais, ou seja, anlises onde se verifica os diversos ngulos e as diversas dimenses a que os negcios esto sujeitos. As tabelas dos banco de dados relacionais possuem apenas duas dimenses, e quando queremos ter uma viso que utilize mais de duas dimenses, necessrios se realizar diversos e complexos processamentos de dados para se obter o resultado desejado, o que torna a consulta ou anlise mais demorada, e ainda exige-se equipamentos mais robustos. O MOLAP - Multidimensional OLAP - trabalha com banco de dados multidimensionais, o que facilita as pesquisas e as anlises multidimensionais, e permite uma modelagem dos dados muito parecida com os modelos dos negcios. Desta forma, podemos fazer, por exemplo, uma pesquisa ou uma anlise do tipo: verificar as vendas realizadas pela empresa por produto, por ms e por loja, ou do tipo saber a rentabilidade de um banco por funcionrio, por ms e por aplicao. A grande vantagem de se trabalhar com a tecnologia MOLAP rapidez nestes tipos de consultas ou anlises. A desvantagem que esta tecnologia no aberta, ou seja, cada fornecedor desta tecnologia possui a sua prpria estrutura, e um pouco mais difcil de se fazer a sua integrao com outras tecnologias. Outra desvantagem que devido a estrutura multidimensional do armazenamento dos dados necessrio um espao muito maior para o armazenamento de dados e, normalmente, ocorrem os dados esparsos, ou seja, clulas do banco de dados que no possuem dados devido ao fato de no existirem transaes que preencham aqueles dados. No exemplo acima da rentabilidade por funcionrio por ms e por aplicao, se algum funcionrio no trabalhar com algum tipo de aplicao no haver dados para serem armazenados referentes esta aplicao, porm o seu espao no banco de dados est assegurado mas no ser preenchido. A maior parte dos bancos de dados multidimensionais armazenam os ndices na memria para melhorar o desempenho e, atualmente, isto limita o tamanho destes bancos de dados a no mximo alguns gigabytes. 5. Data Mining O termo data mining ou minerao de dados ou ainda garimpagem de dados o processo de extrair informaes potencialmente teis a partir de dados crus que esto armazenados em um data warehouse ou nos bancos de dados dos sistemas transacionais.

Data Mining o processo de descoberta de novas correlaes, padres e tendncias entre as informaes de uma empresa, atravs da anlise de grandes quantidades de dados armazenados em bancos de dados usando tcnicas de reconhecimento de padres, estatsticas e matemticas (NIMER & SPANDRI, 1998). Atravs do data mining possvel, por exemplo, se descobrir o perfil de diversas categorias de clientes, o perfil de suas compras e at alguns dados sobre seus hbitos. Temos um padro quando duas colunas de uma tabela compartilham os mesmos dados, por exemplo, quando diversos clientes adquiriram o mesmo produto ou o mesmo conjunto de produtos. O data mining pode fazer esta descoberta automaticamente, sem fornecermos nenhuma informao ao sistema. O data mining estuda o nvel de agrupamento de cada coluna e elimina as colunas que no formam agrupamentos ou formam agrupamentos muito pequenos. possvel, tambm, se fazer as configuraes necessrias para ajustarmos o nvel de relacionamento entre as colunas. Por exemplo, podemos configurar o sistema para descobrir padres que ocorram em um nvel superior a 5%, neste caso os padres que representem um valor inferior a 5% de relacionamento entre as colunas sero desprezados. Um bom sistema de data mining deve permitir, tambm, que se elimine do processo de descoberta os relacionamentos bvios, como por exemplo, relacionar as cidades onde residem os clientes com os seus respectivos estados e CEPs. Segundo MENCONI (1998) o data mining trabalha com um conjunto de tcnicas estatsticas avanadas e princpios de Inteligncia Artificial para identificar os padres de compras e de comportamento dos consumidores. Com base em dados a respeito dos hbitos de consumo dos clientes, seus hobbies e dados sobre suas transaes comerciais e financeiras, possvel traar associaes que revelem grandes files de mercado. Nenhuma tcnica de anlise pode substituir a experincia e o conhecimento nos negcios e seus mercados. Pelo contrrio, a minerao de dados torna o conhecimento e a experincia mais importante que nunca (SMALL, 1997). Hoje, com esta nova ferramenta, a possibilidade de se aprofundar no conhecimento sobre os negcios muito maior. Porm, necessrio j se conhecer muito bem os negcios e utilizar esta ferramenta para se aprofundar mais ainda neste conhecimento, passando a conhecer novos fatores que auxiliaro os gerentes nos desafios que enfrentam no gerenciamento dos seus negcios. O processo de descobrimento realizado pelo data mining pode ser utilizado a partir de sistemas transacionais. Porm, muito mais eficiente utiliz-lo a partir de um data warehouse onde os dados j esto sem erros, sem duplicidade, so consistentes e habilitam descobertas mais abrangentes e precisas. O data mining oferece algumas funes muito sofisticadas, porm a tecnologia utilizada est embutida no software e os usurios ao utiliz-lo no precisam ser experts em tcnicas estatsticas avanadas ou em Inteligncia Artificial. Quando formos adquirir um sistema de data mining, a primeira coisa a se avaliar saber que tipos de modelos ele constri e se esses modelos atendem s necessidades dos nossos negcios. Combinando os conceitos apresentados por SIMOUDIS (1995) e por EDELSTEIN (1996 e 1997) levantamos os principais modelos que os sistemas de data mining constrem para realizarem suas descobertas:

1. Modelo de descoberta de associao. Um modelo de associao poderia descobrir que quando qualquer cliente que compra um item X, em 65% das vezes ele compra tambm o item Y, a menos que haja uma promoo na qual o item Y comprado em 85% das vezes. 2. Modelo de descoberta de sucesso. Por exemplo, se uma casa comprada, ento em 60% das vezes um novo fogo ser comprado dentro de um ms e em 45% das vezes um novo refrigerador ser comprado dentro de dois meses. Pode-se, ento providenciar para que no faltem esses produtos, e um contato devidamente planejado com o cliente poderia ser feito. 3. Modelo de agrupamento. Segmentam um conjunto de dados em grupos diferentes cujos os itens so semelhantes. 4. Modelo de classificao. Reconhece padres que descreve o agrupamento ao qual um determinado item pertence. 5. Modelo de regresso. Usam uma srie de valores existentes para prever que outros valores. 6. Visualizao. Usado para compreender (atravs de uma melhor visualizao) a informao adquirida por outros modelos de minerao de dados. Segundo SIMOUDIS (1995) transformar dados em informao requer um processo de quatro passos: 1. Seleo. Seleo dos tipos de dados que sero utilizados. 2. Transformao. Os dados normalmente sofrem transformaes convertendo um tipo de dados em outro (valores nominais em numrico) ou transformando seus atributos. 3. Minerao. O dados so minerados usando as tcnicas necessrias. 4. Interpretao dos resultados. Se os resultados apresentados no so satisfatrios, pode ser necessrio repetir o processo da minerao de dados, ou fazer repetidas iteraes em alguns passos. A informao resultante deve ser til, confivel e compreensvel. Segundo EDELSTEIN (1996) so essas as principais tcnicas que esto sendo utilizados pelos sistemas de data mining: 1. Redes neurais. So colees de ns conectados que possuem uma camada de entrada e outra de sada, e que realizam diversos processamentos em seus ns. A rede neural capaz de aprender sozinha; atravs de um treinamento apropriado. Em cada passo do treinamento o conjunto de dados de sada comparado com um resultado j conhecido, se for diferente, uma correo calculada e processada automaticamente nos ns na rede. Estes passos so repetidos at que uma condio de parada seja atingida, ou quando um nmero de correes estipulados alcanado.

2. rvores de deciso. Dividem os dados em subgrupos baseado nos valores das variveis. O resultado uma hierarquia de declaraes tipo Se ... ento ... que so utilizadas principalmente para classificar dados. 3. Regra de induo. Criam conjuntos no hierrquicos de condies que podem se sobrepor. Por exemplo, um software de um provedor de solues faz as regras de induo gerando rvores de deciso parciais e as combina com tcnicas estatsticas para escolher qual o melhor resultado. Segundo EDELSTEIN (1996) alguns produtos combinam as caractersticas de redes neurais e de rvores de deciso em uma tentativa de se construir um modelo mais preciso e mais rpido. 6. A independncia das novas Tecnologias da Informao Estas trs tecnologias podem ser implementadas separadamente e independentemente. Em algumas empresas, a implantao do data warehouse j o suficiente para dar o suporte necessrio no gerenciamento dos negcios. A simples separao do banco de dados com fins corporativos dos bancos de dados dos aplicativos operacionais j possibilita um grande auxlio aos gerentes. Existem empresas que implantaram a tecnologia OLAP sem a implantao de um data warehouse, o recomendado mas no obrigatrio. Estas empresas possuem um servidor exclusivo para o OLAP e sempre que necessrio se realizar uma consulta ou uma anlise, os dados so buscados nos bancos de dados dos aplicativos operacionais, so feitos os ajustes necessrios e realizada a consulta ou a anlise necessria. Tambm existem empresas que esto utilizando a tecnologia de minerao de dados independentemente do data warehouse. As dificuldades aumentam, os resultados podem se tornarem menos expressivos, mas no obrigatrio a utilizao do data mining em conjunto com o data warehouse. 7. Concluso Com essa nossa explanao quisemos abordar os conceitos bsicos das trs ferramentas que constituem a mais recente gerao de Sistemas de Apoio Deciso. Todas as trs ferramentas so novas e ainda existe muito a se desenvolver e a se aprender sobre elas. Porm, as empresas que j implementaram algumas ou as trs ferramentas esto satisfeitas com os resultados alcanados. A nossa inteno com este artigo divulgar um pouco destas novas tecnologia, tendo em vista que existe pouca publicao a respeito delas no nosso idioma. Em outros artigos apresentados neste mesmo congresso, fazemos uma explanao um pouco mais aprofundada sobre cada uma das trs novas tecnologias. Continuaremos pesquisando a respeito destas tecnologias e em futuros artigos apresentaremos mais detalhes das mesmas. Quaisquer comentrios, crticas, elogios ou sugestes a respeito deste artigo sero muito bem aceitos nos endereos eletrnicos dos autores.

Bibliografia

CODD, E. F.; CODD, S. B.; SALLEY, C. T. (1998). Providing OLAP (On-Line Analytical Processing) to Users-Analysts: An IT Mandate. Arbor Software. http://www.arborsoft.com/essbase/wht_ppr/coddc0.html (28 Jan. 1998). EDELSTEIN, H. (1996). Technology How To: Mining Data Warehouses. Information Week; 8 Jan. http://techweb.cmp.com/iw/561/61oldat.htm (30 Dez. 1997). EDELSTEIN, H. (1997). Mining For Gold. Information Week; 21 Abr. http://techweb.cmp.com/iw/627/27olmin.htm (30 Dez 1997). FIGUEIREDO, A. M. C. M. (1998) Molap x Rolap: Embate de Tecnologias para Data Warehouse, Developers Magazine, ano 2, n. 18, p. 24-25, fev. FORSMAN, S. (1997). OLAP Council White Paper. OLAP Council. http://www.olapcouncil.org/research/whtpapco.html (01 Fev. 1998). INMON, W. H. (1997). Como Construir o Data Warehouse. Rio de Janeiro, Campos. KIMBALL, R. (1998). Data Warehouse Toolkit. So Paulo, Makron Books. LAMBERT, B. (1996). Data Warehousing Fundamentals: What You Need to Know to Succeed. Data Management Review; March 1996. http://www.datawarehouse.com/resource/articles/lamber8.htm (29 Dez. 1997) MENCONI, D. (1998). A Minerao de Informaes. Info Exame, ano 13, n. 144, maro, p. 92-93. NIMER, F.; SPANDRI, L. C. (1998). Obtendo Vantagem Competitiva com o Uso de Data Mining. Developers Magazine, ano 2, n. 18, p. 30-31, fev. PARSAYE, K. (1996). Surveying Decision Support: New Realms of Analysis. Database Programming & Design; April. http://www.dbpd.com/parsaye.htm (27 Dez 1997). RADEN, N. (1995). Data, Data Everywhere. Information Week, 30 Outubro. http://members.aol.com/nraden/iw_mct01.htm (26 Dez. 1997). SIMOUDIS, E. (1995). Data Mining: A Techonology Comes of Age. IBM Software Quaterly, Vol. 24. http://www.software/ibm.com/sq/issues/vol24/datatech.htm (29 Dez 1997). SMALL, R. D. (1997). Debunking Data Mining Miths. Information Week; 20 Jan. http://techweb.cmp.com/iw/614/14oldat.htm (02 Jan. 1998). TAURION, C. (1997). Data Warehouse: Estado de Arte e Estado de Prtica. Developers Magazine, ano 1, n. 6, p. 10-11, fev. TAURION, C. (1998). Data Warehouse: Vale a Pena gastar Milhes Investindo em um? Developers Magazine, ano 2, n. 18, p. 10-11, fev.

Potrebbero piacerti anche