Data Warehouse, Data Marts e Data Mining em um Fundo de Pensão

Mestrado em Informática
Data Warehouse, Data Mart, Data Mining1

Estudo de Caso
Grupo 012 - MPI - Prof. Dr. Maurício Prates
Antônio Seco antonio.seco@ieee.org

Cláudio de Souza claudio11@uol.com.br
Edilberto Magalhães Silva edil@radiobras.gov.br
José Luís de Araújo jlaraujo@zipmail.com.br
Paulo de Tarso Costa de Sousa ptarso@tecnolink.com.br
1º Semestre - 2000
1
Estudo de Caso desenvolvimento para o Mestrado em Informática – UCB
2
Mestrandos em Informática na UCB na disciplina de TSI
ÍNDICE
1. INTRODUÇÃO.......................................................................................4
2. CONCEITOS DA TECNOLOGIA..........................................................5
2.1. Data Warehouse.......................................................................................................5
2.1.1. O Data Warehouse na empresa.........................................................................................6
2.1.2. Aplicações da Tecnologia.................................................................................................7
2.1.3. A Diferença entre dados Operacionais e Informacionais.................................................7
2.1.4. Questões críticas em Data Warehouse..............................................................................8
2.2 Data Marts.................................................................................................................8
2.3. Data Mining..............................................................................................................9

2.3.1. Áreas de uso do Data Mining.........................................................................................10
2.3.2. Principais Dificuldades para uso da tecnologia..............................................................11
3. IMPLANTAÇÃO DA TECNOLOGIA EM UM FUNDO DE PENSÃO. 11

3.1. O Objetivo dos Fundos de Pensão........................................................................11
3.2.Uma forma de controle: Qualidade dos produtos & Auditoria..........................12
3.3. Comparativo entre os modelos OLAP e OLTP do Fundo de Pensão...............14

3.3.1. Questionamentos para determinação de pontos de controle...........................................16
3.4. Ficha Técnica do projeto.......................................................................................18

3.4.1. Sistema de Informações Gerenciais - Controladoria......................................................18
3.4.2. Ambiente de Rede:.........................................................................................................19
3.4.3. Técnicos:.........................................................................................................................20
3.4.4. Prazos:.............................................................................................................................20
3.4.5. Custos:............................................................................................................................20
4. CONCLUSÃO......................................................................................21
5. REFERÊNCIAS...................................................................................22
Estudo de Caso – Data Warehouse, Data Marts, Data Mining 3
Data Warehouse, Data Mart, Data Mining 3
Antônio Seco antonio.seco@ieee.org

Cláudio de Souza claudio11@uol.com.br
Edilberto Magalhães Silva edil@radiobras.gov.br
José Luís de Araújo jlaraujo@zipmail.com.br
Paulo de Tarso Costa de Sousa ptarso@tecnolink.com.br
Resumo
As organizações precisam adotar formas de gestão eficientes para manter-se
competitivas e sobreviver no ambiente onde estão inseridas. O Data Warehouse é um
instrumento da tecnologia que oferece recursos para suprir as informações gerenciais
necessárias para estabelecer tal controle. Os Fundos de Pensão, por sua vez, são
empresas privadas com características bem peculiares, pois não há uma concorrência
direta entre os fundos para captação de clientes. Contudo a sobrevivência do Plano
depende dos reflexos rápidos da organização para perceber e adotar caminhos que
satisfaçam as expectativas dos clientes, sem comprometer o rendimento presente que
sustenta o objetivo futuro: a suplementação de benefícios sociais.
Palavras-chave
Data Warehouse, Fundos de Pensão, Avaliação Atuarial, Benefícios, Auditoria,
Controladoria.
Summary
The organizations needs to adopt efficient administration forms to stay
competitive and to survive in the atmosphere where they are inserted. The Data
Warehouse is an instrument of the technology that offers resources to supply the
necessary managerial information to establish the controller. The Pension Fund, in
your time, they are companies deprived with very peculiar characteristics, because
there is not a direct competition among the bottoms for customers' reception. However
the survival of the Plan depends on the fast reflexes of the organization to notice and to
adopt roads that satisfy the customers' expectations, without committing the present
revenue that sustains the future objective: the supplement of social benefits.
Keywords
Data Warehouse, Pension Funds , Atuarial Evaluation, Benefits, Audit,
Controller.
3
Estudo de Caso desenvolvimento para o Mestrado em Informática – UCB
1. Introdução
Este trabalho relata um estudo de caso, realizado em um Fundo de Pensão, com

o objetivo de documentar o projeto de uma estrutura de suporte à informação gerencial
até sua fase atual, ressaltando que até a presente data o projeto ainda não foi concluído:
encontra-se em desenvolvimento normal, fluindo dentro do cronograma previsto.
Preocupado com os reflexos oriundos do desconhecimento dos fluxos formais, e
informais, da informação relevante ao negócio "Previdência Complementar", o Fundo
de Pensão recorreu à Tecnologia da Informação para a definição de um projeto piloto
baseado em um armazém de dados o "Data Warehouse".
O texto não está preocupado em descrever detalhadamente os princípios da
tecnologia em questão e dos métodos do Fundo de Pensão. As definições são
apresentadas como instrumento de nivelamento conceitual, destinadas ao
posicionamento no ambiente de estudo. O foco do é a aplicação da tecnologia de Data
Warehousing para a solução de um problema específico dos Fundos de Pensão.
Observamos que a tecnologia de não é aplicada aos processos operacionais. Ela
faz parte de uma instância maior dos sistemas corporativos: O controle da Informação
Gerencial. Esta característica é fundamental, visto que consideramos que as transações
do Processo de Concessão Benefícios em estudo são realizadas em uma 1ª camada,
operacional, através de um mecanismo de banco de dados relacional, para depois serem
extraídas para uma 2ª camada, gerencial, onde se situa o modelo apresentado.
O escopo da análise é, portanto, restrito as estruturas necessárias para o
entendimento do processo analisado. As interfaces com outros processos, ou sistemas
corporativos, foram filtradas e não são representadas no modelo de estudo. Esta
simplificação visa facilitar o entendimento do objetivo do trabalho, e não interfere na
compreensão do ambiente.
Por restrições impostas pela organização na qual procedemos aos estudos, nós
omitiremos o nome da empresa, referenciando-a apenas como "Fundo de Pensão".
2. Conceitos da Tecnologia.
2.1. Data Warehouse.

Data Warehouse ou armazém de dados contém informações obtidas de vários
sistemas informáticos operacionais da empresa. Os dados são purificados por
eliminação de desvios ou erros, transformados, integrados e carregados em bases de
dados organizadas por assunto. Este Data Warehouse pode conter dados detalhados ou
sumários históricos, abrangendo desde algumas semanas até alguns anos. Assim, um
Data Warehouse pode ser definido como uma coleção de dados organizados por
assunto, integrados, variantes no tempo e não voláteis, que suportam o processo
decisório da gerência da empresa. As diferenças com relação às bases de dados
operacionais da empresa podem ser resumidas na Tabela I:
Processamento de transações (OLTP) Data Warehouse (OLAP)
Objetivo Operações do dia-a-dia Recuperação e análise da informação
Estrutura BD relacional otimizado para BD relacional otimizado para

processamento de transações processamento de consultas
Modelo de Dados Normalizado Multidimensional
Acesso SQL SQL e ferramentas avançadas de

análise
Tipo de Dado Dados para operar o negócio Dados para analisar o negócio
Natureza do Dado Detalhado Resumido e detalhado
Tabela I: Comparativo entre universos OLTP e OLAP.
Com a evolução da Tecnologia da Informação e o aumento do uso de

computadores conectados em rede, as empresas vem buscando soluções baseadas em
Sistemas de Informação automatizados para controlar seus processos mais importantes.
A base desses sistemas é, em geral um banco de dados, que com o passar do tempo
acaba armazenando uma grande quantidade de dados relacionados aos negócios, mas
não relacionados entre si. [INMON, 99]
Estes dados controlados por Sistemas Operacionais, ou Corporativos, de uma
empresa constituem um recurso, mas de modo geral, raramente servem como apoio
estratégico no momento da decisão superior. Os sistemas informação "transacionais"
não são projetados para gerar e armazenar as informações estratégicas, tornando-os sem
valor no processo de tomada de decisões estratégicas. Com conseqüência essas decisões
acabam sendo tomadas com base na experiência e conhecimento dos administradores,
quando poderiam ser baseadas na análise de fatos históricos que registrados pelos
diversos sistemas de informação das organizações.

Em termos simples, um Data Warehouse, ou "Armazém de Dados", pode ser
definido como um banco de dados especializado, o qual integra e gerencia o fluxo de
informações a partir dos bancos de dados corporativos e fontes de dados externas à
empresa. Um Data Warehouse é construído para que tais dados possam ser
armazenados e acessados rapidamente, em tempo real, e que não sejam limitados pela
álgebra relacional dos bancos de dados. O principal objetivo do Data Warehouse é
tornar as informações corporativas acessíveis para o seu entendimento, gerenciamento e
uso. [INMON, 99]
2.1.1. O Data Warehouse na empresa.

Como o Data Warehouse está separado dos bancos de dados operacionais, as
consultas dos usuários não causam perda de desempenho nestes sistemas, que ficam
resguardados de alterações indevidas ou perdas de dados. O também não pode ser
comparado a um "Sistema Operacional", que pode ser comprado e instalado em todos os
computadores da empresa. Na realidade sua implantação exige a integração de vários
produtos e processos.
O Data Warehouse oferece os fundamentos e os recursos necessários para um
Sistema de Apoio a Decisão (SAD) eficiente, fornecendo dados integrados e históricos
que servem desde a alta direção, que necessita de informações mais resumidas, até as
gerências de baixo nível, onde os dados detalhados ajudam a observar aspectos mais
táticos da empresa. Nele, os executivos podem obter de modo imediato respostas para
perguntas que normalmente não possuem respostas em seus sistemas operacionais e,
com isso, tomar decisões com base em fatos.
Com o surgimento do Data Warehouse foi necessário a quebra de alguns
paradigmas dos métodos de estruturação de dados convencionais. Novas tecnologias
também precisaram ser desenvolvidas, tanto para armazenamento, como para
recuperação de informações. A necessidade destes novos métodos e tecnologias surgiu
da constatação, primeiro de que existe uma necessidade de informação não atendida
pelos aplicativos comerciais convencionais, que atuam a nível operacional do negócio, e
segundo, pelo fato de que a tecnologia de armazenamento de dados utilizada nestes
aplicativos não atende às necessidades detectadas. Graças aos avanços nos bancos de
dados relacionais, no processamento paralelo e na tecnologia distribuída, finalmente a
tecnologia da informação pode permitir que qualquer organização elabore um Data
Warehouse.
Como as empresas demoram vários anos para gerar e armazenar um volume
considerável de informações, é normal que esses dados estejam espalhados por diversos
locais e que tenham sido gerados por sistemas desenvolvidos em diferentes ambientes e
linguagens. Um dos desafios da implantação de um Data Warehouse é justamente a
integração destes dados, eliminando as redundâncias e identificando informações iguais
que possam estar representadas sob formatos diferentes em sistemas distintos.
Estudar e conhecer a tecnologia de Data Warehouse pode ajudar os empresários
a descobrir novas formas de competir em uma economia globalizada, trazendo melhores
produtos ou serviços para o mercado, mais rápido do que os concorrentes, sem aumentar
o custo do produto ou do serviço. Não existem ainda metodologias formais para
implementação de um Data Warehouse, ela deve ser adaptada às características e às

expectativas de cada empresa, mas o principal objetivo em todas elas é o de descobrir
maneiras diferentes de atuar no mercado e quais as mudanças internas que devem
ocorrer para atender as novas realidades.
Autores como Inmon [INMON, 99], que é reconhecido como o pai do conceito,
Data Warehouse é uma coleção de dados orientados por assuntos, integrados, variáveis
com o tempo e não voláteis, para dar suporte ao processo gerencial de tomada de
decisão; neste contexto, Harjinder [HAR96] conceitua o Data Warehouse como um
procedimento em andamento que aglutina dados de fontes heterogêneas, incluindo
dados históricos e dados externos para atender à necessidade de consultas estruturadas e
ad-hoc, relatórios analíticos e de suporte a decisão. Já outro autor, Barquini [BAR, 96],
define Data Warehouse como uma coleção de técnicas e tecnologias que juntas
disponibilizam um enfoque pragmático e sistemático para tratar com o problema do
usuário final de acessar informações que estão distribuídas em vários sistemas da
organização.
2.1.2. Aplicações da Tecnologia.

As aplicações típicas do Data Warehouse em uma empresa podem ser
classificadas em dois grandes conjuntos:
• Aplicações do negócio: constituem as aplicações que dão suporte

ao dia a dia do negócio da empresa, que garantem a operação da empresa,
também chamadas de sistemas de produção.
• Aplicações sobre o negócio: são as aplicações que analisam o

negócio, ajudando a interpretar o que ocorreu e a decidir sobre estratégias
futuras para a empresa - compreendem os sistemas de suporte à decisão e
sistemas de informações executivas.
Uma arquitetura de dados adequada para dar suporte a estes dois tipos de
aplicações deve estar baseada, analogamente em dois ambientes de bancos de dados: os
bancos de dados operacionais - para dar suporte às aplicações do negócio; e os bancos
de dados para suporte à decisão - para dar suporte às aplicações sobre o negócio.
2.1.3. A Diferença entre dados Operacionais e Informacionais.

• Os Sistemas de Suporte à Decisão (SSD) e Sistemas de
Informações Executivas (SIE) possuem funcionalidade e desempenho
diferentes dos sistemas de produção da empresa. Estes sistemas recuperam e
atualizam um registro por vez, usualmente atendendo a muitos usuários de
forma concorrente, exigindo também um tempo de resposta imediato;
aqueles normalmente lidam com poucos usuários por vez e os requisitos em
termos de tempo de resposta podem não ser críticos. No entanto, usualmente
lidam com consultas complexas, não antecipadas ou previstas, envolvendo
grande quantidade de registros básicos referentes aos processos operacionais
da empresa.
• Os aplicativos SSD e SIE necessitam dados consistentes,

normalmente originários de mais de um sistema de produção, organizados de
forma que favoreçam serem trabalhados por ferramentas de análise de dados;
• Bancos de dados que oferecem recursos para suporte à SSD e SIE

devem ser capazes de oferecer um bom tempo de resposta para consultas que
recuperam grandes conjuntos de dados agregados e históricos;
• SSD e SIE usualmente lidam com tendências, e não com um

único instante de tempo: cada elemento de dado é acompanhado do
correspondente período de tempo a que se refere.
A importância em separar dados que dão suporte aos sistemas de caráter
operacional da empresa, daqueles que dão suporte aos processos gerenciais e de suporte
à decisão é que cada tipo de aplicação pode se concentrar naquilo que faz melhor,
oferecendo melhor funcionalidade e desempenho para seu caso específico.
2.1.4. Questões críticas em Data Warehouse.

Algumas questões representam verdadeiros desafios na implantação de um Data
Warehouse:
• Integração de dados e metadados de várias fontes.
• Qualidade dos dados: limpeza e refinamentos.
• Sumarização e agregação de dados.
• Sincronização das fontes com o Data Warehouse para assegurar a

atualização.
• Problemas de desempenho relacionados ao compartilhamento do mesmo

ambiente computacional para abrigar as bases de dados corporativas
operacionais e o Data Warehouse.
2.2 Data Marts.

Data Marts são tipos especiais de Data Warehouse, contendo dados específicos
para uma área ou departamento da empresa. É um subconjunto dos dados empresariais
que contém dados úteis apenas para uma unidade de negócio específica ou
departamento. Os dados podem ser obtidos diretamente dos sistemas informáticos
operacionais ou do Data Warehouse da empresa, e as análises também são orientadas
para áreas de interesse apenas daquela unidade ou departamento. Os Data Marts são
muito bem aceitos no campo empresarial, pois por suas características exigem menos
investimento de infra-estrutura, produzem resultados mais rapidamente e são escaláveis
até um Data Warehouse.
2.3. Data Mining.

Data Mining é o processo de analisar dados por diferentes perspectivas e
resumi-los em informação aproveitável, que poderá ser utilizada melhorar os ingressos,
reduzir custos ou outras ações úteis para a empresa. O software de Data Mining é um
tipo de ferramenta analítica que permite analisar dados por diferentes dimensões ou
ângulos, categorizá-los e resumir os relacionamentos encontrados. Tecnicamente, Data
Mining é o processo de encontrar correlações ou padrões entre milhares de campos em
grandes bases de dados. Informações, que aparentemente estão camufladas ou
escondidas, permitindo agilidade na tomada de decisões.
Uma empresa que emprega a técnica de Data Mining é capaz de:
• Criar parâmetros para entender o comportamento do consumidor;
• Identificar afinidades entre as escolhas de produtos e serviços;
• Prever hábitos de compras;
• Analisar comportamentos habituais para se detectar fraudes.

A análise automatizada e antecipada oferecida por Data Mining, vai muito além
da simples análise de eventos passados, que é fornecida pelas ferramentas de
retrospectiva típicas de sistemas de apoio à decisão como consultas SQL do universo
transacional (OLTP). [SANTOS & HENRIQUES & REIS, 2000]
Por esta característica o Data Mining é extremamente adequado para analisar
estes grupos de dados, que seriam difíceis de serem analisados usando apenas OLAP,
devido à grandeza, alta densidade ou não serem intuitivos, para serem compreendidos
facilmente.
Um Data Mining pode ser considerado como sendo uma forma de
descobrimento de conhecimento em banco de dados (KDD - Knowledge Discovery in
Databases), área de pesquisa em evidência no momento, que envolve IA - Inteligência
Artificial e Banco de Dados. A construção de modelos estatísticos costuma ser o
método tradicionalmente utilizado para derivar tendências [DW,2000]. Entretanto,
estatísticas tradicionais são limitadas se considerarmos que:
• A análise se torna trabalhosa quando o número de variáveis a serem investigadas

cresce;
• Métodos estatísticos possuem condições que limitam o número de casos a

utilizar, fazendo com que apenas uma pequena parte do universo esteja
disponível para a análise;
• Quando os relacionamentos dos dados são não lineares, torna-se difícil aplicar
métodos estatísticos tradicionais.
Além disso, poucas empresas dispõem de pessoal preparado para esta tarefa tão
especializada, mesmo com a ajuda de estatísticos, pode-se levar semanas para projetar e
construir os modelos.
A estrutura de um Data Mining está baseada em Estatística, Inteligência
Artificial e em Machine Learning, conforme apresentado na Figura 1.
Figura 1: Base de um Data Mining [DW, 2000]
2.3.1. Áreas de uso do Data Mining.

A ferramentas de Data Mining, podem trabalhar em cima de qualquer
grupamento estruturado de dados, não precisando necessariamente ser um banco de
dados formal. Isto elimina a obrigatoriedade de aplicar estas ferramentas em Data
Warehouses. Deve-se porém ressaltar que, se queremos ter maior êxito na busca de
relacionamentos nestes dados ou ainda transformá-lo em base para tomada de decisão, o
mais indicado é ter estas ferramentas “trabalhando dentro” de dados bem organizados e
abrangentes, que é um dos objetivos ao criarmos Data Warehouses ou Data Marts.
As três grandes áreas de uso de um Data Mining, de modo simplificado, são:
• Cross-selling: Identificar associação entre produtos, procurando tirar

proveito dessas associações. “Descobriu-se em uma determinada cadeia de
lojas que ao comprar um brinquedo, geralmente era levado barras de
chocolate”;
• Up-selling: Identificar entre os clientes atuais aqueles que tem potencial para
adquirir produtos que proporcionem maior lucro para a companhia. “Através
da definição de um perfil de usuário, que compra um produto, podemos
determinar que outros usuários, de mesmo perfil e, que ainda não tem este
produto, venham a comprá-lo”;
• Fidelização: Combinar e descobrir fatores que causem a perda de clientes, e

como forma economia, manter estes clientes, o que é mais barato que
conquistar novos.
O Data Mining faz uso da simulação, que representa a ação de construir um

modelo, ou cenário, de uma situação onde se sabe a resposta e aplicá-lo a outra situação
onde a resposta é desconhecida. Aplicando-se técnicas para executar a simulação é
possível achar padrões relevantes e de interesse do usuário. As técnicas e os algoritmos
mais utilizados pelo Data Mining para análise da informações são representadas por:
[DW, 2000] e [THEARLING, 2000]
• Decision Trees
• Rule Induction
• Neural Networks
• Market Basket Analysis
• Genetic Algorithms
• Memory-Based Reasoning (MBR)
2.3.2. Principais Dificuldades para uso da tecnologia.

Existem alguns empecilhos para o uso de Data Mining, o mais significativo hoje
ainda é o alto custo, porém vários fatores podem impedir sua implantação:
• Organização
• Alto Custo
• Necessidade Grandes Bases de Dados
• Novidade e Complexidade
• Montar Ambientes Ideais
3. Implantação da tecnologia em um Fundo de Pensão.
3.1. O Objetivo dos Fundos de Pensão.

Os sistemas de Previdência Social oficiais em geral não têm condições de
garantir a qualidade de vida dos trabalhadores quando estes se aposentam. Isso porque
em geral são baseados no regime de repartição simples, ocorrendo o custeio por uma
geração dos benefícios concedidos à geração antecessora [ABRAPP, 00].
Diversos países evoluídos como Estados Unidos, Alemanha e Japão, adotaram
modelos complementares privados, baseados na poupança de longo prazo para o
financiamento de uma renda futura, complementar àquela oriunda da Previdência
Pública. O modelo privado é mais ágil, baseado na capitalização, e os participantes

formam as reservas durante seu período ativo, o que garantirá benefícios futuros e
disponibilidade de recursos no momento da aposentadoria [ALLEN, 95].
No Brasil a Lei 6.435/77 rege o funcionamento da previdência complementar.
Por este instrumento legal são estabelecidos dois tipos de plano: o aberto, operado por
seguradoras e permitida a associação de qualquer cidadão, e o fechado, operado por um
Fundo de Pensão e restrito a uma comunidade específica [ALLEN, 95].
As diferenças entre os dois modelos são marcantes. No sistema aberto o
investidor é o único garantidor da sua poupança. Há o depósito mensal na reserva
financeira, que, acrescida do rendimento contratual, irá compor o montante de custeio
do pagamento da aposentadoria, vitalícia ou não. No modelo fechado as entidades não
visam a distribuição de lucros e prevêem a contribuição de duas fontes: do participante
e da empresa na qual ele mantém vínculo empregatício, em geral com a relação de 1:1,
para compor a reserva de poupança individual do trabalhador.
As Entidades Fechadas de Previdência Privada (EFPP) operam o Fundo de
Pensão instituído pelas suas Patrocinadoras – Empresas associadas que detêm o vínculo
empregatício dos Participantes, ofertando planos de benefícios complementares aos
oferecidos pela Previdência Social na forma de renda ou pecúlio. Estes recursos
suplementam o montante pago pela Previdência Social, através do Instituto Nacional do
Seguro Social - INSS, fazendo com que a renda ou pecúlio atinja o mesmo nível salarial
do participante, preservando-o, ou a seus dependentes, de oscilações bruscas de renda.
3.2.Uma forma de controle: Qualidade dos produtos & Auditoria.

As entidades que administram os Fundos de Pensão sofrem constantes auditorias
face à natureza social do seu negócio e aos elevados montantes financeiros
manipulados. O governo, regulador dos planos através da Secretaria de Previdência
Complementar, as patrocinadoras e os próprios participantes exigem a transparência
operacional, e analisam de forma contínua o desempenho das entidades. Em resumo,
todos os planos (produtos e serviços ofertados) são regidos por Leis específicas que
estabelecem limites de investimento, mínimos de lucratividade e níveis de
comprometimento com os compromissos futuros.
A lógica estabelecida para o controle dos fundos é simples: como captação, as
entidades utilizam as contribuições dos participantes e patrocinadoras e a operam nos
mercados financeiro e imobiliário. Algumas entidades também oferecem o crédito
mútuo com taxas diferenciadas do mercado financeiro público ou até mesmo financiam
imóveis para os participantes. Contudo deve haver previsão em caixa para o pagamento
dos benefícios compromissados, sejam aqueles que podem ser previstos, tais como:
aposentadoria por tempo de serviço ou aposentaria por idade, ou aqueles de risco, que
ocorrem aleatoriamente, como: pensão, auxílio-doença ou aposentadoria por invalidez
[ALLEN, 95].
O "caixa" destas entidades, chamado de "Reserva Matemática", é calculado
conforme as características do grupo de pessoas que compõem Planos, assumindo que
podem existir grupos independentes, com características próprias, dentro da mesma
entidade – é o caso dos fundos multipatrocinados. O montante acumulado

individualmente para cada participante é denominado Reserva de Poupança, e
representa o valor do investimento que servirá de lastro para o pagamento dos
benefícios futuros deste participante.
Observemos, em tempo, que as características do grupo, termo citado
anteriormente, refere-se a média de idade, expectativa de vida, média de rendimentos,
número médio de dependentes, e outros aspectos relevantes para a "Avaliação Atuarial",
um cálculo estatístico baseado em tabelas-padrão aprovadas pelo Governo Federal
específicas para este fim. Os métodos para o cálculo dos compromissos futuros da
entidade são de responsabilidade da Atuária, ciência que abrange técnicas da
matemática financeira, cálculo de probabilidade e estatística.
Através da "Avaliação Atuarial" os administradores terão condições de
estabelecer quanto dinheiro deve estar disponível em determinada data, sendo este
suficiente para cobrir os compromissos previstos e os de risco. Não pode faltar dinheiro
- o que ocasiona um déficit técnico ou sobrar dinheiro - o que causaria um superávit
técnico. As duas situações são ruins: a primeira porque caracteriza a falta de recursos de
um grupo para cobrir seus benefícios, forçando o fundo a buscar recursos em outros
lugares; no segundo caso o dinheiro ficou parado na Tesouraria, sem a lucratividade
mínima, resultando em prejuízo.
A forma de o atuário prever o montante de caixa é a construção de cenários que
levam em consideração variáveis que se alteram dinamicamente no tempo, como os
compromissos assumidos pelos participantes e patrocinadoras, a política econômica
adotada, as experiências estatísticas na previsão de riscos, a rotatividade dos
empregados nas patrocinadoras, os níveis e planos salariais adotados pelas empresas
entre outros fatores.
Para que o Gestor de um Fundo de Pensão tenha apoio gerencial sobre suas
decisões, deve haver um perfeito sincronismo entre os compromissos futuros,
estabelecidos pela Avaliação Atuarial, com os níveis de investimentos realizados no
Mercado de Capitais, carteira de empréstimos e financiamentos, e finalmente, com a
captação das contribuições de participantes e patrocinadoras [ALLEN, 95]. Este
equilíbrio entre os Ativos e Passivos do Fundo de Pensão podem ser mapeados e
analisados através das técnicas de "Data Warehousing".
Outro aspecto relevante para o acompanhamento do desempenho do Fundo de
Pensão é o estabelecimento de Pontos de Controle, ou INDICADORES DE
DESEMPENHO. Estes fatores são críticos, pois estão diretamente correlacionados com
os PRODUTOS oferecidos pelo fundo. Neste aspecto as técnicas de "Data Mining"
constituem uma importante ferramenta para o diagnóstico de cenários futuros.
3.3. Comparativo entre os modelos OLAP e OLTP do Fundo de

Pensão.
A Avaliação Atuarial é imprescindível para o controle de um Fundo de Pensão,
e dentre os processos internos que mais afetam o comportamento do estudo atuarial
situa-se a Concessão de Benefícios. Este processo específico tem importância relevante
para o desempenho do fundo, visto que é a "atividade fim" da empresa. O controle de
qualidade na concessão dos benefícios está diretamente associado com a imagem de
segurança que a empresa reflete para seus participantes e auditores.
Selecionamos um pequeno cenário para comentar a implantação do projeto
piloto: na Figura 2 apresentamos uma instância do Modelo de Dados do Fundo de
Pensão, no qual aparecem os principais objetos utilizados pelo processo de concessão.
Comentamos que, conforme apresentado na introdução deste trabalho, essa instância do
modelo de dados não representa a totalidade dos negócios do Fundo de Pensão. Nele
estão representados os detalhes necessários para o entendimento da origem dos dados
que irão compor a informação gerencial.
Nota-se que não faz diferença para o Data Warehouse qual o front-end utilizado
para o desenvolvimento dos aplicativos corporativos. O universo dos dados é tratado
como fonte de informações, sendo os programas extratores responsáveis por busca-las
nas bases relacionais do banco de dados corporativo. Também é responsabilidade destes
programas o teste de integridade para compor as informações classificadas como
métricas e, conseqüentemente, as dimensões.
Figura 2 – Modelo de Entidade e Relacionamentos – Segmento do Modelo da

Organização que representa a “Concessão de Benefícios.”
O primeiro passo para a definição do modelo multidimensional é o

estabelecimento das métricas, para compor a tabela base. Estas métricas são analisadas
nos questionamentos relacionados a seguir, e irão compor o modelo multidimensional
apresentado na Figura 3.
3.3.1. Questionamentos para determinação de pontos de controle.

1. Quem pode requerer benefícios no mês "X"?
Objetiva identificar quem pode requerer aposentadoria por idade ou tempo
de serviço no mês "X". Com esta informação a entidade pode iniciar
trabalhos de assistência social no período de mudança na situação laboral do
participante.
2. Quantas pessoas poderiam requerer benefício no mês "X" e
não o fizeram?
A previsão orçamentária para o mês “X” e posteriores cobrem a concessão
do benefício, que se não for solicitado acaba por gerar excedente de caixa,
desequilibrando o plano.
3. Dos benefícios concedidos no mês "X", quais são as espécies?
São dados estatísticos, úteis para a elaboração de cenários e auditoria, no
caso de variações fora do padrão dos grupos de participantes.
4. Qual a média dos benefícios concedidos nos últimos "X"
meses?
Também são dados estatísticos, para comparação com o item anterior.
5. Existe algum participante com mais de um benefício ativo?
Esta informação é de auditoria. Esta situação não pode ocorrer.
6. Qual o montante dos benefícios concedidos no mês "X"?
Esta informação é importante para o verificar o comprometimento da reserva
matemática no mês "X".
7. Gráfico comparativo da Reserva Matemática e Benefícios
Concedidos por grupo no ano.
Esta é uma maneira gráfica para analisar informações já obtidas em consultas
anteriores, referentes ao montante dos benefícios pela reserva matemática durante os
meses. Este gráfico funciona como um "fluxo de caixa", indicando períodos de déficit
ou superávit.
O modelo OLAP apresentado na Figura 3 é alimentado com as informações do
modelo OLTP da Figura 2, necessárias para a resposta aos questionamentos
padronizados (1 a 7) descritos anteriormente.
Figura 3 – Modelo Multidimensional (OLAP) “Star Schema” - Trecho “Concessão

de Benefícios”.
Não existe interação a nível operacional no Data Warehouse, as aplicações

corporativas acessam a base OLTP e neste ambiente – a primeira camada – realizam as
transações de rotina. Um conjunto de rotinas específicas acessam o banco OLTP
periodicamente, sendo responsável pela carga das tabelas do Data Warehouse – a
segunda camada.
Neste momento os dados ficam redundantes, na base OLAP e OLTP. Por este
motivo qualquer operação de “insert” ou “update” na base OLAP é proibida: se
acontecer alteração dos dados OLAP a mesma operação terá que ser feita na base
OLTP, senão haverá quebra de integridade.
Notamos que a integridade é mantida pelas rotinas de carga do Data Warehouse,

as únicas que podem alterar ou inserir informações na base OLAP. Estas rotinas
extraem as informações relevantes para a composição das métricas e das dimensões do
Data Warehouse, e as disponibilizam de forma íntegra para a consulta.
Dessa forma concluímos que a operação do Data Warehouse é semelhante à de
um grande extrator de informações, tabuladas conforme as dimensões, ou “fatias”
(slices) projetados [KIMBALL,98].
Observamos que no exemplo os questionamentos são padronizados, contudo,
conforme a característica dos Data Warehouse, qualquer consulta pode ser construída
através do modelo, com garantia de desempenho e integridade dos resultados. Este tipo
de questionamento, denominado “ad-hoc” é suficiente para destruir uma base OLTP,
mas é um ponto forte da base OLAP [KIMBALL,98].
3.4. Ficha Técnica do projeto.

Observamos que os recursos tecnológicos foram alocados para o projeto de uma
Controladoria, base tecnológica para o funcionamento de uma Gestão de controle da
Informação Gerencial. Como o modelo analisado é apenas um braço desta gestão, os
recursos são compartilhados com outros projetos, fora do âmbito deste trabalho, mas
todos baseados na tecnologia de Data Warehouse.
A Controladoria deve ser um setor do organização capacitado a organizar e
reportar dados e informações relevantes e influir nas decisões dos gestores da entidade.
Na moderna concepção de controladoria, os resultados obtidos extrapolam o
mapeamento contábil convencional, devendo agregar valores novos, obtidos através da
análise dos indicadores de desempenho que mapearam o negócio da organização,
atuando como contabilidade gerencial.
O resultado do Sistema de Informação Gerencial, fundamentado na
contabilidade gerencial, deve ser capaz de oferecer aos gestores insumos para a
definição das melhores alternativas de ação para o alcance dos objetivos. O
conhecimento adquirido permite a mensuração dos resultados e identificação imediata
de falhas no planejamento, possibilitando a sugestão de ações mais rápidas e eficazes
para correção das tendências empresariais.
A proposta do projeto-piloto descrito neste documento é construir a infra-
estrutura organizacional para suportar essa agilidade gerencial, com as características
relacionadas a seguir:
3.4.1. Sistema de Informações Gerenciais - Controladoria.

• Módulo Extração e Transformação:
Obtém e verifica a integridade dos dados do sistema OLTP.
Transfere os dados elaborados para a base OLAP.
• Módulo Contabilidade:
Responsável pelo registro dos indicadores de desempenho.

Serve como base para os demais módulo na certificação das
informações gerenciais.
• Módulo Orçamento:
Interface para simulação de cenários para os planos de ações
gerenciais.
Expõem tendências e cenários, através do fornecimento de resultados
e comparativos de desempenho.
• Módulo Avaliação de Resultados:

Avalia os resultados e desempenhos individuais e consolidados dos
serviços e gestores.
Subsidiam a decisão sobre manutenção, desativação ou
implementação de unidades, produtos e serviços.
• Módulo de Informações Gerenciais:

Gestor de metadados sobre a organização.
Fornecimento de conhecimento para elaboração cenários.
3.4.2. Ambiente de Rede:
Rede local baseada em servidores Windows NT, versão 4.0-SP5. Um destes

servidores é dedicado exclusivamente para hospedar o Banco de Dados Transacional
(OLTP) e outro suporta a Base Analítica (OLAP). Em ambos servidores estão instalados
o gerenciador de Banco de dados SQL Server, versão 7.0 da Microsoft. No servidor
OLAP também funciona o OLAP Manager e o DTS (Data Transformation Services),
instrumentos para controle e extração de dados. As máquinas utilizadas como servidores
são baseadas na arquitetura Intel Pentium III de 700Mhz, com 256 Mbytes de memória
RAM e aproximadamente 100 Gbytes disponíveis em disco rígido
• Existem 6 estações de trabalho baseadas no

ambiente Windows 95/98, inseridas no domínio da rede local da
instalação, nas quais estão instalados os clientes necessários para
a definição e operação das consultas ao DW. Estas estações são
máquinas baseadas em processadores Intel Pentium de 200 MHz
com 64 Mbytes de memória RAM, alocadas para os técnicos

responsáveis pelo Projeto Piloto. O ambiente “Data Warehouse "
ainda não está disponível para produção.
3.4.3. Técnicos:
A equipe é composta por 5 Analistas de Sistemas e 1 Programador. 1
Analista atua como Gerente de Projetos, responsável pela interface com a
direção (“Board”) e outros 2 atuam com Coordenadores de Metas (Projetistas).
Todos atuam em todos os projetos que envolvem o uso da tecnologia de Data
Warehouse.
Todos os Analistas possuem formação superior, 3 em Informática. 3 são
pós-graduados em áreas correlatas, 1 é Especialista em Gestão da Informação.
Todos estão sendo treinados no uso das ferramentas de software utilizadas.
3.4.4. Prazos:
Existe um cronograma de 4 anos estabelecido pelo Plano Estratégico da
empresa a ser cumprido. Dentro deste cronograma aparece o projeto específico
detalhado neste estudo de caso, com prazo de 12 meses para a implantação,
dividido em duas fases:
• 1ª Fase: Implementação da estrutura lógica (definição dos indicadores de
performance).
• 2ª Fase: Desenvolvimento do Sistema de Informações da Controladoria e

utilização do método Data Warehouse.
3.4.5. Custos:
A planilha de custos orça a quantia inicial de R$100.000,00 envolvendo
os itens:
• Compra de 1 servidor de banco de dados: R$ 25.000,00
• Treinamento: R$20.000,00
• Viagens e participação de congressos: R$5.000,00
• Aquisição de licenças de software: R$20.000,00
• Reserva técnica / Gastos com outros projetos: R$30.000,00

4. Conclusão
Quando a questão é a sobrevivência no mercado, as organizações buscam

alternativas para manter seu diferenciador. Constatamos que em ambientes diversos,
seja altamente competitivo como no Mercado Financeiro, ou não como no Mercado dos
Fundos de Pensão Privados, há sempre um fator que motiva os gestores a procurar o
melhor desempenho das suas organizações.
A maior curiosidade é que um fundo de pensão privado não precisa, a rigor,
captar clientes, eles vêm direcionados pelo diferenciador do setor de Recursos Humanos
de uma segunda empresa, a Patrocinadora. Aparentemente a "não concorrência" pode
causar o acomodamento dos gestores dos fundos, pois o fluxo de clientes ocorre
naturalmente, mas, na realidade, não é isso que acontece. Os fundos estão cada vez mais
competitivos, justificando seus custos operacionais com serviços cada vez melhores.
Os esforços, no sentido de aumentar a eficiência dos planos, movimentam toda a
estrutura dos fundos, envolvendo novos projetos e novos paradigmas de controle. Assim
aparece a tecnologia do Data Warehouse, que comporta a base de conhecimentos
necessária para suporte à decisão estratégica das organizações.
Constatamos que a adoção da tecnologia é um investimento alto, que consome
dinheiro, tempo e muito intelecto daqueles que o implementam. Notamos, que neste
nicho de mercado não ocorre a falta de verba, mas as decisões são tomadas com muita
cautela, visto que o nível de auditoria é muito alto. Assim a implementação de projetos
de porte são orientadas por etapas pequenas, que podem projetar o sucesso ou o fracasso
do empreendimento. Os passos dados são pequenos, e sempre há a preocupação com o
retorno dos investimentos realizados.
Neste contexto, a maior dificuldade encontrada pelo projeto é a justificativa para
a realização de despesas com a inovação tecnológica. É facultado o acesso do técnicos à
formação, contudo as verbas com este fim são muito questionadas e comparadas com
prioridades imediatas da empresa. É um paradoxo curioso, pois os gestores estão cientes
da necessidade de melhorar o desempenho, mas não rompem a ligação com
"investimento", numa analogia ao investir dinheiro e realizar lucros no Mercado de
Capitais.
Outro aspecto de relevância, que vem sendo notado durante a execução do
projeto, é a referência ao autoconhecimento empresarial, ou a quebra de paradigmas
empresariais. Mesmo sem a operação do Data Warehouse é comum gerentes
perceberem erros e falhas operacionais antes não detectados, pelo simples fato de
repensar o negócio.
A adoção da tecnologia foi um grande salto para a organização, que ainda está
insegura na sua adoção, mas confia, e espera, bons resultados dentro do período de
quatro anos previsto para o projeto piloto.
5. Referências
[ABRAPP, 00] – ABRAPP - "Associação Brasileira das Entidades Fechadas de

Previdência Privada", através do site http://www.abrapp.org.br , consultado durante os
meses de maio e junho de 2000.
[ALLEN, 95] – ALLEN, EVERET T. - "Planos de Aposentadoria" - Instituto Cultural
de Seguridade Social, ICSS / Consultor, 1995.
[BAR, 96] BARQUINI, RAMON - Planning and designing the Warehouse, New
Jersey, Prentice-Hall, 1996.
[DW, 2000] DW, Equipe - “Data Warehouse - Data Mining”,
http://www.datawarehouse.inf.br/ , artigo: “Uma breve história do Data Mining”, visita
em 20/03/2000.
[HAR, 96] HARJINDER, G. e RAO, P. C. – The Official Guide to Data Warehousing,
Que Corporation, 1996.
[INMON, 99] – INMON, W.H. – “Gerenciando Data Warehouse” – Makron Books,
1999.
[KIMBALL, 98] – KIMBALL, RALPH – “Data Warehouse Toolkit” – Makron Books,
1998.
[SANTOS & HENRIQUES & REIS, 2000] SANTOS , José, HENRIQUES, Nuno
A.C, REIS, Vanda , “Data Mining / Data Warehousing” - FCT, Janeiro de 1999,
http://students.fct.unl.pt/users/nach/dmdw/prologo , consulta em 01/04/2000.
[THEARLING, 2000] THEARLING, Kurt - “Data Mining, CRM, Decision Support,
and Database Marketing (Kurt Thearling)”,
http://www3.shore.net/~kht/text/dmwhite/dmwhite.htm , consulta em 29/03/2000.

Data Warehouse, Data Marts e Data Mining em um Fundo de Pensão

Caricato da

Informazioni sul documento

Descrizione originale:

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Data Warehouse, Data Marts e Data Mining em um Fundo de Pensão

Caricato da

Copyright:

Formati disponibili

Mestrado em Informática

Data Warehouse, Data Mart, Data Mining1

Grupo 012 - MPI - Prof. Dr. Maurício Prates

Antônio Seco antonio.seco@ieee.org

2.2 Data Marts.................................................................................................................8

2.3. Data Mining..............................................................................................................9

3. IMPLANTAÇÃO DA TECNOLOGIA EM UM FUNDO DE PENSÃO. 11

3.2.Uma forma de controle: Qualidade dos produtos & Auditoria..........................12

3.3. Comparativo entre os modelos OLAP e OLTP do Fundo de Pensão...............14

3.4. Ficha Técnica do projeto.......................................................................................18

Data Warehouse, Data Mart, Data Mining 3

Antônio Seco antonio.seco@ieee.org

Este trabalho relata um estudo de caso, realizado em um Fundo de Pensão, com

2.1. Data Warehouse.

Processamento de transações (OLTP) Data Warehouse (OLAP)

Objetivo Operações do dia-a-dia Recuperação e análise da informação

Estrutura BD relacional otimizado para BD relacional otimizado para

Modelo de Dados Normalizado Multidimensional

Acesso SQL SQL e ferramentas avançadas de

Natureza do Dado Detalhado Resumido e detalhado

Tabela I: Comparativo entre universos OLTP e OLAP.

Com a evolução da Tecnologia da Informação e o aumento do uso de

diversos sistemas de informação das organizações.

2.1.1. O Data Warehouse na empresa.

implementação de um Data Warehouse, ela deve ser adaptada às características e às

2.1.2. Aplicações da Tecnologia.

• Aplicações do negócio: constituem as aplicações que dão suporte

• Aplicações sobre o negócio: são as aplicações que analisam o

2.1.3. A Diferença entre dados Operacionais e Informacionais.

• Os aplicativos SSD e SIE necessitam dados consistentes,

• Bancos de dados que oferecem recursos para suporte à SSD e SIE

• SSD e SIE usualmente lidam com tendências, e não com um

2.1.4. Questões críticas em Data Warehouse.

• Integração de dados e metadados de várias fontes.

• Qualidade dos dados: limpeza e refinamentos.

• Sumarização e agregação de dados.

• Sincronização das fontes com o Data Warehouse para assegurar a

• Problemas de desempenho relacionados ao compartilhamento do mesmo

2.2 Data Marts.

2.3. Data Mining.

• Criar parâmetros para entender o comportamento do consumidor;

• Identificar afinidades entre as escolhas de produtos e serviços;

• Prever hábitos de compras;

• Analisar comportamentos habituais para se detectar fraudes.

• A análise se torna trabalhosa quando o número de variáveis a serem investigadas

• Métodos estatísticos possuem condições que limitam o número de casos a

Figura 1: Base de um Data Mining [DW, 2000]

2.3.1. Áreas de uso do Data Mining.

• Cross-selling: Identificar associação entre produtos, procurando tirar

• Fidelização: Combinar e descobrir fatores que causem a perda de clientes, e

O Data Mining faz uso da simulação, que representa a ação de construir um

• Market Basket Analysis

• Memory-Based Reasoning (MBR)

2.3.2. Principais Dificuldades para uso da tecnologia.

• Necessidade Grandes Bases de Dados

• Montar Ambientes Ideais

3. Implantação da tecnologia em um Fundo de Pensão.

3.1. O Objetivo dos Fundos de Pensão.

Pública. O modelo privado é mais ágil, baseado na capitalização, e os participantes

3.2.Uma forma de controle: Qualidade dos produtos & Auditoria.

entidade – é o caso dos fundos multipatrocinados. O montante acumulado

3.3. Comparativo entre os modelos OLAP e OLTP do Fundo de