Sei sulla pagina 1di 110

INTELIGNCIA

ARTIFICIAL

QUEBRANDO PARADIGMAS
na
ANLISE DE EMPRESAS

Carlos Fernando Nogueira

PAPEL

VIRTUAL

Copyright 1999 por Carlos Fernando Nogueira


Ttulo Original: UTILIZAO DE INTELIGNCIA ARTIFICIAL NA ANLISE DO DESEMPENHO DE EMPRESAS

Editor-Chefe: Tomaz Adour


Editorao Eletrnica: Srgio Porto

Papel Virtual Editora


Rua Marqus de So Vicente, 225
Prdio Genesis - sala 21-A - PUC-Rio
Gvea - Rio de Janeiro - RJ CEP: 22453-900
Tel: (021) 239-0170 Ramais: 2057 / 2026 (fax)
E-mail: editor@papelvirtual.com.br
Endereo Eletrnico: www.papelvirtual.com.br

Dedico este trabalho ao


Prof. Augusto Sampaio, ViceReitor Comunitrio da PUC-Rio,
que um dia me sugeriu fazer
este curso, e as profundas
mudanas que ocorreram desde
ento na minha vida.

Agradeo minha me,


Maria Apparecida, pelo apoio
material e intelectual; ao Prof.
Dr. Nelson Ebecken, CoppeUFRJ, pela imensa disponibilidade

cooperao,

determinantes para o sucesso


deste trabalho; e ao Prof. Dr.
Jorge Ferreira da Silva, pela
orientao e pela confiana que
dispensou, ao aceitar o convite
para

orientar-me

nesta

proposta indita para ambos.

SUMRIO

PR E F C I O ......................................................... 09
Prof. Nelson Ebeck
1. O PR O B L E M A
1.1 Introduo ................................................. 11
1.2 Objetivo .................................................... 14
1.3 Delimitao do Estudo .................................. 15
1.4 Relevncia do Estudo ................................... 15
2. RE F E R E N C I A L T E R I C O
2.1. O desenvolvimento ..................................... 17
2.2. A ferramenta utilizada: Inteligncia
Artificial.......................................................... 19
2.3. Caractersticas da Inteligncia Artificial relevantes
para este estudo .............................................. 27
2.4. O papel da ferramenta de IA neste estudo ...... 27
2.5. rvores de Deciso ..................................... 29
2.6. Redes Neurais ............................................ 38
3. ME T O D O L O G I A
3.1. Tipo de Pesquisa ........................................ 53
3.2. Universo e Amostra .................................... 53
3.3. Coleta de Dados ........................................ 53
3.4. Anlise dos Dados ...................................... 54
3.5. Limitaes do Mtodo ................................. 56
3.6. O Escopo e a Avaliao do Estudo ................. 56
4. O EX P E R I M E N T O
4.1 Rodando as rvores de Deciso ..................... 59
4.2. Rodando as Redes Neurais ........................... 70

Fernando Nogueira

5. CO N C L U S E S S O B R E O ES T U D O
5.1. Das ferramentas ........................................ 79
5.2. Do conhecimento extrado do Banco
de Dados ........................................................ 80
6. BI B L I O G R A F I A ................................................ 83
7. AN E X O S
7.1. Listagem de Empresas ................................. 87
7.2. rvores de Deciso ................................... 105

Inteligncia Artificial

APRESENTAO

Transaes no mundo dos negcios geram dados


que so os prprios fundamentos do negcio. H algum
tempo estes dados esto sendo coletados, tratados e
armazenados em bancos de dados de grandes dimenses.
Na comunidade cientfica os dados esto mais
dispersos, uma vez que nesta rea a formulao de
modelos procura definies matemticas precisas.
Entretanto, reconhece-se hoje em dia que estas
descries precisas, nem sempre so possveis.
Conhecimento incompleto e impreciso, observaes de
caracter qualitativo, a grande heterogeneidade dos
parmetros de fenmenos de natureza, condies iniciais
e de contorno no perfeitamente estabelecidas tm
gerado a necessidade de modelos de dados.
Para construir um modelo de dados no so
necessrias complexas equaes diferenciais, o
suficiente a obteno de dados representativos.
A extrao de conhecimento explcito e
compreensvel escondido em bancos de dados gera
informaes preciosas. As tecnologias de Data Mining
tem aberto novos campos de oportunidades,
revolucionando completamente a estratgia de soluo
de problemas.
Data Mining um campo multidisciplinar que
envolve diversas tcnicas. As metodologias tradicionais
de sistemas de suporte a deciso no satisfazem mais as
necessidades de descobrir estruturas escondidas em
grandes massas de dados dentro dos limites de tempo
atualmente exigidos nos ambientes cientficos e comerciais.

Fernando Nogueira

O presente livro tem por objetivo apresentar e


discutir a avaliao de rentabilidade de empresas. Os
resultados obtidos atravs de data mining explicitam
claramente a extrao de conhecimento sobre perfis
lucrativos de empresas em ambientes de acentuada
complexidade.

Nelson Francisco Favilla Ebecken

10

Inteligncia Artificial

1. O P ROBLEMA

1.1.

Introduo
Sabemos respirar, caminhar, andar de bicicleta e

muito mais. Uma infinidade de funes que, s se


quisermos desenvolver mquinas para execut-las,
perceberemos a complexidade, bem como o quanto a
natureza generosa ao nos permitir execut-las sem
termos que entend-las.
Ao passear de bicicleta, uma pessoa que jamais
tenha aprendido a aritmtica bsica poder estar
resolvendo equaes diferenciais complexas, e o estar
fazendo com uma rapidez ainda no atingida nem mesmo
por supercomputadores.
Alguns outros exemplos de situaes em que
complexas funes so executadas pelo homem sem
que tenham sido compreendidas:
(a)

Imagine dois automveis andando (ou correndo) a


120 quilmetros por hora, em sentidos contrrios,
em uma estrada de mo dupla. A uma distncia de
100m, os dois motoristas sabem se a direo que
seguem os conduz a uma coliso, bem como
conseguem estimar a que distncia se cruzaro.

11

Fernando Nogueira

(b)

Compare agora com dois grandes navios, a 12


quilmetros por hora, estando navegando em rotas
paralelas prximas, em um canal. mesma distncia,
os dois comandantes no conseguem estabelecer
um rumo que os d a certeza de que evitaro a
coliso, e menos ainda, conseguem estabelecer a
que distncia se cruzaro.

(c)

Mudando de ambiente, abstraia a incerteza de um


leigo ao investir no mercado financeiro. Por outro
lado, especialistas conseguem estimar os
comportamentos das aes, sendo que por vezes
atribuem esta capacidade a razes subjetivas,
intuies.

O que podemos inferir das situaes descritas,


que existem limitaes em observar e determinar as
variveis que explicam certos fenmenos. No caso dos
navios, o complexo movimento das ondas, o
comportamento de uma embarcao que desliza sobre
sua sustentao ( a gua ) e os baixos valores que as
derivadas do movimento do navio tm, enfim a
complexidade do modelo, torna difcil ao homem
extrapolar seu comportamento. Tambm no mercado
financeiro, a complexidade de variveis extrema,
muitas sendo propositadamente camufladas.
Afinal, quem pode garantir que o vo de uma
borboleta no altera o clima no lado oposto do planeta?
Entretanto, estes problemas no so insolveis.
parte das diferentes aptides para resolver estes
fenmenos, mesmo os menos iluminados evoluiro no
aprendizado. Ou seja, a exposio aos eventos aumenta
o back ground de cada um, dando mais oportunidades
12

Inteligncia Artificial

de perceber, mesmo inconscientemente, parmetros


que expliquem os fenmenos.
Obviamente, h limites para isso, limites de
disponibilidade, de capacidade e de sensibilidade. Afinal,
as pessoas no so mquinas...
Chamemos, ento, as mquinas.
A Engenharia do Conhecimento tem a misso de
introduzir na mquina o conhecimento existente nos
especialistas, viabilizando a sua utilizao em escala, e
tambm aquele enrustido em Bancos de Dados,
transformando-os em informao. Atravs da Inteligncia
Artificial tentamos desvendar padres no perceptveis
a olho nu e, a partir deles, inferir e prever o
comportamento de um novo elemento. Ou seja, ela vem
tentar suprir as limitaes humanas atravs da principal
virtude das mquinas, a capacidade de tratar dados,
de tentar seguidas vezes associar elementos
aparentemente dissociados, testando hipteses que no
nos disporamos a testar.
O computador ento compensa a sua falta de
capacidade de perceber pela sua velocidade de
processamento, fazendo tentativas de associao em
fraes de microsegundo.
Apesar de ser uma procura cega e no
determinstica, trata-se de um processo extremamente
familiar. Poucos motociclistas sequer tm noo de que,
em alta velocidade, pressionam o guido para o lado
oposto ao da curva que querem fazer. Talvez uma

13

Fernando Nogueira

porcentagem ainda menor seja a dos que, tendo


percebido, entendam o que esto fazendo, isto por
vezes a 100 quilmetros por hora. Parece arriscado,
no? Mais at do que o experiente investidor comprando
milhes em aes, baseado por vezes em fatores que
ele mesmo julga, erroneamente, subjetivos.
Da mesma forma que o motociclista e o investidor
tm domnio, ainda que parcial, sobre os referidos
fenmenos, pode o computador procurar assimilar outros,
como o desempenho financeiro de empresas atravs
dos seus dados financeiros, no se utilizando de modelos
j testados.
Como se classificam os perfis das empresas mais
ou menos lucrativas de acordo com seus dados
financeiros? possvel prever o desempenho de empresas
a partir dos seus padres financeiros?

1.2.

Objetivos

O objetivo deste estudo ser compreender e se


possvel, prever o desempenho de empresas, atravs
dos seus dados financeiros disponveis, utilizando-se
para tal de ferramentas de Inteligncia Artificial .
Para que seja possvel atingir este objetivo, ser
necessrio:
obter Banco de Dados sobre o desempenho de
empresas;
estabelecer as regras que determinem o desempenho
das empresas utilizando ferramentas de Inteligncia

14

Inteligncia Artificial

Artificial;
tentar prever o desempenho destas empresas,
observando seu perfil financeiro, podendo, ou no,
fazer uso de informaes histricas;
comparar com os resultados obtidos na realidade,
verificando a capacidade de previso e de explicao
da ferramenta utilizada;

1.3.

Delimitao do Estudo

Ao utilizar-se de Bancos de Dados j disponveis,


do Sistema Economtica, o universo de variveis
analisveis fica restrito aos listados nestes, de cunho
eminentemente financeiro .
Cabe ressaltar que os dados so fornecidos pelas
empresas. Alm das imprecises que possam ocorrer
devidas falta de iseno, faltariam informaes
importantes como: m a r k e t s h a r e, patrimnio
tecnolgico, capital intelectual, qualidade, valor da
marca, processos e satisfao dos stakeholders, entre
outros. Apesar da clara relevncia destes parmetros,
eles no sero abordados, concentrando-se o estudo
na avaliao da ferramenta Inteligncia Artificial como
instrumento eficaz e confivel de apoio analise de
padres em Empresas.

1.4.

Relevncia do Estudo
Existem variados modelos que se propem a

explicar porque uma Empresa mais lucrativa que outra.


Alm da dificuldade evidente em propor-se um modelo

15

Fernando Nogueira

consistente sob o ponto de vista terico, dificuldade


esta que se estabelece pelo fato de estarem envolvidos
muitos fatores, existe tambm a dificuldade em validar
tais modelos.
Este estudo vem apresentar e testar ferramentas
com modelo aberto, com capacidade de testar
associaes no experimentadas, at por serem
improvveis aos paradigmas vigentes. Alm disso, estas
ferramentas permitiriam, uma vez que simplificariam muito
a anlise de dados, que se estabelecesse modelos
especficos para cada Indstria, ou at cada setor,
amenizando a perda de informao que as generalizaes
possam trazer. Impe-se entretanto a esta segmentao,
a disponibilidade de volume de empresas suficiente para
a utilizao de ferramentas de IA.

16

Inteligncia Artificial

2. R EFERENCIAL T ERICO

2.1.

O desenvolvimento
Nas ltimas dcadas, poucas reas do

conhecimento experimentaram desenvolvimento


semelhante ao da computao. De mquinas do tamanho
de salas, capazes de resolver alguns clculos e com
capacidade de memria pequena, vemos hoje mquinas
extremamente capazes, manipulando imagens e sons,
armazenando bibliotecas, e a um custo inexpressivo se
comparado aos primeiros computadores. Hoje
carregamos no bolso equipamentos com maior
capacidade de memria que as antigas maravilhas da
computao.
Com o tempo, de uma mera ferramenta de realizar
clculos, a informtica distanciou-se da matemtica,
desenvolvendo suas prprias reas e teorias. Seu
espao cresceu, e ela se difundiu nos diversos campos
da vida humana.
Como conseqncia deste crescimento, surgiu
a Inteligncia Artificial, uma rea do conhecimento cujo
nome j incmodo, quanto mais a proposta.
O primeiro marco da Inteligncia Artificial foi a

17

Fernando Nogueira

mquina de decriptografia automtica (Inglaterra) que,


na Segunda Guerra Mundial, se propunha a descobrir
as cifras utilizadas pelos alemes. Deste desenvolvimento
veio a aspirao de criar-se um tradutor automtico,
que ainda no se realizou. A complexidade das estruturas
semnticas, to diferentes para cada lngua, no foram
superadas pelos recursos e desenvolvimento disponveis
na poca (1955). Em 1956 criou-se o demonstrador
automtico de teoremas, que no chegou a descobrir
um novo teorema, apesar de ter demonstrado alguns
ento existentes.
De l para c observa-se o crescimento
exponencial da informtica. Do projeto (parcial) de
embarcaes previso do tempo, passando pela anlise
de fraudes, a informtica vem reproduzindo atividades
anteriormente desempenhadas por especialistas.
Estariam elas nos substituindo?
Segundo Cavalcanti (1996), no h fundamento
cientfico que justifique a crena de que existam
mquinas que raciocinem como seres humanos.
Se aparentemente as mquinas no tm
capacidade de pensar como os humanos, resta saber
se os humanos no tm capacidade de assimilar de
forma semelhante s mquinas. Quem sabe at j o
fazem sem perceber.

18

Inteligncia Artificial

2.2. A ferramenta utilizada:


Inteligncia Artificial

2.2.1. A Descoberta do Conhecimento


Segundo Fayyad (1996): Knowledge Discovery
in Databases is the non-trivial process of identifying
valid, novel, potentially useful, and ultimately
understandable patterns in data.
Onde:
* Padro uma sentena que descreve fatos
em um subconjunto dos dados obedecendo a
uma classificao.

* O Processo tem mltiplos passos, envolvendo: preparao de dados, pesquisa de padres, avaliao de conhecimento e refinamento.
* Validao a verificao de que os padres descobertos so extensivos a novos
dados, no utilizados na descoberta dos
padres.
Estabelece-se assim uma forma racional e lgica
de aquisio de conhecimento. Fica explicitada, na
definio do Prof. Fayyad, a complexidade envolvida
nesta descoberta, uma vez que os padres devem ser
descobertos a partir de uma fonte no necessariamente
preparada para isso. Ressalta-se tambm a importncia
da validao das informaes extradas.

19

Fernando Nogueira

Data Mining is a step in the KDD process


consisting of particular Data Mining algorithms that,
under some acceptable computacional efficiency
limitations, produces a particular enumeration of
patterns Ej over F (Fayyad,1996)
Ej a expresso, e F o conjunto de dados.
Como isto implementado? Atravs de algoritmos
dedicados que buscam modelar os fenmenos que
encontram. Esta modelagem pode ser voltada para a
classificao ou mesmo para a previso.
KDD process is the process of using datamining
methods (algorithms) to extract (identify) what is
deemed Knowledge according to the specifications of
measures and thresholds, using the database F along
with any required preprocessing, subsampling, and
transformations of F. (Fayyad,1996)
Ressalta-se a importncia da definio dos
parmetros de exigncia, ou tolerncia, para o que se
considera aprendizado e classificao.
Em se saindo do mundo terico determinstico,
caracterstico da matemtica, e entrando-se no mundo
real, da natureza, faz-se essencial a agregao de uma
das principais caractersticas naturais, a tolerncia. Mas
at que ponto? essencial esta definio para a
tentativa de criar inteligncia onde no h, para
transformar um sistema em um decisor, um caso extremo,
no necessariamente adequado a qualquer situao .

20

Inteligncia Artificial

2.2.1.1. O processo de aquisio de conhecimento

So os passos da Descoberta do Conhecimento, segundo


Fayyad (1996).
1. Desenvolver o entendimento do domnio, o
conhecimento prvio necessrio e a identificao
dos objetivos do usurio.
2. Criar um subconjunto-alvo de dados, onde se
descobrir os padres.
3. Preparao da base de dados, com remoo de
rudos, coletar as informaes necessrias para a
modelagem e escolha da estratgia para
tratamento de campos incompletos.
4. Reduo e Projeo de dados, encontrando os
principais aspectos representativos dos dados,
reduzindo a dimenso do Banco de Dados.
5. Escolha da tarefa do Data Mining, se classificao,
regresso, clusterizao ou previso.
6. Escolha do algoritmo do Data Mining, selecionando
o mtodo apropriado a ser utilizado na descoberta
dos padres.
7. Data Mining. A procura, propriamente dita, dos
padres, utilizando-se das ferramentas
selecionadas no item 6.
8. Interpretao dos padres obtidos, com possvel
retorno a um dos passos 1 a 7.
9. Consolidao do conhecimento adquirido, com
implementao ou mesmo apenas relatrio. Isto

21

Fernando Nogueira

inclui verificao de consistncia com o


conhecimento j existente.
Este processo interativo, podendo haver
loops entre passos. Apesar de haver uma tendncia
ao enfoque no passo 7, Data Mining, todos os passos
so importantes.

2.2.1.2.Os objetivos e passos intermedirios.


Os dois principais objetivos do Data Mining so:
predio e descrio (Fayyad,1996). A predio
consiste na utilizao de variveis exgenas na
determinao de variveis endgenas, baseando-se
em padres descobertos anteriormente ou com outros
dados. A descrio consiste na segmentao dos
dados sendo estes agrupados segundo caractersticas
comuns, dentro da tolerncia desejada.
Para que se alcance os objetivos citados, so
necessrios alguns passos
(Fayyad,1996), quais sejam:

22

intermedirios

Inteligncia Artificial

Classificao. Consiste no agrupamento dos dados


(variveis exgenas) dentro de alguma regra
estabelecida para uma ou mais variveis (variveis
endgenas). Como exemplo, pode-se utilizar a
concesso de emprstimos por um banco, baseado
no valor solicitado pelo cliente e seu escore de
relacionamento com o banco.

Valor
solicitado
No empresta

Empresta

Escore de
relacionamento

23

Fernando Nogueira

Regresso. Consiste na possibilidade de extrapolarse uma varivel endgena, baseando-se nos valores
de variveis exgenas.
Para exemplificar esta funo, observe-se a
concesso de emprstimos em funo do escore de
relacionamento, do valor emprestado e do pagamento
inadimplncia. O cruzamento destas trs variveis
permitem extrapolar que valores podem ser
emprestados a um cliente com um dado escore, com
determinado grau de confiana de que o dbito ser
honrado.

Valor
Solicitado

Escore de
relacionamento

24

Inteligncia Artificial

Segmentao. Consiste no agrupamento coerente de


dados que detenham caractersticas semelhantes.
Estes agrupamentos podem ou no ser mutuamente
excludentes.
No exemplo abaixo observa-se uma possvel
segmentao das expectativas de cada tipo de
cliente, podendo-se criar produtos adequados a cada
um.

Valor
Solicitado

Segmento1

Segmento2
Segmento3

Escorede
relacionamento

25

Fernando Nogueira

Sumarizao. A procura de uma forma sinttica de


representao de subconjuntos dos dados. Por
exemplo, a representao destes por frmulas que o
definam, ou mesmo por sua mdia e desvio padro.
Ex: Se o valor solicitado menor que 10 e o escore
do relacionamento maior que 20, ento pertence
ao segmento 1, com 85% de certeza. A este segmento
seria associado algum tipo de comportamento, por
exemplo, alto risco de inadiplncia.
2.2.1.3. Os componentes dos algoritmos de Data
Mining
Os principais componentes de um algoritmo de
Data Mining so (Fayyad,1996): representao do
modelo, avaliao do modelo e pesquisa.
1. Representao do Modelo. a linguagem que
representa os padres descobertos. Ela deve ser
simples e abrangente. Vale ressaltar que a
limitao da representao de um modelo
excessivamente simplificado no se compensa por
um maior tempo de aprendizagem, havendo perdas
significativas de informao.
2. Avaliao do Modelo. Tem a funo de avaliar o
quo boa foi a modelagem obtida naquele
aprendizado, em relao aos critrios
estabelecidos. A validao, ou seja a avaliao
da capacidade preditiva, se baseia na CROSS
VALIDATION. J a capacidade descritiva, da
utilidade e da facilidade de compreenso tambm
devem ser avaliadas.
26

Inteligncia Artificial

3. Mtodo de Pesquisa. Dividido em pesquisa de


parmetros e de modelo. Na pesquisa de
parmetros, o algoritmo procura pelos parmetros
que melhor atendem aos critrios estabelecidos
de avaliao do modelo. Na pesquisa de modelos,
feita uma procura sobre a procura de
parmetros. Para cada modelo experimentado,
realiza-se uma procura de parmetros. Este
processo imprime a necessidade de uma
interferncia heurstica escolha de modelos, visto
que a complexidade do Banco de Dados pode
tornar invivel a busca para todo o espectro de
modelos possveis.
2.3.

Caractersticas da Inteligncia Artificial


relevantes para este Estudo

A principal caracterstica da IA a utilizao


de mtodos heursticos. Devido s limitaes da
mquina, ela tem que experimentar cada soluo,
percorrer todos os caminhos possveis, sem se utilizar
de solues analticas.
Outra importante face da IA a capacidade
de lidar com informaes conflitantes, insuficientes
e at inexatas.
2.4.

O papel da ferramenta de IA neste Estudo

A IA tem o papel de classificador e previsor


da varivel escolhida como endgena, no caso ser
a rentabilidade sobre o patrimnio das empresas.
Classificador, atravs da utilizao de rvores
de Deciso, onde nveis de rentabilidade segmentam
27

Fernando Nogueira

o Banco de Dados, determinando-se as faixas das


variveis exgenas que correspondem a esta
segmentao.
A capacidade de previso se faz com o uso
das Redes Neurais, onde se utilizou das variveis
exgenas contnuas, cujas participaes na gerao
das variveis endgenas so determinadas.
2.4.1. A escolha das ferramentas
Esta escolha obedece critrios tcnicos e
prticos.
Os critrios tcnicos preocupam-se com a
viabilidade da ferramenta em alcanar os objetivos
desejados. Para tal avaliao, so observados os
seguintes parmetros: tamanho da amostra, em
funo da acurcia e da complexidade de padres
que se procura, conhecimento prvio (certamente
o parmetro mais importante a ser considerado), que
simplifica muito a tarefa do KDD, e a relevncia dos
atributos (exgenos), se eles tm capacidade de
explicar o padro e se no h excesso de rudo.
Os critrios prticos dizem da disponibilidade
da ferramenta e de seu custo.
Devido adequao proposta deste estudo,
bem como a disponibilidade de verses shareware,
com
capacidade
suficiente
para
o
no
comprometimento das anlises desejadas, visto que
os Bancos de Dados so relativamente pequenos,
adotou-se os programas PROFILER e ThinksPro, como

28

Inteligncia Artificial

ferramentas de rvores de Deciso e Redes Neurais,


respectivamente.
A utilizao de rvores de Deciso e Redes
Neurais se deveu ao fato de atenderem plenamente
ao tipo de anlise desejado, alm de serem as
ferramentas de datamining m a i s d i f u n d i d a s e
exploradas atualmente.
Em especial, as rvores de Deciso tm o papel
de geradoras de conhecimento prvio para a anlise
por Redes Neurais, alm da funo de classificadoras.

2.5.

rvores de Deciso

2.5.1. O que so?


Trata-se de um mtodo baseado em divises
sucessivas dos dados, a partir de valores
determinados de suas variveis, uma a cada vez,
gerando um modelo de inferncia de fcil
compreenso. um mtodo que oferece grande
facilidade de apresentao do conhecimento que
extrai. Porm, como conseqncia direta da
simplicidade de representao, pode ocorrer uma
limitao sua capacidade de classificao. Ao
aumentar-se a complexidade do modelo, admitindo
ento expresses mais abrangentes, este fica mais
poderoso, tornando-se entretanto de mais difcil
compreenso.
H vrios algoritmos que implementam rvores
de Deciso e induo de regras (Agrawal et al.,1996),

29

Fernando Nogueira

seu uso a princpio ocorreu preponderantemente em


casos de previso, sendo hoje largamente utilizado
para classificao, regresso e descrio (Agrawal
et al.,1996).

2.5.2. Como funcionam?


2.5.2.1. Um exemplo:
Para auxiliar a explicao da lgica das rvores
de Deciso, torna-se muito eficaz o acompanhamento
de um exemplo. A seguir mostrado superficialmente
o processo ao qual os dados so submetidos, na
procura de padres.
Por exemplo: Qual o Perfil dos M o t o r i s t a s d e
automveis BMW?
Para chegar-se a estes padres, submeterse-ia os dados a perguntas que os dividisse em
subgrupos, ou seja em classes.
Pergunta: Os motoristas de BMW gostam de carros
esportivos?
Esta pergunta j agruparia as respostas em
dois grupos distintos, to mais distintos quanto mais
apropriada e exata ela fosse.
Pode-se apresent-la de uma forma mais
eficiente: Os motoristas de BMW gostam muito de
carros esportivos? Nesta nova verso atribuiu-se um
valor varivel gostar, no caso muito.
Em seguida se faria outra pergunta,
obedecendo, claro, s variveis disponveis no

30

Inteligncia Artificial

Banco de Dados. Por exemplo, outra pergunta


abordaria a classe social dos motoristas de BMW,
podendo surgir uma segregao que retiraria apenas
os de classe mdia da resposta. O que parece
evidente, visto que normalmente apenas pessoas ricas
e seus motoristas dirigem carros deste valor neste
pas.
As perguntas se repetiriam at que
houvesse apenas um tipo de resposta para o
subgrupo formado em uma dada pergunta.
Caso o outro ramo, subgrupo, para aquela
pergunta tenha mais de uma classificao, teriam
continuidade as perguntas.
Atravs destas respostas, o Banco de Dados
se classificaria e poderamos obter regras como:
Pessoas abastadas, que gostam muito de
carros esportivos, no tenham uma Ferrari, residam
em uma cidade onde haja um ou mais revendedores
da BMW e no haja nenhum da AUDI, tm 15% de
chance de dirigir um BMW.
Facilmente se reconstruiriam as perguntas que
teriam sido feitas para chegar-se a esta regra:
1.
Pessoas ricas guiam BMW?
2.
Pessoas que gostam muito de carros
esportivos guiam BMW?
3.
Pessoas que tm Ferrari guiam BMW?
4.
H motoristas de BMW onde no h
revendas ?
5.
H motoristas de BMW onde h
revendas AUDI ?
31

Fernando Nogueira

Teriam ento constitudo uma rvore que teria


como um de seus ramos o seguinte:

S
Gosta de carros
esportivos?

S
Tm u m a
Ferrari?

Renda>X?

N
Tm Conc. BMW
n a cidade?

Tm Conc. AUDI
n a cidade?
N
Tm uma BMW
P=15%

2.5.2.2. Os dados
Para a utilizao de rvores de Deciso, os
dados devem estar organizados de forma regular,
como uma srie de atributos a cada dado, podendo
haver valores discretos e contnuos.
Devido a esta restrio, h limitaes na
diversidade possvel de utilizaes, como ocorreria

32

Inteligncia Artificial

para a anlise de dados descritos subjetivamente,


como uma ficha mdica, por exemplo. Esta limitao
poderia ser contornada possivelmente com a utilizao
de algoritmos identificadores de palavras, que
poderiam gerar um arquivo adequado utilizao, ou
na utilizao de um formulrio padronizado para a
ficha mdica, como ocorre em vrios locais, como o
HemoCentro-RJ.
Apesar da relativa tolerncia a inconsistncia
de dados, deve-se evitar o excesso de dados
incompletos ou claramente dspares. Mesmo que a
ferramenta seja robusta a algum nvel de rudo, sua
eliminao prvia certamente catalisa o aprendizado.
Note-se que no se est abordando as variveis e
suas aparentes inconsistncias, mas sim aos seus
dados que estejam corrompidos.

2.5.2.3. As classes
A definio das classes - para as variveis
endgenas - deve ser realizada previamente, nos
casos em que se houver necessidade, ou seja, quando
as variveis se apresentarem com valores contnuos.
As rvores de Deciso apresentam rendimento
sensivelmente superior ao classificar nveis de padres
do que se obtm com valores contnuos (Quinlan,
96).

33

Fernando Nogueira

2.5.2.4. A estrutura
As rvores de Deciso tm a estrutura
baseada em:
folhas, que seriam as classificaes existentes e
ns de deciso, onde se encontram os testes que
a rvore faz aos dados.
Estes funcionam da seguinte forma: Um dado
entra na rvore atravs da raiz, percorrendo os ns
e neles sendo direcionados de forma a alcanarem as
folhas a que se referem, suas classes.

2.5.2.5. A produo de regras.


A partir das classificaes obtidas pelas folhas,
em que se enquadraram os dados, e dos ns, que
foram percorridos para chegar-se a elas, geram-se
as regras que determinam aquela classificao.
O exemplo dado, Motoristas de BMW, mostra
os testes realizados (ns), correspondendo s
perguntas feitas: maior de 18 anos?, por exemplo,
bem como as folhas, Dirige um BMW.
2.5.2.6. Estatstica e rvores de Deciso.
H muito em comum entre estatstica e rvores
de Deciso. Na verdade, alguns modelos utilizados
foram criados por estatsticos, como o CART (Breiman
et al, 1984).
Convm ressaltar, entretanto, que modelos
estatsticos so focados em tarefas onde os atributos

34

Inteligncia Artificial

so normalmente contnuos; na verdade muitos so


parametrizados, sendo o modelo baseado em
combinaes lineares das variveis que o compem.
Outra premissa importante a normalidade dos
dados, visto que se utilizam de suas mdias, desvios
padro, etc..
2.5.2.7. O compromisso explicao x entendimento.
At onde pode-se ir na classificao de um
Banco de Dados?
Alm da qualidade evidente de classificadoras,
as rvores de Deciso tm uma grande virtude, seus
modelos so de fcil compreenso. As perguntas, ou
testes, a que so submetidos os dados acabam por
gerar regras inteligveis, visto que o prprio processo
de obteno do conhecimento extremamente
simples, na verdade lgico, uma lgica binria de fcil
digesto.
Entretanto, ao exigir-se um refinamento
excessivo da anlise, as informaes extradas passam
a se tornar mais complexas.
2.5.2.8. A pureza, a tolerncia e a probabilidade.
As rvores de Deciso, como visto, so divises
sucessivas de blocos de dados. A cada n se tenta
segmentar os blocos em dois grupos, distintos pela
pergunta chave a que se submeter o bloco.
Nota-se ento a importncia da escolha das
perguntas a serem feitas aos blocos, que visaro
sempre a gerao de sub-blocos, de maior pureza
possvel.
35

Fernando Nogueira

Para tal, faz-se clara a necessidade de uma


definio da impureza (Breiman et al, 1984; Feng &
Michie, 1994). Esta funo tem diversas formas. A
pureza ideal seria conseguida pela obteno de um
bloco que fosse descrito com apenas um determinado
arranjo de variveis, no havendo ocorrncia com
qualquer variao de qualquer parmetro. Algo pouco
provvel em situaes complexas.
Dito de outra forma, medida que os blocos
que chegam a um determinado n apresentam uma
classificao francamente preponderante, est este
n se aproximando da pureza, sendo a situao ideal
definida como aquela em que s haja uma classificao
para os elementos daquele bloco, o n puro.
Para que se alcance a pureza, so utilizados
algoritmos diversos, entre eles o CART (Breiman et
al, 1984).e o Xpertrule PROFILER (Attar Software),
que tm a funo de segmentar os blocos, levando
em considerao apenas um parmetro por vez.
As divises se sucedem at que as variaes
de impureza vo diminuindo, atingindo os nveis
considerados tolerveis p e l o e s p e c i a l i s t a , s e
possvel.
Dificilmente se obter ns puros, associa-se
portanto probabilidades de ocorrncia a cada
classificao.

36

Inteligncia Artificial

2.5.2.9. Quando parar?


A determinao do tamanho ideal das rvores
outro problema a ser tratado.
A existncia de rudos no Banco de Dados
pode gerar uma rvore com mais informaes do que
o Banco de Dados que ela representa.
Ao criar-se um refinamento excessivo, cria-se
uma maior propenso incluso dos rudos, como se
informaes fossem.
Por outro lado, em uma situao semelhante
das Redes Neurais excessivamente treinadas, que
ser comentada no captulo referente, pode-se ter
uma rvore super-ajustada. Por outro lado bvia a
possibilidade de pobreza de representao ao se
cercear precocemente o desenvolvimento de uma
rvore.
Deve-se, por isso, avaliar o momento do
trmino da segmentao, aquele a partir do qual a
evoluo da pureza fica estagnada, passando a rvore
a gerar no regras, mas excees.
Duas so as formas de evitar os dois
desequilbrios acima descritos: forward prunning e
backward prunning . No primeiro faz-se o
acompanhamento da evoluo da impureza dos ns,
da forma j descrita. No segundo se efetua podas
nas rvores obtidas, simplificando os modelos obtidos.
(Breiman et al, 1984).

37

Fernando Nogueira

2.5.2.10. A representatividade.
A capacidade das regras geradas de
representar os padres procurados, fica obviamente
atrelada representatividade da amostra. Ou seja, a
utilizao de blocos desbalanceados em relao ao
universo certamente trar este desbalanceamento
para as regras que se obter.

2.6. Redes Neurais


2.6.1. O que so?
As Redes Neurais, na busca de seu objetivo,
que simular o raciocnio associativo humano, vm
emular um computador analgico em uma mquina
digital, uma vez que a capacidade de lidar com
quantidades, com valores contnuos, ou seja, com
modelos fsicos, naturais, em muito se restringiu ao
adotar-se a lgica binria dos computadores atuais.
Dizer se algo ou no extremamente
consistente com a estrutura e as ferramentas
oferecidas pelas CPUs (Unidades Centrais de
Processamento) e suas tenses de 0V e de 5V.
Por outro lado, o peso exato que uma varivel
deve tomar, muito mais semelhante ao sutil equilbrio
de presses controlado pelo diafragma de uma vlvula
reguladora de presso, tem um carter muito mais
mecnico, fsico, contnuo, enfim analgico.
Para suprir esta deficincia, existem poderosas
ferramentas nos computadores atuais, ferramentas
38

Inteligncia Artificial

com grau de acurcia muito mais alto que nossa


percepo, e que, por isso, nos fazem acreditar
estarmos vendo algo contnuo.
Estamos ento atendidos para nossos clculos
pontuais e determinsticos. Poucas vezes
encontraremos os limites da mquina, poucas vezes
exigiremos da mquina fraes do nosso limite.
Jamais esperaremos dela que intua, que
descubra, que crie uma classificao, que perceba
similaridades, ou mesmo encontre igualdades em meio
a dissimilaridades, atividades de complexidade muito
maior que um simples clculo, cujo erro pode estar
na nona casa decimal. Basta atentarmos para o efeito
que cada inflexo de uma curva tem para a equao
que ela modela.
Se em algum momento conseguirmos isso
baseados no paradigma digital, certamente o ser
com grandes limitaes no nmero de dados, na
quantidade de variveis, na no linearidade delas.
Jamais algo semelhante capacidade humana de nos
reconhecermos sorrindo ou chorando, a cores ou em
preto e branco.
As Redes Neurais tentam fazer o papel das
tais vlvulas reguladoras de presso. Em alguns casos
tm uma referncia que tentam buscar (a presso de
referncia), em outros apenas um grau de semelhana
desejado. Para cada Banco de Dados, pode haver
um comportamento diferente, assim como a equao
real que regeria uma reguladora tem seus coeficientes
variando com a temperatura, presso, desgaste,
impurezas e outras razes. Mas, como um equilibrista,
39

Fernando Nogueira

elas (Redes Neurais) buscam ficar sobre a corda, ou


seja, de forma interativa, com uma gama relevante
de variveis, e com aprendizado contnuo, vo
dominando seu modelo, cuja complexidade, maior
justificativa para a utilizao de mtodos estatsticos,
to grande que paradoxalmente, os inviabilizam.
Como mtodo de regresso no linear, as Redes
Neurais consistem na tentativa de compor
convenientemente funes lineares e no lineares
bsicas, como sigmides, splines e polinmios, gerando
uma fronteira no linear que divida os dados.
Se, por um lado, estes mtodos possuem
acurcia superior aos de rvores de Deciso, so
tambm de mais difcil entendimento. Suas divises,
ou fronteiras tm formas complexas, e no binrias,
como nas rvores de Deciso. Este o fator que lhe
permite a extrapolao, ou previso, s custas da
compreenso do modelo.

2.6.2. Como funcionam?


Trata-se de um mtodo de previso muito
semelhante regresso, utilizada em estatstica,
tendo inclusive incorporado procedimentos de
estatstica paramtrica, em que se ajusta pesos
atribudos a parmetros (ns) visveis ou no, obtendo
um modelo que permite prever o valor de uma dada
varivel para um determinado vetor exgeno.
O modelo estudado, a propagao retrgrada,

40

Inteligncia Artificial

tem como caracterstica no ser paramtrico,


construindo o modelo previsor de acordo com os dados
fornecidos, podendo ser linear, quadrtico, cbico ou
outro.
A sensibilidade das Redes Neurais a rudo se
estabelece pelo fato de elas trat-los como
complexidade do Banco de Dados. Elas tentam ento
se adequar complexidade encontrada, o que pode
ser impossvel, perdendo capacidade de explicao
sobre os padres do Banco de
Dados e,
consequentemente, capacidade de previso.
A escolha de alguns parmetros tm grande
influncia na facilidade, ou mesmo na viabilidade desta
procura. Entre eles poderamos citar por hora, o
preprocessamento dos dados de entrada, visto que
podem ter faixas muito distintas de valores, o que
atrapalha muito a sensibilidade da rede.

2.6.2.1. Os paradigmas

Segundo Bigus (1996), os trs principais


paradigmas seriam:

aprendizado com superviso,


aprendizado sem superviso e
aprendizado por reforo.
Poderamos explic-los atravs de exemplos:

41

Fernando Nogueira

2.6.2.1.1. Redes Supervisionadas.


Ao aprender a ler com sua carinhosa me, uma
criana ter sempre a sinalizao dos seus acertos e
erros atravs dos comentrios dela. Sua me sua
supervisora e ela (a criana) ter sempre uma
referncia a buscar.
Ou seja, ao tentar-se resolver um problema,
dispe-se tanto das variveis quanto das respostas.
A estatstica pode hoje resolver uma infinidade
de problemas com esta configurao, porm h casos
em que a existncia de grandes no linearidades, de
relacionamentos muito complexos entre variveis, a
inexistncia de modelos, ou mesmo a variao do
modelo ao longo do tempo, tornam as redes
supervisionadas uma possibilidade atrativa.
2.6.2.1.2. Redes No Supervisionadas.
Aquela criana cresceu e foi trabalhar em uma
empresa que no disponibilizou algum para
acompanh-la. Essa pessoa agora se depara com uma
pilha de reclamaes de clientes, devendo agruplas de forma coerente. No h referncia a buscar, o
Banco de Dados lhe dir seus padres.
Temos ento muitos dados, no sabemos as
respostas, mas sabemos a pergunta: Qual a relao
entre estes dados?
2.6.2.1.3. Redes por reforo.
Agora olharemos para esta pessoa desde o
incio da sua vida, as opes que tomou, e os

42

Inteligncia Artificial

resultados que alcanou. Se teve realizao


financeira, profissional ou pessoal. Resultados que
so conseqncias de vrios fatores, ocorrendo muito
aps cessadas as causas, como a realizao
financeira, funo dos estudos entre outros fatores.
Muitos outros exemplos poderiam surgir,
sintetizam medidas de sucesso, cujos componentes
alm de complexos e distantes, formam um grande e
complicado somatrio de fatores.
H portanto uma menor evidncia da
contribuio das opes feitas durante a vida, valores
das variveis exgenas, com o sucesso, varivel
endgena.
2.6.2.2. As topologias
As Redes Neurais se formam pelas
interconexes entre seus ns, sejam eles visveis ou
no. Ou seja, desempenham um papel de interface
com o mundo externo, para entrada ou sada de
dados, ou desempenhando um papel interno, intangvel
externamente.

Nvel de Sada

Nvel
Escondido

Nvel de
Entrada

43

Fernando Nogueira

2.6.2.2.1
Segundo Bigus (1996), existem trs topologias
que representam a forma como os dados fluem atravs
destes ns. So elas: feedforward, limited recurrent e
fully recurrent.
2.6.2.2.1. Feedforward
Nvel de Sada
Nvel
Escondido

Nvel de Entrada
Figura B: Configurao feedforward

Os dados de entrada so colocados nos ns de


input, sendo atenuados ou aumentados pelos pesos das
conexes entre os ns, em um nico sentido, vindo a
afetar desta forma o valor dos ns de sada.
2.6.2.2.2. Limited Recurrent

Nvel de Sada

Nvel
Escondido

Nvel de
Entrada

Figura C: Configurao Limited Recurrent

44

Inteligncia Artificial

De forma semelhante, os dados so colocados


na entrada, sendo que, nesta topologia, h influncia
do fluxo de dados passado no clculo da sada atual, ou
seja h memria, porm esta influncia no se faz
com os dados da sada, apenas informaes
intermedirias so consideradas.

2.6.2.2.3. Fully Recurrent

Nvel de Sada

Nvel Escondido

Nvel de Entrada

Figura D: Configurao Fully Recurrent

Nesta topologia, as conexes entre os ns


internos e os de sada tm sentido duplo, permitindo a
realimentao dos dados da sada.
Esta caracterstica tem como conseqncia a
impossibilidade de previso do tempo de produo de
um output, visto que ela se torna auto-gerida.

45

Fernando Nogueira

2.6.2.3. O modelo de Back Propagation.


Uma determinada combinao de topologia,
aprendizado e algoritmo fornece um modelo. Cada modelo
visa uma adequao ao uso a que se destinam, seja
aprendizado rpido, timo, ou outra prioridade.
Este modelo se utiliza da topologia feedfoward,
com aprendizado supervisionado. Tem caractersticas
de uso geral e, apesar de ter boa capacidade, exige
configuraes computacionais relevantes.

erroj = tj - aj

aj = (net i)

Figura E: O Algoritmo Back-Propagation

Neste algoritmo a funo de sada das unidades


a funo identidade:

oj = a j
e, deste ponto em diante, o valor de ativao a
ser utilizado tanto como valor de sada de uma unidade
quanto como valor de entrada.

46

Inteligncia Artificial

A partir desta comparao obtm-se o erro na


sada, que o valor que se quer minimizar.
Pode-se estabelecer um valor de referncia, um
erro aceitvel, estando a rede treinada quando os erros
das suas sadas estiverem enquadrados nos valores de
referncia.
Alm do erro, que poder ser expresso sob sua
forma absoluta, quadrtica, mxima, ou outras de
conhecimento geral, pode-se tambm adotar como
medidas do treinamento da rede a Acurcia e a
Correlao Linear (entre as sadas calculadas e as sadas
padro).
1.1.1.1.

A funo de Ativao

Para corrigir-se os valores de sada, fazendo com


que se aproximem dos valores desejados, existe a funo
de ativao. Ela procura minimizar o gradiente das sadas,
denominada Regra de Delta Generalizada, obtendo a
convergncia entre os valores obtidos e esperados. As
funes mais apropriadas para este propsito so
aquelas com comportamento sigmoidal, sendo as mais
usadas as logstica e a tangente hiperblica (Gallant,
1994; Masters, 1994; in: Apostila de Redes Neurais

1
0,8
0,6
0,4
0,2

Artificiais).

0
x

(a) funo logstica

47

Fernando Nogueira

net

e j e j
aj = net net
e j +e j
net

0,8
0,6
0,4
0,2
0

-4

-0,2 0

3,9

-0,4
-0,6
-0,8
-1

Figura -F: Funes de ativao

O termo net j o valor da entrada total na unidade


j, dado por:

net j = w ji a i + j
i

onde j denominado bias (limiar) e pode ser


considerado como o peso de conexo com uma unidade
que tem o valor de sada igual a 1. Este termo ajustado
durante o treinamento pelo mesmo procedimento que
os demais pesos.
Cada parcela do somatrio acima, wji.ai ,
representa a contribuio de cada uma das unidades
do nvel inferior para a sada da unidade em questo.
Apesar de intuitivo, a escolha errada de uma
funo no impede o treinamento, apenas o retarda.
Existe uma tendncia a uma mais rpida
adaptao dos pesos das conexes para funes com

48

Inteligncia Artificial

valores positivos e negativos, como a tanh (Masters,


1994 in: Apostila de Redes Neurais Artificiais).
Alm das funes citadas, existem diversas
desenvolvidas para variadas aplicaes (Hertz et al.,
1990 in: Apostila de Redes Neurais Artificiais).
2.6.2.5. O clculo do erro.
O erro calculado da sada para a entrada,
utilizando-se da derivada parcial da funo de ativao.
No caso das funes citadas, seria:

Funo logstica

Funo tanh

Derivada parcial

Delta nas
unidades de sada

Delta nas
unidades escondidas

Tabela G: Deltas nas unidades

2.6.2.6. Quando parar?


Obtido o sinal de erro, pode-se determinar o fim
do treinamento atravs da comparao entre o valor
obtido e um valor arbitrado de referncia. No h
49

Fernando Nogueira

entretanto garantias de que se alcance este valor,


podendo ocorrer um super-treinamento da rede, que
no representa um aprendizado mas uma memorizao
do Banco de Dados de treinamento. Para evitar isso,
pode-se estabelecer que a rede cesse o treinamento
pelo nmero de pocas, que so as passagens do
treinamento pelo Banco de Dados (ciclo de aprendizado).
2.6.2.7. possvel acelerar-se a convergncia.
Pode-se acelerar a convergncia do aprendizado
atravs da adio de coeficientes Regra de Delta
Generalizada, coeficiente de smothing, ou simplesmente
alterando os valores da taxa de aprendizado e
momentum, a caracterstica de inrcia da rede a
grandes alteraes das conexes, que ocorrendo
gerariam um valor acentuado no gradiente das sadas,
instabilizando o aprendizado. H ainda a possibilidade
da incluso de termos de segunda ordem na funo de
ativao, entre outros mtodos (Hertz et al., 1990 in:
Apostila de Redes Neurais Artificiais).
2.6.2.8.

Aspectos relevantes.

No treinamento de uma rede pode-se chegar a um


valor de gradiente mnimo local, que no corresponde
condio de treinamento mxima possvel. Tal pode
ser evitado atravs do retreinamento da rede a partir
de pesos iniciais diferentes nas conexes. Existem
mtodos que prevem esta situao, como o de
(Vogl, 1988 in: Apostila de Redes Neurais Artificiais),
com bons resultados.

50

Inteligncia Artificial

A escolha dos pesos iniciais deve ser por valores


com pequena amplitude, podendo ser positivos ou
negativos, porm diferentes, entre [-2/z,2/z], onde
z a quantidade de entradas de uma unidade
(Gallant, 1994; in: Apostila de Redes Neurais
Artificiais). Uma rede com pesos iguais pode jamais
alcanar a condio tima de treinamento se esta
ocorrer para valores diferentes.

Devido amplitude dos valores da entrada, esta


necessita de tratamento para que a Rede Neural
tenha condies de treinamento. Como conseqncia
direta desta distoro dos dados, somada a limitao
intrnseca das Redes Neurais quanto a valores de
sada, faz-se necessrio recorrigi-lo na sada.

Um modelo com apenas um n invisvel capaz de


modelar qualquer funo contnua com qualquer grau
de acurcia, segundo Bigus (1996).

H muitas variaes do algoritmo original, entretanto


ele ainda o mais utilizado, principalmente devido
sua simplicidade e versatilidade.

Uma rede com um modelo de propagao retrgrada


pode facilmente modelar uma regresso linear, sem
necessitar sequer de ns invisveis. Entretanto, ao
adicionar-se um n invisvel, ela se torna no linear,
ficando capaz de realizar regresses logsticas
multivariveis, de forma superior s tcnicas
estatsticas, visto que podem ser geradas mltiplas
sadas simultneas.

De uma forma geral, o uso de Redes Neurais abrange


classificaes, modelagens e previses em sries

51

Fernando Nogueira

temporais.

Entre outros modelos menos populares, pode-se citar


o modelo de Kohonen, o modelo de Propagao
Retrgrada Recorrente, a modelo de Funo de Base
Radial, o da Teoria da Ressonncia Adaptativa e
das Redes Probabilsticas. Cada um tem suas
caractersticas e adequaes.

2.6.2.9. Condensado.
De forma sucinta, a lgica das Redes Neurais
consiste de trs fases:
1. Um dado fornecido a um n de entrada,
encaminhado aos ns intermedirios, gerando um
valor nos ns de sada. Esta a previso obtida.
2. Compara-se o vetor previso obtido com os valores
conhecidos, j que o aprendizado supervisionado.
Da subtrao de um pelo outro, gerado um sinal
de erro.
3. O sinal de erro enviado de volta, atravs das
conexes, onde so obtidas suas contribuies para
aquele.

52

Inteligncia Artificial

3. METODOLOGIA

3.1. Tipo de pesquisa


Utilizando a tipologia de Vergara (1991), este
estudo se classifica quanto aos fins como exploratria,
visto que se realizar em uma rea com pouco
conhecimento acumulado, qual seja a utilizao de
ferramentas de Inteligncia Artificial na anlise do
desempenho de empresas.
Quanto aos meios de investigao, uma
pesquisa bibliogrfica, uma vez que se utilizar de Bancos
de Dados publicados.
3.2. Universo e Amostra
O universo da pesquisa so as empresas
nacionais, de diversas indstrias, que tenham aes
em bolsas de valores.
3.3.

Coleta de Dados

Foram consultados os Bancos de Dados


disponveis no programa Economtica.

53

Fernando Nogueira

3.4. A Anlise dos Dados


3.4.1. A metodologia proposta
Neste estudo prope-se a utilizao das duas
ferramentas, rvores de Deciso e Redes Neurais, em
cadeia. Ou seja, submete-se o Banco de Dados anlise
por rvores de Deciso, seguida pela anlise por Redes
Neurais.
Tal ordenao visa explorar-se a caracterstica
de robustez e classificadora das rvores de Deciso,
uma vez que se dispe de um Banco de Dados
relativamente desconhecido, podendo inclusive conter
parcela relevante de dados incompletos ou com rudos.
Aps adquirida alguma base de conhecimento,
pode-se partir para a utilizao de Redes Neurais, menos
robustas presena de variveis esprias.
Entretanto, esta utilizao vem a requerer um
tratamento de dados prvio, onde se devem retirar os
campos incompletos, bem como os dados claramente
errados.
3.4.1.1.

As vantagens

Da utilizao desta metodologia verifica-se a


possibilidade de se criar uma base de conhecimento
inicial, na verdade uma classificao, obtida pelas
rvores de Deciso, para ento partir-se para as Redes
Neurais, em uma condio de utilizao mais segura.

54

Inteligncia Artificial

3.4.1.2. Em que casos seria mais conveniente?


Esta metodologia se adequa a estudos em que
se queira abrir o leque de variveis, bem como queles
em que se dispe de um Banco de Dados de grandes
dimenses, em registros e em campos. Se aplica tambm
a Bancos de Dados em que se tenha pouco, ou nenhum
conhecimento prvio, no se viabilizando uma seleo
de variveis.
Para buscas conservadoras, em Bancos de Dados
pequenos, pode-se tentar diretamente as Redes Neurais,
caso a classificao seja dispensvel.
A Anlise dos dados efetuou-se nas seguintes fases:
Obteno dos dados
Classificao dos dados
Tentativa de previso
Testes
Estas etapas sero oportunamente explodidas,
de forma sucinta se referiro a:
Obteno de dados: Atravs dos Bancos de
Dados disponveis no programa Economtica,
observando-se a qualidade dos dados, a possibilidade
de explicao dos fenmenos a serem medidos e a
quantidade de dados disponveis, entre outras.
Classificao dos dados: Atravs da utilizao
de rvores de Deciso, se buscar classificar os dados
de acordo com os tipos de sadas fornecidas. Esta
classificao explicitar as variveis de maior relevncia
na explicao das variveis de sada, o que servir de
subsdio ao passo seguinte.

55

Fernando Nogueira

Tentativa de Previso: Utilizando-se de Redes


Neurais, e com uma expectativa de variveis mais
relevantes obtidas com as rvores de Deciso, se
tentar prever o comportamento das variveis de sada.
Testes: Parte do Banco de Dados ter sido
separada para que seja testado, e validado, o modelo
obtido.
3.5. Limitaes do Mtodo
Esta pesquisa se limita a estudar os fatores
financeiros das empresas, o que explica apenas em parte
seus desempenhos.
Em nosso pas, devido atual poltica fiscal, devese olhar com restries os dados, mesmo oficiais,
fornecidos pelas empresas. Para ilustrar tal afirmao,
no ano de 1995, apenas 25% das 500 maiores empresas
nacionais , em vendas, tiveram lucro superior a 6% no
ano. Ou seja, 75% sequer se igualaram ao rendimento
mnimo garantido pela caderneta de poupana.
A inexistncia de Bancos de Dados abrangentes
sobre empresas brasileiras pode obrigar a utilizao de
empresas de segmentos distintos, forando
generalizaes que significaro perda de informaes.

3.6.

O escopo e a avaliao do estudo.

Neste estudo no se foca as ferramentas,


evitando-se entrar em detalhes de setagens e dos
efeitos conseguidos em cada opo, bem como nos

56

Inteligncia Artificial

labirintos da Inteligncia Artificial. Apesar de ser


necessria a aquisio deste conhecimento para o
sucesso da proposta, seu detalhamento tiraria a ateno
do estudo da metodologia para as ferramentas.
Evita-se tambm a interferncia dos especialista
no processo, tanto quanto possvel, o que poderia
influenciar os resultados. Apesar de haver crticas aos
resultados parciais, no se permitiu a influncia sobre o
processo, o que refora a proposta inicial, de que muitas
vezes se desconhece os modelos reais, devido aos
paradigmas vigentes, que no permitem que se teste
algumas hipteses.
Considera-se a validao da amostra de teste
por Redes Neurais como suficiente para a avaliao do
processo, observando-se s ento sua consistncia.
Ou seja, se esta metodologia for capaz de prever a
rentabilidade de empresas, ela consistente, ao menos
para as caractersticas da amostra.

57

4. O EXPERIMENTO

4.1. Rodando as rvores de Deciso


4.1.1. Economtica a origem dos Dados.
Em uma breve descrio do programa, este se
destina a prover informaes financeiras e
mercadolgicas, entre outras, das empresas que tm
aes nas Bolsas de Valores brasileiras.
Estas informaes so de grande diversidade,
especialmente as de carter financeiro, sendo
disponibilizados, alm de dados crus, diversos
cruzamentos relevantes de dados, sempre visando
anlises do desempenho passado e presente, bem como
extrapolaes para comportamentos futuros.
So disponibilizadas tambm sries histricas de
dados e pareceres sobre os ambientes destas empresas.
1.1.2. O Banco de Dados .
O Banco de Dados foi obtido atravs do programa
Economtica licenciado para a PUC-Rio.
Dentro da grande gama de informaes
oferecidas, foram selecionadas as que, a priori, seriam

Fernando Nogueira

indicadoras do desempenho das empresas. Nesta parte


se fez uso do especialista, o Prof. Dr. Jorge Ferreira da
Silva, que conduziu esta seleo, tendo sido eleitos os
seguintes indicadores:

Indicador
Rentabilidade sobre Ativos no ltimo Balano
Rentabilidade sobre o Patrimnio Lquido no ltimo
Balano
Alavancagem Financeira no ltimo Balano
Alavancagem Operacional no ltimo balano
Ativos Permanentes no ltimo Balano
Ativo Imobilizado no ltimo balano
Salrios e Encargos no ltimo Balano
Passivo Circulante
Custo dos Produtos Vendidos
Despesas Administrativas
Lucro Antes do Imposto de Renda
Incentivos Fiscais
Aumento das Aes na Tesouraria
Setor

60

Inteligncia Artificial

4.1.3. O formato.
Apesar da aparente facilidade na obteno dos
dados, tal aspecto no se estende ao formato em que
ele disponibilizado.
O programa fornece um arquivo texto com
padres de formatao que requerem tratamento, a fim
de serem entendidos por programas de anlise de dados.
4.1.4. Registros invlidos.
Outra preocupao que deve ser considerada
a existncia de grande parcela de registros com campos
parcialmente fornecidos. Na verdade eles chegam a
compor cerca de 45% do Banco de Dados para os
indicadores que foram selecionados. Estes registros
devem ser tratados, no caso eliminados, para que no
haja o comprometimento das anlises pelos Bancos de
Dados .
Inicialmente este Banco de Dados oferecia 540
registros contendo os dados selecionados (4.1.2.) das
aes negociadas nas bolsas brasileiras. Aps uma
filtragem inicial, retirando apenas os registros com mais
da metade dos campos em branco (no fornecidos) e
as empresas que tivessem mais de uma ao na bolsa
de valores, passou-se a contar com 290 registros (7.1.),
que foram os submetidos, aps tratamento, anlise
por rvores de Deciso.
4.1.5. O experimento.
Para a realizao da anlise por rvores de
Deciso, foram seguidos os seguintes passos:
61

Fernando Nogueira

1. Tratamento dos dados. De posse dos dados


disponibilizados no sistema Economtica, em arquivo
.txt, foi gerado um Banco de Dados em dBase3, com
formatao compreensvel pelo programa Profiler. Na
gerao deste arquivo cumpriram-se as etapas que
se seguem:
Converso do Banco de Dados para o formato
Excel, onde pudesse ser manipulado e
formatado.
Reformatao do Banco de Dados, visto que
o arquivo gerado pelo Economtica tem
formatao inadequada anlise, possuindo
linhas em branco com finalidade puramente
esttica, tornando-se incompreensvel para
outros programas;
Eliminao dos registros com poucos campos
disponveis, o que se mostrou uma
necessidade relevante pelo fato de haver
muitas aes com falta de poro significativa
de parmetros (cerca de 45%);
Gerao do Banco de Dados em dBase3 (para
ser entendido pela interface ODBC);
Submisso do Banco de Dados ao Administrador
de ODBC.
2. Anlise do Banco de Dados, utilizando o
programa Profiler.
Escolha da varivel endgena, Rentabilidade sobre
o Patrimnio - apenas uma pode ser escolhida bem como a excluso daquelas que no serviriam
como exgenas, por exemplo: NOME, Rentabilidade
Sobre Ativos e LAIR (que certamente teriam

62

Inteligncia Artificial

grandes correlaes com a Rentabilidade sobre o


Patrimnio).
Determinao dos parmetros de induo da rvore
de Deciso. Neste ponto so escolhidos os
principais parmetros que o programa utilizar para
as divises do Banco de Dados. So eles:

Parmetro

Setagem

Menor Conjunto Admissvel

Esta setagem permite adequar a


complexidade do modelo que ser
gerado. Ao limitar-se os
subconjuntos a valores maiores,
perde-se informao, por estar
sendo mais generalista, porm a
compreenso fica privilegiada, bem
como os rudos existentes perdem
parte da sua capacidade de
comprometer a rvore a ser
gerada.
Critrio de Diviso

Entropia

Apesar de ser recomendado o uso da


entropia para variveis endgenas
discretas, pode-se optar pelo critrio
Chi-quadrado.
Mxima significncia por ramo
Para variveis endgenas
discretas deve-se utilizar o valor
0,5%, para variveis endgenas
contnuas pode-se ajust-lo para
outros valores ( de 0,1% at 5,0%).

63

0,5%

Fernando Nogueira

Alm destes parmetros, h tambm os que so


considerados como default pelo programa, porm de
relevncia para a rvore de Deciso. Estes fogem ao
escopo do trabalho.

Induo da rvore, propriamente dita. Ao determinarse ao programa que induza automaticamente a


rvore de Deciso, este procede com os passos
citados no respectivo captulo, efetuando as
subdivises sucessivas, otimizando os parmetros
de induo da rvore.

Anlise da rvore obtida. O especialista avalia a


rvore gerada, bem como os indicadores de qualidade
oferecidos pelo programa, como o desvio padro,
para o caso de variveis contnuas.

Cabe aqui ressaltar que, como foi adotada uma


varivel contnua como endgena, esbarrou-se nas
limitaes do algoritmo (Quinlan, 96). Obteve-se ento
elevados valores de desvio padro, ressaltando esta
limitao. Isto gerou a necessidade de voltar-se ao
tratamento do Banco de Dados, com a criao de uma
varivel discreta que retratasse a rentabilidade sobre o
patrimnio.
Tal procedimento, visivelmente limitador da gama
de variao da varivel endgena, no traz grande
impacto adequao da utilizao de rvores de
Deciso, visto que sua proposta classificadora, e no
previsora. A sua razo pode ser explicada at
intuitivamente, uma vez que, ao tratar-se uma varivel
de forma contnua, automaticamente dispe-se de muito
menos registros para cada nvel de classificao.

64

Inteligncia Artificial

rvore 1 (ver anexo)


Do ponto de vista prtico, e no matemtico,
questiona-se o grau de certeza que se possa conferir a
dados de rentabilidade diferentes por at alguns pontos
percentuais, em um mercado com a volatilidade do nosso,
bem como com o grau de confiabilidade que se possa
conferir aos dados financeiros fornecidos pelas empresas
em um pas com a atual legislao fiscal, o mesmo
valendo para a nossa fiscalizao das leis...
Desta forma, considera-se a limitao que se
impe, pela utilizao de uma varivel classificadora
discreta, sem impacto significativo para o mtodo aqui
proposto, no qual as rvores de Deciso tm papel
classificador apenas.
Voltando-se induo, obteve-se uma nova
rvore, que ser exposta a seguir, na qual foram
oferecidos nveis de probabilidades de grande relevncia
e com excelente grau de explicao, retomando o
binmio, anlise versus poder de compreenso.
Brindaram-se nesta nova rvore os trs nveis de
classificao, existindo folhas com excelente nvel de
segmentao e de representatividade, ou seja, com
quantidades relevantes de ocorrncias e com elevada
acurcia.
Classificao
Rentabilidade maior que 10%
Rentabilidade entre 0 e 10%
Rentabilidade menor que 0%
< Total>

Acurcia
61,1%
60,6%
69,7%
63,6%

65

Fernando Nogueira

Entretanto, devido impossibilidade de utilizao


da varivel SETOR por Redes Neurais, esta foi
desabilitada, obtendo-se uma nova rvore, cujos nveis
de acurcia foram os seguintes:
Classificao

Acurcia

Rentabilidade maior que 10%

75,5%

Rentabilidade entre 0 e 10%

50,0%

Rentabilidade menor que 0%

52,8%

< Total>

60,1%

Demonstrando a importncia do SETOR para a


classificao das empresas como sensvel, porm no
indispensvel.

rvore 2 (vide anexo)


O refinamento da rvore. Ao permitir-se maior
grau de liberdade na segmentao dos subgrupos das
rvores, que se obteve ao diminuir-se a quantidade
mnima de ocorrncia por grupos, de 10 para 5 empresas,
observou-se uma grande consistncia com a rvore
obtida anteriormente, o que ratifica a qualidade daquela.

Classificao

Acurcia

Rentabilidade maior que 10%


Rentabilidade entre 0 e 10%
Rentabilidade menor que 0%
< Total>

66

75,0%
50,0%
60,7%
62,5%

Inteligncia Artificial

rvore 3 (vide anexo)


4.1.6. Gerao das Regras.
O programa gera as regras obtidas pela rvore,
podendo ser fornecidos os cdigos de implementao
em diversas linguagens, bem como em lgica.
As regras a seguir foram obtidas em um estgio
intermedirio da anlise.
Rules To Reach Leaf Profile 1
IF ALAFIN_ULB < -0.463619834
AND SETOR = Energia OR Mineracao OR Papel
Cel OR Brinquedo
THEN RENT_DISCR = menor10 (Probability =
0.7143)

Rules To Reach Leaf Profile 2


IF ALAFIN_ULB < -0.463619834
AND ALAOPE_ULB < 0.736163792
AND SETOR = Textil OR Petro Qui OR Alimento
OR Siderurgi OR Construto OR Mat Trans OR Quimica
OR Madeira OR Seguros OR Informati
THEN RENT_DISCR = maior10 (Probability =
0.6000)

Rules To Reach Leaf Profile 3


IF ALAFIN_ULB < -0.463619834
AND ALAOPE_ULB >= 0.736163792
AND SETOR = Textil OR Petro Qui OR Alimento
OR Siderurgi OR Construto OR Mat Trans OR Quimica
OR Madeira OR Seguros OR Informati
THEN RENT_DISCR = menor0 (Probability =
0.9091)

67

Fernando Nogueira

No Anexo 7.2.1. encontra-se a totalidade das


regras obtidas. Apenas para exemplificao, encontrase no anexo 7.2.2. o cdigo automaticamente gerado
na linguagem C e, no anexo 7.2.3., o cdigo em SAS.
Para cada folha a que nossa rvore chegou, fica
estabelecida uma regra que segmenta os grupos que a
compe e a probabilidade associada.
Estas regras so de fcil compreenso, o que j
fora ressaltado como uma importante caracterstica
desta ferramenta.
4.1.7. Concluses sobre rvores de Deciso.
4.1.7.1. A ferramenta.
As rvores de Deciso se comprovaram como
uma poderosa ferramenta classificadora.
Chegou-se a resultados relevantes e de fcil
compreenso.
Ao selecionar as variveis inseridas nas anlises,
no se tinha a noo das diferenas de importncia de
cada uma na explicao dos padres existentes. Estes
sequer eram conhecidos, o que normalmente se
resolveria atravs de uma anlise estatstica. Entretanto,
utilizando-se de rvores de Deciso, isto foi alcanado
rapidamente e com resultados de fcil digesto.
O programa desconsiderou

parcela relevante,

em quantidade, das variveis prioristicamente eleitas,


o que entretanto no causou perda da capacidade de
explicao do fenmeno, atravs de uma segmentao
abrangente . Isto comprova a qualidade desta
68

Inteligncia Artificial

metodologia de que se faam estudos de uma forma


mais ousada, visto que o prmio a ser pago muito
mais baixo do que os das atuais metodologias, o que
certamente permitir associaes que antes seriam
evitadas devido ao tempo que custariam e por poderem
comprometer os resultados gerais.
Os resultados obtidos por rvores de Deciso
sero validados por Redes Neurais. Isto se implementar
atravs da utilizao de trs Bancos de Dados, sendo
um total e dois complementares e o mais excludentes
possvel (no havendo comprometimento pela falta de
dados), extrados do Banco de Dados geral, contendo
ou no os parmetros eleitos nesta etapa.
4.1.7.2. As regras.
A anlise ressaltou a importncia das
Alavancagens Financeira e Operacional, indicadores
crticos que, se por um lado viabilizam a existncia de
uma empresa, podem tambm drenar sua lucratividade.
Outro indicador que mereceu destaque foi o
Setor, uma vez que cada qual tem o seu perfil
financeiro, ou mesmo passa por momento distinto dos
demais. A eleio deste valida o modelo que percebeu
estes perfis especficos, chegando a agrup-los, talvez
em conjuntos que no seriam intudos.
A rvore percebeu a significncia de Setor, , a
nica varivel no financeira, o que consistente com
o fato de setores da economia terem perfis e
rentabilidade distintas.

69

Fernando Nogueira

Ao retirar-se Setor do estudo, uma vez que no


poderia ser utilizado pelas Redes Neurais, observou-se
ainda uma classificao satisfatria.
Finalmente os Ativos Permanentes, que na
verdade um forte indicador da dimenso do negcio,
ressaltando as oportunidades de ganhos em escala.
4.2.

Rodando as Redes Neurais.

4.2.1. Utilizando todos os parmetros dos Bancos


de Dados.
4.2.1.1. Rodando
Para a realizao da tentativa de previso por
Redes Neurais, foram seguidos os seguintes passos:
1. Tratamento dos dados. De posse dos dados
disponibilizados no sistema Economtica, em arquivo
.txt, foi gerado um Banco de Dados em Excel,
podendo ou no efetuar-se um tratamento preliminar
dos dados. Na gerao deste Banco de Dados
cumpriram-se as etapas que se seguem:
Eliminao dos registros com poucos campos
disponveis, de forma semelhante ao que se
fez com rvores de Deciso, porm com maior
nfase e durante o treinamento da rede
(recurso do software), visto que a existncia
de registros esprios tem grande efeito
negativo no treinamento. Neste Banco de
Dados constatou-se a existncia de algumas
aes com falta de poro significativa de
parmetros, assim como dados claramente
70

Inteligncia Artificial

absurdos. Aps este tratamento, o Banco de


Dados possua 268 registros.
2. Anlise do Banco de Dados, utilizando o
programa Thinks Pro.
Etapas:
Escolha da varivel endgena (apenas uma
pode ser escolhida), bem como a excluso
daquelas que no serviriam como exgenas,
por exemplo: NOME, Rentabilidade Sobre Ativos
(que certamente teria uma grande correlao
com a Rentabilidade sobre o Patrimnio que
foi escolhida como varivel endgena), bem
como qualquer varivel no numrica, no caso
Setor. Observa-se que variveis discretas so
encaradas como contnuas.
Determinao dos parmetros de
treinamento da Rede Neural. So eles:
Parmetro

Setagem

Arquitetura

Multi Layer Full Feed Forward

Tipo de erro

Mdia do erro quadrtico

Layers

5 (Input, Output e 3 Ocultos)

Regra de Aprendizado Propagao Retrgrada Normal (para todos)


Funo de tratamento SumSq=1 (Input)
de entradas

L2 dist (Ocultos)
Dot Prot (Output)

71

Fernando Nogueira

Alm destes parmetros h tambm os que so


considerados como default pelo programa (Ward Systems
Group, 1993), porm de relevncia para a Rede Neural.
Estes fogem ao escopo do trabalho.
Treinamento da Rede, propriamente dito. Ao
determinar-se ao programa que treine
automaticamente a Rede Neural, este procede
com os passos citados no respectivo captulo,
adequando os pesos das conexes. Durante
o treinamento feito o acompanhamento dos
valores de erro total, mdio e mximo, bem
como a porcentagem de acerto da amostra
de treinamento, ou de teste, que se baseia
nos valores setados de tolerncia.
Acompanhamento do treinamento. Devese observar que falsa a impresso de que o
continuado treinamento melhora o aprendizado
da rede. Ao contrrio, a saturao do
treinamento bitola a rede que perde a
capacidade de extrapolar seu aprendizado
para amostras inditas, limitando-se o acerto
quelas da amostra de treinamento.
Ajustes nas setagens da rede. Podem ser
experimentadas variaes nos parmetros de
treinamento da rede, sejam estes na
quantidade
de
ns
ocultos,
no
preprocessamento dos dados, na topologia de
rede, ou qualquer outro disponibilizado pelo
software. A tabela abaixo demonstra outras
variaes tentadas neste experimento:

72

Inteligncia Artificial

Arquitetura

Multilayer
Full Feed
Forward

Multilayer
Full Feed
Forward

Multilayer
Full Feed
Forward

Multilayer
Full Feed
Forward

Tratamento
das entradas

sum sqr=1

sum sqr=1

sum sqr=1

feito no BD

Erro mximo

44.31

42.78

43.49

32.63

Erro mdio

4.95

4.89

4.89

7.37

Classificao
Correta

72.2

73.2

72.9

73.2

Layers

Tolerncia
(%)

4.2.1.2. Resultados
Alm dos nveis alcanados no conjunto de
treinamento, faz-se essencial a validao do
aprendizado, para tal fazendo-se uso de amostra indita.
No caso utilizou-se uma que fosse representativa do
Banco de Dados, ou seja, possusse uma distribuio
de nveis de sada semelhante do conjunto de
treinamento. Esta amostra possua 24 registros.
A seguir os resultados definitivos que foram
obtidos, aps otimizaes e ajustes na rede:

Arquitetura
Layers
Tratamento das
entradas

Conjunto de
Treinamento
Multilayer Full Feed
Forward
5
sum sqr=1

73

Conjunto de Teste
N/A
5
sum sqr=1

Fernando Nogueira

Erro mximo
Erro mdio
Classificao
Correta (%)
Tolerncia (%)

14,13
3,01
78,25

8,44
2,83
70,83

4.2.2. Rodando com os parmetros eleitos na rvore de Deciso.


4.2.2.1. Rodando
Seguiu-se nesta etapa os mesmos passos do
ensaio que o precedeu (considerando todas as variveis
disponveis).
Tentou-se entretanto avaliar a relevncia da
classificao obtida com a utilizao de rvores de
Deciso. Para tal efetuaram-se dois experimentos, um
com contendo as variveis eleitas e outro com as
demais.
As variveis eleitas:
Alavancagem Financeira
Alavancagem Operacional
Ativos Permanentes
Alm destas observou-se o destaque dos Salrios
e Encargos e dos Incentivos Fiscais, entretanto no
foram ratificados devido aos elevados nveis de dados
no fornecidos.
Observou-se uma limitao do s o f t w a r e
disponvel, devida utilizao de parmetros insuficientes

74

Inteligncia Artificial

(em quantidade, no em poder de explicao) para a


arquitetura vigente.
Objetivando no alter-la, evitando que os
resultados obtidos fossem comprometidos ou privilegiados
por uma diferena de setagem, optou-se por incluir uma
varivel a mais, escolhida entre as no eleitas,
mantendo-se assim a setagem anterior da rede.
Esta varivel extra foi trocada por outras
igualmente no eleitas, procurando-se variaes de
desempenho que indicassem que aquela seria um varivel
relevante, apesar de no eleita. Como esperado, isto
no ocorreu, obtendo-se nveis de treinamento e
validao semelhantes em todas as composies
testadas.

4.2.2.2. Resultados
Conjunto de Conjunto de Conjunto de
Treinament
Teste
Treinament
o
o
Arquitetura
Layers
Tratamento
das entradas

Erro mximo
Erro mdio
Classificao
Correta (%)
Tolerncia
(%)

Conjunto
de Teste

Multilayer Full
Feed Forward

N/A

Multilayer Full
Feed Forward

N/A

sum sqr=1

sum sqr=1

sum sqr=1

sum sqr=1

L2 dist

L2 dist

L2 dist

L2 dist

Dot prot

Dot prot

Dot prot

Dot prot

14,30

5,45

28,46

11,48

3,18

2,81

5,57

6,98

77,63

73,33

63,73

20,00

75

Fernando Nogueira

4.2.3. Concluses sobre Redes Neurais


O papel de previsor das Redes Neurais foi
cumprido de forma plenamente satisfatria. Os
resultados obtidos, com as respectivas validaes,
alcanaram ndices de acurcia incomuns.
Evitou-se agregar ao experimento influncias
baseadas no conhecimento de especialistas. Isto s se
fez na escolha inicial das variveis que compuseram o
estudo, sendo que mesmo essas se mostraram um
universo muito maior do que o necessrio para chegarse aos objetivos desejados.
O conhecimento que foi aproveitado como ponto
de partida para a anlise com Redes Neurais foi apenas
o obtido atravs da utilizao das rvores de Deciso,
sendo que se confirmou a eficcia daquelas ao validarse as escolhas feitas por estas, obtendo-se ndices de
aprendizado completamente comprometidos ao retirarse os indicadores eleitos pelas rvores de Deciso do
conjunto de treinamento.
As Redes Neurais que, divergindo das rvores
de Deciso, apresentam maior sensibilidade a rudos,
exigiram uma maior precauo com os dados e
experimentos testados. Este cuidado foi tomado e notouse a evoluo dos resultados ao filtrar-se dados
visivelmente esprios, ou com lacunas relevantes. Desta
forma evoluiu-se de ndices de aprendizado inferiores a
50% para os valores finais listados.
Conforme esperado, validou-se a utilizao de
rvores de Deciso. Os nveis de treinamento das redes
alcanados demonstraram que as variveis eleitas
76

Inteligncia Artificial

explicaram o fenmeno, uma vez que ofereceram nveis


de treinamento semelhantes aos obtidos com o Banco
de Dados geral.
No sentido contrrio, a utilizao de variveis
descartadas pelas rvores de Deciso, oferecem nveis
de acurcia insignificantes nas amostras de teste, da
ordem de 20%, ou seja, nenhum, visto que, ao aplicarse um valor constante e igual a zero a todas as sadas
(nenhum aprendizado), obtm-se nveis desta ordem,
pela simples distribuio dos valores endgenos.

77

5. C ONCLUSES

SOBRE O

E STUDO

5.1. Das Ferramentas


A metodologia proposta demonstrou ter
qualidades que a tornam extremamente atrativa para
realizao de anlises de dados tabulados de empresas.
Entre estas qualidades, cabe ressaltar o seu
poder previsor e classificador, mesmo partindo-se de
dados em excesso e, em especial, no caso de rvores
de Deciso contendo rudos e inconsistncias.
Outro importante aspecto que no pode ser
descartado a facilidade e a rapidez que ele oferece.
O mtodo efetivamente inteligente e isto se faz
notar pela baixa necessidade de interferncia do usurio
no processo. Na verdade, tal interferncia se efetivou
essencialmente no tratamento dos dados para a previso
por Redes Neurais, e nas escolhas dos parmetros de
aprendizado, sejam eles as tolerncias, o tipo de
tratamento de dados iniciais e a arquitetura mais
adequada.
Apesar de ter sido proposta a utilizao de
rvores de Deciso seguida pela de Redes Neurais, cada
ferramenta pode ser utilizada separadamente, sendo

Fernando Nogueira

isto decidido em funo da necessidade de classificar


ou prever. Na verdade foram feitas para serem
ferramentas autnomas, sendo a sugesto do
acoplamento entre elas originria deste estudo, o que
se mostrou til, mas no essencial para o Banco de
Dados utilizado.
Por parte das rvores de Deciso, sendo
adequada a classificao e as regras por ela oferecidas,
esta funciona eficiente e robustamente quanto
qualidade dos dados e existncia de informaes
suprfluas.
Entretanto, ao considerar-se as Redes Neurais,
surge a necessidade de se ter melhor definido o escopo
das variveis mais relevantes no fenmeno. Tal se deve
ao fato da funo previsora ser muito mais sensvel aos
rudos que a classificadora.
A se evidenciou a validade da metodologia
proposta, uma vez que as rvores de Deciso
proporcionaram foco ao estudo por Redes Neurais. Este
foco, no caso de Bancos de Dados muito extensos, em
registros ou em campos, representaria um poderoso
catalisador, evitando que as Redes Neurais tentassem
o aprendizado em um Banco de Dados maior e pior.
Mesmo antes disso, a filtragem de rudos ocorreria em
um maior nmero de campos.
5.2. Do conhecimento extrado do Banco de Dados.
Alm da classificao e da previso conseguidas,
j comentadas nos captulos de rvores de Deciso e
Redes Neurais, respectivamente, observou-se um padro
existente no Banco de Dados, caracterstico da nossa
80

Inteligncia Artificial

economia, que certamente contribuiu para os elevados


nveis obtidos na classificao e previso: o peso da
administrao financeira no desempenho das empresas.
Conforme comentado na Delimitao do Estudo
(1.3.), o Banco de Dados estudado carente de
informaes de diversas naturezas, entre elas, capital
intelectual, satisfao dos stakeholders, valor da marca,
qualidade dos processos, etc..
O fato desta limitao no comprometer a
capacidade de previso de rentabilidade das empresas
demonstra a distoro ainda existente no nosso pas, o
domnio da administrao financeira sobre as demais
atividades das empresas, refletido na possibilidade de
dispensa de outros indicadores, sem comprometimento
dos resultados.
Tal se deve obviamente atual poltica de juros,
que tomam uma dimenso comparvel, em muitos casos
superior, ao lucro operacional das empresas.
Se intuitivamente seria esperado que, quatro
anos aps a estabilizao da economia, os desempenhos
das empresas teriam uma explicao menos financeira
e mais produtiva (competitividade produtiva), uma vez
que se deixara o ambiente inflacionrio, tal no se
efetivou ainda, uma vez que as empresas pagam um
custo muito elevado pelo seu financiamento, deixando
a muito do que geram.
Sugere-se batizar o padro descoberto com a
original alcunha de :
CUSTO BRASIL.

81

6. BIBLIOGRAFIA

AGRAWAL, R., MANNILA, H., SRIKANT, R., TOIVONEM,


H., VERKANO, I.
1996
Fast Discovery of Association Rules.:
Advances in Knowledge Discovery and
Data Mining, MIT Press, pp. 307-329.
A.A.
1997
A.A.
1997

Apostila de Redes Neurais Artificiais,


Programa de Engenharia Civil da COPPE/UFRJ.
Attar Software XpertRule Profiler.
Documentao do Programa.

BIGUS, J. P.
1996
Data Mining with Neural Networks , 1 ed.
USA, McGraw-Hill.
BREIMAN, L. FRIEDMAN, J. H. OLSHEN, R. A., STONE, C. J.
1984
Classification and Decision Trees, 1 ed.
Monterrey, California, USA, Wadsworth &
Brooks.
FAYYAD, M., SHAPIRO, P. SMYTH, P., UTHURUSAMY, R.
1996
Preface. Advances in Knowledge Discovery and Data Mining. MIT Press, pp.xiii- xiv.

Fernando Nogueira

FENG, C. MICHIE, D.
1994
Machine Learning of Rules and Trees.
Machine Learning, Neural and Statistical
Classification, Ellis Horwood Series in
Artificial Intelligence, pp 50-84.
GAINES, B. R.
1996
Transforming Rules and Trees into
Comprehensible Knowledge Structures.
Advances in Knowledge Discovery and
Data Mining, MIT Press, pp 205-229.
GALLANT, STEPHEN I.
1994
Neural Network Learning and Expert
Systems, MIT Press, Cambridge.
GUYON, I., MATIC, N. VAPNIK, V.
1998
Discovering Informative Patterns and Data
Cleaning. Advances in Knowledge
Discovery and Data Mining. MIT Press, pp.
181-205.
HERTZ, J., KROGH, A., PALMER, R. G.
1990
Introduction to the Theory of Neural
Computing, Addison Wesley Publishing
Company,
LU, H., SETIONO, R.,LIU, H.
1996
Efective Data Mining Using Neural Networks,
IEEE Transactions on Knowledge and Data
Engineering, v. 8, n. 6, pp 957-961
MANNILA, H.
1997
Methods and Problems in Data Mining,
Proceedings of Internacional Conference
on Database Theory, Greece

84

Inteligncia Artificial

MICHIE, D. SPIEGELHALTER, D. J. TAYLOR, C. C.


1994
Introduction. Machine Learning, Neural
and Statistical Classification, Ellis Horwood
Series in Artificial Intelligence, pp 1-5
QUINLAN, J.
1996
Improved Use of Continuos Attributes in
C4.5. Journal of Artificial Intelligence
Research 4. AI Access Foundation and
Morgan Kaufmann Publishers, pp 77-90
QUINLAN, J.
1993
C4.5: Programs for Machine Learning. San
Mateo, Calif.: Morgan Kaufmann
SMITH, M.
1996
Neural Networks for Statistical Modeling,
1 ed. USA, International Thomson Computer
Press,.
VERGARA, Sylvia Constant.
1991
Sugesto para estruturao de um Projeto de
Pesquisa. Cadernos de Pesquisa EBAP 02/
91. Rio de Janeiro: Fundao Getlio Vargas
VOGL, T. P., Mangis, J. K., Rigler, A. K., Zink, W. T.,
Alkon, D. L.
1988
Accelerating the Convergence of the
Backpropagation Method, Biological
Cybernetics, Vol.4-5, N5, pp.257-263
A.A.
1993

Ward Systems Group, documentao do


programa NeuroShell 2.

85

7. ANEXOS

7.1. Listagem de Empresas


MPRESA
RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULB
IMOBIL_ULB
Acesita P
0
0
5
0
0
Acos Vill
-4
-40
3
576257000 479584000
Adubos Tr
1
0
6
117537000 114685000
Agrale PN
1
1
-4
28581000
21868000
Agroceres
-15
12
-3
24568000
24115000
Albarus O
16
1
4
141654000
51065000
Alpargata
3
1
3
358935000 316976000
Alpargata
-20
1
-9
229234000 118622000
Amadeo Ro
-2
-1
-1
32137000
15554000
America d
1
249664000 139130000
Antarctic
14
3
2
106732000
87040000
Antarctic
6
1
4
390153000 139036000
Antarctic
3
1
5
0
447758000
Antarctic
0
0
6
118919000
91815000
Arno PN
9
2
3
58296000
54566000
Artex PN
-34
8
10
94689000
60254000
Avipal ON
4
2
3
432814000 192452000
Azevedo P
-57
3
0
19799000
8606000
Bahema PN
11
1
1
39678000
1454000
Bahia Sul
-6
-8
3
0
0
Bandeiran
-3
368758000
87698000
Banrisul
-1
197449000
80335000
Bardella
6
-4
-1
80016000
32904000
BCN PN
-1
863551000
51105000
Belgo Min
3
1
2
0
628205000
Bemge PN
0
245275000
68178000
Besc PNB
1
127709000
59755000
Beta PNA
-22
2
0
27444000
27334000
Bic Caloi
-61
-8
0
98994000
34365000
Biobras P
19
2
4
15750000
14263000
Boavista
-8
430608000
42358000
Bombril P
3
1
4
758552000
73907000
Bompreco
5
1
9
523586000 270243000
Bradesco
2
0
602322000
Brahma PN
12
2
2
0
0
Brampac P
-31
10
0
100124000
4293000

Fernando Nogueira

Brasil PN
Brasilit
Brasinca
Brasperol
Brazil Re
Brumadinh
Buettner
C R T ON
Cach Dour
Cacique P
Caemi Met
Cambuci P
Casa Angl
CBV Ind M
CEB PN

1
28
-6
-3
6
-7
-19
4
0
4
1
-6
5
15
5

1
-9
-2
3
1
12
1
0
14
-1
6
2
3
1

9
-9
2
2
0
7
2
3
7
0
-14
1
2
4

0
249940000
63850000
100880000
136126000
30697776
26603000
0
0
37045000
625434000
40193000
172831000
14842000
432185000

EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULB


INCFIS_ULB
Acesita P
22897000
578089000
472612000
61948000
Acos Vill
12641000
287218000
316069000
40664000
Adubos Tr
0
55834000
168947000
11455000
Agrale PN
1301000
7667000
40212000
4439000
Agroceres
4223000
52426000
40151000
16419000
Albarus O
3916000
23548000
122371000
12585000
Alpargata
8210000
176671000
311695000
24662000
Alpargata
26268000
100106000
269596000
54367000
Amadeo Ro
3321000
20837000
11865000
2041000
America d
101704000
Antarctic
0
50470000
48134000
8341000
Antarctic
0
88263000
96248000
18386000
Antarctic
0
350615000
331234000
34298000
Antarctic
0
17728000
32035000
4647000
Arno PN
5416000
45113000
187147000
15513000
Artex PN
9203000
87256000
151346000
20142000
Avipal ON
4262000
183783000
270774000
16696000
Azevedo P
2471000
24035000
14760000
3487000
Bahema PN
0
436000
0
743000
Bahia Sul
0
516251000
226013000
41170000
Bandeiran
295011000
Banrisul
139951000
Bardella
7725000
99036000
106405000
14567000
BCN PN
242017000
Belgo Min
36139000
306197000
371984000
26585000
Bemge PN
103296000
Besc PNB
96183000
Beta PNA
547000
7112000
9003000
1792000
Bic Caloi
2590000
54897000
87199000
11633000
Biobras P
2508000
7603000
18356000
6878000
Boavista
130756000
Bombril P
7914000
228907000
197002000
29562000
Bompreco
7852000
199660000
909998000
26561000
Bradesco
Brahma PN
68562000
159209000

88

0
10991000
45370000
65816000
60540000
0
26495000
0
0
28035000
370000
34572000
6654000
14842000
430657000

0
0
0
0
5192000
0
0

727000
231000
1122000
0
0
0
5847000

0
0

0
46000
0

4815000

Inteligncia Artificial

Brampac P
Brasil PN
Brasilit
Brasinca
Brasperol
Brazil Re
Brumadinh
Buettner
C R T ON
Cach Dour
Cacique P
Caemi Met
Cambuci P
Casa Angl
CBV Ind M
CEB PN

63928000

74625000

10688000

1301000
3518000
0
0
0
1699000
32712000
92000
2402000
431000
2379000
0
0
5825000

41926000
74603000
36758000
45042000
0
25448000
795883000
22362000
235174000
22916000
49349000
5903000
42201000
79767000

37388000
15820000
31656000
24192000
0
41317000
473376000
0
189902000
0
71708000
0
48775000
0

2755000
3074000
5330000
6381000
45470
3649000
240665000
16431000
16846000
9467000
5316000
4880000
9664000
220989000

SETOR

RENT_DISCR

Siderurgi
Siderurgi
Fertiliza
Mat Trans
Fertiliza
Auto Peca
Textil
Textil
Metalurgi
Bancos
Bebidas
Bebidas
Bebidas
Bebidas
Eletrodom
Textil
Alimento
Construto
Comercio
Papel Cel
Bancos
Bancos
Indust Me
Bancos
Siderurgi
Bancos
Bancos
Outros
Mat Trans
Quimica
Bancos
Quimica
Comercio
Bancos
Bebidas

menor10
menor0
menor10
menor10
menor0
maior10
menor10
menor0
menor0
maior10
maior10
maior10
menor10
menor10
maior10
menor0
menor10
menor0
maior10
menor0
menor0
menor0
maior10
menor0
menor10
menor0
maior10
menor0
maior10
maior10
menor0
menor10
menor10
maior10
maior10

EMPRESA RENTPA_ULB AUACTE_ULB


LAIR_ULBA,
Acesita P
0
0
Acos Vill
-10
Adubos Tr
1
0
Agrale PN
2
0
Agroceres
-37
0
Albarus O
18
0
Alpargata
4
0
Alpargata
-31
0
Amadeo Ro
-4
America d
13
Antarctic
20
0
Antarctic
10
0
Antarctic
5
0
Antarctic
0
0
Arno PN
12
0
Artex PN
-174
0
Avipal ON
8
0
Azevedo P
-168
Bahema PN
12
Bahia Sul
-13
0
Bandeiran
-53
Banrisul
-21
Bardella
10
0
BCN PN
-14
Belgo Min
4
0
Bemge PN
-37
Besc PNB
10
Beta PNA
-35
Bic Caloi
331
0
Biobras P
26
0
Boavista
-174
Bombril P
5
0
Bompreco
8
Bradesco
15
Brahma PN
34
0

89

183000

0
0
0
0
336000
0

-18251000
-31279000
-29056000
771000
-17813000
35412000
16297000
-87852000
-2020000
35416000
44169000
36192000
63033000
-2568000
29900000
-27445000
39700000
-8517000
4440000

-91617000
23068000
62230000
42906000
-7474000
-83728000
12998000
48353000
45277000
830512000
522872000

Fernando Nogueira

Brampac P
Brasil PN
Brasilit
Brasinca
Brasperol
Brazil Re
Brumadinh
Buettner
C R T ON
Cach Dour
Cacique P
Caemi Met
Cambuci P
Casa Angl
CBV Ind M
CEB PN

-175
10
35
-37
-5
14
-7
62
7
0
19
1
-11
7
34
7

Outros
Bancos
Cimento
Mat Trans
Textil
Construto
Mineracao
Textil
Telecomun
Energia
Alimento
Mineracao
Textil
Comercio
Indust Me
Energia

0
0
0
0
0
0

menor0
maior10
maior10
menor0
menor0
maior10
menor0
maior10
menor10
menor10
maior10
menor10
menor0
menor10
maior10
menor10

-27463000
532014000
135091000
-9156000
-8208000
18690000
-2348084
-8962000
126067000
2921000
14454000
8545000
-7680000
14889000
17173000
47551000

EMPRESA
RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULB
IMOBIL_ULB
Cedro PNA
3
1
-4
133036000
58132000
CEEE Ener
-37
5
-1
0
0
Celesc ON
2
-13
10
0
0
Celg PNB
0
2
3
954476000 950545000
Celpe AN
6
2
17
619927000 619635000
Cemat ON
4
1
-11
700173000 695417000
Cemig ON
3
1
5
0
0
Cerj ON
3
1
7
834075000 832689000
Cesp ON
5
1
6
0
0
Ceterp PN
0
1
4
328576000
17232000
Ceval PN
-11
5
8
0
0
Chapeco P
-172
-1
0
12492000
12327000
Cia Herin
1
1
-2
110958000
3446000
Cim Itau
5
2
3
646773000 260980000
Cimaf ON
-14
1
-88
116720000
115151000
Ciquine P
-3
275
-3
121829000
55788000
CMA Part
-106
2
0
10676000
0
CNV Cia V
-3
-7
4
4732000
4306000
Coelba ON
4
2
6
0
0
Coelce ON
3
1
7
643039000 642896000
Cofap PN
-33
3
-4
236441000 150894000
Coldex PN
-6
0
0
9758000
156000
Comgas PN
1
0
5
548483000 510747000
Confab PN
10
2
-1
158751000
57671000
Const Bet
0
0
9
10223000
5903000
Continent
-4
5
-8
195917000 134940000
Copas PN
-3
-10
70
58334000
45957000
Copel ADR
4
2
4
0
0
Copesul O
8
2
1
0
988504000
Corbetta
-37
107
-2
21611000
15941000
Cosipa ON
-3
-3
2
0
0
Coteminas
5
2
3
537625000 501770000
Cremer PN
-18
458
13
84402000
80360000
CTM Citru
-10
4
0
86041000
8232000
Czarina P
-60
-2
0
5488000
5250000
D F Vasco
-22
5
-2
1687000
1449000

90

Inteligncia Artificial

DHB PN
Dixie Tog
Docas PN
Dohler PN
Duratex P
Eberle PN
EDN PNA
Electrolu
Eletropau
Elevad At
Eluma PN
Embraer P
Encorpar
Enersul O
Enxuta PN
Ericsson

-31
0
-177
4
5
-11
-47
2
1
14
-39
-2
0
-9
-11
17

-4
0
3
9
2
-108
-7
1
0
5
5
-1
1
4
-87
3

0
7
0
13
2
128
0
27
20
2
0
2
0
-7
-32
2

22231000
366483000
69779000
73906000
561483000
69242000
88442000
188951000
0
89411000
174790000
706221000
72718000
616787000
60322000
131510000

EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULB


INCFIS_ULB
Cedro PNA
3256000
38818000
107561000
12543000
CEEE Ener
12826000
719498000
545053000
415584000
Celesc ON
36106000
251191000
0
648624000
Celg PNB
15288000
368194000
0
214082000
Celpe AN
12801000
162878000
0
481104000
Cemat ON
1490000
181690000
0
259880000
Cemig ON
22451000
0
Cerj ON
3407000
234944000
0
513779000
Cesp ON
86346000
0
Ceterp PN
6529000
39836000
0
76483000
Ceval PN
22579000
1042000
Chapeco P
0
79229000
0
1279000
Cia Herin
15000
87310000
0
3089000
Cim Itau
0
69524000
187145000
16897000
Cimaf ON
2763000
21717000
51805000
8859000
Ciquine P
3507000
52670000
111503000
11180000
CMA Part
0
0
0
41000
CNV Cia V
100000
4293000
9372000
1064000
Coelba ON
4242000
299928000
0
555685000
Coelce ON
10143000
191837000
0
347471000
Cofap PN
18017000
135856000
88880000
18269000
Coldex PN
0
36591000
0
10000
Comgas PN
5319000
65216000
120161000
85139000
Confab PN
2072000
87603000
103438000
7465000
Const Bet
498000
10535000
43484000
4207000
Continent
10218000
133190000
370431000
13758000
Copas PN
2014000
92823000
166705000
10290000
Copel ADR
70367000
688343000
0
666347000
Copesul O
0
196465000
608083000
21588000
Corbetta
1291000
27080000
14083000
976000
Cosipa ON
32660000
43454000
Coteminas
0
94160000
80995000
14786000
Cremer PN
4022000
45089000
74790000
11897000
CTM Citru
1064000
88625000
35346000
3558000

91

7358000
214413000
1043000
42511000
222801000
51811000
72170000
177621000
0
26216000
143272000
268885000
23000
613366000
55030000
106357000

0
0
0
0
0
0
0
0
0
0
0

0
0

0
0
0
0
0

1641000
0

Fernando Nogueira

Czarina P
D F Vasco
DHB PN
Dixie Tog
Docas PN
Dohler PN
Duratex P
Eberle PN
EDN PNA
Electrolu
Eletropau
Elevad At
Eluma PN
Embraer P
Encorpar
Enersul O
Enxuta PN
Ericsson

415000
458000
0
5380000
67000
0
11878000
6943000
0
0
39610000
17194000
4530000
15232000
0
814000
1783000
22168000

4908000
3730000
26712000
73249000
1468000
31409000
90878000
144507000
101129000
128510000
128270000
46023000
666180000
158000
208342000
24143000
580389000

EMPRESA RENTPA_ULB AUACTE_ULB


LAIR_ULBA,
Cedro PNA
4
0
CEEE Ener
-168
Celesc ON
3
0
Celg PNB
11
Celpe AN
8
0
Cemat ON
10
0
Cemig ON
4
Cerj ON
11
0
Cesp ON
9
0
Ceterp PN
0
0
Ceval PN
-41
0
Chapeco P
173
Cia Herin
3
0
Cim Itau
7
Cimaf ON
-18
0
Ciquine P
-6
0
CMA Part
-177
CNV Cia V
-59
Coelba ON
8
0
Coelce ON
5
0
Cofap PN
-83
Coldex PN
1
Comgas PN
2
0
Confab PN
15
Const Bet
0
0
Continent
-8
Copas PN
-12
0
Copel ADR
6
0
Copesul O
14
0
Corbetta
-2121
Cosipa ON
-8
Coteminas
6
0

92

2042000
5167000
0
178314000
0
111626000
243906000
91072000
71988000
694330000
0
197290000
97430000
566103000
0
0
45066000
944752000

162000
1812000
726000
28882000
5094000
7565000
26827000
10328000
5533000
29043000
55162000
4419000
31744000
23000
221291000
6012000
87300000

SETOR

RENT_DISCR

Textil
Energia
Energia
Energia
Energia
Energia
Energia
Energia
Energia
Telecomun
Alimento
Alimento
Textil
Cimento
Metalurgi
Petro Qui
Mineracao
Textil
Energia
Energia
Auto Peca
Elet Elet
Petro Qui
Metalurgi
Construto
Eletrodom
Fertiliza
Energia
Petro Qui
Couro
Siderurgi
Textil

menor10
menor0
menor10
maior10
menor10
maior10
menor10
maior10
menor10
menor10
menor0
maior10
menor10
menor10
menor0
menor0
menor0
menor0
menor10
menor10
menor0
menor10
menor10
maior10
menor10
menor0
menor0
menor10
maior10
menor0
menor0
menor10

0
0
0
645000
0
0
0
0
0
0
0
0

2095000
67280000
13026000
53597000
401341000
26432000
6976000
-81056000
4749000
57679000
-21062000
-4533000
-11334000
-404000
89669000
-8773000
8239000
-249000
10726000
36368000
413000
-13099000
-6661000
399591000
187207000
-7348000
48905000

Inteligncia Artificial

Cremer PN
CTM Citru
Czarina P
D F Vasco
DHB PN
Dixie Tog
Docas PN
Dohler PN
Duratex P
Eberle PN
EDN PNA
Electrolu
Eletropau
Elevad At
Eluma PN
Embraer P
Encorpar
Enersul O
Enxuta PN
Ericsson

-194
-22
82
-55
106
1
-580
6
7
-154
268
2
2
79
-158
-8
0
-19
183
43

Textil
Alimento
Couro
Outros
Auto Peca
Outros
Diversos
Textil
Madeira
Metalurgi
Petro Qui
Eletrodom
Energia
Indust Me
Metalurgi
Transp Ae
Outros
Energia
Eletrodom
Elet Elet

0
0
19000
0
0
0
0
0
0
0
0
0
0

menor0
menor0
maior10
menor0
maior10
menor10
menor0
menor10
menor10
menor0
maior10
menor10
menor10
maior10
menor0
menor0
menor10
menor0
maior10
maior10

-12882000
-11402000
-684000
-1670000
-11727000
2606000
11496000
62500000
-14002000
-72478000
9963000
54241000
-68795000
311000
-72060000
-6875000
325394000

EMPRESA
RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULB
IMOBIL_ULB
Escelsa O
5
4
5
982783000 722020000
Estrela P
0
-4
-6
25269000
18334000
Eternit O
17
2
5
225276000
16947000
Eucatex P
-5
-62
7
355258000 204186000
Excel Eco
0
450112000
48709000
F Catagua
2
2
5
539235000 151673000
Fab C Ren
3
1
3
33314000
18234000
Ferbasa P
1
1
2
112112000
80308000
Ferro Lig
-22
350
-2
165317000 136057000
Fertibras
6
2
16
78005000
10952000
Fertisul
5
3
2
168756000 153529000
Fertiza P
4
2
7
38549000
5935000
Fibam PN
1
0
10
11133000
11021000
Forjas Ta
5
2
44
69545000
34094000
Fosfertil
10
2
1
729650000 337909000
Frangosul
1
1
6
217008000 216814000
Fras-Le P
14
3
2
47933000
40105000
Gerdau Me
10
1
0
906501000
9230000
Gerdau PN
7
1
2
0
0
Globex PN
4
-427
-3
266505000 114743000
Gradiente
-19
24
-4
130793000 112243000
Granoleo
-1
1
-2
41406000
30290000
Grazzioti
9
3
6
16382999
14179260
Guararape
8
1
-8
313747000
22139000
Hercules
-107
-1
-3
17092000
11932000
Hering Te
1
0
3
176198000 147551000
HSBC Bame
-60
3
-2
139559000
96328000
IAP PN
-54
-10
-8
97508000
43532000
Iguacu Ca
6
5
4
41851000
25513000
Imperio P
-13
9
0
39872000
39740000

93

Fernando Nogueira

Ind Villa
Inds Romi
Inepar PN
Iochp-Max
Ipiranga
Ipiranga
Itaubanco
Itausa ON
Itautec P
Iven PN
IVI PN
J B Duart
Karsten P
Kepler We
Klabin PN
Lacta PN
Latasa ON
Light ON
LightPar
Lix da Cu
Loj Ameri
Lojas Ara

10
4
6
-12
20
14
2
12
-15
10
-3
-19
1
6
0
-4
1
9
12
-15
-3
-19

1
1
2
7
1
2

0
4
8
-4
3
3

1
5
1
-2
60
1

0
-9
0
0
0
-23
-40
0
-24
2
4
0
0
69
0

0
-110
1
2
1
5
3
5

106655000
123894000
467448000
214518000
272369000
551208000
0
0
367086000
428829000
485090000
41835000
69768000
44515000
0
72449000
424507000
0
0
26649000
398445000
189509000

EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULB


INCFIS_ULB
Escelsa O
0
151937000
0
298581000
Estrela P
909000
40318000
35730000
17846000
Eternit O
1401000
33992000
34603000
5624000
Eucatex P
8589000
95275000
104779000
14601000
Excel Eco
154105000
F Catagua
2033000
28807000
0
58629000
Fab C Ren
2037000
31248000
48283000
3053000
Ferbasa P
250000
18513000
67083000
6696000
Ferro Lig
5329000
102119000
94071000
8371000
Fertibras
1202000
54918000
97784000
8476000
Fertisul
0
271033000
262877000
13035000
Fertiza P
835000
40917000
110833000
4498000
Fibam PN
0
13904000
20482000
4056000
Forjas Ta
0
23530000
35542000
5163000
Fosfertil
0
263589000
170185000
11226000
Frangosul
152000
101097000
225341000
14449000
Fras-Le P
4097000
40461000
79618000
10191000
Gerdau Me
2895000
20407000
0
968000
Gerdau PN
17198000
311990000
255442000
25800000
Globex PN
0
679557000
989860000
60193000
Gradiente
6367000
324920000
551614000
45976000
Granoleo
239000
7344000
23013000
7541000
Grazzioti
1600509
20596241
64209510
6565243
Guararape
161000
13354000
39983000
11411000
Hercules
3370000
149513000
20625000
2450000
Hering Te
9564000
140778000
192438000
10104000
HSBC Bame
384270000
569850000
172323000
IAP PN
2119000
97854000
116060000
5171000

94

38764000
111229000
36494000
15026000
88751000
436933000
0
10272000
133225000
0
480260000
24760000
56685000
11790000
1017000
69421000
331844000
0
0
4669000
201448000
186779000

0
0
263000
0
0
0
903000
0
75000
483000
0
0
157000
0
4216000

0
0
0
0
1005000
0
0

Inteligncia Artificial

Iguacu Ca
Imperio P
Ind Villa
Inds Romi
Inepar PN
Iochp-Max
Ipiranga
Ipiranga
Itaubanco
Itausa ON
Itautec P
Iven PN
IVI PN
J B Duart
Karsten P
Kepler We
Klabin PN
Lacta PN
Latasa ON
Light ON
LightPar
Lix da Cu
Loj Ameri
Lojas Ara

1165000
0
730000
4681000
1610000
6970000
2065000
18607000

55936000
20475000
30500000
59185000
176405000
177650000
57241000
272270000

102769000
32055000
0
116193000
131780000
428827000
783789000

8324000
3914000
7799000
18354000
20744000
36841000
18008000
147402000

0
10865000
0
0
0
3754000

870161000
435619000
16825000
536545000
53151000
38805000
23810000
4805000
45880000
328958000
465994000
44642000
102193000
332635000
721021000

0
643212000
0
357621000
23032000
82344000
29124000
0
172910000
381340000
0
0
32712000

10106000
64693000
117000
38721000
6041000
10828000

0
0

4570000
48393000
25078000

SETOR

RENT_DISCR

Energia
Brinquedo
Cimento
Madeira
Bancos
Energia
Textil
Metalurgi
Metalurgi
Fertiliza
Fertiliza
Fertiliza
Metalurgi
Metalurgi
Fertiliza
Alimento
Auto Peca
Metalurgi
Siderurgi
Comercio
Elet Elet
Alimento
Comercio
Textil
Metalurgi
Textil

maior10
menor10
maior10
menor0
menor0
menor10
menor10
menor10
menor0
maior10
maior10
maior10
menor10
menor10
maior10
menor10
maior10
maior10
maior10
maior10
menor0
menor0
maior10
menor10
maior10
menor10

46000
13056000
3709000
26768000
0
21082000
23087000
7170000

EMPRESA RENTPA_ULB AUACTE_ULB


LAIR_ULBA,
Escelsa O
10
0
Estrela P
9
0
Eternit O
19
0
Eucatex P
-12
0
Excel Eco
-8
F Catagua
3
0
Fab C Ren
6
0
Ferbasa P
2
Ferro Lig
-4051
0
Fertibras
14
0
Fertisul
17
0
Fertiza P
12
0
Fibam PN
2
0
Forjas Ta
6
0
Fosfertil
22
0
Frangosul
2
0
Fras-Le P
70
Gerdau Me
14
Gerdau PN
10
Globex PN
11
0
Gradiente
-233
0
Granoleo
-1
0
Grazzioti
13
0
Guararape
9
0
Hercules
29
Hering Te
3
0

95

2265000
19138000
64109000
46244000

244000
0
415000
0
0
0
3689000

0
0
0
0
0
0

126080000
508000
65670000
-31966000
4127000
17376000
2508000
3899000
-57469000
9473000
32463000
4315000
269000
7099000
97032000
4946000
16331000
30787000
54156000
39399000
-98727000
-819000
10154655
41910000
-31690000
7825000

Fernando Nogueira

HSBC Bame
IAP PN
Iguacu Ca
Imperio P
Ind Villa
Inds Romi
Inepar PN
Iochp-Max
Ipiranga
Ipiranga
Itaubanco
Itausa ON
Itautec P
Iven PN
IVI PN
J B Duart
Karsten P
Kepler We
Klabin PN
Lacta PN
Latasa ON
Light ON
LightPar
Lix da Cu
Loj Ameri
Lojas Ara

-168
417
11
-36
22
6
10
-33
23
22
17
17
-49
11
-9
-365
1
9
0
-17
3
14
12
-67
-8
-167

Seguros
Fertiliza
Alimento
Alimento
Indust Me
Indust Me
Outros
Mat Trans
Petro Qui
Petro Qui
Bancos
Diversos
Informati
Energia
Outros
Alimento
Textil
Mat Trans
Papel Cel
Alimento
Outros
Energia
Energia
Construto
Comercio
Comercio

0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0

menor0
maior10
maior10
menor0
maior10
menor10
maior10
menor0
maior10
maior10
maior10
maior10
menor0
maior10
menor0
menor0
menor10
menor10
menor10
menor0
menor10
maior10
maior10
menor0
menor0
menor0

-91131000
14218000
-11860000
13561000
19550000
59349000
-67922000
84116000
228231000
756174000
504000000
47608000
-26325000
-10800000
845000
3877000
-3151000
-12174000
11806000
419886000
348284000
-24044000
-34646000

EMPRESA
RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULB
IMOBIL_ULB
Lojas Ren
15
-7
-10
46676000
26325000
Lorenz PN
14
1
1
73000000
48165000
Madeirit
-51
-7
0
46590000
18529000
Magnesita
8
2
5
184995000
99743000
Maio Gall
-25
31
-12
11317000
11178000
Makro ON
4
-20
14
201396000 198435000
Manah PN
3
1
4
197828000 119521000
Manasa PN
-4
5
-1
45947000
37357000
Mangels P
2
1
0
103328000
96000
Mannesman
-3
5
-8
521073000 321899000
Marcopolo
11
2
2
103542000
59783000
Marisol P
8
1
6
80498000
49061000
Melpaper
-9
1
0
96880000
96880000
Merc Bras
2
197813000
68619000
Met Barba
18
2
2
75557000
66462000
Metal Lev
1
1
10
113000000
73115000
Metisa PN
7
2
4
13259000
11311000
Michelett
0
0
11
15788000
14469000
Mont Aran
6
2
0
127363000
337000
Montreal
-409
0
0
214000
13000
Multibras
8
1
6
815497000 328260000
Multicana
-18
2
0
86080000
160000
Nakata PN
1
1
4
42161000
36273000
Nitrocarb
-14
9
6
126935000
48353000

96

Inteligncia Artificial

Nord Bras
Nordon Me
Noroeste
Odebrecht
Olma PN
Olvebra P
Orion PN
OSA PN
Oxiteno P
P, Acucar
Panvel ON
Paraibuna
Paranapan
Parmalat
Paul F Lu
Perdigao
Persico P
Petrobras
Petrobras
Petroflex
Petropar
Petroq,Un
Petroquis
Pettenati
Pirelli O
Pirelli P
Polar PN
Polialden

1
-54
1
-4
-36
-379
-17
7
6
7
13
-15
-47
0
3
8
-14
7
4
-4
-12
1
14
-1
10
13
10
1

-4

2
9
0
-24
1
2
-5
1
14
4
0
2
1
-329
2
1
-8
1
0
-4
-1
3
2
4
-1

0
0
0
-9
0
-6
10
6
3
0
6
9
0
0
4
1
12
0
1
0
4
3
3
4
6

261472000
20144000
312888000
0
64284000
566000
24910000
134090000
522762000
961203000
67610000
268056000
581325000
652010000
0
437788000
194899000
546694000
0
387807000
81867000
922923000
517726000
83864000
146331000
292798000
177980000
153725000

EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULB


INCFIS_ULB
Lojas Ren
0
64435000
132618000
20634000
Lorenz PN
0
24588000
28566000
3375000
Madeirit
10069000
15491000
4405000
Magnesita
0
75700000
153269000
36465000
Maio Gall
765000
11177000
15299000
2318000
Makro ON
9764000
184496000
129758000
Manah PN
2604000
211101000
399655000
6572000
Manasa PN
134000
9965000
7166000
3596000
Mangels P
0
3695000
0
6000
Mannesman
10220000
182537000
354032000
65898000
Marcopolo
9177000
70037000
233880000
17655000
Marisol P
3530000
36560000
79955000
15649000
Melpaper
0
155000
0
1086000
Merc Bras
68344000
Met Barba
4563000
50313000
108082000
9969000
Metal Lev
9555000
115872000
180794000
30735000
Metisa PN
1564000
9098000
27222000
2696000
Michelett
945000
7501000
20270000
5414000
Mont Aran
186000
4718000
0
4047000
Montreal
6000
7828000
0
299000
Multibras
19726000
344717000
73607000
Multicana
117000
1605000
0
3976000

97

175772000
20124000
56423000
747000
59149000
20000
24711000
18000
116319000
917531000
5376000
169265000
1699000
651894000
0
0
188741000
459532000
0
368177000
315000
860786000
382000
83359000
77319000
154098000
131306000
61500000

0
0
0
0

0
68000
550000

0
0
53000
0

9252000

Fernando Nogueira

Nakata PN
Nitrocarb
Nord Bras
Nordon Me
Noroeste
Odebrecht
Olma PN
Olvebra P
Orion PN
OSA PN
Oxiteno P
P, Acucar
Panvel ON
Paraibuna
Paranapan
Parmalat
Paul F Lu
Perdigao
Persico P
Petrobras
Petrobras
Petroflex
Petropar
Petroq,Un
Petroquis
Pettenati
Pirelli O
Pirelli P
Polar PN
Polialden

4713000
0

16501000
43269000

80409000
106871000

6099000

63763000

65672000

0
0
2000
1972000
7000
9098000
38018000
1289000
657000
818000
0
47691000
140000
665000
18036000
296711000
0
64000
6028000
1582000
0
18597000
35141000
5983000
1277000

1953000
57145000
458000
26568000
2658000
39739000
808992000
16365000
154560000
226327000
335200000
331494000
15792000
231927000
829188000

0
129666000
0
12191000
88000
114231000

114991000
2800000
170516000
103526000
28332000
216567000
225970000
58590000
27913000

308587000
0
524782000
0
27578000
441697000
541982000
61128000
82864000

562000
1751000
158257000
708259000
15967000
3942000
14989000
13359000
2033000
34370000
46644000
16872000
14125000

SETOR

RENT_DISCR

Comercio
Alimento
Madeira
Mineracao
Auto Peca
Comercio
Fertiliza
Madeira
Indust Me
Siderurgi
Mat Trans
Textil
Papel Cel
Bancos
Metalurgi
Auto Peca
Metalurgi
Metalurgi
Diversos
Construto

maior10
maior10
maior10
maior10
maior10
menor10
menor10
menor0
menor10
menor0
maior10
maior10
menor0
menor10
maior10
menor10
maior10
menor10
menor10
maior10

EMPRESA RENTPA_ULB AUACTE_ULB


LAIR_ULBA,
Lojas Ren
28
0
Lorenz PN
22
Madeirit
236
0
Magnesita
10
0
Maio Gall
45
Makro ON
7
0
Manah PN
7
Manasa PN
-11
Mangels P
3
Mannesman
-4
0
Marcopolo
16
0
Marisol P
11
0
Melpaper
-12
Merc Bras
7
Met Barba
27
0
Metal Lev
3
0
Metisa PN
11
0
Michelett
1
0
Mont Aran
6
Montreal
56

98

107848000
100057000
75348000
285366000
0
0
5615000

12290000
8126000
133382000
3991000
165776000
20676000
6093000
594000
6335000
350000
30659000
149060000
8751000
6879000
17139000
7280000

0
0
0
0
0

0
0
0
0
0
0
0
0
0
1025000
0

26366000
16247000
-36886000
34800000
-3910000
21513000
12350000
-4147000
2503000
-21252000
35824000
15490000
-8739000
65027000
50489000
7560000
3111000
251000
26678000
8248000

Inteligncia Artificial

Multibras
Multicana
Nakata PN
Nitrocarb
Nord Bras
Nordon Me
Noroeste
Odebrecht
Olma PN
Olvebra P
Orion PN
OSA PN
Oxiteno P
P, Acucar
Panvel ON
Paraibuna
Paranapan
Parmalat
Paul F Lu
Perdigao
Persico P
Petrobras
Petrobras
Petroflex
Petropar
Petroq,Un
Petroquis
Pettenati
Pirelli O
Pirelli P
Polar PN
Polialden

12
-35
1
-45
9
176
9
-5
-152
10
114
7
8
17
17
-67
-151
1
5
8
-380
11
7
-10
-12
3
19
-2
25
27
15
1

Eletrodom
Diversos
Auto Peca
Petro Qui
Bancos
Indust Me
Bancos
Construto
Alimento
Alimento
Quimica
Auto Peca
Petro Qui
Comercio
Outros
Metalurgi
Mineracao
Alimento
Energia
Alimento
Metalurgi
Petro Qui
Petro Qui
Petro Qui
Petro Qui
Petro Qui
Petro Qui
Textil
Outros
Auto Peca
Bebidas
Petro Qui

0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0

maior10
menor0
menor10
menor0
menor10
maior10
menor10
menor0
menor0
maior10
maior10
menor10
menor10
maior10
maior10
menor0
menor0
menor10
menor10
menor10
menor0
maior10
menor10
menor0
menor0
menor10
maior10
menor0
maior10
maior10
maior10
menor10

139800000
-84170000
2472000
-22027000
100900000
-29521000
29573000
-48878000
-32476000
-4845000
-5874000
10625000
41641000
157127000
12470000
-45271000
6062000
166772000
34703000
-12528000
219895000
-22964000
-11892000
14364000
-3377000
53467000
96232000
49966000
4212000

EMPRESA
RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULB
IMOBIL_ULB
Polipropi
-8
2
0
218086000
212000
Politeno
4
1
2
320277000 193876000
Pronor PN
-1
-1
-8
217056000
91426000
Quimica G
-29
3
23
11312000
6910000
Randon Pa
5
1
-6
205807000
2344000
Real Cons
13
1
-1
465468000
51000
Real de I
3
683260000
26166000
Real ON
1
590944000 310039000
Real Part
14
1
-1
441095000
19000
Real PN
1
590944000 310039000
Recrusul
3
2
-2
30741000
17047000
Ren Herma
7
1
3
172922000
4230000
Rheem PN
-13
17
0
106641000
97124000
Rhodia-St
-295
1
0
40855000
3130000
Ripasa PN
-3
-4
5
794091000 712311000
Rossi Res
5
4
3
40160725
1905856
Sabesp ON
2
1
2
0
0
Sadia Con
4
2
12
536303000 277045000

99

Fernando Nogueira

Sadia Fri
Sam Indus
Samitri O
Sansuy PN
Santista
Saraiva L
Schlosser
Serrana O
Sharp PN
Sibra PNC
Sid Nacio
Sid Tubar
Sifco PN
Sola PN
Solorrico
Souto Vid
Souza Cru
Staroup P
Sudameris
Sultepa P
Supergasb
Suzano PN
TAM PN
Tecel,S,J
Tectoy PN
Teka PN
Tel B Cam
Telebahia
Telebras
Telebrasi
Teleceara
Telegoias
Telemig O
Telepar O

1
-14
4
6
-4
14
-12
8
6
-25
6
3
-34
0
3
16
19
3
1
3
-1
0
10
-1
-59
-10
7
7
13
12
15
20
12
6

1
1
1
4
13
2
11
1
1
7
2
3
-9
0
1
1
2
2

-3
0
6
2
-14
4
-3
0
0
0
2
2
3
8
6
0
4
3

1
2
0
3
0
11
5
1
1
1
1
1

1
5
6
5
-1
7
73
2
2
0
1
2
2
1
2

1
1

160426000
71757000
625986000
64458000
509013000
49248000
36093000
304638000
285126000
206421000
0
0
153823000
137099000
91150000
529224000
992700000
15636000
334569000
70923000
161348000
0
77179000
35366000
18701000
249850000
893708000
0
0
0
783573000
133474000
0
0

EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULB


INCFIS_ULB
Polipropi
0
7181000
0
995000
Politeno
2317000
83013000
250069000
11129000
Pronor PN
0
54683000
119835000
10580000
Quimica G
629000
7987000
9753000
1563000
Randon Pa
285000
6209000
0
5183000
Real Cons
71000
10376000
0
1630000
Real de I
60088000
Real ON
735223000
Real Part
0
8671000
0
1019000
Real PN
735223000
Recrusul
1247000
24281000
53210000
5294000
Ren Herma
1131000
20104000
22830000
4103000
Rheem PN
4091000
63755000
88560000
12487000
Rhodia-St
1213000
4659000
0
685000
Ripasa PN
6827000
199389000
219722000
26299000
Rossi Res
3014434
78961851
59743719
12167169

100

152553000
9157000
282470000
62375000
297740000
22178000
35925000
4656000
19642000
154608000
0
0
128568000
136983000
37816000
0
522600000
15632000
70531000
45970000
145146000
419539000
71381000
22432000
6298000
184511000
891999000
0
141263000
0
783496000
133474000
0
0

0
0

0
854000
0
0
0
0

Inteligncia Artificial

Sabesp ON
Sadia Con
Sadia Fri
Sam Indus
Samitri O
Sansuy PN
Santista
Saraiva L
Schlosser
Serrana O
Sharp PN
Sibra PNC
Sid Nacio
Sid Tubar
Sifco PN
Sola PN
Solorrico
Souto Vid
Souza Cru
Staroup P
Sudameris
Sultepa P
Supergasb
Suzano PN
TAM PN
Tecel,S,J
Tectoy PN
Teka PN
Tel B Cam
Telebahia
Telebras
Telebrasi
Teleceara
Telegoias
Telemig O
Telepar O

191122000
32581000
8881000
216000
3907000
2129000
793000
2333000
246000
0
300000
45236000
8412000
5595000
1355000
1998000
45489000
43500000
727000
1401000
3739000
15767000
0
992000
394000
4491000
16778000
13267000
23034000
18146000
12024000
328000
0
38475000

800103000
306276000
52844000
66337000
49958000
600000000
15370000

710134000
139759000
105341000
192517000
0
869000000
21752000

53153000
28688000
176705000
149720000
5706000
33870000
117203000
133413000
270916000
848293000
139797000
175124000
5507000
713524000
273290000

70289000
62637000
374073000
339633000
45048000
30080000
194851000
173869000
275454000
0
191276000
130868000
50431000
527475000
360081000

172431000
79659000
16665000
3955000
8716000
10584000
93553000
15768000
4670000
6257000
12759000
6303000
139900000
47876000
13510000
6459000
8199000
624000
303600000
2601000
209198000
7562000
84222000
48691000
32895000
3895000
10005000
16670000
48543000
107959000
243956000
53064000
53919000
10595000
127238000
140351000

SETOR

RENT_DISCR

Petro Qui
Petro Qui
Petro Qui
Petro Qui
Mat Trans
Diversos
Bancos
Bancos
Diversos
Bancos
Mat Trans
Quimica
Metalurgi
Petro Qui

menor0
menor10
menor0
menor0
menor10
maior10
maior10
maior10
maior10
maior10
menor10
menor10
menor0
menor0

438114000
139127000
9538000
98130000
37702000
515784000
21173000
17673000
9370000
116528000
109656000

EMPRESA RENTPA_ULB AUACTE_ULB


LAIR_ULBA,
Polipropi
-11
Politeno
6
0
Pronor PN
-2
Quimica G
-74
Randon Pa
6
0
Real Cons
14
0
Real de I
13
Real ON
12
Real Part
14
0
Real PN
12
Recrusul
4
0
Ren Herma
8
0
Rheem PN
-33
Rhodia-St
-387
0

101

208483000
0
89966000
60310000
23613000
24997000
0
0
89291000

5249000
68000
7000
0
0
300000
0
0
0
0
0
0
0
0
26200000
0

0
0
0
0
0
0
0
0
0

17000
11000

-17802000
23031000
-1997000
-10217000
12271000
63656000
94045000
130881000
61505000
130881000
2279000
15519000
-19177000

Fernando Nogueira

Ripasa PN
Rossi Res
Sabesp ON
Sadia Con
Sadia Fri
Sam Indus
Samitri O
Sansuy PN
Santista
Saraiva L
Schlosser
Serrana O
Sharp PN
Sibra PNC
Sid Nacio
Sid Tubar
Sifco PN
Sola PN
Solorrico
Souto Vid
Souza Cru
Staroup P
Sudameris
Sultepa P
Supergasb
Suzano PN
TAM PN
Tecel,S,J
Tectoy PN
Teka PN
Tel B Cam
Telebahia
Telebras
Telebrasi
Teleceara
Telegoias
Telemig O
Telepar O

-5
11
3
9
2
-17
5
70
-12
20
-41
10
10
-115
10
4
35
0
7
23
31
13
8
7
-2
1
23
-1
-495
-26
8
11
13
14
20
23
18
9

0
0
0
0
0

Papel Cel
Construto
Outros
Alimento
Alimento
Outros
Mineracao
Outros
Alimento
Outros
Textil
Diversos
Elet Elet
Siderurgi
Siderurgi
Siderurgi
Auto Peca
Alimento
Fertiliza
Diversos
Outros
Textil
Bancos
Construto
Petro Qui
Papel Cel
Transp Ae
Textil
Brinquedo
Textil
Telecomun
Telecomun
Telecomun
Telecomun
Telecomun
Telecomun
Telecomun
Telecomun

0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0

0
0

menor0
maior10
menor10
menor10
menor10
menor0
menor10
maior10
menor0
maior10
menor0
maior10
maior10
menor0
maior10
menor10
maior10
menor10
menor10
maior10
maior10
maior10
menor10
menor10
menor0
menor10
maior10
menor0
menor0
menor0
menor10
maior10
maior10
maior10
maior10
maior10
maior10
menor10

-31790000
22724554
326486000
59943000
6511000
-24966000
31515000
6207000
-37986000
19029000
-5629000
27443000
19681000
-69103000
430263000
209549000
-84756000
1624000
5357000
90408000
441500000
1019000
55077000
7385000
2272000
-12847000
48882000
-524000
-35985000
-36184000
110469000
184094000
202169000
184576000
31852000
458229000
245261000

EMPRESA
RENTAT_ULB ALAFIN_ULB ALAOPE_ULB PERMAN_ULB
IMOBIL_ULB
Telerj ON
5
1
2
0
0
Telesp ON
8
1
2
0
0
Telest PN
13
1
2
583456000 581345000
Telpe ON
14
1
1
929010000 928018000
Tex Renau
4
2
3
32013000
30299000
Tibras PN
-1
-2
-23
242902000 233415000
Trafo PN
4
2
5
32760000
29062000
Transbras
10
-3
-3
154209000 151852000
Trevisa P
1
-2
1
71790000
2756000
Trikem PN
-1
-1
2
0
789065000
Trombini
-6
2
6
98244000
962000
Tupy PN
-7
14
0
105589000
77000

102

Inteligncia Artificial

Unibanco
Unipar PN
Usiminas
Usin C Pi
Vale Rio
Varga Fre
Varig PN
Vidr S Ma
Vigor PN
Votec PN
Votoranti
Vulcabras
Weg PN
Wembley P
Wetzel Fu
Wetzel Me
White Mar
Wiest PN
Zivi PN

2
-10
7
0
5
6
1
6
1
1
1
-46
15
11
-6
-15
7
2
-65

2
2
-1
2
2
2
2
1
0
-2
400
2
1
8
-22
1
0
-2

-1
1
0
1
3
9
5
5
1
0
0
19
0
3
-7
0
3
-2

0
436796000
0
158752000
0
120825000
0
463291000
288905000
31498000
0
17113000
241972071
280488000
13191000
31680000
0
44238000
27598000

298245000
20079000
0
46932000
0
104054000
0
242542000
202589000
31498000
19503000
16140000
5251452
14000
12603000
30416000
6878000
35284000
21274000

EMPRESA SLENCP_ULB PASCIR_ULB CPV_ULBA,E DESADM_ULB


INCFIS_ULB
Telerj ON
88966000
707824000
292092000
0
Telesp ON
182626000
546111000
51856000
Telest PN
8839000
108158000
106646000
54337000
0
Telpe ON
10263000
150708000
155992000
58691000
Tex Renau
2010000
45851000
58330000
4182000
0
Tibras PN
3857000
50030000
99916000
17194000
0
Trafo PN
1973000
10941000
32880000
5680000
325000
Transbras
0
660094000
619067000
69603000
0
Trevisa P
0
24471000
0
890000
0
Trikem PN
12394000
451378000
313258000
20098000
Trombini
5000
89000
189000
1144000
Tupy PN
23000
3797000
0
2060000
0
Unibanco
Unipar PN
0
39060000
55440000
15403000
Usiminas
9119000
57257000
17245000
Usin C Pi
0
119152000
76897000
8960000
Vale Rio
106000000
196000000
0
Varga Fre
0
85657000
193731000
19209000
0
Varig PN
33274000
159291000
Vidr S Ma
8583000
110165000
289859000
51947000
26000
Vigor PN
2834000
27263000
109146000
9616000
0
Votec PN
634000
56109000
1201000
149000
Votoranti
2321000
29468000
0
21204000
0
Vulcabras
1526000
25387000
33233000
7625000
Weg PN
0
24279718
13677418
4850705
398083
Wembley P
0
8210000
0
828000
Wetzel Fu
4793000
14318000
17295000
1900000
0
Wetzel Me
4433000
19095000
18981000
2621000
0
White Mar
0
15282000
0
16151000
0
Wiest PN
0
15063000
36525000
3649000
0
Zivi PN
437000
110583000
31303000
7106000

103

Fernando Nogueira

EMPRESA RENTPA_ULB AUACTE_ULB


LAIR_ULBA,
Telerj ON
8
0
Telesp ON
10
0
Telest PN
17
0
Telpe ON
19
Tex Renau
9
0
Tibras PN
-2
0
Trafo PN
5
0
Transbras
-77
0
Trevisa P
2
0
Trikem PN
-3
Trombini
-9
Tupy PN
-11
0
Unibanco
16
Unipar PN
-15
Usiminas
12
0
Usin C Pi
-1
Vale Rio
8
0
Varga Fre
12
0
Varig PN
10
Vidr S Ma
7
0
Vigor PN
2
0
Votec PN
-2
Votoranti
1
0
Vulcabras
-15486
Weg PN
20
10925660
Wembley P
12
Wetzel Fu
62
0
Wetzel Me
54
0
White Mar
8
0
Wiest PN
4
0
Zivi PN
49

104

SETOR

RENT_DISCR

Telecomun
Telecomun
Telecomun
Telecomun
Textil
Quimica
Elet Elet
Transp Ae
Fertiliza
Petro Qui
Papel Cel
Indust Me
Bancos
Petro Qui
Siderurgi
Diversos
Mineracao
Auto Peca
Transp Ae
Outros
Alimento
Transp Ae
Papel Cel
Couro
Elet Elet
Textil
Metalurgi
Metalurgi
Quimica
Auto Peca
Metalurgi

menor10
maior10
maior10
maior10
menor10
menor0
menor10
menor0
menor10
menor0
menor0
menor0
maior10
menor0
maior10
menor0
menor10
maior10
maior10
menor10
menor10
menor0
menor10
menor0
maior10
maior10
maior10
maior10
menor10
menor10
maior10

343833000
103680000
209049000
4836000
-3519000
3501000
101091000
1060000
4172000
-18986000
-7451000
504413000
-51988000
459151000
1316000
809000000
15277000
27837000
48761000
6717000
-1145000
16616000
-19040000
68174918
33000000
-1366000
-8328000
108608000
1304000
-32159000

Inteligncia Artificial

7.2. rvores de Deciso

105

Fernando Nogueira

106

Inteligncia Artificial

7.2.1. Regras Obtidas pelas rvores de Deciso

Rules To Reach Leaf Profile 1


IF ALAFIN_ULB < 2.358344990
AND ALAOPE_ULB < 0.155443950
THEN RENT_DISCR = maior10 (Probability = 0.4330)

Rules To Reach Leaf Profile 2


IF ALAFIN_ULB >= 2.358344990 AND < 4.129895766
AND ALAOPE_ULB < 0.155443950
THEN RENT_DISCR = menor0 (Probability = 1.0000)

Rules To Reach Leaf Profile 3


IF ALAFIN_ULB < -0.543776291
AND ALAOPE_ULB >= 0.155443950
THEN RENT_DISCR = menor0 (Probability = 0.6842)

Rules To Reach Leaf Profile 4


IF ALAFIN_ULB >= -0.543776291 AND < 1.018342762
AND ALAOPE_ULB >= 0.155443950
THEN RENT_DISCR = menor10 (Probability = 0.7015)

Rules To Reach Leaf Profile 5


IF ALAFIN_ULB >= 1.018342762 AND < 4.129895766
AND ALAOPE_ULB >= 0.155443950
THEN RENT_DISCR = maior10 (Probability = 0.6500)

Rules To Reach Leaf Profile 6


IF ALAFIN_ULB >= 4.129895766
THEN RENT_DISCR = menor0 (Probability = 0.8293)

107

Fernando Nogueira

7.2.2. Cdigo em Linguagem C


void TreeProc ( void )
{
if ( ALAFIN_ULB < 4.129895766 )
if ( ALAOPE_ULB < 0.155443950 )
if ( ALAFIN_ULB < 2.358344990 )
{
profileNo = 1 ;
strcpy ( result , maior10 ) ;
probability = 0.433 ;
}
else
{
profileNo = 2 ;
strcpy ( result , menor0 ) ;
probability = 1.000 ;
}
else
if ( ALAFIN_ULB < -0.543776291 )
{
profileNo = 3 ;
strcpy ( result , menor0 ) ;
probability = 0.684 ;
}
else
if ( ALAFIN_ULB < 1.018342762 )
{
profileNo = 4 ;
strcpy ( result , menor10 ) ;
probability = 0.701 ;
}
else
{
profileNo = 5 ;
strcpy ( result , maior10 ) ;
probability = 0.650 ;
}
else
{
profileNo = 6 ;
strcpy ( result , menor0 ) ;
probability = 0.829 ;
}
}
108

Inteligncia Artificial

7.2.3. Regras em SAS


/* Decision Tree Code */
if ( ALAFIN_U < 4.129895766 )
then do;
if ( ALAOPE_U < 0.155443950 ) then do;
if ( ALAFIN_U < 2.358344990 ) then do;
profile = 1 ;
result = maior10;
prob = 0.433 ;
END;
else if ( ALAFIN_U >= 2.358344990 ) then do;
profile = 2 ;
result = menor0;
prob = 1.000 ;
END;
END;
else if ( ALAOPE_U >= 0.155443950 ) then do;
if ( ALAFIN_U < -0.543776291 ) then do;
profile = 3 ;
result = menor0;
prob = 0.684 ;
END;
else if ( ALAFIN_U >= -0.543776291 ) then do;
if ( ALAFIN_U < 1.018342762 )
then do;
profile = 4 ;
result = menor10;
prob = 0.701 ;
END;
else if ( ALAFIN_U >= 1.018342762 ) then do;
profile = 5 ;
result = maior10;
prob = 0.650 ;
END;
END;
END;
END;
else if ( ALAFIN_U >= 4.129895766 )
then do;
profile = 6 ;
result = menor0;
prob = 0.829 ;
END;

109

Para encomendar este livro, entre em contato com:

Papel Virtual Editora


Rua Marqus de So Vicente, 225
Prdio Genesis - sala 21-A - PUC-Rio
Gvea - Rio de Janeiro - RJ CEP: 22453-900

Tel: (021) 239-0170 Ramais: 2057 / 2026 (fax)


E-mail: editor@papelvirtual.com.br
Endereo Eletrnico: www.papelvirtual.com.br

Potrebbero piacerti anche