Sei sulla pagina 1di 100

APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO GEOQUMICA DE LEOS

Marcia Val Springer

Tese de Doutorado apresentada ao Programa de Ps-graduao em Engenharia Civil, COPPE, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessrios obteno do ttulo de Doutor em Engenharia Civil. Orientador(es): Dbora de Almeida Azevedo Luiz Landau

Rio de Janeiro Dezembro de 2012

APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO GEOQUMICA DE LEOS

Marcia Val Springer

TESE SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO LUIZ COIMBRA DE PS-GRADUAO E PESQUISA DE ENGENHARIA (COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSRIOS PARA A OBTENO DO GRAU DE DOUTOR EM CINCIAS EM ENGENHARIA CIVIL.

Examinada por: ________________________________________________ Profa. Dbora de Almeida Azevedo, D.Sc.

________________________________________________ Prof. Luiz Landau, D.Sc.

________________________________________________ Dr. Eugnio Vaz dos Santos Neto

________________________________________________ Profa. Celeste Yara dos Santos Siqueira, D.Sc.

________________________________________________ Prof. Nelson Francisco Favilla Ebecken

RIO DE JANEIRO, RJ - BRASIL DEZEMBRO DE 2012

Springer, Marcia Val Aplicao de Inteligncia Computacional na

Caracterizao Geoqumica de leos/ Marcia Val Springer. Rio de Janeiro: UFRJ/COPPE, 2012. X, 90 p.: il.; 29,7 cm. Orientador: Dbora de Almeida Azevedo Luiz Landau Tese (doutorado) UFRJ/ COPPE/ Programa de Engenharia Civil, 2012. Referncias Bibliogrficas: p. 83-90. 1. Caracterizao Geoqumica. 2. Agrupamento fuzzy. 3. Biomarcadores e Diamantides. I. Azevedo, Dbora de Almeida et al. II. Universidade Federal do Rio de Janeiro, COPPE, Programa de Engenharia Civil. III. Ttulo.

iii

Dedico esta tese aos meus pais, ao meu querido irmo, a minha querida Tia Marizete, ao meu querido esposo Antonio pela pacincia do dia a dia e incansvel apoio, e todas as pessoas que amo.

iv

"No existe sorte. Sorte quando a preparao encontra oportunidade". (autor desconhecido)

AGRADECIMENTOS
A Deus, graas sempre. Aos meus pais, Luiz e Juara, por tudo sempre. Ao meu esposo, Antonio, por seu amor, com amor sempre. Ele que foi o mais sacrificado pelas minhas frequentes ausncias e indisponibilidades. Pelo apoio incondicional que me deu desde sempre. Ao meu querido irmo, Marcus, um dos grandes incentivadores desta jornada. A minha querida Tia Marizete, por seu apoio e carinho incondicional, estando sempre ao meu lado. A minha querida dinda, Regina, e prima, Juju, pelo incentivo. A minha orientadora Dbora pela orientao, dedicao, compreenso e confiana prestadas a mim durante todos esses anos. Todo meu crescimento profissional, Mestrado e agora doutorado, foi regido por ela. Ao coordenador do curso Sistemas Petrolferos Luiz Landau, pelo empenho de oferecer um curso altamente qualificado e por todo apoio fornecido. A todos os professores que compartilharam os conhecimentos e experincias profissionais. A minha querida amiga Tatiana, pelo incentivo, apoio e animao diria, indispensveis, e por nunca permitir que eu desanimasse. A minha amiga Kaza, por todo apoio e carinho. Ao amigo Jean, pelo companheirismo e pacincia. Aos funcionrios do LAMCE e LAB2M, em especial Mnica, Srgio, Marcos e Vernica. Aos funcionrio do PEC, em especial Beth e ao Jairo, por seu excelente trabalho, carinho e ateno. Aos meus amigos do IFRJ, toda a equipe de fsico-qumica, e a amiga Regina pela torcida e incentivo.

vi

Aos membros da banca. Gostaria de agradecer ao Programa de Formao de Recursos Humanos da Agncia Nacional de Petrleo (PRH-02). A todos vocs que moram no meu corao um sincero Obrigado......

vii

Resumo da Tese apresentada COPPE/UFRJ como parte dos requisitos necessrios para a obteno do grau de Doutor em Cincias (D.Sc.)

APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO GEOQUMICA DE LEOS

Marcia Val Springer

Dezembro/2012

Orientadores: Dbora de Almeida Azevedo Luiz Landau

Programa: Engenharia Civil Durante os ltimos anos, em funo da demanda da explorao de petrleo, tem-se verificado um crescimento substancial da quantidade e complexidade de dados armazenados na forma digital na rea da geoqumica orgnica. Diante deste cenrio, busca-se testar o desempenho do mtodo de descoberta do conhecimento no apoio ao agrupamento de amostras de leos a partir de parmetros geoqumicos, para estimar a maturao trmica e identificar a origem. Em vista disso, o presente trabalho teve como objetivo propor um mtodo para extrao de informaes desconhecidas a partir de uma base de dados, contendo parmetros geoqumicos envolvendo biomarcadores e diamantides e tendo como resultados a visualizao de agrupamentos fuzzy de amostras de leos. Este mtodo foi desenvolvido sobre dados envolvendo bacias sedimentares brasileiras e a bacia sedimentar colombiana, Llanos Orientales. Segundo esse mtodo, as amostras foram agrupadas em cinco grupos diferentes quanto ao parmetro de maturao trmica. Na caracterizao do ambiente deposicional, observou-se que as amostras puderam ser divididas em quatro grupos principais: grupo 1 possui uma contribuio marinha; grupo 2 indicativos de uma mistura

(marinho e terrestre); grupo 3 possui caractersticas de uma mistura contendo, tambm, uma contribuio marinha e grupo 4 possui caractersticas terrestres.

viii

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the requirements for the degree of Doctor of Science (D.Sc.)

APPLICATION OF COMPUTATIONAL INTELLIGENCE IN GEOCHEMICAL CHARACTERIZATION OF OILS

Marcia Val Springer

December/2012

Advisors: Dbora de Almeida Azevedo Luiz Landau

Department: Civil Engineering Organic Geochemistry is a powerful tool to aid oil exploration. During recent years, due to the demand of oil, there has been a substantial increase in the amount and complexity of data stored in digital form. Given this scenario, we seek to test the performance of the method of knowledge discovery in supporting the grouping of oil samples from geochemical parameters to evaluate thermal maturity and identify source. Therefore, the present work aimed to propose a method to extract unknown information from a database, with the results to visualize fuzzy clusters of oil samples from geochemical parameters, involving biomarkers and diamondoid. This method was developed on data using Brazilian sedimentary basins and the Colombian sedimentary basin, named Llanos Orientales. Under this method, the samples were grouped into five different groups as the parameter of thermal maturation. In the characterization of the depositional environment, it was observed that the samples could be divided into four main groups: group 1 has a marine contribution, group 2 indicating a mixture (marine and terrestrial), group 3 has characteristics of a mixture containing a marine contribution, and group 4 has terrestrial features.

ix

ndice
Captulo1....................................................................................................................... 1
1.1) Introduo e Motivao ................................................................................................1 1.2) Objetivo ......................................................................................................................6

Captulo 2: rea de Estudo ......................................................................................... 7 Captulo3: Parmetros Geoqumicos ....................................................................... 14 Captulo4: Fundamentao Terica ........................................................................26
4.1) Anlise de agrupamento Clustering ....................................................................26 4.2) Mtodo de Agrupamento Fuzzy .................................................................................29 4.2.1) Mtodo de Clusterizao Fuzzy c-means (FCM) ...............................................32 4.2.2) Ajuste dos parmetros .........................................................................................36

Captulo5: Materiais e Mtodos ............................................................................... 40


5.1) Procedimentos Analticos ...........................................................................................40 5.1.1) Tcnicas Analticas Utilizadas.............................................................................42 5.2) Avaliao Estatstica dos dados .................................................................................44

Captulo6: Base de Dados - Descrio...................................................................... 47 Captulo7: Resultados e Discusso ........................................................................... 50


7.1) Parmetros de Maturao ..........................................................................................50 7.1.1) Interpretao dos resultados pela caracterizao de Biomarcadores e Diamantides ..................................................................................................................50 7.1.2) Anlise de agrupamento FCM fuzzy c-means .................................................60 7.2) Parmetros de Ambientes Deposicionais (Origem) ..................................................66 7.2.1) Interpretao dos resultados pela caracterizao de Biomarcadores e Diamantides ..................................................................................................................66 7.2.2) Anlise de agrupamento FCM fuzzy c-means .................................................73

Captulo 8: Concluso................................................................................................ 80 Captulo 9: Recomendaes ...................................................................................... 82 Captulo 10: Referncias Bibliogrficas................................................................... 83

Captulo 1.
1.1) Introduo e Motivao
Atualmente as organizaes tm-se mostrado extremamente eficientes em obter, organizar e armazenar grandes quantidades de dados, obtidos de suas operaes dirias ou pesquisas cientficas, porm a maioria no usa adequadamente essa gigantesca quantidade de dados para transform-la em conhecimentos e que poderiam ser utilizados em suas prprias atividades, sejam elas comerciais ou cientficas.

Para explorar e extrair informaes teis de um banco de dados foi proposto, em 1989, o processo de KDD (Knowledge Discovery Database). Este processo referese s etapas que produzem conhecimento a partir de dados e, principalmente, etapa de minerao de dados, que a fase que transforma dados em informao (FAYYAD et al.,1996). O conceito de Data-Mining (minerao de dados) est se tornando cada vez mais popular como uma ferramenta de descoberta de informaes, que podem revelar estruturas de conhecimentos, que possam guiar decises em condies de certeza limitada. Este processo de obter informaes a partir de um banco de dados no uma tarefa trivial, pois envolve algumas etapas com muitas decises realizadas pelo analista (Figura 1), como: Criao de um conjunto de dados alvos (SELEO); Pr-processamento e limpeza dos dados; Reduo de dados e projeo (TRANSFORMAO); Busca por padres e/ou associaes (MINERAO DE DADOS); Interpretao dos padres minerados.

Figura 1: Processo de extrao de conhecimento em bases de dados e suas etapas (adaptado FAYAAD et al. 1996)

A seleo de dados tem como objetivo identificar as origens internas e externas da informao, extraindo um subconjunto de dados necessrio para a aplicao da minerao de dados, selecionando apenas atributos relevantes aos objetivos do processo de extrao de conhecimento (MACEDO et al., 2010).

A etapa de processamento dos dados visa assegurar a qualidade dos dados selecionados. Como o resultado do processo de extrao possivelmente ser utilizado no processo de tomada de deciso, a qualidade dos dados um fator extremamente importante. Esta fase inicia-se com uma reviso geral da estrutura dos dados e a definio de medidas de qualidade, utilizando uma combinao de mtodos estatsticos e tcnicas de visualizao de dados. A seguir encontram-se descritos os problemas tratados na etapa de processamento dos dados, segundo BOENTE & GOLDSCHMIDT & ESTRELA (2008): Eliminao de dados duplicados - so removidos dados duplicados e/ou corrompidos; Tratamento de outliers- so valores significantemente fora do esperado para uma varivel; Valores faltantes - valores que no esto presentes no conjunto selecionado e valores invlidos que foram eliminados durante a deteco de outliers. 2

A etapa de transformao de dados tem como objetivo converter o conjunto bruto de dados em uma forma padro de uso, tornando os dados teis para a minerao (BOENTE, OLIVEIRA & ROSA, 2007). Devido s restries de espao em memria e tempo de processamento, o nmero de atributos disponveis para anlise pode inviabilizar a minerao de dados. Com isso, tcnicas de reduo de dados so aplicadas, sendo feitas de trs modos: Reduo do nmero de exemplos deve ser feita mantendo as caractersticas do conjunto de dados original, por meio da gerao de amostras representativas dos dados; Reduo do nmero de atributos realizada pelo especialista do domnio, seleciona-se um subconjunto dos atributos de forma que no tenha impacto na qualidade do conjunto final; Reduo do nmero de valores de um atributo consiste na reduo do nmero de valores de um atributo, geralmente utilizando-se tcnicas de discretizao e suavizao de valores. A discretizao de um atributo consiste na substituio de um atributo contnuo por um atributo discreto, por meio do agrupamento de seus valores. A suavizao de valores agrupa determinados atributos em um valor numrico que o represente, podendo ser, por exemplo, a mdia ou a mediana.

Essa etapa auxilia na reduo do tempo de processamento para a tcnica de minerao, diminuindo o espao de busca. As transformaes devem, entretanto, preservar ao mximo, nas amostras geradas, as informaes presentes nos dados brutos.

A minerao de dados a etapa mais importante do processo de KDD e caracteriza-se pela existncia de uma tcnica de minerao capaz de extrair conhecimento implcito de um banco de dados em funo de um objetivo proposto (JACKSON, 2002).

As tcnicas de minerao de dados podem ter gerado uma quantidade enorme de padres, dos quais podem no ser relevantes ou interessantes ao usurio. Um dos objetivos principais do processo de KDD que o usurio possa compreender e utilizar o conhecimento descoberto (FAYAAD et al., 1996). Mas, podem ocorrer casos em que os modelos so muito complexos ou no fazem sentido para os especialistas. Existem algumas formas de se caracterizar a qualidade dos resultados obtidos, como a compreensibilidade e a interessabilidade. A compreensibilidade de um conjunto de regras relaciona-se com a facilidade de interpretao dessas regras por um ser humano. Assim, quanto menor a quantidade de regras de um dado modelo e menor o nmero de condies por regra, maior ser a compreensibilidade das regras descobertas. A interessabilidade uma medida de qualidade que tenta estimar o quanto de conhecimento interessante ou inesperado existe, e deve combinar fatores numa medida que reflete como o especialista julga o padro. Aps a anlise do conhecimento, caso esse no seja de interesse do usurio final ou no cumpra os objetivos propostos, o processo de extrao pode ser repetido, ajustando-se os parmetros ou melhorando o processo de escolha dos dados, para a obteno de melhores resultados em uma prxima iterao.

Diferentes modelos podem ser aplicados aos bancos de dados para dar o suporte necessrio aos distintos problemas nas mais diversas reas. Estes modelos so divididos de acordo com a natureza da atividade, e os principais so: predio, agrupamento (Clustering) e classificao. No captulo 4 sero apresentadas em maiores detalhes as tcnicas de anlise de cluster (agrupamento), que o foco principal deste trabalho.

Para a obteno destes modelos, diferentes tcnicas computacionais baseadas em paradigmas da inteligncia computacional tm sido empregadas na indstria do petrleo. Dentre estas tcnicas esto as Redes Neurais, Lgica Fuzzy, Regras de Associao, rvores de deciso, Algoritmos Genticos, entre outros.

A construo de modelos determinsticos e de interpretao tem sido crescentemente substituda por estes mtodos computacionais. A diversidade destas aplicaes de minerao de dados usadas nos problemas de campos de leo e gs e a 4

aceitao destas metodologias tm se manifestado em grande interesse principalmente por parte de engenheiros e cientistas em todo o mundo.

Durante os ltimos anos, em funo no apenas da demanda da explorao de petrleo, mas tambm do desenvolvimento das tcnicas analticas, tem-se verificado um crescimento substancial da quantidade e complexidade de dados armazenados na forma digital na geoqumica orgnica. Este grande volume de dados acaba sendo invivel de ser analisado por especialistas atravs de mtodos convencionais, tais como planilhas de clculo e relatrios informativos operacionais, onde o especialista testa sua hiptese contra a base de dados. Estatsticas tradicionais so limitadas se levarmos em conta que a anlise se torna bastante trabalhosa quando o nmero de variveis a serem investigadas cresce seguidamente. Tais mtodos possuem condies que limitam o nmero de casos a utilizar, fazendo com que apenas uma pequena parte do universo esteja disponvel para a anlise e, quando os relacionamentos dos dados no so lineares, torna-se difcil empregar os mtodos estatsticos tradicionais.

Na Geoqumica Orgnica, as pesquisas envolvendo Inteligncia Artificial tm sua atuao de forma pontual. De um modo geral, as pesquisas baseadas em grandes volumes de dados na rea de Geoqumica Orgnica vm sendo norteadas a partir de uma perspectiva descritiva e preditiva, onde a estatstica a ferramenta.

Diante deste cenrio, busca-se testar o desempenho do mtodo de descoberta do conhecimento no apoio ao agrupamento de amostras de leos a partir de parmetros geoqumicos, como maturao e ambiente deposicional (origem).

A anlise de agrupamento tem por objetivo agrupar dados semelhantes em conjunto para que possam ser generalizadas como um grupo. H muitos algoritmos para anlise de cluster, com base em estatsticas, redes neurais e dos conjuntos fuzzy. Em vista disso, o presente trabalho tem como proposta a introduo da tcnica de Minerao de Dados baseados em Sistemas Fuzzy. O processo de clusterizao (agrupamento) escolhido para desenvolver o trabalho foi o algoritmo Fuzzy C-means (FCM).

1.2) Objetivo
No presente trabalho, foram analisadas amostras de leos provenientes de bacias sedimentares brasileiras e da bacia sedimentar colombiana Llanos Orientales.

O principal objetivo deste estudo propor um mtodo para extrao de informaes desconhecidas a partir de uma base de dados, tendo como resultado a visualizao de agrupamentos fuzzy de amostras de leo a partir de parmetros geoqumicos para avaliar a maturao trmica e identificar a origem.

Captulo 2. rea de estudo


O banco de dados para a realizao deste estudo apresenta parmetros geoqumicos de maturao e ambiente deposicional para amostras provenientes de bacias sedimentares da margem continental brasileira e da bacia sedimentar colombiana Llanos Orientales. As amostras de leo provenientes de bacias sedimentares brasileiras, exploradas neste presente trabalho, foram caracterizadas geoquimicamente nos trabalhos: JESUINO (2005), TAMANQUEIRA (2006), CALDAS (2009) e SILVA (2010). J as amostras de leo provenientes da bacia colombiana foram caracterizadas previamente no trabalho desenvolvido por SPRINGER (2007). A seguir, ser apresentada uma breve descrio das reas de estudo envolvidas.

- Bacias sedimentares brasileiras da margem continental

O Brasil um pas com uma das maiores extenses de margem continental do mundo, englobando diversos segmentos com bacias sedimentares com caractersticas geolgicas distintas e diferentes graus de conhecimento do potencial exploratrio, figura 2 (MELLO, 1988; MELLO et al., 1988a, b). A origem das bacias sedimentares da margem continental brasileira est diretamente relacionada ao processo de ruptura e separao das placas tectnicas africana e sul-americana, figura 3 (BIZZI et al., 2003).

A margem divergente da Amrica do Sul, estendendo-se por mais de 12.000 km desde o Delta do Orinoco no Oriente Venezuelano at a Terra do Fogo, no extremo sul da Argentina, inclui um sistema contnuo de bacias sedimentares originadas pelos mecanismos de distenso litosfrica que, a partir do Mesozico, conduziram ruptura do paleocontinente Gondwana, e separao definitiva das placas Africana e SulAmericana, acompanhando a formao do Oceano Atlntico Sul.

Considerando-se a natureza e a orientao dos campos de tenses regionais durante a fase de rifteamento e a dinmica das placas Africana e Sul-Americana 7

durante a fase de deriva continental, trs domnios distintos podem ser reconhecidos ao longo da margem: uma regio dominantemente distensiva, entre o sul da Argentina e o extremo nordeste da costa brasileira; um segmento de natureza transformante, correspondente ao Atlntico Equatorial; e a regio ao norte da Foz do Amazonas, onde novamente operaram processos de carter dominantemente distensional (MILANI & THOMAZ FILHO, 2000).

No domnio distensivo meridional, o estilo estrutural durante a fase rift foi marcado pela atividade de falhas normais orientadas principalmente na direo paralela costa. Este estilo pode ser observado em cada uma das bacias individuais ao longo da margem. Falhas de transferncia ocorrem a altos ngulos em relao direo regional de desenvolvimento das falhas normais. O conjunto de falhas normais evoluiu e acabou por definir a orientao regional de abertura da margem passiva, e as zonas de transferncia do rift nuclearam as grandes falhas transformantes do assoalho ocenico, cuja projeo contra a borda do continente se d em ngulo reto (MILANI et al., 2000).

O estilo tectnico da margem adjacente ao Atlntico Equatorial foi diferente. Cisalhamento dextrgiro foi o mecanismo responsvel pela ruptura crustal, originando um padro de falhas oblquas subverticais que controlaram o rifteamento e evoluram para grandes zonas de fratura ocenicas paralelas costa entre as quais se incluem Fernando de Noronha, Chain, Romanche e So Paulo.

Uma terceira regio na margem divergente da Amrica do Sul corresponde ao trecho situado ao norte da Foz do Amazonas. Tal domnio faz parte de outro contexto distensivo, o do Oceano Atlntico Central, mais antigo que o restante da margem uma vez que l se encontram documentados processos de ruptura ativos j no Trissico.

Os vrios setores individuais ou bacias ao longo da extensa e contnua margem divergente do continente compartilham algumas caractersticas comuns, como por exemplo, os clssicos estgios tectono-sedimentares evolutivos que incluem o rift, a fase transicional e a marinha aberta (MILANI et al., 2000).

Como resultado de sua histria evolutiva, o registro sedimentar dessas bacias pode ser subdividido em quatro grandes seqncias: pr-rift, rift, transicional, e drift. A sequncia pr-rift, depositada do final do Jurssico ao inicio do Cretceo, caracterizada por sedimentos continentais, principalmente lacustres, fluviais e delticos. A seqncia rift, de idade Neocomiana a Barremiana, se depositou na fase de extenso crustal e caracterizada pelo predomnio de sedimentos lacustres de gua doce/salobra a salina, e secundariamente, por depsitos flvio-delticos. A seqncia transicional, de idade Aptiana, depositou-se entre o final da fase rift e o incio do estgio drift, sendo caracterizada por depsitos fluviais, delticos e lacustres com influncia marinha e alta salinidade. Finalmente, a seqncia drift depositou-se do Albiano ao presente, em resposta ao processo de separao entre as placas africana e sul-americana e formao do oceano Atlntico, sendo que seus depsitos so essencialmente marinhos (BIZZI et al., 2003).

Figura 2: Mapa de localizao das bacias sedimentares da margem continental brasileira (modificado de MELLO et al., 1988b).

10

Figura 3: Mapa com a distribuio das bacias marginais dos litorais brasileiro e africano, apresentando reconstruo tectnica das bacias sedimentares na configurao pr-deriva continental, ajustado a reconstruo paleogrfica de 124Ma. (BIZZI et al., 2003).

11

- Bacia sedimentar colombiana, Llanos Orientales

A bacia sedimentar colombiana Llanos Orientales est localizada no final norte de uma longa srie de bacias subandinas, estendidas desde a Argentina at a Venezuela (Figura 4). A maior parte da bacia est localizada na Colmbia, cobrindo uma rea de aproximadamente 200.000 Km2, com uma pequena poro no sudeste da Venezuela. A bacia dos Llanos Orientales cercada ao oeste pela Cordilheira Oriental; ao norte pela bacia Apure e pela Cordilheira de Mrida na Venezuela; a leste pelo escudo cratnico Guiana e ao sul pela Bacia Amaznica. A bacia dos Llanos Orientales, situada na Colmbia, tem sua historia geolgica ligada ao

desenvolvimento da parte norte dos Andes. Embora a formao desta bacia e o preenchimento inicial com sedimentos tenham sido provocados por mecanismos de subsidncia tectnica e termal associados com eventos de extenso litosfrica (rift intracratnico e back-arc), a geometria atual e os processos de carga do petrleo esto associados a mecanismos compressivos que provocaram inverso tectnica e o soerguimento dos Andes no Negeno.

Esses

ltimos

eventos

criaram

novas

estruturas

ou

transformaram

drasticamente aquelas mais antigas, modificando os regimes termal e de presses e tendo importantes implicaes no funcionamento dos sistemas petrolferos, principalmente na distribuio e qualidade das acumulaes (BAUTISTA, 2008).

A ltima seo do Cretceo do nordeste da Amrica Latina contm excelentes rochas geradoras, que tem originado a maioria dos leos encontrados na Colmbia, Equador e Venezuela. Os sedimentos ricos em matria orgnica da formao La Luna so descritos como de fontes marinhas, alglicas e carbonticas (ZUMBERGE, 1983). Entretanto, reconstrues estratigrficas e paleogeogrficas mostram que este esquema um pouco simplista. A complexa evoluo tectnica do nordeste da Amrica do Sul resulta em uma grande variedade de ambientes deposicionais e condies paleogeogrficas, que controlam o tipo e a quantidade de matria orgnica preservada. Essas mudanas nas caractersticas da rocha geradora resultam em diferentes tipos de leos (BAUTISTA, 2008).

12

80 W

75 W

MarCaribbean do Caribe Sea


10 N

Oceano Pacific Ocean Pacfico

"

Bacia Llanos Orientales

1120000

CONCESION TRINIDAD
1100000

CANO GARZA

LAS ABEJAS

FLORENA PAUTO SUR


1080000

TOCARIA
YOPAL

CUPIAGUA
1060000

LA GLORIA NORTE LA GLORIA SARDINAS

CUSIANA BUENOS AIRES


1040000

RIO CHITAMENA

1020000

JUNCAL EL PALMAR
1000000 1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000

0m

25000 m

50000 m

1280000

1300000

1320000

1340000

Figura 4: Mapa de localizao da bacia sedimentar colombiana Llanos Orientales, apresentando os campos explorados ( ).

13

Captulo 3.
Parmetros Geoqumicos
O petrleo uma mistura complexa de produtos metaestveis,

predominantemente de hidrocarbonetos e outras substncias orgnicas sulfuradas, nitrogenadas e oxigenadas (TISSOT & WELTE, 1984), ou seja, apresenta quatro grupos de compostos: hidrocarbonetos saturados, hidrocarbonetos aromticos, resinas e asfaltenos. uma substncia oleosa, inflamvel, menos densa que a gua, com cheiro caracterstico e de cor varivel.

A indstria petrolfera foi gradualmente percebendo, ao longo de dcadas de explorao, que para se encontrar jazidas de hidrocarbonetos de volume significativo era imperioso que um determinado nmero de requisitos geolgicos ocorresse simultaneamente nas bacias sedimentares. O estudo destas caractersticas de maneira integrada e a simulao preliminar das condies timas para sua existncia concomitante, com o objetivo de permitir a diminuio do risco exploratrio envolvido nas perfuraes de poos, um item de elevado custo, foram consolidados em um nico conceito: sistema petrolfero. O conceito de sistema petrolfero agrupa os diversos elementos que controlam a existncia de jazidas de petrleo numa bacia sedimentar. Tal conceito, visualizado numa escala global, parece justificar de maneira adequada as diversas provncias petrolferas conhecidas.

Um sistema petrolfero ativo compreende a existncia e o funcionamento sncronos de quatro elementos (rochas geradoras maturas, rochas-reservatrio, rochas selantes e trapas) e dois fenmenos geolgicos dependentes do tempo (migrao e sincronismo) (MILANI et al, 2000).

O petrleo tem origem a partir da matria orgnica depositada nas bacias sedimentares. Com o progressivo soterramento e aumento da temperatura ao longo do tempo geolgico, a matria orgnica passa por uma srie de transformaes fsicoqumicas que podem ser agrupadas de acordo com os seguintes estgios evolutivos: diagnese, catagnese e metagnese (TISSOT & WELTE, 1984; PETERS & MOLDOWAN, 1993; HORSFIELD & RULLKOTER,1994). 14

A diagnese o processo inicial de alterao fsica, qumica e biolgica da matria orgnica sob condies de soterramento incipiente e baixas temperaturas. Ao final dessa etapa, a biomassa de origem sedimentar se transforma em querognio, constituinte orgnico das rochas sedimentares, insolvel em solventes orgnicos (TISSOT & WELTE, 1984). Com o aumento da presso e temperatura (soterramento progressivo), o querognio degradado para a formao do petrleo, iniciando o estgio denominado catagnese, e a matria orgnica passa por uma srie de transformaes qumicas, tais como reaes de isomerizao, aromatizao e craqueamento, que resultam na converso do querognio em leo. Sob condies de soterramento ainda maiores, chega-se ao estdio denominado metagnese, onde mudanas mais severas no material orgnico ocasionam a formao de metano e restando apenas resduos carbonosos.

O grupo dos hidrocarbonetos saturados constitui o grupo mais abundante e a classe mais investigada, pois onde se encontram os biomarcadores (terpanos e esteranos) e os diamantides.

A concentrao de hidrocarbonetos saturados no petrleo depende das suas geradoras que por sua vez esto relacionadas ao tipo de matria orgnica e seu respectivo ambiente deposicional. leos mais pesados e leos originados de matria orgnica de origem continental possuem maior proporo destes compostos, enquanto que leos derivados de matria orgnica de origem marinha, ou uma mistura destes dois tipos de matria orgnica geram um petrleo mais rico em compostos cclicos (TISSOT & WELTE, 1984).

A caracterizao dos sistemas petrolferos, atravs de parmetros de geoqumica orgnica, fundamental para o desenvolvimento de modelos preditivos para a explorao de petrleo nas bacias sedimentares. A maturao trmica e o tipo da matria orgnica constituem as principais variveis que controlam a gerao de hidrocarbonetos nas bacias sedimentares. So vrios os parmetros geoqumicos utilizados para avaliar o nvel de evoluo trmica e para caracterizar o ambiente deposicional das rochas geradoras (PETERS & MOLDOWAN, 1993); os mais

15

utilizados se baseiam nas reaes de isomerizao de biomarcadores, particularmente das famlias dos esteranos e terpanos, e na concentrao de diamantides.

Os biomarcadores so compostos orgnicos complexos que apresentam tomos de carbono e hidrognio, e so encontrados em rochas e sedimentos. So fsseis moleculares derivados de substncias presentes em organismos vivos, que mostram pequenas mudanas na estrutura herdada das molculas orgnicas originais (ZUNBERGE, 1987a; PETERS & MOLDOWAN, 1993). Durante a diagnese, as molculas dos precursores, os triterpenides e esterides, que contm um ou mais tomos de oxignio e que frequentemente apresentam ligaes duplas, passam por reaes qumicas nas quais perdem os tomos de oxignio. Suas ligaes duplas so reduzidas para produzir o biomarcador saturado mais estvel, preservado nas amostras geolgicas. Estes compostos representam uma pequena frao do petrleo, porm so de grande importncia, pois permitem a correlao entre leo e a rocha geradora, a avaliao do grau de evoluo trmica e do nvel de biodegradao que o leo foi submetido (WAPLES & MACHIHARA, 1991).

Os parmetros de biomarcadores tm sido amplamente utilizados para a caracterizao de ambientes deposicionais das rochas geradoras de petrleo. Vrios autores descrevem a distribuio dos biomarcadores como uma ferramenta til para distinguir rochas geradoras depositadas em diferentes ambientes. As razes de biomarcadores, quando comparadas com outros parmetros, so teis na inferncia do tipo de rocha geradora mesmo quando apenas amostras de leos esto disponveis (PETERS et al., 2005). Os organismos que apresentam os precursores biolgicos dos biomarcadores vivem em determinadas condies ambientais. Logo, os

biomarcadores podem ser utilizados como indicadores dessas condies de vida (WALPES & MACHIHARA, 1991).

A seguir, esto listados os parmetros mais utilizados na caracterizao de ambientes deposicionais:

16

Razo Pristano/Fitano Os biomarcadores Pristano e Fitano so os compostos mais conhecidos e mais abundantes em sedimentos e leos. A fonte mais comum desses isoprenides a clorofila A, presentes em organismos fototrficos. A cadeia fitil da clorofila quebrada em condies anxicas ou redutoras em sedimentos, formando o fitol, que sofre reduo dihidrofitol e chega a fitano. Em condies xicas o fitol tambm sofre oxidao cido fitnico, que em seguida descarboxila gerando o pristeno e por reduo forma o pristano, Figura 5 (BROOKS et al., 1969; PETERS et al., 2005).

Figura 5: Origem diagentica do pristano e fitano a partir do fitol (PETERS et al., 2005).

DIDYK et al. (1978) propuseram uma relao direta entre a razo pristano/fitano (Pr/Fi) e oxigenao do ambiente deposicional. Valores de razo Pr/Fi < 1 indicariam deposio anxica, particularmente quando acompanhadas pela alta quantidade de porfirina e de enxofre. J a razo Pr/Fi > 1 indicaria ambiente deposicional xico. Em estudos de bacias sedimentares da margem continental brasileira, alguns autores propuseram que em ambientes de gua doce e salinos (lacustre de gua doce, salino e marinho aberto) ocorre a predominncia do pristano, com razo pristano/fitano maior que 1. J em ambientes marinhos carbonticos e hipersalinos, ocorre a predominncia de fitano, com razo pristano/fitano menor que 1 (MELLO et al., 1988a, 1988b; MELLO & MAXWELL, 1990). Segundo PETERS et al. (2005), os valores desta razo normalmente se encontram na faixa entre 0,8 e 3,0, sendo que para ambientes xicos caractersticos de matria orgnica terrestre a razo pristano/fitano maior que 3,0, enquanto que para ambientes anxicos, comumente hipersalinos ou carbonticos, a razo pristano/fitano menor que 0,8. 17

Razo Hopano/Esteranos Um dos principais parmetros de biomarcadores para anlise de origem a razo entre os hopanos/esteranos. Esta razo foi obtida abrangendo os esteranos C27C29 (20S+20R) + esteranos C27-C29 (20S+20R) e os hopanos C29, C30, C31-C33 (22S+22R). Esta razo mostra a maior contribuio de organismos eucariticos (especialmente algas) ou contribuio de organismos procariticos (bactrias). Em geral, altas concentraes de esteranos e baixos valores da razo hopanos/esteranos (menor ou igual a 4) indicam deposio de matria orgnica marinha com maior contribuio de organismos planctnicos e/ou algas. Diferentemente, baixas concentraes de esteranos e altos valores de razo hopano/esterano (maior que 7) indicam deposio de matria orgnica continental e/ou microbiana retrabalhada (PETERS et al., 2005).
Razo TPP/DIA

Outro importante parmetro de origem a razo dos poliprenides tetracclicos (TPPs) / Diasteranos C27 13(H),17(H) (20S+20R). HOLBA et al. (2000, 2003) mostraram que indicadores especficos, os tetracclicos poliprenides (TPP), permitem uma melhor diferenciao entre os ambientes lacustres e marinhos. A caracterizao desses ambientes mais complexa porque eles possuem uma enorme variedade de condies deposicionais. Estes autores mostraram que a abundncia destes compostos no petrleo reflete a natureza do ambiente. Altas concentraes relativas de TPPs em leos e rochas geradoras em relao aos disteranos indicam deposio em ambientes marinhos. Razo Diasteranos/Esteranos A razo disteranos/esteranos dada por [(C27 13, 17(H) 20S + 20R)/(C27 5,14,17(H) 20S + 20R)]. Os diasteranos esto presentes em quantidades significativas em leos que apresentam alta maturao trmica (WAPLES & MACHIHARA, 1991). So formados facilmente emsedimentos clsticos, logo a razo disteranos/esteranos frequentemente usada para diferenciar rochas geradoras carbonticas de clsticas (WALPES & MACHIHARA, 1991; PETERS et al., 2005). 18

Baixos valores da razo diasteranos/esteranos indicam matria orgnica anxica pobre em material argiloso, rocha carbontica ou hipersalina. J altos valores, so tpicos de rochas geradoras ricas em argila como, por exemplo, ambientes lacustres e marinho deltaico (PETERS et al., 2005). Porm, alguns estudos mostraram o oposto a esta afirmao, uma vez que altos valores da razo disateranos/esteranos foram encontrados em extratos de rochas carbonticas, MOLDOWAN et al. (1991), e em rochas geradoras da Flrida pobres em argila (PALACAS et al., 1984).

MOLDOWAN et al. (1986), SEIFERT & MOLDOWAN et al. (1978) sugeriram que alm do ambiente deposicional, esta razo influenciada pelo potencial de oxi-reduo, pela maturao e/ou biodegradao. Os diasteranos so mais estveis que os esteranos e se tornam mais abundantes com o aumento da maturao. A intensa biodegradao pode resultar na destruio seletiva dos esteranos e alterar a interpretao do resultado. Assim. Esta razo til para diferenciar condies deposicionais quando as amostras apresentam nveis de maturao e de biodegradao similares (PETERS et al., 2005). Razo Terpanos Tricclicos/17(H), 21(H)-hopano Os terpanos tricclicos foram propostos inicialmente como compostos capazes de avaliar o grau de evoluo trmica de rochas e leos (SEIFERT & MOLDOWAN, 1978). Posteriormente, foram utilizados para caracterizar ambientes deposicionais. MELLO et al. (1988 a; 1988 b) sugeriram que a principal importncia dos tricclicos se encontra na sua abundncia e no tanto no seu padro de distribuio. Razo terpano tetracclico/17(H), 21(H)-hopano O terpano tetracclico C24tem sido encontrado em leos e extratos de inmeras rochas evaporticas e carbonticas (AQUINO NETO et al., 1983; PALACAS et al., 1984; PETERS et al., 2005). Porm, alguns estudos em leos australianos de origem terrestre mostram a presena deste composto.

19

Esta razo bastante utilizada na caracterizao de ambientes deposicionais, e de acordo com alguns estudos, as maiores abundncias do terpano tetracclico C24 foram encontradas em ambientes marinho deltaicose lacustres salinos (MELLO, 1988). No entanto, este autor afirma que na ausncia de outras evidncias a alta abundncia relativa do terpano tetracclico C24 indica abundante deposio de matria orgnica terrestre. Razo Ts/Tm SEIFERT & MOLDOWAN. (1980), mostraram que esta razo s era afetada pela maturao trmica. Porm, alguns estudos posteriores mostraram a correlao de Ts e Tm com condies diagenticas. Apesar da relao entre Ts/Tm e a litologia ainda no ser bastante clara, vrios estudos j mostraram que os valores de Ts/Tm so menores em ambientes hipersalinos e maiores em carbonticos (RULLKOTTER & MARZI, 1988; WAPLES & MACHIHARA, 1991). ROBINSON, (1987), mostrou tambm que em leos de origem terrestre os valores de Tm so maiores e nos leos de origem lacustre so baixos.

O avano das transformaes qumicas sofridas pelo querognio e o petrleo sob condies crescentes de soterramento e temperatura resultam na formao de hidrocarbonetos mais leves que podem ser monitorados por uma srie de indicadores geoqumicos, conhecidos como parmetros de maturao trmica (TISSOT & WELTE, 1984).

Distribuies de biomarcadores so amplamente utilizados na avaliao da maturidade do leo (PETERS & MOLDOWAN, 1993). Muitos dos parmetros de maturao, envolvendo biomarcadores, atingem o equilbrio antesda janela de leo, e em alguns casos, mostram inverso em nveis elevados de maturidade. Consequentemente, estas propores no so eficazes como indicadores de maturao para leos de alta maturidade (FARRIMOND et al., 1998).

Os parmetros de maturao trmica mais usados so:

20

22S/(22S+22R); razo de isomerizao dos homohopanos Isomerizao no C22 dos 17(H)-hopanos C31a C35ocorre antes que muitas razes de biomarcadores usados para estimar a maturao trmica de leos e sedimentos. O precursor biolgico possui a configurao 22R que gradualmente convertida em uma mistura de diastereoismeros 22R e 22S. As propores de 22R e 22S podem ser calculadas para todos ou apenas um homohopano. Porm, como os homlogos C33, C34e C35 podem apresentar problemas de coeluio de picos, os mais utilizados para calcular esta razo so os homlogos C31e C32 (PETERS et al., 2005). A razo 22S/(22S+22R) varia de 0 a 0,6 (valor de equilbrio 0,57 a 0,62) durante o processo de maturao trmica. Alguns estudos mostram que essa razo sofre influncia de alguns fatores, como por exemplo, a litologia da bacia. Portanto, essa razo deve ser utilizada com cautela (PETERS et al., 2005). Terpanos Tricclicos/17(H)-hopanos Esta razo aumenta com o aumento da maturao trmica. Isto ocorre porque mais tricclicos so liberados do querognio em altos nveis de maturao. A origem dos terpanos tricclicos pode ser o resultado da diagnese de vrios precursores biolgicos; logo esta razo pode variar consideravelmente entre leos de diferentes rochas geradoras ou diferentesfcies orgnicas da mesma rocha geradora (PETERS et al., 2005). Ts/(Ts+Tm) Durante a catagnese, C2717(H)-trisnorhopano (Tm ou 17(H)-22,29,30trisnorhopano) apresenta menor estabilidade do que o C27 18(H)-trisnorhopano II (Ts ou 18 (H)-22,29,30-trisnorneohopano).

Esta razo deveras dependente quanto maturidade e quanto origem. Por isso, um bom indicador de maturao quando utilizada para avaliar leos de mesma origem com fcies orgnicas compatveis (PETERS et al., 2005).

21

20S/(20S+20R), razo de isomerizao dos esteranos Devido facilidade na anlise usando os cromatogramas de massa do on m/z 217, as razes de isomerizao dos esteranos so calculadas nos compostos C29 (24etilcolestanos, estigmastanos ou sistostanos), visto que os compostos C27 e C28 apresentam interferncia de coeluio de picos (PETERS et al., 2005).

medida que aumenta a maturao trmica, a configurao R no C20, existente nos precursores esteroidais presentes nos organismos vivos, convertida em uma mistura de configuraes R e S. A isomerizao no C20 do C29 5(H),14(H),17(H) aumenta a razo de zero para aproximadamente 0,5, sendo o valor de equilbrio entre 0,52 e 0,55.

Alguns fatores como variaes organofcies e a biodegradao podem afetar razes de esteranos. No caso da biodegradao, h a remoo seletiva dos epmeros resultando no aumento da razo para valores acima de 0,55 (PETERS et al., 2005). /(+), C29 esteranos A isomerizao no C-14 e C-17 nos C29 esteranos regulares 20S e 20S gera um aumento na razo /(+), que varia de valores prximos de zero at 0,7 (valores de equilbrio 0,67 a 0,71). O grfico /(+) versus 20S/(20S+20R) para os esteranos C29 so eficazes na caracterizao da maturao trmica das rochas geradoras e leos, sendo muito utilizado no estudo de sistemas petrolferos (SEIFERT & MOLDOWAN, 1986).

Geralmente, os parmetros de maturao baseados em biomarcadores saturados no podem ser aplicados em amostras de leo altamente maturo como dito anteriormente. Sendo assim, utiliza-se uma anlise integrada dos parmetros de

biomarcadores e diamantides, j que estes so mais estveis degradao trmica.

22

Os diamantides j foram identificados em vrios leos brutos (WEI et al., 2007; AZEVEDO et al., 2008 e referncias, SPRINGER et al., 2010; FANG et al., 2012). Eles so rgidos, e mais estveis do que os hidrocarbonetos: uma vez formados, eles so resistentes destruio trmica e biolgica (WINGERT, 1992). Variaes na estabilidade trmica de diamantides metil-substitudos levaram utilizao de determinadas propores de ismeros como parmetros de maturao de leos brutos e rochas geradoras, especialmente em fases de alta gerao de hidrocarboneto (CHEN et al., 1995; 1996).

Usando as relaes de diamantides em combinao com os biomarcadores, podemos efetuar uma avaliao mais refinada de maturidade e de ambiente deposicional (DAHL et al., 1999; AZEVEDO et al., 2008; SPRINGER et al., 2010).

Os parmetros de diamantides empregados na avaliao das amostras de leo do presente estudo foram os ndices IMA (ndice metil-adamantano) e IMD (ndice dimetiladamantano), proposto por CHEN et al. (1996), e os ndices do grfico de DAHL et al. (1999) para avaliao do grau de maturao trmica, apresentados a seguir.

Os estudos de DAHL et al. (1999) propuseram que a estabilidade trmica dos diamantides conduz sua concentrao progressiva durante o craqueamento do leo, enquanto a concentrao de biomarcadores diminui. Este mtodo particularmente til para condensados altamente maturos, onde outros mtodos podem no ser confiveis. Os biomarcadores, por geralmente apresentarem ligaes que podem ser rompidas, com o aumento da maturao trmica, sua concentrao decresce antes do craqueamento da maioria dos componentes de leos. Os diamantides, que apresentam estrutura molecular bastante estvel quando comparada a outros componentes do petrleo, tendem a ter concentraes maiores no leo residual. Desta forma, o craqueamento intenso de um leo acarreta a destruio da maioria dos componentes e o aumento da concentrao de diamantides. Segundo DAHL et al. (1999), diferentes biomarcadores apresentam comportamentos diferentes frente estabilidade trmica.

23

Para obteno da correlao entre diamantides e biomarcadores, sugeriram preferencialmente a utilizao da concentrao de um dos biomarcadores menos estveis, o 5(H),14 (H),17(H)-24-etilcolestano 20R (estigmastano), pois sua concentrao se aproxima de zero no ponto em que a concentrao de diamantides comea a aumentar (Figura 6). A utilizao das concentraes do 3-metildiamantano e 4-metildiamantano foi sugerida pelo fato de que estes compostos no so facilmente perdidos por evaporao.

Figura 6: Ilustrao da curva assinttica caracterizando a correlao entre as concentraes de diamantides (metildiamantanos) e biomarcadores (estigmastano) para leos de diferentes nveis de maturao trmica, craqueados e no craqueados, de um sistema petrolfero especfico (adaptado de DAHL et al., 1999).

CHEN et al. (1996) identificaram os diamantides em amostras de leos e rochas geradoras de algumas bacias sedimentares chinesas. Com a finalidade de avaliar o grau de evoluo trmica, foram estabelecidas duas razes de diamantides: (1) IMA ndice de metiladamantano = 1MA/(1MA+2MA), (2) IMD ndice de metildiamantano = 4MD/(1MD + 3 MD + 4 MD). A abundncia relativa do 1metiladamantano e 4-metildiadamantano deve aumentar em funo do grau de evoluo trmica em razo das maiores estabilidades desses compostos.

24

Esses parmetros de maturao foram escolhidos por serem mais resistentes ao estresse trmico, e j terem sido amplamente estudados (PETERS & MOLDOWAN, 1993; AZEVEDO et al., 2008; SPRINGER et al., 2010).

25

Captulo 4. Fundamentao Terica


4.1) Anlise de agrupamento Clustering
A anlise de agrupamento uma das etapas na minerao de dados que rotineiramente utilizada como um primeiro passo para descobrir a estrutura oculta do conjunto de dados no ordenados, criando grupos com certa similaridade, ou seja, cria grupos associados a uma funo de pertinncia (HLLERMEIER, 2005). Por esse critrio: sendo um conjunto de dados representados pelos registros e valores das variveis, deseja-se criar uma funo que determine qual grupo cada registro pertence. O objetivo desta tcnica dividir o conjunto de dados em subconjuntos homogneos. A anlise de agrupamento possui diversas etapas:

representao dos padres (podendo incluir extrao ou seleo de caractersticas): envolve definio do nmero, tipo e modo de apresentao dos atributos que descrevem cada padro;

seleo de caractersticas: processo de identificao do subconjunto mais efetivo dos atributos disponveis para descrever cada padro;

extrao de caractersticas: uso de uma ou mais transformaes junto aos atributos de entrada de modo a salientar uma ou mais caracterstica dentre aquelas que esto presentes nos dados.

medida de similaridade: fornecida por uma funo de distncia definida entre pares de dados ou padres. possvel incluir na medida de distncia aspectos conceituais (qualitativos) ou ento numricos (quantitativos).

agrupamento: os grupos podem ser definidos como conjuntos crisp (um padro pertence ou no-pertence a um dado grupo) ou fuzzy (um padro pode apresentar graus de pertinncia aos grupos). O processo de agrupamento pode 26

ser hierrquico, com um processo recursivo de junes ou separaes de grupos, ou no-hierrquico, com o emprego direto de tcnicas de discriminao de clusters.

apresentao: deve permitir que um computador possa utilizar o resultado de forma direta ou ento deve ser orientada ao usurio, permitindo a visualizao grfica dos clusters e a compreenso de suas inter relaes, atravs da proposio de prottipos ou outras descries compactas para os clusters.

realimentao do resultado do processo de clusterizao pode levar redefinio dos mdulos de extrao ou seleo de caractersticas e medida de similaridade.

A Figura 7 apresenta as etapas dessa anlise.

Figura 7: Esquema ilustrando as etapas do processo de agrupamento (adaptado de HLLERMEIER, 2005).

27

Sendo um ramo da estatstica, a clusterizao tem sido vastamente estudada por muitos anos, baseando-se na introduo de uma medida de distncia entre os objetos. A partir da utilizao dessa medida, determina-se um critrio que expressa a ideia da clusterizao, isto , que particiona o conjunto de objetos em n clusters individuais e homogneos, nos quais elementos de um cluster so to similares entre si quanto possvel, e to diferentes quanto possvel, dos elementos dos outros clusters. Segundo BRAILOVSKY (1991), a minimizao desse critrio resulta em clusters timos.

A anlise de agrupamentos lida com a descoberta de estruturas e grupos de um conjunto de dados, e para melhor proveito, dados multivariados. Assim sendo, dificilmente algum poder afirmar que a descoberta de determinado grupo ser perfeita. De fato, rudos ou imprecises no podem ser completamente eliminados (HOPPNER et al., 2000).

Na anlise de agrupamento clssica, cada objeto atribudo a um cluster de uma maneira inequvoca. Consequentemente, os grupos individuais so separados por uma fronteira acentuada, abrupta. Na prtica, tais limites no so frequentemente muito naturais. Na verdade, a fronteira entre os clusters e a transio entre eles so geralmente suave e no abrupta. Isso pode ser feito por meio do uso da Teoria de Conjuntos Fuzzy (TCF) para representar valores imprecisos. Nos mtodos de agrupamento fuzzy, um objeto pode pertencer a diferentes grupos ao mesmo tempo, o grau que cada objeto pertence a um grupo particular expresso em termos de uma funo de pertinncia (HLLERMEIER, 2005).

No presente trabalho, o algoritmo adotado o fuzzy c-means (FCM), que pertence ao grupo de algoritmos para agrupamentos fuzzy, desenvolvido segundo EVSUKOFF et al., 2004. A seguir ser apresentado o mecanismo de agrupamento via fuzzy c-means.

28

4.2) Mtodo de Agrupamento Fuzzy


Como visto anteriormente, na anlise de cluster clssica (crisp), essas classes devem formar uma partio de X; indivduos que pertencem ao mesmo bloco (classe) da partio esto totalmente relacionados (so indistinguveis) e indivduos que pertencem a blocos distintos no esto relacionados. Em outras palavras, indivduos esto totalmente relacionados entre si ou no esto relacionados. Em muitas aplicaes prticas, no entanto, uma partio crisp pode ser muito restritiva e invivel, devido, muitas vezes, impreciso ou a no completeza dos dados.

Segundo BEZDEK & PAL (1992), a impreciso nos dados pode surgir de diversas fontes. Por exemplo, erros em instrumentos ou rudos no experimento podem levar a valores parcialmente confiveis de determinados atributos. Em alguns casos, o custo envolvido na extrao de valores muito precisos de um atributo pode ser alto. Em outros casos, pode ser difcil decidir quais so os atributos mais relevantes que caracterizam um elemento. Por essas razes, torna-se conveniente o uso de variveis lingusticas e limitaes para descrever os valores de atributos, em vez de tentar fornecer uma representao numrica exata para os dados com valores incertos dos atributos. Isso pode ser feito por meio do uso da Teoria de Conjuntos Fuzzy (TCF) para representar valores imprecisos. Conjuntos Fuzzy esto inerentemente inclinados a lidar com o conhecimento e domnio lingustico produzindo solues mais interpretveis. Essa teoria de conjuntos fuzzy foi introduzida primeiramente por Zadeh em meados da dcada de 60, e construa a partir dos conceitos j estabelecidos da lgica clssica.

Na teoria clssica dos conjuntos, as relaes entre um elemento e um conjunto so bem definidas: dado um conjunto A em um universo U, os elementos deste universo pertencem ou no pertencem quele conjunto. Esta relao expressa por uma funo caracterstica fA: se fA(x) = 1, x pertence a A; se fA(x) = 0, x no pertence a A.

29

Zadeh props uma generalizao: a funo caracterstica pode assumir um nmero infinito de valores no intervalo de [0,1]. Sendo assim, um conjunto fuzzy A em um universo U definido por uma funo de pertinncia A(x): U[0,1]. Um determinado elemento do universo pode pertencer simultaneamente a um conjunto e ao seu complementar, sendo representado pela funo de pertinncia (REZENDE, 2005).

Segundo KLIR & YUAN (1995), a teoria de conjuntos fuzzy pode ser utilizada em pelo menos dois nveis no problema de clusterizao: 1) no nvel de atributos, para representar os elementos do conjunto como um vetor de graus de pertinncia, sendo que cada um desses graus representa o grau de posse do atributo em questo, por parte desses elementos; e 2) no nvel de classificao, para representar a pertinncia desses elementos s classes, bem como para prover uma estimativa das informaes incompletas em termos de valores de pertinncia. Em ambos os casos, permitem-se diferentes graus de relacionamento entre elementos do conjunto, sendo que um elemento pode pertencer a mais de uma classe. Com a utilizao da abordagem fuzzy, o problema passa ento a ser caracterizado como um problema de clusterizao fuzzy, cujo objetivo a obteno de uma partio fuzzy em um conjunto de dados X. No agrupamento fuzzy, cada cluster um conjunto fuzzy de todos os padres, como apresentado na Figura 8, que exemplifica agrupamentos nebulosos e no nebulosos sendo os retngulos H1 e H2 agrupamentos crisp (hard) e as elipses F1 e F2 a sada do algoritmo nebuloso.

30

Figura 8: Comparao entre agrupamentos clssicos (conjuntos H1 e H2) e agrupamentos fuzzy (conjuntos F1 e F2) (modificado de JAIN, MURTY, FLYNN, 1999). Existem muitos algoritmos de clusterizao disponveis na literatura, sendo que a sua escolha depende dos tipos de dados disponveis e da aplicao desejada (GAN et al., 2007). Dois tipos so mais aceitos: algoritmos de mtodos hierrquicos e de mtodos de partio. O primeiro organiza o conjunto de dados em uma forma hierrquica de acordo com a proximidade entre os indivduos e os resultados so visualizados na forma de um dendrograma. J os mtodos particionais associam um conjunto de indivduos a k grupos sem criar uma estrutura hierrquica.

A maioria dos algoritmos de clusterizao de alguma forma dependente de uma distncia a qual utilizada para definir que registros so similares e quais no. Vrios mtodos tm sido desenvolvidos para obter tanto clusters baseados na teoria clssica quanto fuzzy a partir de um determinado conjunto de dados. Para o caso da abordagem fuzzy, foco deste trabalho, na seo seguinte ser apresentado o algoritmo de relevncia e aplicabilidade para este estudo, o algoritmo Fuzzy c-means.

31

4.2.1) Mtodo de Agrupamento Fuzzy C-means (FCM)


Fuzzy C-means o algoritmo de clusterizao de mtodo de partio mais popular, e derivado do algoritmo K-means. O mtodo de clusterizao FCM feito substituindo a funo caracterstica por uma funo de pertinncia, que gera uma transio suave, ou seja, permite que um dado pertena a dois ou mais agrupamentos simultaneamente (EVSUKOFF et al., 2004; EVSUKOFF et al., 2006; OLIVEIRA & PEDRYCZ, 2007). Pode ser descrito da seguinte maneira:

Supondo um conjunto de indivduos X={x1,...,xn}, x Rp (espao p

dimensional), deseja-se organiz-los em clusters, C={C1,..., Cc}. O algoritmo FCM objetiva fornecer uma partio fuzzy de um conjunto de indivduos em c clusters. Sendo assim, ele define e minimiza uma funo objetivo (Jm), a qual mede a adequao entre os indivduos e os clusters:

Onde, m>1 representa o fator de nebulosidade que existe entre uma categoria e outra. O algoritmo possui V={v1,...,vc} como um conjunto de vetores que representa os centros das categorias. U representa a matriz de graus de incluso nebulosos, e ij o grau de incluso do ponto j na categoria i. A matriz U deve seguir as seguintes condies: a soma dos valores de pertinncia de um registro a todas as classes igual a 1, ou melhor, a soma de todas as colunas de uma linha da matriz U igual a 1; cada registro deve pertencer a pelo menos um agrupamento e nenhum deles deve conter todos registros, ou seja, a soma de todas as linhas da matriz U deve ser maior que 0 e menor que n.

O mtodo fuzzy c-means pode ser equacionado por meio de um algoritmo iterativo, baseado na minimizao de um ndice de desempenho, que indica a 32

adequabilidade da pseudopartio gerada. O desempenho do algoritmo influenciado pela escolha do nmero de classes c, dos centros de cluster iniciais, da ordem na qual os vetores so processados, da medida de distncia, do critrio de parada e pelas propriedades geomtricas dos dados. Os conjuntos que apresentam clusters compactos, bem separados e com formas hiperesfricas, so apropriados para este mtodo, mas para encontrar agrupamentos adequados necessrio realizar extensivos testes com vrios valores de c, distncias, critrios de parada, centros de cluster iniciais e diferentes ordens de amostras.

Assim, o algoritmo assume como entrada os seguintes parmetros: o nmero desejado de clusters c; uma medida de distncia m (1,), que define a distncia permitida entre os pontos e os centros de cluster; e um nmero pequeno > 0, utilizado como um critrio de parada, alm da instanciao inicial dos graus de pertinncia dos objetos a cada uma das classes e dos centros de cluster dessas classes. A seguir, sero descritos os passos do algoritmo.

Passo1: Considere t = 0 representando a iterao 0. Defina P(0) como uma pseudopartio P = {A1,A2,,Ac}, atribuindo os graus de pertinncia dos elementos s classes dessa pseudopartio, os quais podem ser informados ou calculados de forma aleatria. Passo2: No caso de t = 0, fornea os c centros de cluster 1(t), c(t) iniciais. Para t > 0, calcule os c centros de cluster 1(t), c(t) pela equao abaixo para P(t) e o valor de m fornecido.

A varivel real m > 1 chamada de ndice de fuzzificao e usada para definir a distncia permitida entre os pontos e o centro que est sendo calculado. Quanto maior o valor de m, mais elementos do conjunto so considerados como pertencentes 33

a uma pseudopartio.

Esse parmetro escolhido de acordo com o problema

considerado. No existe nenhuma base terica para uma escolha tima do valor de m. O vetor i, calculado pela equao acima visto como o centro do cluster Ai a mdia ponderada dos dados em Ai. O peso do dado X a m-sima potncia do seu grau de pertinncia ao conjunto fuzzy Ai.

Passo3: Atualize P(t) para P(t+1) usando o seguinte procedimento: para cada xk X e para todo i {1,2,,c}, se ||xk - i(t)||2 >0, calcule o grau de pertinncia do elemento xk classe Ai, pela frmula abaixo, sendo que as classes Ai podem ser selecionadas em uma ordem pr-definida ou aleatoriamente.

Assume- se que || || alguma norma indicada para o produto interno no espao Rp e ||xk-i(t)||2 representa a distncia entre xk e i.

Por meio da frmula acima, a distncia de cada elemento xk ao centro de cluster i da pseudopartio atual Ai comparada distncia do mesmo elemento ao centro de cluster j de todas as demais pseudoparties Aj, de modo a atribuir um grau de pertinncia ao elemento xk no cluster Ai que seja proporcional ao seu grau de pertinncia aos demais clusters Aj. Quando ||xk - i(t)||2= 0 para algum i I {1,2,,c}, o que indica que xk corresponde ao centro de cluster i, defina Ai(t+1) (xk) como um nmero real no negativo que satisfaz a equao abaixo e defina Ai(t+1)(xk)= 0 para i {1,2,,c} -I.

34

Em casos como este, quando o elemento coincide com o centro de cluster de uma classe Ai, o ideal seria que o algoritmo atribusse a tal elemento o grau de pertinncia mximo (1) quela classe e o grau de pertinncia mnimo (0) s demais classes. No entanto, o teste realizado pela frmula acima se torna necessrio, uma vez que esse elemento pode ter sido associado a outras classes com um grau de pertinncia maior que zero, se Ai no for a primeira classe selecionada pelo algoritmo. Nota- se, portanto, a influncia da ordem na qual as pseudoparties so escolhidas.

Passo 4: Como critrio de parada, compare P(t)e P(t+1). Se |P(t)-P(t+1)| , ento pare; caso contrrio, faa t = t + 1 e retorne ao Passo 2. Neste teste, |P(t) - P(t+1)| denota a distncia entre P(t+1) e P(t), dada pela frmula:

Essa frmula verifica se a mxima diferena entre o grau de pertinncia de qualquer elemento xk em uma dada classe Ai na iterao atual e na iterao anterior menor que o erro definido e, sendo isso feito para todas as classes. Em caso positivo, o algoritmo deve parar e retornar os graus de pertinncias atuais de todos os elementos, em todas as classes, como resultado. Note que, quanto menor o valor de , maior o nmero de passos e, consequentemente, mais refinada a pseudopartio final obtida.

Ao final da ltima iterao do algoritmo, a pseudopartio obtida deve ser analisada segundo algum critrio que expresse a ideia geral de que as associaes so fortes dentro do cluster e fracas entre clusters. Este critrio pode ser definido, por exemplo, em termos de ndices de desempenho, tal como o ndice Jm(P), dado em funo dos centros de cluster e de m pela frmula a seguir.

35

Este ndice de desempenho mede, para todos os elementos, a soma das distncias ponderadas de cada elemento a cada um dos centros de cluster da pseudopartio. Quanto menor o valor de Jm(P), melhor a pseudopartio fuzzy P. Consequentemente, o objetivo do mtodo de clusterizao fuzzy c-means encontrar uma pseudopartio P que minimize o ndice de desempenho Jm(P). Assim, o problema de clusterizao pode ser equacionado como um problema de otimizao. Vrios testes, utilizando diferentes valores para os parmetros do algoritmo, podem ser feitos de forma a se obter ndices de desempenho menores, ou seja, resultados mais adequados.

4.2.2) Ajuste dos parmetros


Diversos so os critrios de validao do resultado do agrupamento propostos na literatura (XIE & BENI, 1991; BEZDEK, 1998, PAKHIRA, 1998).

Aps a aplicao desses algoritmos algumas perguntas ficam no ar, como por exemplo: Quantos grupos existem no conjunto de dados?; Os resultados realmente representam o meu conjunto de dados?; Essa a melhor maneira de particionar os dados?. Para tais questionamentos, existem medidas que visam validar os mtodos empregados, medindo a qualidade dos agrupamentos resultantes da aplicao dos algoritmos. A ideia geral presente nesses ndices de validao baseia-se em uma viso geomtrica da partio, de forma que uma boa partio apresenta clusters compactos e bem separados (EVSUKOFF et al., 2004). Para a anlise de cluster fuzzy, em que o valor de pertinncia associado a cada ponto, o grau de superposio entre os grupos deve ser levado em conta, sendo a melhor partio aquela que apresentar a menor superposio.

Para produzir uma escolha tima do nmero de grupos, alguns ndices so utilizados para validar, a posteriori, o resultado do agrupamento. No entanto, no existe consenso quanto ao ndice ou coeficiente de validade mais eficiente, havendo 36

ainda pesquisas sendo desenvolvidas a esse respeito, como em KIM et al. (2004) e WU & YANG (2005), com uma tentativa de encontrar um ndice que se encaixe a qualquer estrutura de dados.

Um dos ndices mais recentes de validao, o PBM, foi proposto por trs pesquisadores: Pakhira, Bandyopadhyay e Maulik. Este ndice o produto de trs fatores, cuja maximizao garante uma partio formada por um nmero pequeno de clusters e compactos separados (PAKHIRA et al., 2004). Esse ndice pode ser definido por:

sendo c o nmero de agrupamentos e,

tal que,

e,

N o nmero total de pontos do conjunto, U(X) = [uki]cN uma matriz de pertinncia para os dados e vi a matriz de centro do i -simo agrupamento. O objetivo maximizar o ndice para obter o nmero de agrupamentos. Quanto maior o ndice PBM, melhor ser a clusterizao fuzzy.

37

O ndice Calinski e Harabasz (CALINSKI & HARABASZ, 1974) escolhe como melhor esquema de agrupamento aquele em que obtm o maior valor do ndice, faz testes estatsticos e vale-se apenas da estrutura interna para validar os agrupamentos.

em que

a disperso interna dos grupos,

a disperso entre os grupos e c o centro do conjunto de dados.

O ndice de validao XB (XIE & BENI, 1991) define-se pela seguinte equao:

em que uij so entradas de uma matriz U que representa um agrupamento de dados difuso. Valores baixos deste ndice indicam grupos compactos e bem separados.

38

ndices de validao como PBM, Calinski-Harabasz, Xie-Beni, de maneira geral, tentam avaliar a capacidade intra-cluster e a separao inter-cluster (PAKHIRA et al., 2004).

Note-se que o uso concomitante de um conjunto de ndices diferentes pode representar um subsdio mais robusto na escolha do melhor nmero de grupos. Isto porque resultados de ndices de origens diferentes e com interpretaes diversas que apresentam recomendaes coincidentes reforam as convices para a escolha a ser feita.

O ndice de validao PBM obteve bons resultados em vrios bancos de dados quando comparado com outros ndices (PAKHIRA et al., 2004). Sendo assim, o ndice PBM foi aplicado na realizao deste trabalho.

39

Captulo 5. Materiais e Mtodos

A utilizao das tcnicas geoqumicas permite correlacionar os leos entre si e com as rochas geradoras caracterizadas, correlaes essas que podem levar a concluses a respeito dos tipos de petrleo presentes em uma provncia produtora, e seus graus de evoluo trmica.

Para a realizao deste estudo foi selecionado um conjunto de amostras de leos que foram caracterizadas por parmetros geoqumicos, envolvendo biomarcadores e diamantides.

A preparao das amostras e os mtodos analticos empregados foram realizadas do laboratrio LAGOA - Laboratrio de Geoqumica Orgnica Molecular e Ambiental do Instituto de Qumica da UFRJ.

5.1) Procedimentos Analticos


As anlises geoqumicas realizadas nas amostras de leo, descritas a seguir, foram: separao em fraes por cromatografia lquida; cromatografia gasosa do leo total (whole oil) e cromatografia gasosa acoplada a espectrometria de massas da frao dos hidrocarbonetos saturados. O procedimento analtico realizado no laboratrio est representado na figura 9.

40

leo Bruto

Cromatografia Gasosa

Cromatografia Lquida

Padres Internos (PIs)

Hexano

Hexano/ Diclorometano (8:2)

Metanol/ Diclorometano (9:1)

Frao de HCs Saturados

Frao de HCs Aromticos

Frao de Compostos Polares

CG-EM

Biomarcadores

Diamantides

Figura 9: Esquema ilustrativo da sequncia de anlises para as amostras de leos selecionados.

41

5.1.1) Tcnicas analticas utilizadas


As amostras de leos foram analisadas utilizando-se cromatografia lquida, cromatografia gasosa (CG) e cromatografia gasosa acoplada espectrometria de massas (CG-EM).

- Cromatografia lquida

A cromatografia lquida utilizada para separar os leos em fraes: hidrocarbonetos saturados, hidrocarbonetos aromticos e compostos polares (denominados NSO), a partir da propriedade da polaridade especfica que cada composto possui.

Aproximadamente, 100 mg de leo bruto foi pesado e dissolvido em 5,0 mL de hexano, e acrescentou-se 0,5 mL da mistura de padres preparada previamente (ndodecano-d26, n-hexadecano-d34 (Chiron S.A., Noruega), e n-tetracosano-d50 (Cambridge Isotopes Laboratories, USA)). A soluo foi adicionada no topo da coluna cromatogrfica contendo 2,5 mg de slica gel ativada, e foi eluda com hexano. Sendo assim, as fraes de hidrocarbonetos saturados (1 frao), hidrocarbonetos aromticos (2 frao) e compostos NSO (3 frao) foram separadas (GRICE et al. 2000; AZEVEDO et al., 2008; SPRINGER et al., 2010).

A frao de hidrocarbonetos saturados (1 frao) foi eluda com 5,0 mL de nhexano e recolhida em frascos de 2,0 mL, totalizando um volume final de aproximadamente 1,5 mL e logo em seguida analisada por cromatografia gasosa acoplada espectrometria de massas para a deteco dos diamantides.

42

Posteriormente, o volume final foi reduzido a aproximadamente 800 L, para anlise dos biomarcadores.

A frao de hidrocarbonetos aromticos (2 frao) foi eluda com 10,0 mL de nhexano/diclorometano (8:2), enquanto a frao dos compostos polares (3 frao) foi eluda com 10,0 mL de diclorometano/metanol (9:1).

- Cromatografia gasosa

A Cromatografia Gasosa (CG) uma tcnica de separao e anlise de misturas de substncias volatilizveis. A cromatografia em fase gasosa permite uma separao mais refinada dos compostos orgnicos presentes em leos ou extrato de rocha do que a cromatografia lquida. Seus resultados so apresentados sob a forma de grfico (cromatograma) onde observada a distribuio dos compostos orgnicos presentes.

A anlise de leo total (Whole oil) foi realizada em um cromatgrafo gasoso Agilent Technologies modelo HP5890 srie II, coluna capilar DB-5 de 30 metros de comprimento, 0,25 mm de dimetro interno e 0,25 m de espessura de fase estacionria. As condies cromatogrficas utilizadas para as anlises foram: temperatura de 40C (isoterma de 1 minuto) a 310C (isoterma de 19 minutos), com taxa de aquecimento de 6C min-1. A temperatura do injetor foi de 290C e do detector foi de 320C.

- Cromatografia Gasosa acoplada Espectrometria de Massas (CG-EM)

A cromatografia gasosa no revela a informao estrutural sobre os compostos em anlise, por isso importante o acoplamento de um cromatgrafo a gs com um detector mais especfico, como por exemplo, o detector seletivo de massas. Este acoplamento leva obteno do espectro de massas de cada analito que eludo da cromatografia (CG). A interpretao do espectro de massas (EM) permite a identificao dos componentes de interesse.

43

As fraes dos hidrocarbonetos saturados separadas por cromatografia em coluna de slica foram analisadas por cromatografia gasosa de alta resoluo acoplada a espectrometria de massas (CG/EM). Estas foram realizadas em um instrumento Agilent Technologies 6890N acoplado a um detector seletivo de massas Agilent Technologies 5973 utilizando uma coluna capilar de slica fundida recoberta com DB5 (J&W; 30 m X 0,25 mm d.i.; df = 0,25 m).

As amostras foram analisadas por CG-EM atravs do modo de monitoramento seletivo de ons (MSI). Para a caracterizao dos biomarcadores foram selecionados os seguintes ons: m/z 217 para os -esteranos, m/z 218 para os -esteranos e m/z 191 para terpanos, m/z 177, 259 e 231, e m/z 66 para os padres internos (n-alcanos perdeuterados: n-dodecano-d26, n-hexadecano-d34 e n-tetracosano-d50). As

condies cromatogrficas utilizadas para as anlises foram: temperatura 70C a 170C com taxa de aquecimento 20C min-1, de 170C a 310C com aquecimento de 2C min-1 e isoterma de 310C durante 10 minutos. Foi realizada injeo automtica de 1,0 L da amostra, com impacto de eltrons a 70 eV, utilizando hlio como gs de carreador, a uma presso constante de 10 psi.

No caso dos diamantides foram selecionados os seguintes ons: m/z 135, 136, 149, 163, 177 (adamantanos); m/z 187, 188, 201, 215 (diamantanos) e m/z 66 para os padres internos (n-alcanos perdeuterados: n-dodecano-d26, nhexadecano-d34 e ntetracosano-d50). As condies cromatogrficas utilizadas para as anlises foram: temperatura 40C a 180 C com taxa de aquecimento 3 C min-1, de 180 C a 310C com aquecimento de 6C min-1 e isoterma de 310C durante 10 minutos. Foi realizada injeo automtica de 1,0 L da amostra, com impacto de eltrons a 70 eV, utilizando hlio como gs de carreador, a uma presso constante de 10 psi.

5.2) Avaliao estatstica dos dados


Hoje em dia, existem diversas ferramentas encontradas no mercado que seriam passveis de serem utilizadas na execuo deste estudo. Dentre elas destacam-se: o Statistica, MatLab, Clementine, Intelligent Miner e Weka. Porm, para a realizao deste trabalho optou-se pela utilizao do MatLab verso 6.5, de fcil interface com o usurio e com mdulos de visualizao j contemplados no pacote. 44

O MatLab um "software" interativo de alta performance voltado para o clculo numrico, que integra anlise numrica, clculo com matrizes, processamento de sinais e construo de grficos em ambiente fcil de usar onde problemas e solues so expressos somente como eles so escritos matematicamente, ao contrrio da programao tradicional (SANTOS, 2009). A modelagem pode ser dividida em quatro blocos principais, conforme apresentado na Figura 10.

Figura 10: Esquema de viso geral do processo para anlise de grupos.

A Seleo e Tratamento de Dados o processo responsvel pelo prprocessamento dos dados. O processo de anlise de agrupamento de dados inicia-se com a seleo e preparao do conjunto de dados a ser utilizado na fase de agrupamento. Estas duas etapas envolvem a seleo de um conjunto de dados representativo da base de dados e a realizao de processos de tratamento de dados, a fim de garantir a qualidade dos dados que sero utilizados nas etapas seguintes do processo.

45

A Parametrizao do Aplicativo o processo responsvel pela parametrizao do processo de agrupamento de dados, bem como os resultados a serem analisados.

Agrupamento de Dados e Gerao de Resultados o processo responsvel pelo agrupamento de dados, bem como a gerao dos dados a serem utilizados na etapa de apresentao dos resultados.

A fase de Apresentao dos Resultados a responsvel pelo processamento dos dados da etapa anterior para gerao dos grficos e planilhas, disponibilizando as tabelas e grficos que servem de auxlio anlise dos resultados gerados pelo processo de agrupamento de dados.

46

Captulo 6. Base de Dados - Descrio


A caracterizao dos sistemas petrolferos, atravs de parmetros de geoqumica orgnica, fundamental para o desenvolvimento de modelos preditivos para a explorao de petrleo. A maturao trmica e a caracterizao do ambiente deposicional das rochas geradoras constituem os principais parmetros controladores de gerao de hidrocarbonetos nas rochas sedimentares, e muitos autores tm mostrado que as evidncias geoqumicas e as distribuies dos biomarcadores e diamantides podem fornecer critrios para distinguir rochas geradoras depositadas em diferentes ambientes, como j discutido no captulo 3.

Como j citado anteriormente, a base de dados contem registros de parmetros de maturao trmica e ambiente deposicional de 69 amostras, envolvendo razes de biomarcadores e diamantides, que foram selecionadas a partir de trabalhos j desenvolvidos anteriormente. Essas amostras de leos so provenientes de bacias sedimentares brasileiras e da bacia sedimentar Llanos Orientales, sendo no total 7 bacias diferentes, como apresentado na Tabela 2. A seguir, ser apresentado um resumo destes estudos, mostrando a caracterizao geoqumica quanto aos parmetros de maturao e origem.

47

Tabela 2: Relao das amostras de leos usadas neste etudo. As amostras de A a G pertencem s bacias brasileiras (indicadas em verde), e as H, bacia colombiana (indicadas em laranja).

BA1 BA2 BA3 BA4 BA5 BA6 BB1 BB2 BB3 BC1 BC2 BC3 BC4 BC5 BC6 BC7 BC8

BC9 BC10 BC11 BC12 BC13 BC14 BC15 BC16 BC17 BC18 BC19 BC20 BC21 BC22 BC23 BC24 BC25

BC26 BE1 BE2


BF1 BF2 BF3 BF4 BF5 BF6 BG1 BG2 BG3 BG4 BG5 BH1 BH2 BH3

BH4 BH5 BH6 BH7 BH8 BH9 BH10 BH11 BH12 BH13 BH14 BH15 BH16 BH17 BH18 BH19 BH20

Os estudos envolvendo as amostras de leo selecionadas indicam que os leos apresentam graus de maturao diferente, isto , sofreram aquecimento diferenciado no processo de gerao, ao longo do tempo geolgico.

Segundo JESUINO (2005), TAMANQUEIRA (2006), CALDAS (2009) e SILVA (2010), cujo objetivo foi caracterizar amostras de bacias sedimentares brasileiras (bacias BA a BG), as amostras estudadas apresentam diferentes graus de evoluo trmica, estando alguns leos na fase de craqueamento. O emprego dos parmetros de biomarcadores mostrou-se restrito para a avaliao de leos com alto grau de evoluo trmica, alm do limite de estabilizao da maioria dos parmetros de esteranos e hopanos (que ocorre antes ou durante a janela de gerao do leo). 48

Portanto, a integrao das anlises de diamantides e biomarcadores foi decisiva para a caracterizao dos leos. Os diamantides permitiram a obteno de resultados mais consistentes. As anlises destes compostos sugerem que os leos das bacias envolvidas apresentam diferentes estgios de maturao: foram encontradas amostras com alto grau de evoluo trmica e amostras pouco evoludas termicamente.

A origem dos leos foi diagnosticada como sendo marinha, mas diferentes graus de influncia de matria orgnica depositada em ambiente continental (ou lacustre).

No estudo desenvolvido por SPRINGER (2007), cujo objetivo foi a caracterizao geoqumica de leos provenientes da bacia sedimentar colombiana, Llanos Orientales, as amostras de leo analisadas apresentaram, tambm, diferentes estgios de maturao. O estudo realizado demonstrou que os leos estudados foram classificados como biodegradados de baixa maturidade a alta maturidade e, tambm, como craqueados. Essa caracterizao tambm s foi possvel de ser determinada pela integrao de parmetros de biomarcadores e diamantides, segundo Dahl et al. (1999).

Na caracterizao do ambiente deposicional, baseados em parmetros de biomarcadores, o estudo demonstrou que algumas amostras possuem caractersticas de matria orgnica marinha, outras de matria orgnica terrestre e, a grande maioria se comporta como mistura.

49

Captulo 7. Resultados e Discusso


Este captulo apresenta primeiramente a interpretao dos resultados atravs dos mtodos tradicionais, ou seja, correlaes entre os parmetros envolvidos, tanto para a caracterizao da maturao quanto para a caracterizao da origem. Em seguida, apresenta os resultados da execuo do algoritmo Fuzzy c-means.

7.1) Parmetros de Maturao


7.1.1) Interpretao dos resultados Biomarcadores e Diamantides pela caracterizao de

Para a caracterizao geoqumica dos leos em estudo, alguns parmetros de biomarcadores e diamantides propostos na literatura como indicadores do nvel de evoluo trmica (SEIFERT & MOLDOWAN, 1991; WAPLES & MACHIHARA, 1991; CHEN et al., 1996; WASEDA & NISHITA, 1998; DAHL et al., 1999; PETERS et al., 2005) foram calculados e avaliados, como mostra a Tabela 3.

50

Tabela 3: Valores dos parmetros de biomarcadores dependentes de maturao trmica para as amostras de leo estudadas. As amostras de BA a BG pertencem s bacias brasileiras, e as BH, bacia colombiana.

AMOSTRAS IMD BA1 0,58 BA2 0,68 BA3 BA4 BA5 BA6 BB1 BB2 BB3 BC1 BC2 BC3 BC4 BC5 BC6 BC7 BC8 BC9 BC10 BC11 BC12 BC13 BC14 BC15 BC16 BC17 BC18 BC19 BC20 BC21 BC22 BC23 BC24 BC25 0,57 0,58 0,55 0,53 0,39 0,33 0,40 0,46 0,44 0,47 0,44 0,38 0,44 0,42 0,41 0,40 0,39 0,30 0,31 0,38 0,38 0,27 0,44 0,34 0,44 0,42 0,41 0,43 0,45 0,45 0,44 0,44

3-+4Metildiamantanos Estigmastano IMA (ppm) (ppm) 0,67 0,69 0,68 0,68 0,69 0,76 0,63 0,57 0,64 0,61 0,68 0,68 0,69 0,60 0,68 0,61 0,65 0,68 0,64 0,62 0,62 0,68 0,62 0,69 0,74 0,62 0,69 0,57 0,64 0,72 0,71 0,73 0,70 0,72 90,89 137,17 91,77 130,39 111,08 29,77 0,37 1,84 2,41 45,35 44,34 21,04 22,87 16,67 25,83 20,03 5,54 7,48 4,38 86,56 30,08 9,21 8,16 45,85 4,00 83,52 4,62 26,82 5,14 32,33 30,00 150,16 19,03 19,96 9,25 21,32 106,02 50,65 8,33 3,78 34,19 83,13 73,63 342,66 721,40 28,64 235,57 766,88 688,90 41,25 29,80 30,82 24,64 20,09 44,66 19,69 294,14 6,16 8,69 25,99 7,61 76,34 11,28 13,46 23,74 0,50 148,70 112,44

Esteranos /(+)(C29) 0,61 0,61 0,52 0,51 0,41 0,49 0,34 0,43 0,31 0,53 0,35 0,24 0,55 0,3 0,23 0,48 0,6 0,6 0,39 0,5 0,32 0,6 0,43 0,4 0,35 0,45 0,39 0,4 0,42 0,52 0,34 0,33 0,41 0,37

Esteranos S/(S+R) C29 0,55 0,63 0,56 0,54 0,5 0,58 0,49 0,5 0,41 0,57 0,54 0,41 0,69 0,48 0,49 0,51 0,58 0,54 0,59 0,58 0,48 0,7 0,43 0,38 0,52 0,24 0,42 0,52 0,53 0,52 0,52 0,54 0,52 0,4

51

BC26 BE1 BE2 BF1 BF2 BF3 BF4 BF5 BF6 BG1 BG2 BG3 BG4 BG5 BH1 BH2 BH3 BH4 BH5 BH6 BH7 BH8 BH9 BH10 BH11 BH12 BH13 BH14 BH15 BH16 BH17 BH18 BH19 BH20

0,59 0,50 0,46 0,50 0,52 0,43 0,49 0,49 0,47 0,40 0,61 0,41 0,50 0,44 0,42 0,41 0,43 0,43 0,42 0,42 0,42 0,41 0,41 0,41 0,42 0,44 0,43 0,44 0,45 0,43 0,40 0,40 0,43 0,43

0,71 0,64 0,61 0,76 0,77 0,75 0,64 0,65 0,63 0,85 0,67 0,70 0,67 0,75 0,70 0,66 0,69 0,69 0,68 0,67 0,67 0,67 0,68 0,66 0,69 0,69 0,70 0,68 0,68 0,65 0,61 0,66 0,64 0,68

52,38 2,15 3,39 23,30 41,09 40,63 47,97 59,60 158,36 11,64 302,70 33,41 110,28 63,30 224,61 34,36 44,91 49,23 50,27 51,22 37,24 46,71 111,30 121,76 131,14 110,07 125,72 111,47 104,33 87,24 37,85 59,58 52,78 106,41

19,52 135,74 70,26 56,24 122,80 57,01 29,30 37,77 19,16 36,91 44,13 23,48 0,69 22,51 10,16 7,19 7,40 8,67 6,40 12,05 4,85 11,01 17,68 6,72 15,01 31,20 52,18 58,12 17,68 16,59 38,77 25,95 32,92 25,78

0,31 0,37 0,35 0,50 0,44 0,44 0,57 0,58 0,49 0,47 0,62 0,51 0 0,54 0,50 0,55 0,63 0,54 0,76 0,60 0,75 0,75 0,68 0,67 0,70 0,68 0,68 0,70 0,61 0,64 0,53 0,67 0,38 0,53

0,36 0,51 0,48 0,37 0,28 0,38 0,22 0,26 0,28 0,44 0,33 0,38 0 0,38 0,51 0,36 0,35 0,51 0,33 0,58 0,27 0,34 0,46 0,38 0,33 0,56 0,38 0,33 0,33 0,36 0,50 0,38 0,55 0,56

IMD: ndice de metildiamantano. IMA: ndice de metiladamantano.

52

Para a caracterizao geoqumica das amostras de leos em estudo, podemos destacar duas razes de biomarcadores que envolvem a isomerizao de esteranos, muito utilizadas na avaliao da maturao de leos: a razo dos C29 20S/ (20S+20R) e a razo dos C29 / (+) (FARRIMOND et al., 1998).

A razo 20S/ (20S + 20R) esterano C29 usada para medir a evoluo trmica da rocha geradora ao longo da zona imatura e parte da zona principal de gerao do leo, chamada janela de gerao do leo (PETERS & MOLDOWAN, 1993). Apenas a configurao R no C-20 est presente nos precursores esteroidais oriundos de organismos vivos. Esta configurao convertida ao longo do processo de maturao para uma mistura de esteranos de configuraes R e S e atinge seus valores de equilbrio antes ou durante o incio da janela de gerao do leo. Esses valores variam de zero at aproximadamente 0,5, sendo que os valores 0,52 e 0,55 se encontram na faixa de equilbrio (SEIFERT & MOLDOWAN, 1986; PETERS et al., 2005).

A razo / ( + )-esterano C29 uma razo de isomerizao importante nos estudos de maturao. Seus valores de equilbrio atingem a janela de gerao do leo, variando de zero a aproximadamente 0,7, sendo que os valores 0,67 e 0,71 se encontram na fase de equilbrio. A configurao dos esteranos a produzida biologicamente. Com o avano do processo da diagnese, esta forma progressivamente, converte-se em uma mistura de epmeros e . Esta transformao ainda no bem conhecida, acredita-se que dois tomos de hidrognio prximos mudam simultaneamente da posio alfa () para a posio beta (). J que existem os diastereoismeros 20S e 20R para cada forma, e respectivamente, existiro quatro espcies distintas em cada uma das famlias (C27, C28 e C29 esteranos). A isomerizao no C-14 e C-17 nos C29 esteranos regulares 20S e 20R gera um aumento na razo / (+), que com o progressivo aumento da maturao, varia de valores prximos a zero at valores prximos a 0,7 (PETERS et al., 2005).

53

Uma grande ferramenta usada para a avaliao mais completa destas duas razes o grfico de correlao entre elas, apresentado na Figura 11.

Figura 11: Grfico de relao entre as razes / (+) versus 20S/ (20S + 20R).

Para a razo / (+), o grfico mostrou que apenas as amostras da bacia BH (bacia sedimentar colombiana Llanos Orientales) atingiram ou ultrapassaram o limite de estabilizao. As demais amostras de leo, todas provenientes de bacias sedimentares brasileiras, no atingiram o limite de estabilizao para esta razo.

Os resultados da razo 20S/ (20S + 20R) mostram que amostras provenientes de trs bacias BA, BC e BH atingiram ou ultrapassaram a zona de equilbrio.

As amostras de leo provenientes das bacias BB, BF e BG se encontram abaixo das zonas de estabilizao para ambas os parmetros.

A partir da figura 11, no se observa uma tendncia de evoluo linear para todo o grupo de leos analisado, e sim certa disperso e uma tendncia de agrupamento por bacia, o que evidenciaria, aparentemente, um controle da origem dos leos sobre alguns parmetros de maturao. 54

A fim de auxiliar no estudo do grau de evoluo trmica dos leos selecionados, utilizaram-se os diamantides atravs dos ndices propostos por Chen et al., (1996), detalhados no captulo 3: MAI = 1-MA/(1-MA + 2-MA) e MDI = 4-MD/(1-MD + 3MD + 4-MD). A Figura 12 apresenta o grfico que correlaciona esses ndices.

Na avaliao das amostras sob a influncia dos parmetros de CHEN et al. (1996) foi observado que as amostras de leo estudadas esto distribudas em regies de altos valores dos ndices IMD e IMA. Os leos da bacia BA e alguns leos das bacias BC, BF e BG se destacam (crculo azul) apresentando os maiores valores para ambos os ndices, indicando um elevado grau de evoluo trmica. Por outro lado, alguns leos da bacia BC e uma amostra da bacia BB (destacado no crculo vermelho) apresentam os menores valores de MAI e MDI, sendo considerado os leos menos evoludo termicamente em relao aos demais.

Figura 12: Grfico entre os ndices de metiladamantanos (MDI) e metildiamantanos (MAI) para as amostras de leo selecionadas.

55

Outras correlaes realizadas foram entre o MDI e as razes de biomarcadores

/ (+) e 20S/ (20S + 20R) esterano C29, Figuras 13A e 13B,


respectivamente. A partir destes grficos, podemos observar que o parmetro origem pode ser um grande controlador sob alguns fatores maturao: no existe uma tendncia linear para todo o grupo, e sim um visvel agrupamento por bacia. Na figura 13B, observa-se uma clara separao entre as amostras da bacia BH (bacia colombiana) e as demais amostras, provenientes de bacias sedimentares brasileiras. No grfico da figura 13A, observou-se uma disperso linear para as amostras das bacias brasileiras, destacando as amostras da bacia BA como as mais evoludas termicamente.

56

Aumento da maturao

Figura 13: Grficos de : (A) correlao entre MDI e a razo / (+); (B) correlao entre MDI e a razo 20S/ (20S + 20R) esterano C29.

57

Outra correlao muito estudada para analisar a evoluo trmica dos leos foi proposta por DAHL et al. (1999). A resistncia estabilidade trmica dos diamantides leva a um consequente aumento da sua concentrao durante a evoluo trmica do leo, enquanto a concentrao dos biomarcadores, que so menos resistentes a essas condies, diminui. Com o aumento do estresse trmico os biomarcadores so degradados, este fato pode ser observado pela diminuio da concentrao do estigmastano (5,14,17(H)-24-etil-colestano 20 R). Por outro lado, ocorre um enriquecimento da concentrao de diamantides, neste caso foi usado o somatrio do 3-metildiamantano e 4-metildiamantano.

O resultado do grfico entre as concentraes de 3-+4-metildiamantanos e Estigmastano est representado nas Figuras 14A e 14B. Para as amostras em estudo, possvel observar que as amostras da bacia BC tm caractersticas tanto imaturas (amostras destacadas pelo crculo vermelho) quanto maturas e altamente maturas. As amostras da bacia BB so maturas, mas ainda no se encontram na fase de craqueamento. A maioria das amostras das bacias BA e BH so altamente maturas, sendo que algumas j se encontram na fase de craqueamento, assim como uma amostra da bacia BG. Algumas amostras das bacias BA e BH apresentam altas concentraes de estigmastano e diamantides, que segundo DAHL e colaboradores (1999), pode ser considerado mistura de leos em diferentes pulsos de migrao com nveis diferenciados de maturao.

58

maturao

craqueamento

Mistura

Figura 14: Grfico de correlao entre 3-+4- metildiamantano versus Estigmastano, proposto por DAHL et al. (1999).

59

7.1.2) Anlise de agrupamento FCM Fuzzy c-means

A anlise de agrupamento foi realizada utilizando os parmetros e valores mostrados na Tabela 2. Pela anlise de cluster as amostras foram diferenciadas em cinco grupos de diferentes graus de maturao. Os resultados so discutidos a seguir.

Antes de realizar o processo de clusterizao foi efetuado o pr-tratamento dos dados, analisando a presena de valores ausentes e correlaes entre as variveis, seguindo o procedimento de Data Mining.

Com a finalidade de determinar o melhor nmero possvel de agrupamentos foi utilizado o ndice de validao PBM, detalhado no captulo 4 (PAKHIRA et al., 2004).. Analisando a Tabela 4, que apresenta diferentes valores de m para cada agrupamento, o ndice de validao indica cinco grupos.

Tabela 4: Determinao do nmero de grupos.


Grupos 2 3 m=1,2 0,125 0,185 0,360 1,207 1,116 m=1,4 0,081 0,124 0,158 0,417 0,145 m=1,6 0,044 0,073 0,081 0,166 0,085 m=1,8 0,026 0,050 0,047 0,053 0,050 m=2,0 0,011 0,033 0,033 0,028 0,023

4 5 6

60

Nas Figuras 15, 16 e 17, podemos observar a distribuio e a disposio desses grupos. A partir das figuras 15 e 16, pode-se observar que o grupo 5 apresenta o menor nmero de amostras envolvidas, e o grupo 2 o maior nmero.

Na figura 17, observa-se, a seguir, a disposio dos agrupamentos para 5 grupos, obedecendo funo de pertinncia fuzzy (m=1,2).

C3 C2

C5 C1 C4

Figura 15: Grfico de distribuio dos grupos para os parmetros de maturao selecionados de acordo com os centros dos grupos e as suas cardinalidades Y1 e Y2.

61

Figura 16: Grfico de distribuio dos grupos em porcentagem para os parmetros de maturao selecionados.

62

Figura 17: Grfico de funo de pertinncia para os parmetros de maturao, usando FCM, com ndice de fuzzificao m=1,2 e, componentes principais CP1 e CP2.

Como j discutido no captulo de fundamentao terica (captulo 4), e observando a tabela 4, com o aumento do valor do parmetro de fuzzificao (m) o valor do ndice diminui, pois mais imprecisas so as parties geradas. Nas Figuras 18A e 18B observa-se a disposio das funes de pertinncia para diferentes valores de m, m=1,2 e m=1,8, respectivamente.

63

Figura 18: Grficos de funes de pertinncia para os parmetros de maturao, usando FCM: (A) m =1,2; (B) m = 1,8.

A interpretao de cada cluster pode ser realizada pelos centros de suas respectivas coordenadas. Observando a Tabela 5, podem-se fazer algumas consideraes relatadas a seguir.

64

Tabela 5: Valores dos Parmetros de Maturao nos Centros de Grupos. Parmetros MAI MDI 3+4 metildiamantanos Estigmastano /(+)(C29) S/(S+R) C29 Grupo 1
1,68 1,44 84,64 108,96 1,52 1,51

Grupo 2
1,67 1,50 98,80 105,10 1,58 1,48

Grupo 3
1,69 1,50 119,58 99,00 1,61 1,50

Grupo 4
1,67 1,44 111,37 129,02 1,66 1,56

Grupo 5
1,73 1,45 138,93 78,06 1,50 1,53

Os parmetros 3-+4- metildiamantanos e Estigmastano so os que possuem maior ponderao em cada grupo, ou seja, so mais significativos. No grupo 1, a contribuio de Estigmastano supera a contribuio de metildiamantanos, o que pode sugerir um grupo de amostras de leo pouco maturo, evento que tambm ocorre no grupo 2. Porm, este apresenta uma maior contribuio dos metildiamantanos em relao aquele. Sendo assim, o grupo 2 pode ser considerado mais evoludo termicamente que o grupo 1.

J nos grupos 3 e 5 a contribuio dos metildiamantanos maior que a do biomarcador estigmastano: o grupo 5 apresenta o menor valor de estigmastano e o maior valor de metildiamantano em relao aos demais grupos, mostrando ser assim o mais evoludo termicamente; o grupo 3 possui menor valor de metildiamantano e maior valor de estigmastano que o grupo 5, mostrando ser menos maturo que este, mas com maior maturidade que os grupos 1 e 2.

Analisando os resultados para o grupo 4, observam-se valores elevados de biomarcadores e valores elevados de diamantides. Consequentemente, suspeita-se de mistura de leos em diferentes pulsos de migrao com nveis diferenciados de maturao (DAHL et al., 1999).

Conforme os resultados discutidos anteriormente, os parmetros 3-+4metildiamantanos e Estigmastano apresentam uma contribuio muito superior aos demais parmetros. Sendo assim, considerados parmetros decisivos para o agrupamento das amostras do estudo. Estes resultados, vo de encontro com os 65

resultados obtidos pela anlise tradicional, ou seja, mais uma vez a utilizao dos parmetros envolvendo diamantides foi decisivo para o entendimento do comportamento das amostras em estudo.

7.2) Parmetros de Ambientes Deposicionais (Origem)


7.2.1) Interpretao dos resultados Biomarcadores e Diamantides pela caracterizao de

Como mencionado no captulo 3, os biomarcadores permitem a caracterizao de ambientes deposicionais das rochas geradoras. Sendo assim, razes de biomarcadores consideradas como indicadores de origem so correlacionadas para distinguir tais ambientes, Tabela 6.

importante ressaltar que so desconhecidas as bacias sedimentares brasileiras e os poos de origem dos leos analisados, sabe-se apenas que as amostras da bacia BH pertencem bacia colombiana Llanos Orientales.

66

Tabela 6: Valores dos parmetros de biomarcadores dependentes de ambientes deposicionais para as amostras de leo estudadas, sendo: as amostras em verdes pertencem a Bacias Sedimentares Brasileiras, e as amostras destacadas em laranja, Bacia Sedimentar Colombiana. AMOSTRAS Pr/Fi Pr/nC17 Fi/nC18 Hop/Est TTP/DIA Tr25/Tr26 BA1 1,88 0,96 1,04 0,05 0,40 1,11 BA2 1,13 0,88 0,92 0,91 0,40 1,15 BA3 1,05 0,70 0,95 1,69 0,30 0,72 BA4 1,06 0,73 0,98 1,43 0,50 0,59 BA5 1,22 0,66 0,86 2,48 0,30 0,62 BA6 1,40 2,02 0,91 5,61 3,80 1,12 BB1 0,00 0,00 0,00 3,30 0,60 0,89 BB2 1,56 0,53 0,36 13,57 0,50 1,38 BB3 0,00 0,00 0,00 5,81 1,96 1,13 BC1 1,22 0,98 1,01 0,32 0,22 0,96 BC2 0,85 0,90 1,51 0,54 0,25 1,12 BC3 1,05 0,80 1,12 0,28 0,28 1,00 BC4 BC5 BC6 BC7 BC8 BC9 BC10 BC11 BC12 BC13 BC14 BC15 BC16 BC17 BC18 BC19 BC20 BC21 BC22 BC23 BC24 BC25 BC26 BE1 BE2 BF1 BF2 1,80 1,00 2,31 1,61 1,65 1,49 2,14 1,38 2,94 1,27 0,80 0,67 1,46 2,16 0,94 2,75 1,56 1,18 1,00 1,51 1,12 0,89 0,95 0,00 1,40 1,52 1,61 0,24 0,56 1,75 0,54 0,36 0,34 0,50 0,45 0,57 0,90 0,47 0,71 0,29 0,67 0,93 0,39 0,26 0,23 0,39 0,29 0,36 0,50 0,65 0,00 1,47 0,98 1,23 0,14 0,74 0,84 0,38 0,24 0,24 0,27 0,35 0,50 0,95 0,91 1,58 0,21 0,35 1,15 0,16 0,17 0,22 0,52 0,22 0,39 0,88 1,16 0,00 0,89 0,76 1,09 0,49 2,89 0,46 2,40 0,73 0,81 5,86 0,79 3,00 3,68 0,77 0,97 3,02 2,04 1,56 3,45 3,84 8,03 2,09 3,71 1,14 0,91 0,88 3,86 3,74 1,84 1,66 2,10 0,23 0,12 0,86 1,81 2,57 4,90 0,18 0,61 1,03 0,06 0,07 0,82 0,80 0,15 0,81 1,32 0,19 0,25 0,59 0,32 0,08 0,09 0,00 0,00 0,19 0,19 0,90 1,00 0,90 0,60 0,30 1,00 0,90 0,80 0,90 0,70 0,60 0,70 0,80 0,80 0,90 1,10 1,40 0,60 0,57 0,64 0,61 0,62 0,84 0,65 0,60 0,74 0,55

67

BF3 BF4 BF5 BF6 BG1 BG2 BG3 BG4 BG5 BH1 BH2 BH3 BH4 BH5 BH6 BH7 BH8 BH9 BH10 BH11 BH12 BH13 BH14 BH15 BH16 BH17 BH18 BH19 BH20 BH21

1,68 2,33 0,21 1,57 1,57 1,48 1,90 2,58 2,30 2,99 3,84 3,54 3,67 2,66 2,35 2,81 2,12 2,48 2,10 0,00 2,05 0,45 0,00 0,00 2,75 0,00 2,58 2,00 2,99 0,00

0,91 0,76 0,07 1,00 0,92 1,25 1,03 1,46 1,22 2,03 1,66 1,96 1,92 1,61 1,66 1,51 1,75 1,60 1,61 2,04 0,92 0,76 0,00 0,00 1,84 0,00 1,44 1,89 1,53 0,00

0,92 0,32 0,34 1,21 0,62 1,01 0,74 1,16 0,71 5,53 5,97 6,55 6,41 3,34 3,26 3,63 3,08 3,29 2,97 4,12 2,17 0,48 0,00 0,00 4,50 0,00 3,44 3,41 4,38 0,00

1,66 9,16 8,91 1,40 2,64 2,65 3,09 0,00 3,93 2,10 2,17 1,45 1,20 0,77 0,65 1,58 0,73 1,32 0,32 1,93 0,78 0,41 0,37 0,42 0,86 0,78 0,71 0,83 0,55 1,18

0,42 25,94 6,60 0,29 0,57 0,19 0,46 0,00 0,53 0,96 0,76 1,77 1,93 2,83 3,25 2,76 3,34 3,69 0,00 1,02 1,02 0,87 0,85 1,11 1,37 0,51 1,18 1,32 0,74 0,00

0,54 1,34 0,63 0,64 0,61 0,67 0,73 0,80 1,00 0,96 0,86 1,28 1,17 1,28 1,08 1,32 1,27 0,88 1,47 0,94 1,01 1,10 0,98 0,51 0,86 0,90 1,09 1,12 0,93 0,00

68

Uma maneira de observarmos a origem da matria orgnica atravs da construo do grfico Hopanos/Esteranos versus Pristano/Fitano, Figura 19. Pode-se observar que a maioria das amostras da bacia BH possui caractersticas marinhas acentuadas. Amostras das bacias BA, BC, BE, BF, BG apresentam altos valores para ambas as razes, sendo considerado mistura. Algumas amostras provenientes das bacias BB, BC e BF se destacam das demais, apresentando caractersticas terrestres mais acentuadas.

Marinho

Mistura

Continental

Figura 19: Correlao entre as razes Hopanos/Esteranos versus Pristano/Fitano para as amostras deste estudo.

69

Pelos parmetros avaliados no grfico da Figura 20 (Fitano/nC18 versus Pristano/nC17), pode-se observar que as amostras da bacia BH e algumas amostras da bacia BC apresentam predominncia de caractersticas marinhas. Uma amostra de leo da bacia BA apresenta altos valores de ambas razes, sendo caracterizada como mistura. As amostras da bacia BG apresentam caractersticas terrestres.

Figura 20: Correlao entre as razes Fitano/nC18 versus Pristano/nC17 para as amostras deste estudo.

Outro importante parmetro de origem a razo dos Diasteranos C27 13(H),17(H) (20S+20R)/Poliprenides Tetracclicos (TPPs). Estudos mostram que ambientes com altas concentraes relativas de TPPs em leos e rochas geradoras indicam deposio em ambientes lacustres de gua (doce/salobra), enquanto baixas concentraes sugerem deposio em ambientes marinhos (HOLBA et al., 2003). Analisando o grfico da Figura 21, pode-se perceber que a maioria das amostras se comporta como mistura, com um carter marinho acentuado. Algumas amostras das bacias BA, BB, BC e BF possuem uma maior predominncia de caractersticas terrestres, e outras amostras da bacia BC apresentam caractersticas marinhas bem acentuadas.

70

Figura 21: Correlao entre as razes Hopanos/Esteranos e DIA C27/TPP para as amostras deste estudo.

71

A razo Terpano Tricclico C25 /C26 outro parmetro importante que nos mostra a influncia dos ambientes deposicionais. No grfico da Figura 22, podemos observar esta razo contra a razo Hop/Est. A concentrao dos compostos tricclicos C25 maior que a dos compostos tricclicos C26 (C25/C26 >1) em alguns leos provenientes das bacias BH, BC e BA, indicando uma contribuio marinha.

Figura 22: Grfico de correlao entre as razes Hop/Est versus Tr25/Tr26.

72

7.2.2) Anlise de agrupamento FCM Fuzzy c-means


A anlise de agrupamento foi realizada utilizando como parmetros as razes Hop/Est, DiaC27/TPP e TrC25/TrC26. Antes de realizar o processo de clusterizao foi etuado o pr-tratamento, analisando a presena de valores ausentes e correlaes entre as variveis, seguindo o procedimento de Data Mining. Pela anlise de cluster as amostras foram diferenciadas em quatro grupos (Tabela 7), que ser discutido adiante.

Com a finalidade de determinar o melhor nmero possvel de agrupamentos foi utilizado o ndice de validao PBM, detalhado no captulo 4 (PAKHIRA et al., 2004). Analisando a Tabela 7, que apresenta diferentes valores de m para cada agrupamento, o ndice de validao indica quatro grupos.

Tabela 7: Determinao do nmero de grupos.


Grupos 2 3 m=1,2 0,065 0,165 0,431 0,316 m=1,4 0,051 0,261 0,364 0,325 m=1,6 0,042 0,176 0,235 0,190 m=1,8 0,033 0,090 0,153 0,107 m=2,0 0,026 0,043 0,109 0,104

4 5

Nas Figuras 23, 24, 25 e 26, podemos observar a distribuio e a disposio desses grupos. A partir das figuras 24 e 25, pode-se observar que o grupo 4 apresenta o menor nmero de amostras envolvidas, e o grupo 1 o maior nmero.

73

Figura 23: Grfico de distribuio dos grupos em porcentagem para os parmetros de origem selecionados.

C1 C2

C4

C3

Figura 24: Grfico de distribuio dos grupos para os parmetros de origem selecionados de acordo com os centros dos grupos e as suas cardinalidades Y1 e Y2.

74

Nas figuras 25 e 26, observa-se a disposio dos agrupamentos para 4 grupos, obedecendo funo de pertinncia fuzzy (m=1,2).

Figura 25: Grfico de funo de pertinncia (3D) para os parmetros de origem, usando FCM, com ndice de fuzzificao m=1,2 e, componentes principais CP1 e CP2.

75

Figura 26: Grfico de funo de pertinncia (2D) para os parmetros de origem, usando FCM, com ndice de fuzzificao m=1,2 e, componentes principais 1 e 2 (CP1 e CP2).

76

A interpretao de cada cluster pode ser realizada pelos centros de suas respectivas coordenadas, apresentado na Tabela 8. Observando a Tabela 8 e Figura 27, podem-se fazer algumas consideraes relatadas a seguir.

Tabela 8: Valores dos Parmetros de Origem nos Centros de Grupos.


Valores dos Parmetros de Origem nos Centros de Grupos Grupo1 Grupo 2 4,14 5,36 2,00 Grupo 3 6,86 5,59 2,08 Grupo 4 1,91 2,60 2,04

Hop/Est TPP/DIA Tr25/Tr26

0,38 2,80 1,95

Figura 27: Grfico em barra relacionando os Valores dos Parmetros de Origem nos Centros de Grupos e os 4 Grupos estimados.

77

Grupo 1

Analisando os valores dos parmetros de origem para o grupo 1, observa-se que a contribuio da razo Hop/Est a menor e, a razo TPP/DIA a maior. Como discutido anteriormente, ambientes com baixa contribuio Hop/Est indicam deposio de matria orgnica marinha, a partir dos dados da tabela 8, pode-se sugerir de uma forte contribuio marinha para as amostras pertencentes a este grupo.

Grupo 2

Este grupo de amostras apresenta uma forte contribuio das razes Hop/Est, TPP/DIA, sendo os valores da razo TPP/DIA superiores. Logo, a partir desses dados pode-se sugerir que estes valores so indicativos de uma mistura (contendo tambm carter continental) para estas amostras.

Grupo 3

No grupo 3, a contribuio das razes TPP/DIA e Hop/Est muito maior em relao aos demais grupos. O valor da razo Hop/Est superior ao valor da razo TPP/Dia. Estes resultados indicam que os leos com altas razes TPP/Dia e Hop/Est, esto relacionados a uma mistura contendo, tambm, uma contribuio marinha.

Grupo 4 O grupo 4, assim como o grupo 1, tambm possui valores mais baixos que os grupos 2 e 3. Porm a contribuio da razo Hop/Est bem maior em relao ao grupo 1, o que pode caracterizar um carter continental.

78

Podemos concluir que a maioria das amostras est localizada nos grupo 1 e 2, ou seja, podem ser caracterizadas por uma contribuio marinha (grupo 1) e uma mistura contendo tambm carter continental (grupo 2). Sendo assim, os resultados obtidos a partir da clusterizao fuzzy se aproximam dos resultados das correlaes envolvendo biomarcadores, como discutidos no item 6.2.1.

79

Captulo 8. Concluso
Neste estudo buscou-se a caracterizao geoqumica quanto a origem e evoluo trmica de 69 amostras de leo, provenientes de algumas bacias sedimentares brasileiras e da bacia sedimentar colombiana Llanos Orientales, a partir de parmetros indicativos de maturao trmica e de ambiente deposicional das rochas geradoras, envolvendo razes de biomarcadores e diamantides. Para tanto, foram construdos diversos grficos de correlao envolvendo os parmetros geoqumicos - metodologia tradicional e, buscando uma melhor visualizao e interpretao dos resultados, os dados foram avaliados por anlise de agrupamento fuzzy.

Esta metodologia foi desenvolvida usando dados gerados a partir de trabalhos (teses e dissertaes) desenvolvidos por estudantes desta instituio de ensino e pesquisa.

Com relao ao grau de maturao, observou-se uma grande diversidade. Entretanto, de acordo com o agrupamento fuzzy foram observados cinco grupos. Para tal, foi fundamental a integrao dos parmetros de biomarcadores e diamantides para a interpretao do comportamento das amostras de leo. Os parmetros sugeridos por DAHL et al. (1999), ou seja, o biomarcador estigmastano e a soma dos diamantides 3-+4- metildiamantanos, foram os que possuram maior ponderao em cada grupo, ou seja, so os mais significativos. Para o grupo 1, a contribuio de estigmastano superou a contribuio de metildiamantanos, sugerindo um grupo de amostras de leo pouco evoludas termicamente, evento que tambm ocorreu no grupo 2. Porm, este apresentou uma maior contribuio dos metildiamantanos, sendo considerado mais evoludo termicamente que o grupo 1. Os grupos 3 e 5, apresentaram uma contribuio dos metildiamantanos superior a do biomarcador estigmastano, sendo o grupo 5 caracterizado como o mais evoludo termicamente pois apresentou o menor valor de estigmastano e o maior valor de metildiamantano em relao aos demais grupos; o grupo 3 apresentou menor valor de metildiamantano e maior valor de estigmastano que o grupo 5, mostrando ser menos maturo que este, 80

mas com maior maturidade que os grupos 1 e 2. O grupo 4 foi caracterizado como mistura de leos em diferentes pulsos de migrao com nveis diferenciados de maturao, pois apresentou elevados valores de estigmastano e diamantides.

De acordo com o agrupamento fuzzy observou-se que as amostras puderam ser divididas em quatro grupos principais quanto origem: grupo 1 possui uma contribuio marinha; grupo 2 indicativos de uma mistura (contendo tambm carter continental); grupo 3 possui caractersticas de uma mistura contendo, tambm, uma contribuio marinha e grupo 4 possui caractersticas continentais.

Para tal, os parmetros TTP/Dia27 e Hop/Est foram os mais significativos. O parmetro Tr25/Tr26 apresentou contribuies semelhantes para os grupos.

Os resultados obtidos a partir da clusterizao fuzzy se aproximaram dos resultados das correlaes tradicionais envolvendo biomarcadores e diamantides.

Pode-se concluir que para uma avaliao mais detalhada de um conjunto elevado de parmetros como o caso das razes de biomarcadores e diamantides para leos, o uso da anlise de agrupamento fuzzy foi uma ferramenta satisfatria. Esta, embora j venha sendo utilizada em diversas reas e em alguns centros de pesquisa da indstria de petrleo, ainda no uma ferramenta de rotina.

A incluso de parmetros de diamantides na avaliao dos leos foi de real importncia no refinamento dos dados e melhor diferenciao dos leos quanto maturao.

81

Captulo 9. Recomendaes
Para uma melhor avaliao do mtodo, recomenda-se aplicar esta tcnica em um banco de dados com um nmero superior de amostras analisadas e, se possvel, pertencentes a uma mesma bacia sedimentar, possuindo tambm outros parmetros de ambiente deposicional.

Recomenda-se avaliar a tcnica aplicada neste trabalho em relao influncia da biodegradao, outro processo geoqumico, mediado por microorganismos que degrada parcialmente os leos.

Apesar de o nmero de agrupamentos para os parmetros geoqumicos envolvidos apresentar bem a variabilidade dos dados em estudo, recomenda-se testar outros ndices de validao de grupos, visto que j existem indicadores mais recentes voltados para a lgica fuzzy e usando algoritmos genticos.

82

Captulo 10. Referncias Bibliogrficas


AZEVEDO, D.A., TAMANQUEIRA, J.B., DIAS, J.C.M., CARMO, A.P.B., LANDAU, L., GONALVES, F.T.T., 2008. Multivariate statistical analysis of diamondoid and biomarker data in selected oil samples from Brazilian basins. Fuel, v.87, p. 2122-2130.

AQUINO NETO, F.R., TRENDEL, J.M., RESTLE, A., CONNAN, J., ALBRECHT, P.A., 1983. Occurrence and formation of tricyclic and tetracyclic terpanes in sediments and petroleum, In: Bjoroy, M. et al (eds), Advances in Organic Geochemistry 1981, Wiley, p. 659-667.

BEZDEK, J.C.; PAL, S.K., 1992. Fuzzy models for pattern recognition: method that search for structures in data. Piscataway: IEEE Press.

BIZZI, A.L., SCHOBBENHAUS, C., VIDOTTI, M.B., GONALVES, H.J., 2003. Geologia, Tectnica e Recursos minerais do Brasil. Servio Geolgico do Brasil (CPRM). Livro disponvel em formato pdf no site:

http://www.cprm.gov.br/.

BOBROWSKI, L., BEZDEK, J.C., 1991. C-Means Clustering with the l1 and l Norms. In IEEE Transactions on Systems, Man, and Cybernetics, vol. 21, n. 3, Maio/Junho, p. 545-554.

BOENTE, A.N.P., OLIVEIRA, F.S.G., ROSA, J.L.A., 2007. Utilizao de Ferramenta de KDD para Integrao de Aprendizagem e Tecnologia em Busca da Gesto Estratgica do Conhecimento na Empresa. Anais do Simpsio de Excelncia em Gesto e Tecnologia, v.1, p. 123-132.

BOENTE, A.N.P, GOLDSCHMIDT, ESTRELA, V.V., 2008. Uma Metodologia de Suporte ao Processo de Descoberta de Conhecimento em Bases de Dados. In: V

83

Simpsio de Excelncia em Gesto e Tecnologia, V SEGeT, , v.1, p. 4-5, Resende RJ.

CALDAS, B. 2009. Diamantides como ferramenta na avaliao de leos em bacias sedimentares brasileiras. Monografia, IQ/UFRJ, Rio de Janeiro, RJ, Brasil.

CALISKI, T., HARABASZ, J., 1974. A dendrite method for cluster analysis, Communications in Statistics, v. 3, p. 127.

CHEN, J., FU, J., SHENG, G., LIU, D., ZHANG, J., 1996. Diamondoid hydrocarbon ratios: novel maturity indices for highly mature crude oils, Organic Geochemistry, v.25, p. 179190.

CHEN, J., DENG, C., LIANG, D., WANG, X., ZHONG, N., SONG, F., SHI, X., JIN, T., XIANG, S., 2003. Mixed oils derived from multiple source rocks in

the Cainan oil.eld, Junggar basin, northwest china. part I:genetic potential of source rocks, features of biomarkers and oil sources of typical crude oils, Organic Geochemistry, v.34, p. 889909.

CHEN, J., DENG, C., LIANG, D., WANG, X., ZHONG, N., SONG, F., SHI, X., JIN, T., XIANG, S., 2003. Mixed oils derived from multiple source rocks in

the Cainan oil.eld, Junggar basin, northwest china. part 2:artificial mixing experiments on typical crude oils and quantitative oil-source correlation. Organic Geochemistry 34, p. 911930.

DAHL, J., MOLDOWAN, M., PETERS, K., CLAYPOOL, G., ROONEY, M., MICHAEL, G., MELLO, M., KOHNEN, M., 1999. Diamondoid hydrocarbons as indicators of natural cracking, Nature, v. 399, p.54-56.

DIDYK, B.M., SIMONEIT, B.R.T., BRASSEL,S.C., EGLINTON, G., 1978. Organic geochemical indicators of paleoenvironmental conditions of

sedimentation, Nature, v.272, p. 216-222.

84

EVSUKOFF, A. G., GONALVES, F. T. T., BEDREGAL, R. P., EBECKEN, N. F. F., 2004. Fuzzy Classification of Surface Geochemistry Data Applied to Determination of HC Anomalies, IEE Joint 2nd International Conference on Soft Computing and Intelligent Systems.

EVSUKOFF, A.G., FAIRBAIRN, E.M.R., FARIA, E.F., SILVOSO, M.M., TOLEDO, R.D., 2006. Modeling adiabatic temperature rise during concrete hydration: A data mining approach. Computers and Structures, v.84, p. 2351 2362.

FANG, C., XIONG, Y., LIANG Q., LI Y., 2012. Variation in abundance and distribution of diamondoid during oil cracking, Organic Geochemistry 47, p. 18.

FAYYAD, U.M., PIATETSKY-SHAPIRO, G., SMYTH, P., UTHURUSAMY, R., 1996. Advances in knowledge discovery and data mining. Massachusetts, MIT Press.

FARRIMOND, P., TAYLOR, A., TELNAES, N., 1998. Biomarker maturity parameters: the role of generation and thermal degradation, Organic Geochemistry, v.29, p. 1181-1197.

GAN, G., MA, C., WU, J., 2007. Data Clustering: Theory, Algorithms, and Applications. First ed. Alexandria, Virginia, ASA-SIAM.

GRICE, K., ALEXANDER, R., KAGI, R., 2000, Diamondoid hydrocarbons as indicators of biodegradation in Australian crude oils, Organic Geochemistry, v. 31, p.67-73.

HOLBA, A.G., TEGELAAR, E., ELLIS, L., SINGLETARY, M.S., 2000. Tetracyclic polyprenoids: Indicators of freshwater (lacustrine) algal input, Geology, v.28, p. 251- 254.

85

HOLBA, A.G., DZOU, L.I., WOOD, G.D., ELLIS, L., ADAM, P., SCHAEFFER, P., ALBRECHT, P., GREENE, T., HUGHES, W.B., 2003. Application of tetracyclic polyprenoids as indicators of input from fresh-brackish water environments, Organic Geochemistry, v. 34, p. 441-469.

HOPPNER, F., KLAWONN, F., KRUSE, R., RUNKLER, T., 2000. FUZZY CLUSTER ANALYSIS: Methods for classification, data analysis and image recognition. 2 ed. New York, NY 10158-0012, USA, John Wiley & Sons - LTD.

HLLERMEIER, E., 2005. Fuzzy methods in machine learning and data mining: Status and prospects. Fuzzy Sets Syst., v. 156, p. 387407.

JACKSON, J. 2002. Data mining: a conceptual overview. Communications of the Association for Information Systems. v. 8, p. 267-296.

JAIN, A.K.; MURTY, M.N.; FLYNN, P.J., 1999. Data Clustering: A Review. ACM Computing Surveys (CSUR). ACM Press, New York, vol. 31 (3), p. 264323.

JESUINO, L.S., 2005, Aplicao dos Diamantides na Avaliao Geoqumica de leos em Bacias Sedimentares Brasileiras. Dissertao de MSc.,COPPE/UFRJ, Rio de Janeiro, RJ, Brasil.

KLIR, G.J., YUAN, B., 1995. Fuzzy Sets and Fuzzy Logic Theory and Applications. New Jersey, Prentice Hall. MILANI, E.J., BRANDO J.A.S.L., ZALN P.V., GAMBOA, L.A.P., 2000. Petrleo na margem continental brasileira: geologia, explorao, resultados e perspectivas. Revista Brasileira de Geofsica, v. 18, cap. 3, p. 351-396.

MILANI, E.J., THOMAZ FILHO, A., 2000. Sedimentary basins of South America. In: Cordani,U.G.; Milani, E.J.; Thomaz Filho, A.; and Campos, D.A. (Eds.),

86

Tectonic evolution of South America. Rio de Janeiro, 31st International Geological Congress, p. 389-452.

MACEDO, D.C., MATOS, S.N., 2010. Extrao de conhecimento atravs da Minerao de Dados. Revista de Engenharia e Tecnologia, v.2.

MELLO, M.R., 1988. Geochemical and Molecular Studies of the Depositional Environments of Source Rocks and Their Derived Oils from the Brazilian Marginal Basins. University of Bristol, Ph. D. Thesis.

MELLO, M. R., GAGLIANONE, P.C., BRASSEL, S.C., MAXWELL, J.R., 1988a. Geochemical and Biological Marker Assessment of Depositional Environments Using Brazilian Offshore Oils. Marine and Petroleum Geology, v. 5, p. 205-223.

MELLO, M.R., TELNAES, N., GAGLIANONE, P.C., CHICARELLI, M.I., BRASSEL, S.C., MAXWELL, J.R., 1988b. Organic Geochemical

Characterization of Depositional Paleoenvironments of Source Rocks and Oil in Brazilian Marginal Basins, Organic Geochemistry, v.13, p.31-45.

MOLDOWAN, J.M, LEE, C.Y., WATT, D.S., 1991. Analysis and occurrence of C26-steranes in petroleum and source rocks, Geochimica et Cosmochimica Acta, v.55, p. 1065-1081.

OLIVEIRA, J.V.D., PEDRYCZ W., 2007. Advances in Fuzzy Clustering and its Applications. Wiley, New York.

PAKHIRA, M. K., BANDYOPADHYAY, S., MAULIK, U., 2004, Validity index for crisp and fuzzy clusters, Pattern Recognition, v. 37, n. 3, pp. 487501. ISSN: 0031-3203.

PALACAS, J.G., ANDERS, D.E., KING, J.D., 1984. South Florida basin - a prime example of carbonate source rocks in petroleum. In: Palacas, J.G. (eds), Petroleum Geochemistry and Source Rocks Potential of Carbonate Rocks, American Association of Petroleum Geologists, Tulsa, Oklahoma, p. 71-96. 87

PETERS, K.E., MOLDOWAN, J.M., 1993. The Biomarker Guide: Interpreting Molecular Fossils in Petroleum and Ancient Sediments. New Jersey, Prentice-Hall Inc.

PETERS, K.E., WALTERS, C.C., MOLDOWAN, J.M., 2005. The Biomarker Guide: Biomarkers and Isotopes in the Environment and Human History. 2 ed, v. 1 e 2, New York, Cambridge University Press.

REZENDE, S.O., 2003. Minerao de dados. In: Sistemas inteligentes: fundamentos e aplicaes. So Paulo, Malone, p. 307- 333.

ROBINSON, K.M., 1987. An overview of source rocks and oils in Indonesia. In: Proceedings of the Indonesian Petroleum Association, Sixteenth Annual Convention, Indonesian Petroleum Association, v.1, Jakarta, p. 97-122.

RULLKOTTER, J., MARZI, R., 1988. Natural and artificial maturation of biological markers in a Toarcian shale from northern Germany, In: Mattavelli, L. and Novelli, L. (eds), Advances in Organic Geochemistry 1987, Pergamon Press, Oxford, p. 639-645.

SANTOS, R.J., 2009. Introduo ao Matlab. Departamento de Matemtica. Universidade Federal de Minas Gerais - UFMG. http://www.mat.ufmg.br/~regi

SCHULZ, L.K., WILHELMS, A., REIN, E., STEEN, R.A., 2001. Application of Diamondoids to Distinguish Source Rock Facies, Organic Geochemistry, v.32, p.365-375.

SEIFERT, W.K., MOLDOWAN, J.M., 1986. Use of biological markers in petroleum exploration. In: Jonhs, R.B. (eds), Methods in Geochemistry and Geophysics, Elsevier, Amsterdam, v.24, p. 261-290.

88

SILVA, D.B., 2010. Integrao de parmetros geoqumicos para caracterizao de leos leves atravs de biomarcadores, diamantides, hidrocarbonetos leves e dibenzotiofenos. Dissertao de MSc., IQ/UFRJ, Rio de Janeiro, RJ, Brasil.

SPRINGER , M.V., 2007, Caracterizao de Biomarcadores e Diamantides em Amostras de leos da Bacia Llanos Orientales, Colmbia. Dissertao de MSc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil.

SPRINGER, M.V., GARCIA, D.F., GONALVES, F.T.T., LANDAU, L., AZEVEDO, D.A., 2010. Diamondoid and Biomarker Characterization in Oils from the Llanos Orientales Basin, Colombia. Organic Geochemistry, v.41, p.1013-1018.

TAMANQUEIRA, J. B., 2006, Caracterizao de Diamantides em Amostras de leo de Bacias Sedimentares Brasileiras. Dissertao de MSc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil.

TEN HAVEN, H.L., DE LEEUW, J.W., RULLKOTTER, J., SINNINGHE DAMST, J.S., 1987. Restricted utility of the pristane/phytane ratio as a palaeoenvironmental indicator. Nature, v.330, p. 641-643. TISSOT, B.P., WELTE, D.H., 1984. Petroleum Formation and Occurrence. 2 ed., Berlin, Springer-Verlag.

WAPLES, D.W., MACHIHARA, T., 1991. Biomarkers for geologists: a practical guide to the application of steranes and triterpanes in petroleum geology. AAPG methods in exploration series, v. 9, p.1-76.

WINGERT, W.S., 1992. GC-.M.S Analysis of Diamondoid Hydrocarbons in Smackover Petroleums. Fuel, v.71, p. 37-43.

XIE, X., BENI, G., 1991.Validity Measure for Fuzzy Clustering. IEEE Transactions on Pattern Analysis and Machine Intelligence, v. 13, p. 841847.

89

ZUMBERGE, J.E., 1983. Tricyclic diterpane distributions in the correlation of Paleozoic crude oils from the Williston basin. In: M.Bjoroy et al. (eds), Advances in Organic Geochemistry 1981, Wiley, p. 738-745.

ZUMBERGE, J.E., 1987a. Prediction of source rock characteristics based on terpane biomarkers in crude oils: a multivariate statistical approach. Geochimica et Cosmochimica Acta, v.51, p. 1625-1637.

ZUMBERGE, J.E., 1987b. Terpenoid biomarker distributions in low maturity crude oils. Organic Geochemistry, v.11, p. 479-496.

90

Potrebbero piacerti anche