Sei sulla pagina 1di 13

CENTRO UNIVERSITRIO FEEVALE

IVAN MOISS PAZ

UM ESTUDO DA UTILIZAO DO PADRO XML COMO ARMAZENAMENTO DE DADOS NOS PRINCIPAIS BANCOS DE DADOS COMERCIAIS

Anteprojeto de Trabalho de Concluso

Novo Hamburgo, setembro de 2008.

IVAN MOISS PAZ


ivanpaz.paz@gmail.com.br

UM ESTUDO DA UTILIZAO DO PADRO XML COMO ARMAZENAMENTO DE DADOS NOS PRINCIPAIS BANCOS DE DADOS COMERCIAIS

Centro Universitrio Feevale Instituto de Cincias Exatas e Tecnolgicas Curso de Cincia da Computao Anteprojeto de Trabalho de Concluso

Professor orientador: Guillermo Nudelman Hess

Novo Hamburgo, setembro de 2008.

RESUMO
crescente a preocupao na rea de banco de dados em relao ao armazenamento, integridade, representao dos dados, restries e vrios outros aspectos que envolvem banco de dados e XML. A possibilidade de definio de esquemas que incluem restries de integridade como conhecido na rea de banco de dados relacionais, tem levado pesquisadores e fabricantes a investigar novas formas para essas estruturas tradicionais. Desta forma esse trabalho tem o objetivo de verificar o tratamento dado a XML pelos atuais bandos de dados comerciais e verificar a situao atual frente a esses problemas.

Palavras-chave: XML. SGBD.

SUMRIO

MOTIVAO ...........................................................................................................................5 OBJETIVOS ..............................................................................................................................8 METODOLOGIA ......................................................................................................................9 CRONOGRAMA ....................................................................................................................11 BIBLIOGRAFIA ....................................................................................................................13

MOTIVAO
O surgimento da WEB teve sua estrutura pautada na construo de documentos de textos e imagens, puramente informativos, sem interao imediata com os usurios. Eram informaes em texto, som e imagem estticos, apenas criados e disponibilizados para acesso. (PELLEGRINO, 2008). O crescimento exponencial da utilizao da WEB nos ltimos anos deixou claro que novas formas de intercmbio e de armazenamento de dados teriam que ser pensadas. Ficou evidente que outras formas de relacionamento como, por exemplo, o comrcio eletrnico, precisariam reconhecer os elementos envolvidos nas informaes transmitidas atravs dessa tecnologia. At ento a HTML era suficiente para veicular informao no estruturada. Mas apenas com ela era difcil reconhecer algum dado esperado previamente ou vincular informaes semnticas de forma que algum sistema mais gerencial pudesse ser construdo (PELLEGRINO, 2008). Tambm j era sentida a necessidade da integrao do ambiente WEB com o ambiente corporativo de banco de dados (SGBDs). Era notvel que os dados armazenados nos bancos de dados precisavam fazer parte desse ambiente. Os SGBDs comerciais comearam a surgir a partir do final dos anos 70. Em sua grande maioria, os SGBDs eram baseados no modelo relacional de Codd (NASSU, 1999). Os SGBDs basicamente manipulam dados. Eles fornecem aos usurios opes de incluso, atualizao, excluso como tambm acesso aos seus dados. Tambm disponibilizam recursos de integridade e persistncia, requisitos indispensveis para garantia da confiabilidade. Contudo, incorporar simplesmente os SGBDs tecnologia WEB no seria adequado. Os principais SGBDs comerciais trabalham basicamente com dados estruturados isto , possuem os dados organizados em tabelas, que so estruturas rgidas (fixas) e com relacionamento entre si. Eles so utilizados obedecendo a chaves de acesso, chaves estrangeiras e relacionamentos implementados que garantem a consistncia entre os dados. Por outro lado os novos recursos (dados) disponibilizados na WEB nem sempre obedecem uma estrutura fixa com

relacionamento bem definidos. Em sua maioria, um contedo caracterizado por uma estrutura complexa ou irregular e de contedo misto. Um exemplo claro dessa situao : No site de fabricantes de equipamentos, o manual de usurio do produto normalmente encontra-se em uma seo de download completamente desvinculada da seo que apresenta o produto a venda. O cliente precisa realizar dois acessos para comprar o produto e baixar o manual. Essa realidade tem a ver com o fato de que o contedo do manual irregular ou inconstante. Inviabilizando a estruturao direta desse contedo num SGBD relacional, a alternativa que segue a publicao no relacionada a um produto provocando os dois acessos. A dificuldade em armazenar o contedo de um documento no estruturado (ou, no mximo, semi-estruturado) em um SGBD est justamente na variao de informao que cada documento pode possuir. Para um determinado produto o peso pode ser uma caracterstica obrigatria enquanto para outro esse atributo pode ser omitido. Estruturar esse contedo para que atenda aos requisitos de um SGBD relacional ou retirar esse contedo da WEB torna-se invivel. A partir de 1998, com a criao da XML, essas necessidades passam a ser atendidas. A XML surge como uma tecnologia de linguagem de marcao que descreve dados de praticamente qualquer tipo de uma forma semi-estruturada (DEITEL, 2003). Com a XML tambm fica possvel manipulao de informaes coorporativas estruturadas e viabiliza que regras de negcio passem a fazer parte das aplicaes WEB. A amplitude oferecida pela XML ficou to evidente que logo surgiram propostas para bancos de dados baseados puramente em XML. Num primeiro momento a idia de banco de dados puramente XML apresentava mais afinidade com bancos de dados orientados a objetos empolgando ainda mais alguns pesquisadores. Contudo poucos bancos surgiram em funo dos sistemas legados existentes e a facilidade da gerao de XML a partir de dados relacionais (GRAVES, 2003). Ao mesmo tempo, os grandes fabricantes de SGBDs passaram a incorporar em seus bancos de dados suporte a XML atravs de funes e algoritmos. Alguns fabricantes foram mais longe e colocaram suporte nativo, ou seja, dentro do prprio cdigo do SGBD uma estrutura para trabalhar com XML. Resumindo XML tornou-se uma ponte entre a WEB no estruturada e de contedo irregular e os bancos de dados relacionais largamente utilizados pelos sistemas comerciais corporativos. Dentre as abordagens possveis para o armazenamento de dados ou documentos XML em bancos de dados, a mais largamente utilizada a que procura converter a estrutura dos

dados existente em um banco de dados convencional em um documento XML. Outra utilizao importante o simples armazenamento de estruturas de dados em XML e este por sua vez armazenado em tabelas dentro de um banco de dados convencional (PELLEGRINO, 2008). O que por sua vez possibilita a utilizao de vasta documentao e APIs existentes hoje para os bancos relacionais (SHANMUGASUNDARAM, 2008). O objetivo desse trabalho identificar como essa relao XML e bancos de dados est se comportando nos dias atuais. O trabalho abordar o tratamento dado ao XML pelos principais bancos de dados comerciais. O trabalho tentar identificar como os documentos so armazenados. Se existe algum tipo de tratamento referencial entre os dados armazenados tradicionalmente no banco e o documento XML vinculado a esses dados.

OBJETIVOS
Objetivo geral Avaliar quais os requisitos que os SGBDs relacionais deveriam cumprir para armazenar documentos XML garantindo a integridade do documento com o registro ao qual est associado e os mecanismos para insero, alterao e consulta a este documento a partir da base de dados. Com base nisso, analisar at que ponto os SGBDs comerciais hoje efetivamente tm o suporte adequado a documentos XML. Objetivos especficos Analisar os requisitos necessrios para XML poder substituir ou complementar bancos de dados. Discutir sobre os bancos de dados XML nativos. Estudar os requisitos que os bancos de dados relacionais precisam para armazenar XML. Avaliar at que ponto os bancos de dados comerciais tem suporte a XML.

METODOLOGIA
1. Elaborao do anteprojeto e a definio do escopo do trabalho com auxlio do professor orientador; 2. Estudo do XML em livros, artigos, revistas, monografias, dissertaes e pginas da Web para o desenvolvimento da fundamentao terica para o trabalho; 3. Estudo dos bancos de dados XML nativos, como so construdos e suas principais caractersticas; 4. Anlise dos requisitos necessrios para integrar bancos de dados comerciais e documentos XML; 5. Estudo das linguagens xPath e xQuery usadas para manipulao de dados XML; 6. Redao do Trabalho de Concluso I; 7. Reviso e Entrega do Trabalho de Concluso I; 8. Criao de um conjunto de critrios para avaliar os SGBDs comerciais frente ao XML; 9. Avaliao do SGBD Oracle sobre o contexto do trabalho; 10. Avaliao do SGBD Ibm DB2 sobre o contexto do trabalho; 11. Avaliao do SGBD Postgre SQL sobre o contexto do trabalho; 12. Avaliao do SGBD Sql Server sobre o contexto do trabalho; 13. Analise comparativa dos SGBDs comerciais frente pesquisa realizada;

14. Concluso. Questes pendentes de implementao frente ao objetivo deste trabalho. 15. Redao do Trabalho de Concluso II; 16. Reviso e Entrega do Trabalho de Concluso II; 17. Banca. Defesa da monografia perante a banca avaliadora.

CRONOGRAMA
Trabalho de Concluso I Meses Set Out X X X X X X X X X

Etapa Elaborao do anteprojeto Estudo do XML Bancos XML Nativos Anlise dos Requisitos Linguagens xPath e xQuery Redao TC1 Reviso Entrega TC1

Agosto X X

Nov

Trabalho de Concluso II

Etapa Critrios de Avaliao Avaliao do SGBD Oracle Avaliao do SGBD DB2 Avaliao do SGBD Postgre SQL Avaliao do SGBD Sql Server Analise Comparativa Elaborao da Concluso Redaodo TC II Reviso e Entrega TC II

Mar X

Meses Abr Mai X X X X X X X X

Jun

X X

BIBLIOGRAFIA

DEITEL, Deitel, Nieto Lin & Sadhu, Booknab, XML como Programar, BOOKMAN Companhia Editora, 2001 GRAVES, Mark. Projeto de Banco de Dados com XML. So Paulo : Pearson Education, 2003. Grazieno Pellegrino, Henrique Leite, Humbeto Junior, Robson Tenrio, XML e Banco de Dados para WEB: Panorama, Estado atual e Perspectivas, Instituto de Matemtica Universidade Federal da Bahia. JAYAVEL, Shanmugasundaram . Efficiently Publishing Relational Data as XML Documents NASSU, Eugnio A. . Banco de Dados Orientados a Objetos. So Paulo : Edgard Blucher LTDA, 2003.

Potrebbero piacerti anche