Sei sulla pagina 1di 34

PRESENTADO POR:

HOLGUIN GUTIERREZ YAJAIRA


MEDINA CABANA ALEX
PRADO GUTIERREZ LUCIANO
VIZCARRA MINAYA ISHBARA

INGENIERO:
HUGO RUCANO
CURSO:
PROCESAMIENTO DE INFORMACION EN APLIACIONES TELEMATICAS AVANZADAS
Es un lenguaje utilizado ampliamente en el
desarrollo de la World Wide Web, existen ya
herramientas y estndares de programacin
para leer documentos XML. Las herramientas
o programas que leen el lenguaje XML y
comprueban si el documento es vlido
sintcticamente, se denominan analizadores
o "parsers"
Es un mdulo, biblioteca o programa que se
ocupa de transformar un archivo de texto en una
representacin interna. En el caso de XML, como
el formato siempre es el mismo, no necesitamos
crear un parser cada vez que hacemos un
programa, sino que existen un gran nmero de
parsers o analizadores sintcticos disponibles
que pueden averiguar si un documento XML
cumple con una determinada gramtica. Entre
esos analizadores o parsers cabe
destacar DOM y SAX.
DOM y SAX, son dos herramientas que sirven
para analizar el lenguaje XML y definir la
estructura de un documento, aunque existen
otras muchas.
Podemos hacer una distincin entre las
herramientas que son validantes y las que
son No validantes.
Las primeras verifican que el documento,
adems de estar bien formado de acuerdo a las
reglas de XML, responda a una estructura
definida en una Definicin del Tipo de
Documento (DTD).
SAX
Define interfaz dirigido por eventos (event-driven) para el
procesamiento de un documento XML

DOM
Provee una representacin de un documento XML en
forma de un rbol
Carga todo el documento XML en memoria
Documento
XML

Aplicacin
Parser XML
XML

XML DTD
XML Schema
Es un estndar pblico desarrollado para el
anlisis basado en eventos de documentos
XML. SAX define una interfaz de
programacin abstracta que modela el
conjunto de informacin XML (infoset) a
travs de una secuencia lineal de llamadas de
mtodo conocido.
Define un interfaz comn implementado por
muchos XML Parsers
Es el estndar de-facto para procesamiento
de XML basado en eventos
SAX no es un parseador de XML
SAX2 aade soporte para XML Namespaces
Analizador o parser SAX:
Detecta cundo empieza y termina un elemento o el documento, o un
conjunto de caracteres, etc. (genera eventos)
Gestiona los espacios de nombres
Comprueba que el documento est bien formado
Las aplicaciones necesitan implementar manejadores de los
eventos notificados
SAX lee secuencialmente de principio a fin, sin cargar todo el
documento en memoria
Ventaja: eficiencia en cuanto al tiempo y la memoria
empleados en el anlisis
Desventaja: no disponemos de la estructura en rbol de los
documentos
La principal ventaja es la de de rendimiento
de SAX ir a un precio. Por ejemplo, en el caso
de consultas avanzadas, SAX puede ser
agobiante debido a la complejidad de
administrar el contexto durante el
procesamiento. En estos casos, la mayora de
los desarrolladores utilizan el DOM o alguna
combinacin de SAX y DOM.
Se usa SAX cuando la informacin
almacenada en los documentos XML, es
decir, los datos, han sido generados por
mquina o son legible por mquina. En este
caso, SAX es la forma ms directa de API para
que los programas tengan acceso a esa
informacin. Los datos generados y legibles
por mquina incluyen algunos elementos
como los siguientes:
Propiedades de objetos Java almacenados en
formato XML
Consultas (queries) formuladas usando
alguna clase de texto basada en lenguajes de
interrogacin (SQL, XQL, OQL, etc.)
El conjunto resultante se genera basndose
en conjunto de resultados que se generan
basndose en consultas (queries) (ste
debera incluir datos en tablas de bases de
datosrelacionales codificadas en XML).
Puede ser una libreta de direcciones. La libreta
en un archivo XML contiene puramente datos
que pueden ser codificados como texto usando
XML, no se trata, pues de algo similar a un
documento creado con un procesador de textos,
sino a datos en s mismos.
Cuanto los datos son de este tipo, lo corriente es
crear una estructura de datos y clases, es decir,
un modelo de objetos (object models) para
poder ordenar, manipular y almacenar estos
datos.
permite crear rpidamente una herramienta
u operador de clase que puede crear
instancias de los modelos de objetos basados
en el almacenamiento de datos de los
documentos.
El modelo de objeto Libreta de
direcciones contendra las siguientes clases:
Clases Libreta de Direcciones, que es un
contenedor para objetos Persona.
Clase Persona, que es un contenedor para la
cadena de objetos nombre y correo
electrnico.
Sun's JAXP
http://java.sun.com/xml/
The Apache XML Project's Xerces Java Parser
http://xml.apache.org/xerces-j/index.html
SAXON XSLT processor
http://users.iclway.co.uk/mhkay/saxon/
Oracle XML Developer's Kit for Java
http://technet.oracle.com/tech/xml/xdk_java.ht
ml
ParserAdapter
http://www.megginson.com/SAX/Java/index.ht
ml
El Modelo de Objetos del
Documento o Document Object
Model (DOM) es un modelo de objetos
estandarizado para documentos HTML y XML
DOM es un conjunto de interfaces para
describir una estructura abstracta para un
documento XML.
Los programas que acceden a la estructura de un
documento a travs de la interfaz de DOM
pueden insertarse arbitrariamente, borrarse y
reordenar los nodos de un documento XML, esto
es, con DOM se puede modificar el contenido, la
estructura y el estilo o presentacin de los
documentos.
Todas estas funciones se realizan mediante
llamadas a funciones y procedimientos que
permiten acceder, cambiar, borrar o aadir
nodos de informacin (datos o metadatos) de
los documentos XML.
DOM es una una interfaz de programacin de
aplicaciones (API) para documentos HTML y XML.
Define la estructura lgica de los documentos y el
modo en que se accede y manipula un documento.
El trmino documento en DOM se entiende de una
forma amplia, pues XML se utiliza cada vez ms como
un medio para representar muchas clases diferentes
de informacin que puede ser almacenada en
sistemas diversos, y mucha de esta informacin se
vera, en trminos tradicionales, ms como datos que
como documentos.
Documento se carga totalmente en memoria
en una estructura de rbol
Ventaja: fcil acceder a datos en funcin de la
jerarqua de elementos, as como modificar el
contenido de los documentos e incluso
crearlos desde cero.
Desventaja: coste en tiempo y memoria que
conlleva construir el rbol
El DOM es, un API o interfaz de programacin
para documentos. DOM guarda una gran
similitud con la estructura del documento al que
modeliza y muestra los documentos con una
estructura lgica que es muy parecida a un rbol.
DOM no especifica que los documentos
deban ser desarrollados como un rbol o un
bosque, ni tampoco especifica cmo deben
implementarse las relaciones entre objetos.
El DOM es un modelo lgico que puede
desarrollarse de la manera que sea ms
conveniente, por eso se debe hablar de
un modelo de estructura en general, y no de
estructura en forma de rbol, en particular.
DOM identifica:
las interfaces y objetos usados para
representar y manipular un documento
la semntica de estas interfaces y objetos,
incluyendo comportamiento y atributos
las relaciones y colaboraciones entre estas
interfaces y objetos
DOM es un conjunto de interfaces
y objetos diseado para manipular
documentos HTML y XML que se
puede desarrollar usando otros
sistemas y lenguajes especficos.
Element un elemento XML
Attribute un attributo
Text texto contenido en un elemento o atributo
CDATAsection seccin CDATA
EntityReference Referencia a una entidad
Entity Indicacin de una entidad XML
ProcessingInstruction Una instruccin de
procesamiento
Comment Contenido de un comentario de XML
Document El objeto documento
DocumentType Referencia al elemento DOCTYPE
DocumentFragment Referencia a fragmento de
documento
Notation Contenedor de una anotacin
Node un nodo en el rbol de un documento
NodeList una lista de objetos nodos
NamedNodeMap permite interaccin y
acceso por nombre a una coleccin de
atributos
API JAXP de J2SE provee independencia del
analizador
Para conseguir una instancia de analizador
DOM a travs de JAXP usamos
DocumentBuilder y
DocumentBuilderFactory:
import javax.xml.parsers.*;
import org.w3c.dom.*;
DocumentBuilderFactory fact =
DocumentBuilderFactory.newInstance();
// Crear nueva instancia de DOMBuilder
DocumentBuilder parser =
fact.newDocumentBuilder();
Root

Pelculas

Pelcula ... Pelcula

titulo=Lo que el
titulo=Malena
codigo=1 viento se llev codigo=5

actores=Clark Gable, Vivien diirector=Giuseppe actores=Monica Bellucci,


diirector=Victor Fleming
Leigh, Leslie Howard Tornatore Giuseppe Sulfaro
Un analizador (parser) SAX es una herramienta
ms verstil, ms veloz y menos potente que un
analizador (parser) DOM
SAX requiere una mayor programacin, pero
puede ser muy til si lo que interesa es rescatar
un fragmento de un documento o buscar slo un
elemento en particular.
DOM es menos verstil, ms lento, pero una vez
usado no hay que desarrollar nada ms.
DOM se obtiene el rbol ya construido y listo
para poder funcionar.
Un parser DOM tiene una interfaz de estilo
como la que sigue:
nodoRaiz = domParse( documento )
Y lo que produce es un rbol de nodos
Cuando nos referimos a interfaz al hablar de
DOM (o de SAX), no nos estamos refiriendo
a interfaz grfica, sino a interfaz de aplicaciones.
Una interfaz es un dispositivo que permite
comunicar dos sistemas que no hablan el mismo
lenguaje. Una Interfaz de Programacin de
Aplicaciones o API (Application Programming
interface) es un conjunto de funciones o
mtodos usados para acceder a cierta
funcionalidad. La interfaz se encarga de
mantener el dilogo con los datos para poder
tener acceso a ellos y manipularlos.

Potrebbero piacerti anche