Sei sulla pagina 1di 43

Internet es un conjunto descentralizado de redes de comunicación interconectadas que utilizan la familia de

protocolosTCP/IP, garantizando que las redes físicas heterogéneas que la componen funcionen como una red
lógica única, de alcance mundial. Sus orígenes se remontan a 1969, cuando se estableció la primera conexión de
computadoras, conocida como ARPANET, entre tres universidades en California y una en Utah, Estados
Unidos.

Uno de los servicios que más éxito ha tenido en Internet ha sido la World Wide Web (WWW, o "la Web"),
hasta tal punto que es habitual la confusión entre ambos términos. La WWW es un conjunto de protocolos que
permite, de forma sencilla, la consulta remota de archivos de hipertexto. Ésta fue un desarrollo posterior (1990)
y utiliza Internet como medio de transmisión.

Existen, por tanto, muchos otros servicios y protocolos en Internet, aparte de la Web: el envío de correo
electrónico (SMTP), la transmisión de archivos (FTP y P2P), las conversaciones en línea (IRC), la mensajería
instantánea y presencia, la transmisión de contenido y comunicación multimedia -telefonía (VoIP), televisión
(IPTV)-, los boletines electrónicos (NNTP), el acceso remoto a otros dispositivos (SSH y Telnet) o los juegos
en línea.

El género de la palabra Internet es ambiguo, según el Diccionario de la lengua española de la Real Academia
Española.3

Internet es una red de redes que permite la interconexión descentralizada de computadoras a través de un
conjunto de protocolos denominado TCP/IP. Tuvo sus orígenes en 1969, cuando una agencia del
Departamento de Defensa de los Estados Unidos  comenzó a buscar alternativas ante una eventual guerra
atómica que pudiera incomunicar a las personas. Tres años más tarde se realizó la primera demostración pública
del sistema ideado, gracias a que tres universidades de California y una de Utah lograron establecer una
conexión conocida como ARPANET (AdvancedResearchProjects Agency Network).

A diferencia de lo que suele pensarse, Internet y la World Wide Web no son sinónimos. La WWW  es
un sistema de información desarrollado en 1989 por Tim Berners Lee y Robert Cailliau. Este servicio
permite el acceso a información que se encuentra enlazada mediante el protocolo HTTP (HyperText
Transfer Protocol).

Otros servicios y protocolos disponibles en la red de redes son el acceso remoto a computadoras conocido como
Telnet, el sistema de transferencia de archivos FTP, el correo electrónico (POP y SMTP), el intercambio de
archivos P2P y las conversaciones online o chats.

El desarrollo de Internet ha superado ampliamente cualquier previsión y constituyó una verdadera revolución
en la sociedad moderna. El sistema se transformó en un pilar de las comunicaciones, el entretenimiento y el
comercio en todos los rincones del planeta.

Las estadísticas indican que, en 2006, los usuarios de Internet (conocidos como internautas) superaron los
1.100 millones de personas. Se espera que en la próxima década esa cifra se duplique, impulsada por la
masificación de los accesos de alta velocidad (banda ancha).

Qué es el Internet ?
>Inicio>Computadoras e Internet

El Internet es una red informática descentralizada, que para permitir la conexión entre computadoras opera a través de
un protocolo de comunicaciones. Para referirnos a ella además se utiliza el término "web"  en inglés, refiriéndose a una
"tela de araña" para representar esta red de conexiones. En palabras sencillas, la Internet es un conjunto de
computadoras conectadas entre si, compartiendo una determinada cantidad de contenidos; por este motivo es que no
se puede responder a la pregunta de donde está la Internet físicamente - está en todas las partes donde exista un
ordenador con conectividad a esta red.

Digamos entonces que el Internet es la red de redes, por la cual, millones de computadoras se pueden conectar entre
sí. De esta, se puede extraer información a una escala nunca antes vista. También es conocida como la World Wide
Web (www, prefijo bastante conocido por los que la navegan, ya que las direcciones o URLs por lo general comienzan
utilizándolo), y su estructura actual data de la década de los 90`. Con su aparición, la revolución de la información
terminó definitivamente por despegar a escala masiva. Son millones las personas, las cuales por medio de un módem y
hoy en día, por medio de la banda ancha, acceden a millones de páginas, que contienen información de la más diversa
índole. Existen páginas de carácter personal, educativas, y por supuesto orientadas a los negocios; de hecho, toda
empresa lo suficientemente tecnologizada cuenta con una página en Internet.

World Wide Web

Antiguo logo de WWW diseñado por Robert Cailliau.


Para otros usos de este término, véase WWW (desambiguación) y Web (desambiguación).
No debe confundirse con WorldWideWeb o Internet.

En informática, la World Wide Web (WWW) o Red informática mundial1 es un sistema de distribución de
información basado en hipertexto o hipermedios enlazados y accesibles a través de Internet. Con un navegador
web, un usuario visualiza sitios web compuestos de páginas web que pueden contener texto, imágenes, vídeos u
otros contenidos multimedia, y navega a través de ellas usando hiperenlaces.

La Web fue creada alrededor de 1989 por el inglésTimBerners-Lee con la ayuda del belgaRobertCailliau
mientras trabajaban en el CERN en Ginebra, Suiza, y publicado en 1992. Desde entonces, Berners-Lee ha
jugado un papel activo guiando el desarrollo de estándares Web (como los lenguajes de marcado con los que se
crean las páginas web), y en los últimos años ha abogado por su visión de una Web semántica.

WWW son las iniciales que identifican a la expresión inglesa World Wide Web, el sistema de documentos de
hipertexto que se encuentran enlazados entre sí y a los que se accede por medio de Internet. A través de un
software conocido como navegador, los usuarios pueden visualizar diversos sitios web (los cuales contienen
texto, imágenes, videos y otros contenidos multimedia) y navegar a través de ellos mediante los hipervínculos.

De esta manera, podríamos decir, utilizando una comparación con el sector de las comunicaciones telefónicas,
que www es el “prefijo” que tiene todo portal que se encuentre en la mencionada Red al que queremos acceder.

Gracias precisamente a Internet, al uso de la www y, por consiguiente, a las diversas páginas web que aquellas
presentan los ciudadanos de todo el mundo tenemos la posibilidad de acceder a un sinfín de espacios donde
podemos encontrar la información sobre un aspecto que estamos buscando, donde tenemos la oportunidad de
entretenernos visualizando imágenes interesantes o incluso donde podemos comunicarnos con personas de
cualquier rincón de la geografía de nuestro planeta.

En este sentido, y partiendo de los ejemplos expuestos, podemos subrayar que algunas de las web que más
afluencia de usuarios tienen en todo el mundo son el buscador Google, el portal de vídeos Youtube o redes
sociales como Facebook.
Merece destacarse que por todo ello Internet y el mundo www se ha convertido en la auténtica revolución e
innovación del siglo XX y en eje indiscutible del siglo actual. Y es que ha logrado originar un cambio absoluto
no sólo en el ámbito tecnológico sino también social.

De esta manera, sociólogos expertos han subrayado como aquellos han modificado en parte la comunicación
entre los seres humanos. Y es que no sólo es que muchas personas apuesten por la Red para poder  tener
conversaciones con sus amigos o familiares sino que también un elevado número de ellas utilizan lo mismo para
conocer a nuevos amigos o relaciones, para recuperar el contacto con gente o incluso para establecer relaciones
laborales.

La WWW, según se advierte al repasar los orígenes de esta sigla, fue desarrollada
a inicios de la década del ’90 por un hombre de origen inglés llamado Tim Berners-Lee, quien contó con la
colaboración de Robert Cailliau, un belga que trabajaba con él en Ginebra (Suiza). De todas formas, sus
antecedentes se remontan a los años ’40. Hay que destacar que Berners-Lee y Cailliau han sido claves para la
creación de diversos estándares relacionados al universo web, como ocurrió con los lenguajes de marcado que
hacen posible la creación de páginas.

El funcionamiento de la WWW se da por iniciado cuando un usuario ingresa una dirección (URL) en su
navegador o cuando sigue un enlace de hipertexto incluido en una página. El navegador entonces impulsa una
serie de comunicaciones para obtener los datos de la página solicitada y, de esta forma, visualizarla.

El primer paso consiste en transformar el nombre del servidor de la URL en una dirección IP, utilizando la base
de datos conocida como DNS. La dirección IP permite contactar al servidor web y hacer la transferencia de los
paquetes de datos.

Luego se envía una solicitud HTTP al servidor a fin de lograr acceder al recurso. Primero se pide el texto
HTML y después se produce el análisis por parte del navegador, que realiza otras peticiones reservadas a los
gráficos y al resto de los archivos que formen parte de la página.
La WWW, abreviatura de World Wide Web, es la red global mundial de intercambio de documentos a
través de hipertexto comúnmente conocida como Internet.

Para la informática, la World Wide Web es un sistema de información y documentos vinculada a través de
hipertexto e hipermedios a los que se puede acceder por medio de Internet, más específicamente, con un
navegador web.

En 1989 Tim Berners Lee y Robert Cailiau, dos investigadores del CERN (Organización Europea para la
Investigación Nuclear) crearon la Web, interviniendo luego en el desarrollo de los diversos estándares y
escenarios Web a partir de su invención.

El funcionamiento de la Web ocurre mediante navegadores web (los más comunes, Internet Explorer, Mozilla
Firefox y Safari). El usuario puede visualizar el contenido incluido en páginas y sitios web ingresando una
dirección URL en el campo determinado. Así, tiene acceso a texto, imágenes, videos, audio y todo tipo de
contenido, y navega entre múltiples unidades de contenido usando hiperenlaces que lo conducen a través de
simples clicks.

El “www” es actualmente un estándar mundial que la mayoría de los sitios web incluyen como parte de su
dirección y que es preciso para ingresar y navegar en la Web. Si bien Internet no consiste simplemente en el
intercambio de información y contenido a través de sitios web, se trata quizás de uno de los usos más difundidos
de esta tecnología.

Fácilmente, cualquier usuario puede no sólo acceder, sino generar su propio contenido para ser publicado en la
WWW mediante aplicaciones gratuitas y rápidas, que permiten intercambiar información desde y hacia todas
partes del mundo utilizando el mismo protocolo de navegación. El “www” es un protocolo íntimamente ligado
con el “http”, “.net”, “jsp”, “php” y “asp”, entre otros.
Para facilitar la navegación y la búsqueda de información en la Web, existen los denominados buscadores,
como Google o Yahoo, que permiten que un usuario ingrese un término de su interés y reciba como resultado
cientos de miles de sitios web relacionados con dicho concepto o palabra clave.

¿Quésignifica World Wide Web, web o www? -


Definición de World Wide Web, web o www
Web o la web, la red o www de World Wide Web, es básicamente un medio de comunicación de texto,
gráficos y otros objetos multimedia a través de Internet, es decir, la web es un sistema de hipertexto que utiliza
Internet como su mecanismo de transporte o desde otro punto de vista, una forma gráfica de explorar Internet.

La web fué creada en 1989 en un instituto de investigación de Suiza , la web se basa en buscadores y el
protocolo de transporte de hipertexto (hypertexttransportprotocol (http)). La mayoría de los documentos de la
web se crean utilizando lenguaje HTML (hypertextmarkuplanguage).

Es importante saber que web o www no son sinónimo de Internet, la web es un subconjunto de Internet que
consiste en páginas a las que se puede acceder usando un navegador. Internet es la red de redes donde reside
toda la información. Tanto el correo electrónico, como FTPs, juegos, etc. son parte de Internet, pero no de la
Web.

Para buscar hipertexto se utilizan programas llamados buscadores web que recuperan trozos de información
(llamados documentos o páginas web) de los servidores web y muestran en la pantalla del ordenador de la
persona que está buscando la información gráfica, textual o video e incluso audio.

Después se pueden seguir enlaces o hyperlinks en cada página a otros documentos o incluso devolver
información al servidor para interactuar con él. Al acto de seguir un enlace tras otro a veces se le llama navegar
en Internet.

La web se ha convertido en un medio muy popular de publicar información en Internet, y con el desarrollo del
protocolo de transferencia segura (secured server protocol (https)), la web es ahora un medio de comercio
electrónico donde los consumidores pueden escoger sus productos on-line y realizar sus compras utilizando la
información de sus tarjetas bancarias de forma segura.

Navegador web
El WorldWideWeb para equipos basados en NeXT, fue el primer navegador web (1991).

Un navegador o navegador web (del inglés, web browser) es una aplicación que opera a través de Internet,
interpretando la información de archivos y sitios web para que podamos ser capaces de leerla, (ya se encuentre
ésta alojada en un servidor dentro de la World Wide Web o en un servidor local).

El navegador interpreta el código, HTML generalmente, en el que está escrita la página web y lo presenta en
pantalla permitiendo al usuario interactuar con su contenido y navegar hacia otros lugares de la red mediante
enlaces o hipervínculos.
La funcionalidad básica de un navegador web es permitir la visualización de documentos de texto, posiblemente
con recursos multimedia incrustados. Los documentos pueden estar ubicados en la computadora en donde está
el usuario, pero también pueden estar en cualquier otro dispositivo que esté conectado a la computadora del
usuario o a través de Internet, y que tenga los recursos necesarios para la transmisión de los documentos (un
software servidor web).

Tales documentos, comúnmente denominados páginas web, poseen hipervínculos que enlazan una porción de
texto o una imagen a otro documento, normalmente relacionado con el texto o la imagen.

El seguimiento de enlaces de una página a otra, ubicada en cualquier computadora conectada a la Internet, se
llama navegación, de donde se origina el nombre navegador (aplicado tanto para el programa como para la
persona que lo utiliza, a la cual también se le llama cibernauta). Por otro lado, hojeador es una traducción literal
del original en inglés, browser, aunque su uso es minoritario.

Un navegador web o explorador web (del inglés, navigator o browser) es una aplicación software libre que permite al
usuario recuperar y visualizar documentos de hipertexto, comúnmente descritos en HTML, desde servidores web de
todo el mundo a través de Internet. Esta red de documentos es denominada World Wide Web (WWW). Los navegadores
actuales permiten mostrar o ejecutar: gráficos, secuencias de vídeo, sonido, animaciones y programas diversos además
del texto y los hipervínculos o enlaces. Internet Explorer
Mozilla Firefox
Opera Web browser [ Editar definición ]

Del latín navigātor, navegador es un adjetivo que hace referencia a aquel o aquello que navega. Navegar, por
otra parte, es un verbo que señala a la acción de viajar en una embarcación o desplazarse a través de
unared informática.

El término, por lo tanto, tiene dos grandes usos: uno vinculado a la navegación
tradicional (es decir, a los traslados a través de ríos, mares o lagos) y otro relacionado con las redes virtuales
como Internet.

La persona especializada en la navegación de navíos se conoce como navegador o navegante. En este caso, la
noción también se aplica al navegante aéreo, que es el profesional a cargo de guiar a los aviones a través de
diversos métodos.

En el ámbito de la tecnología, un navegador o navegador web es un programa informático que permite


visualizar la información contenida en una página web, ya sea alojada en Internet o en un servidor local.

El navegador está en condiciones de interpretar los códigos de programación (por lo general, el lenguaje
HTML) de la página y presentar el contenido en pantalla de modo tal que el usuario pueda interactuar con la
información y navegar hacia otras páginas a través de enlaces (también conocidos como hipervínculos o links).
Los navegadores más populares son Internet Explorer y Mozilla FireFox.
Un navegador GPS (Global PositioningSystem o Sistema de Posicionamiento Global) es un dispositivo que
permite ubicar posiciones en un mapa digital, vinculado a una base de datos. Estos sistemas suelen tener
información de las calles de una ciudad: el usuario, por lo tanto, instala su navegador GPS en su automóvil y
puede consultar cómo realizar todo tipo de recorridos.

(Browser, explorador, navegador web). Aplicación que sirve para acceder a la WWW (todas las páginas web) y "navegar"
por ella a través de los enlaces.

Generalmente estos programas no sólo traen la utilidad de navegar por la WWW, sino que pueden también administrar
correo, grupos de noticias, ingresar al servicio de FTP, etc.

Actualmente los navegadores más populares son Internet Explorer, Netscape, Opera y Firefox.

Cada navegador provee su propio user-agent.

Navegadores web más utilizados (julio 2011)

* Internet Explorer - 42,4%


* Firefox - 28,13%
* Google Chrome - 21,89%
* Safari - 4.68%
* Opera - 0.88%
* Netscape - 0.71%
* Opera Mini - 0.27%
* Otros - 0.22%

Hypertext Transfer Protocol


Hyper text Transfer Protocol
(HTTP)
Familia: Familia de protocolos de Internet
Función: Transferencia de hipertexto
Última versión: 1.2
Puertos: 80/TCP

Ubicación en la pila de protocolos


Aplicación HTTP
Transporte TCP
Red IP

RFC 1945 (HTTP/1.0, 1996)


Estándares: RFC 2616 (HTTP/1.1, 1999)
RFC 2774 (HTTP/1.2, 2000)
Este artículo o sección necesita referencias que aparezcan en una publicación acreditada, como
revistas especializadas, monografías, prensa diaria o páginas de Internet fidedignas.
Puedes añadirlas así o avisar al autor principal del artículo en su página de discusión pegando:
{{subst:Avisoreferencias|Hypertext Transfer Protocol}} ~~~~

Hypertext Transfer Protocol o HTTP (en español protocolo de transferencia de hipertexto) es el protocolo
usado en cada transacción de la World Wide Web. HTTP fue desarrollado por el World Wide Web Consortium
y la Internet EngineeringTaskForce, colaboración que culminó en 1999 con la publicación de una serie de RFC,
el más importante de ellos es el RFC 2616 que especifica la versión 1.1. HTTP define la sintaxis y la semántica
que utilizan los elementos de software de la arquitectura web (clientes, servidores, proxies) para comunicarse.
Es un protocolo orientado a transacciones y sigue el esquema petición-respuesta entre un cliente y un servidor.
Al cliente que efectúa la petición (un navegador web o un spider) se lo conoce como "useragent" (agente del
usuario). A la información transmitida se la llama recurso y se la identifica mediante un localizador uniforme de
recursos (URL). Los recursos pueden ser archivos, el resultado de la ejecución de un programa, una consulta a
una base de datos, la traducción automática de un documento, etc.

HTTP es un protocolo sin estado, es decir, que no guarda ninguna información sobre conexiones anteriores. El
desarrollo de aplicaciones web necesita frecuentemente mantener estado. Para esto se usan las cookies, que es
información que un servidor puede almacenar en el sistema cliente. Esto le permite a las aplicaciones web
instituir la noción de "sesión", y también permite rastrear usuarios ya que las cookies pueden guardarse en el
cliente por tiempo indeterminado.

Introducción al protocolo HTTP


Desde 1990, el protocolo HTTP (Protocolo de transferencia de hipertexto) es el protocolo más utilizado en
Internet. La versión 0.9 sólo tenía la finalidad de transferir los datos a través de Internet (en particular páginas
Web escritas en HTML). La versión 1.0 del protocolo (la más utilizada) permite la transferencia de mensajes
con encabezados que describen el contenido de los mensajes mediante la codificación MIME.

El propósito del protocolo HTTP es permitir la transferencia de archivos (principalmente, en formato HTML).
entre un navegador (el cliente) y un servidor web (denominado, entre otros, httpd en equipos UNIX) localizado
mediante una cadena de caracteres denominada dirección URL.

Comunicación entre el navegador y el servidor


La comunicación entre el navegador y el servidor se lleva a cabo en dos etapas:
 El navegador realiza una solicitud HTTP
 El servidor procesa la solicitud y después envía una respuesta HTTP

En realidad, la comunicación se realiza en más etapas si se considera el procesamiento de la solicitud en el


servidor. Dado que sólo nos ocupamos del protocolo HTTP, no se explicará la parte del procesamiento en el
servidor en esta sección del artículo. Si este tema les interesa, puede consultar el articulo sobre el tratamiento de
CGI.

l protocolo HTTP

Definiciíon:

El protocolo de transferencia de hipertexto (HTTP, Hyper Text Transfer Protocol (Protocolo de transferencia de
Hyper Texto)) es el protocolo usado en cada transacción de la Web (WWW). Un protocolo se puyede entender
como el lenguaje utilizado por dos computadoras para comunicarse entre si.

Hyper Texto se refiere al contenido de las paginas escrito en un lenguaje especial (html), los browser
(navegadores) se comunican con los servidores de internet mediante este protocolo se envian las paginas en el
lenguaje html y lo interpretan y nos muestran su contenido.

HTTP es un protocolo sin estado, es decir, que no guarda ninguna información sobre conexiones anteriores. Al
finalizar la transacción todos los datos se pierden. Por esto se popularizaron las cookies, que son pequeños
archivos guardados en el propio ordenador que puede leer un sitio web al establecer conexión con él, y de esta
forma reconocer a un visitante que ya estuvo en ese sitio anteriormente. Gracias a esta identificación, el sitio
web puede almacenar gran número de información sobre cada visitante, ofreciéndole así un mejor servicio.

File Transfer Protocol


File Transfer Protocol
(FTP)

Familia: Familia de protocolos de Internet

Función: protocolo de transferencia de


archivos

20/TCP DATA Port


Puertos:
21/TCP Control Port

Ubicación en la pila de protocolos

Aplicación FTP

Transporte TCP

Red IP

FTP: RFC 959 (1985)


Estándares: Extensiones de FTP para IPv6 y
NATs: RFC 2428 (1998)

FTP (siglas en inglés de File Transfer Protocol, 'Protocolo de Transferencia de Archivos') en informática, es un
protocolo de red para la transferencia de archivos entre sistemas conectados a una red TCP (Transmission
Control Protocol), basado en la arquitectura cliente-servidor. Desde un equipo cliente se puede conectar a un
servidor para descargar archivos desde él o para enviarle archivos, independientemente del sistema operativo
utilizado en cada equipo.

El servicio FTP es ofrecido por la capa de aplicación del modelo de capas de red TCP/IP al usuario, utilizando
normalmente el puerto de red 20 y el 21. Un problema básico de FTP es que está pensado para ofrecer la
máxima velocidad en la conexión, pero no la máxima seguridad, ya que todo el intercambio de información,
desde el login y password del usuario en el servidor hasta la transferencia de cualquier archivo, se realiza en
texto plano sin ningún tipo de cifrado, con lo que un posible atacante puede capturar este tráfico, acceder al
servidor y/o apropiarse de los archivos transferidos.

Para solucionar este problema son de gran utilidad aplicaciones como scp y sftp, incluidas en el paquete SSH,
que permiten transferir archivos pero cifrando todo el tráfico.

Introducción al protocolo FTP

El protocolo FTP (Protocolo de transferencia de archivos) es, como su nombre lo indica, un protocolo para
transferir archivos.

La implementación del FTP se remonta a 1971 cuando se desarrolló un sistema de transferencia de archivos
(descrito en RFC141) entre equipos del Instituto Tecnológico de Massachusetts (MIT, Massachusetts Institute
of Technology). Desde entonces, diversos documentos de RFC (petición de comentarios) han mejorado el
protocolo básico, pero las innovaciones más importantes se llevaron a cabo en julio de 1973.

Actualmente, el protocolo FTP está definido por RFC 959 (Protocolo de transferencia de archivos (FTP) -
Especificaciones).
La función del protocolo FTP

El protocolo FTP define la manera en que los datos deben ser transferidos a través de una red TCP/IP.

El objetivo del protocolo FTP es:

 permitir que equipos remotos puedan compartir archivos


 permitir la independencia entre los sistemas de archivo del equipo del cliente y del equipo del servidor
 permitir una transferencia de datos eficaz

El modelo FTP

El protocolo FTP está incluido dentro del modelo cliente-servidor, es decir, un equipo envía órdenes (el cliente)
y el otro espera solicitudes para llevar a cabo acciones (el servidor).

Durante una conexión FTP, se encuentran abiertos dos canales de transmisión:

 Un canal de comandos (canal de control)


 Un canal de datos

Por lo tanto, el cliente y el servidor cuentan con dos procesos que permiten la administración de estos dos tipos
de información:

 DTP (Proceso de transferencia de datos) es el proceso encargado de establecer la conexión y de administrar el


canal de datos. El DTP del lado del servidor se denomina SERVIDOR DE DTP y el DTP del lado del cliente se
denomina USUARIO DE DTP.
 PI (Intérprete de protocolo) interpreta el protocolo y permite que el DTP pueda ser controlado mediante los
comandos recibidos a través del canal de control. Esto es diferente en el cliente y el servidor:
o El SERVIDOR PI es responsable de escuchar los comandos que provienen de un USUARIO PI a través del
canal de control en un puerto de datos, de establecer la conexión para el canal de control, de recibir los
comandos FTP del USUARIO PI a través de éste, de responderles y de ejecutar el SERVIDOR DE DTP.
o El USUARIO PI es responsable de establecer la conexión con el servidor FTP, de enviar los comandos FTP,
de recibir respuestas del SERVIDOR PI y de controlar al USUARIO DE DTP, si fuera necesario.

Cuando un cliente FTP se conecta con un servidor FTP, el USUARIO PI inicia la conexión con el servidor de
acuerdo con el protocolo Telnet. El cliente envía comandos FTP al servidor, el servidor los interpreta, ejecuta su
DTP y después envía una respuesta estándar. Una vez que se establece la conexión, el servidor PI proporciona
el puerto por el cual se enviarán los datos al Cliente DTP. El cliente DTP escucha el puerto especificado para
los datos provenientes del servidor.
Es importante tener en cuenta que, debido a que los puertos de control y de datos son canales separados, es
posible enviar comandos desde un equipo y recibir datos en otro. Entonces, por ejemplo, es posible transferir
datos entre dos servidores FTP mediante el paso indirecto por un cliente para enviar instrucciones de control y
la transferencia de información entre dos procesos del servidor conectados en el puerto correcto.

En esta configuración, el protocolo indica que los canales de control deben permanecer abiertos durante la
transferencia de datos. De este modo, un servidor puede detener una transmisión si el canal de control es
interrumpido durante la transmisión.

File Transfer Protocol

FTP (File Transfer Protocol) es un protocolo de transferencia de archivos entre sistemas conectados a una red
TCP basado en la arquitectura cliente-servidor, de manera que desde un equipo cliente nos podemos conectar a
un servidor para descargar archivos desde él o para enviarle nuestros propios archivos independientemente del
sistema operativo utilizado en cada equipo.

El Servicio FTP es ofrecido por la capa de Aplicación del modelo de capas de red TCP/IP al usuario, utilizando
normalmente el puerto de red 20 y el 21. Un problema básico de FTP es que está pensado para ofrecer la
máxima velocidad en la conexión, pero no la máxima seguridad, ya que todo el intercambio de información,
desde el login y password del usuario en el servidor hasta la transferencia de cualquier archivo, se realiza en
texto plano sin ningún tipo de cifrado, con lo que un posible atacante lo tiene muy fácil para capturar este
tráfico, acceder al servidor, o apropiarse de los archivos transferidos.
¿Qué es el W3C? - Definición de W3C
W3C son las siglas de World Wide Web Consortium, un consorcio fundado en 1994 para dirigir a la Web
hacia su pleno potencial mediante el desarrollo de protocolos comunes que promuevan su evolución y aseguren
su interoperabilidad.

El consorcio está compuesto por un grupo de programadores, desarrolladores web, ejecutivos de la industria y
usuarios que ayudan a definir las especificaciones para el desarrollo de la tecnología web.

World Wide Web Consortium (Consorcio de la Web o Telaraña Mundial). Organismo que regula los estándares en la
WWW. Está dirigida por Tim Berners-Lee (creador de la WWW).

14/07/09 Las hojas de Estilo en cascada (Cascading Style Sheets), CSS es un lenguaje
artificial usado para definir la presentación de un documento estructurado escrito en HTML
o XML (y por extensión en XHTML). El WWWC (World Wide Web Consortium) es el
encargado de formular la especificación de las hojas de estilo que servirán de estándar para
los agentes de usuario o navegadores.
- definición de css. - 2 - 2 - Las hojas de Estilo en cascada (Cascading Style Sheets), CSS es un lenguaje
artificial usado para definir la presentación de un documento estructurado escrito en HTML o XML (y por
extensión en XHTML). El WWWC (World Wide Web Consortium) es el encargado de formular la
especificación de las hojas de estilo que servirán de estándar para los agentes de usuario o navegadores. - 2 - -

CSS se utiliza para dar estilo a documentos HTML y XML, separando el contenido de la presentación. Los
Estilos definen la forma de mostrar los elementos HTML y XML. CSS permite a los desarrolladores Web
controlar el estilo y el formato de múltiples páginas Web al mismo tiempo. Cualquier cambio en el estilo
marcado para un elemento en la CSS afectará a todas las páginas vinculadas a esa CSS en las que aparezca ese
elemento.

CSS funciona a base de reglas, es decir, declaraciones sobre el estilo de uno o más elementos. Las hojas de
estilo están compuestas por una o más de esas reglas aplicadas a un documento HTML o XML. La regla tiene
dos partes: un selector y la declaración. A su vez la declaración está compuesta por una propiedad y el valor que
se le asigne.

La información de estilo puede ser adjuntada tanto como un documento separado o en el mismo documento
HTML. En este último caso podrían definirse estilos generales en la cabecera del documento o en cada etiqueta
particular mediante el atributo "style".
Definición de CSS - ¿Qué son las hojas de estilo o
cascadingstylesheets?
CSS son las siglas de Cascading Style Sheets - Hojas de Estilo en Cascada - que es un lenguaje que describe la
presentación de los documentos estructurados en hojas de estilo para diferentes métodos de interpretación, es
decir, describe como se va a mostrar un documento en pantalla, por impresora, por voz (cuando la información
es pronunciada a través de un dispositivo de lectura) o en dispositivos táctiles basados en Braille.

¿Para que sirve?

CSS es una especificación desarrollada por el W3C (World Wide Web Consortium) para permitir la separación
de los contenidos de los documentos escritos en HTML, XML, XHTML, SVG, o XUL de la presentacin del
documento con las hojas de estilo, incluyendo elementos tales como los colores, fondos, márgenes, bordes, tipos
de letra..., modificando as la apariencia de una página web de una forma más sencilla, permitiendo a los
desarrolladores controlar el estilo y formato de sus documentos.

¿Cómo funciona?

El lenguaje CSS se basa en una serie de reglas que rigen el estilo de los elementos en los documentos
estructurados, y que forman la sintaxis de las hojas de estilo. Cada regla consiste en un selector y una
declaración, esta última va entre corchetes y consiste en una propiedad o atributo, y un valor separados por dos
puntos.

Selector
Ejemplo:

h2 {color: green;}

 h2 ---> es el selector
 {color: green;} ---> es la declaración
o color ---> es la propiedad o atributo
o green ---> es el valor

Selector

El Selector especifica que elementos HTML van a estar afectados por esa declaración, de manera que hace de
enlace entre la estructura del documento y la regla estilística en la hoja de estilo.

Declaración

La Declaración que va entre corchetes es la información de estilo que indica cómo se va a ver el selector. En
caso de que haya más de una declaración se usa punto y coma para separarlas.

Propiedad o Atributo y Valor

Dentro de la declaración, la Propiedad o Atributo define la interpretación del elemento asignándosele un cierto
Valor, que puede ser color, alineación, tipo de fuente, tamaño..., es decir, especifican qué aspecto del selector se
va a cambiar.

Tres tipos de estilos

La información CSS se puede proporcionar por varias fuentes, ya sea adjunto como un documento por separado
o incorporado en el documento HTML, y dentro de estas posibilidades destacan tres formas de dar estilo a un
documento web:

Hoja de Estilo Externa

La Hoja de Estilo Externa se almacena en un archivo diferente al del archivo con el código HTML al cal estar
vinculado a través del elemento link, que debe ir situado en la sección head. Es la manera de programar ms
eficiente, ya que separa completamente las reglas de formato para la página HTML de la estructura básica de la
página.

Hoja de Estilo Interna

La Hoja de Estilo Internaest incorporada a un documento HTML, a través del elemento style dentro de la
sección head, consiguiendo de esta manera separar la información del estilo del código HTML.

Estilo en Línea

El Estilo en Línea sirve para insertar el lenguaje de estilo directamente dentro de la sección body con el
elemento style. Sin embargo, este tipo de estilo no se recomienda pues se debe intentar siempre separar el
contenido de la presentación.
Versiones CSS

Existen varias versiones: CSS1 y CSS2, la CSS3 está todavía en desarrollo por el CSS WG (Cascading Style
SheetsWorkingGroup).

Los navegadores actuales implementan bastante bien CSS1 desde 1999 (tres años después de su lanzamiento)
aunque dependiendo de la marca y versión del navegador hay algunas pequeñas diferencias de implementación.
El primer navegador en dar soporte completo al CSS1 ha sido Internet Explorer 5.0 forthe Macintosh en 2000,
anteriormente el que mejor soportaba CSS1 haba sido Opera, después otros navegadores también lo han ido
implementando.

Sin embargo, CSS2 (lanzado en 1998) sólo está parcialmente implementado en los navegadores más recientes,
variando en estos los niveles de implementación.

Ventajas de CSS

 La principal ventaja de CSS sobre el lenguaje HTML o similar, es que el estilo se puede guardar completamente
por separado del contenido siendo posible, por ejemplo, almacenar todos los estilos de presentación para una
web de 10.000 páginas en un sólo archivo de CSS.
 CSS permite un mejor control en la presentación de un sitio web que los elementos de HTML, agilizando su
actualización.
 Aumento de la accesibilidad de los usuarios gracias a que pueden especificar su propia hoja de estilo,
permitiéndoles modificar el formato de un sitio web según sus necesidades, de manera que por ejemplo,
personas con deficiencias visuales puedan configurar su propia hoja de estilo para aumentar el tamaño del
texto.
 El ahorro global en el ancho de banda es notable, ya que la hoja de estilo se almacena en cache después de la
primera solicitud y se puede volver a usar para cada página del sitio, no se tiene que descargar con cada página
web. Por otro lado, quitando todo lenguaje de marcado en la presentación en favor del uso de CSS reduce su
tamaño y ancho de banda hasta más del 50%, esto beneficia al dueño del sitio web con menos ancho de banda y
costes de almacenamiento, as como a los visitantes para los cuales las páginas se van a cargar más rápido.
 Una página puede tener diferentes hojas de estilo para mostrarse en diferentes dispositivos, como pueden ser
impresoras, lectores de voz, o móviles.

Introducción a las hojas de estilo

El concepto de hojas de estilo apareció por primera vez en 1996 cuando W3C publicó una recomendación
nueva intitulada "Hojas de estilo en cascada" o CSS, su sigla en inglés.

El principio de las hojas de estilo consiste en la utilización de un solo documento para almacenar las
características de presentación de las páginas asociadas a grupos de elementos. Esto implica nombrar un
conjunto de definiciones y características de presentación de las páginas, y activar esos nombres para aplicarlos
a una parte del texto. Por ejemplo, se pueden configurar los títulos de una sección para que aparezcan en fuente
Arial, en color verde y en cursiva.

Las hojas de estilo se desarrollaron para compensar los defectos de HTML con respecto a la presentación y al
diseño de las páginas. HTML tiene varias etiquetas para modificar la presentación y definir los estilos del texto,
pero cada elemento tiene su propio estilo, independientemente de los elementos que lo rodean. Al utilizar hojas
de estilo, cuando se necesite cambiar la apariencia de un sitio que tiene cientos de páginas Web todo lo que hay
que hacer es editar las definiciones de la hoja de estilo en un solo lugar para cambiar la apariencia del sitio
completo.

Se denominan "hojas de estilo en cascada" porque se pueden definir múltiples hojas y los estilos pueden
aplicarse a todas las páginas (con un sistema predefinido para resolver conflictos).

Las hojas de estilo pueden utilizarse para:

 lograr una apariencia uniforme de todo el sitio al activar una sola definición de estilo en cada página,
 cambiar un aspecto en todo el sitio Web con tan sólo editar unas pocas líneas,
 hacer que los códigos HTML sean más fáciles de leer ya que los estilos se definen por separado,
 permitir que las páginas se carguen más rápido ya que hay menos cantidad de HTML en cada página,
 posicionar los elementos de la página de una manera más uniforme.

CSS 2.0

Desde el 12 de mayo de 1998, la norma CSS 2.0 ha sido el estándar vigente. CSS 2.0 agrega características
nuevas a la norma anterior (1.0), que incluye:

 Consideraciones sobre cómo se va a mostrar un documento en los distintos medios (como una pantalla, una
impresora, un sistema Braille, un sintetizador de voz, etc.).
 Adición de características de sonido para ciegos y minusválidos visuales.
 Cursores para maniobrar.
 Administración de desbordamiento y visibilidad de elementos.

Compatibilidad con los navegadores

A pesar de las recomendaciones de W3C, no todos los navegadores muestran las hojas de estilo de la misma
forma. El explorador Microsoft Internet Explorer 3.0 fue el primero que integró hojas de estilo y su uso se hizo
más común con las versiones 4.0 y superiores de Internet Explorer y Netscape Navigator.

Navegadores que admiten hojas de estilo:

 Microsoft Internet Explorer 3.0 (parcialmente)


 Microsoft Internet Explorer 4 x
 Microsoft Internet Explorer 5 x
 Microsoft Internet Explorer 6 x
 Netscape Navigator 4.x
 Netscape Navigator 6.x
 Netscape Navigator 7.x
 Mozilla x.x
 Firefox x.x
 Opera 5.x
 Opera 6.x
 Opera 7.x
 Camino 0.8x
 Safari 1.xx

1.2.2. URL
Prácticamente, todo el mundo está familiarizado con una dirección de Internet o URL (UniformResource
Locutor) usadas en páginas Web. Direcciones como por ejemplo www.itver.edu.mx nos resultan tan conocidas
como la dirección de una calle. La palabra “www.google.com.mx” se ha vuelto parte de nuestro lenguaje. Sin
embargo, la forma mas común de direcciones que usamos, las cuales contienen letras y nombres reconocibles,
solo se usan para que podamos reconocerlas e interpretarlas y no son las que utilizan los procesadores
realmente.

Para poder identificar un sitio en Internet, las computadoras no usan un formato como www.itver.edu.mx, usan
números denominados direcciones IP. Una dirección IP es un número formado por cuatro segmentos y separado
por puntos. Cada uno de estos cuatro números va del 0 al 255. Volviendo al ejemplo anterior, la dirección del
Instituto Técnologico de Veracruz (una de ellas) es 148.208.233.1. Para hacer la traducción entre uno y otro
formato, se usa un DNS (DomainNameSystem: Servidor de nombre de dominios), los cuales guardan una base
de datos que identifica y asocia los nombres de Webs a sus correspondientes direcciones IP.

Luego entonces URL es un formato de asignación de nombres universal, utilizado para indicar un recurso en
Internet. Es una cadena de caracteres ASCII imprimible que se divide en cuatro partes:

 El nombre del protocolo: es decir, el lenguaje utilizado para comunicarse en la red. El protocolo más
usado es el protocolo HTTP (Protocolo de transferencia de hipertexto), que posibilita el intercambio de
páginas Web en formato HTML. Sin embargo, pueden utilizarse muchos otros protocolos como por
ejemplo FTP, Mailto, etc.;
 El nombre del servidor: es un nombre de dominio del equipo que aloja el recurso solicitado. Es
importante tener en cuenta que es posible utilizar la dirección IP del servidor, pero esto hace que la URL
sea menos legible;
 El número del puerto: es un número relacionado con un servicio que le permite al servidor conocer el
tipo de recurso solicitado. El puerto predeterminado relacionado con este protocolo es el puerto 80. Por
lo tanto, cuando el servicio Web del servidor esté asociado al puerto número 80, el número de puerto es
opcional;
 La ruta de acceso al recurso: esta última parte le permite al servidor conocer dónde se encuentra el
recurso, esto es, generalmente, el sitio (directorio) y nombre del archivo solicitado.

Por lo tanto, una URL tiene la siguiente estructura:

Puerto
Protocolo Nombre del servidor
(opcional si es 80)
http:// www.itver.edu.mx  
http:// portal.itver.edu.mx :7778
ftp:// ftp.paginasprodigy.com.mx/  
http:// 216.64.208.72  

Por ejemplo, los siguientes protocolos pueden utilizarse con URL:


 http, para navegar por páginas web;
 ftp, para navegar por sitios FTP;
 telnet, para conectarse a un terminal remoto;
 mailto, para enviar un correo electrónico;
 wais;
 gopher.

El nombre del archivo en la URL puede estar seguido de un signo de interrogación y después de datos en
formato ASCII. Estos son datos adicionales enviados como parámetros para una aplicación del servidor (por
ejemplo, una secuencia de comandos CGI ).

Cuando llegamos a un sitio Web, habitualmente llegamos a una página principal que es la puerta de entrada o
presentación del sitio Web. Esta página se suele llamar el “index”, y cuando accedemos al dominio, nos suele
llevar a ella por defecto. Sin embargo veremos una URL mas larga según naveguemos por el sitio Web. Este es
el camino a una página en particular o un archivo que queremos descargar. Normalmente, este camino tendrá el
nombre de un directorio, algunos sub-directorios y luego archivos con una extensión html, aunque pueden ser
de otro tipo como php, jsp, asp… etc.

Muchos navegadores web no requieren que el usuario ingrese "http://" para dirigirse a una página web, puesto
que HTTP es el protocolo más común que se usa en navegadores web. Igualmente, dado que 80 es el puerto por
omisión para HTTP, usualmente no se especifica. Normalmente uno sólo ingresa un URL parcial tal como
www.itver.edu.mx.

Dado que el protocolo HTTP permite que un servidor responda a una solicitud redireccionando el navegador
web a un URL diferente, muchos servidores adicionalmente permiten a los usuarios omitir ciertas partes del
URL, tales como la parte "www.". Por ejemplo: itver.edu.mx.

Lenguajes del lado servidor y del lado cliente


17 enero 2007

LuisBases técnicas2 comentarios

A veces, cuando los expertos hablan del diseño de páginas web dinámicas, utilizan una jerga de siglas
que describen la gran variedad de lenguajes de programación utilizados para producir efectos dinámicos en una
página web. Todos esos lenguajes de programación pueden ordenarse en dos grupos, que responden a dos
estrategias complementarias: los programas que producen esas animaciones en la página web, ¿deben ejecutarse
en el ordenador del cliente web? ¿o deben ejecutarse en el servidor?
El navegador web es una aplicación que sólo comprende las etiquetas html. Con esas etiquetas, el programa
navegador da formato a la página y la presenta en la pantalla del usuario. Es un servicio esencial, pero sólo
proporciona páginas estáticas.

Hace ya mucho tiempo que los diseñadores de páginas web vieron la necesidad de incorporar a las páginas web
elementos dinámicos y comportamientos programados. No sólo para incluir animaciones gráficas, sino también
para interactuar con el usuario de la página para, por ejemplo, pedirle datos, seleccionar opciones o confirmar
operaciones.

Como el lenguaje htmles incapaz de proporcionar el control de los elementos dinámicos de una web, se recurre
a incluir pequeños programas o scripts en el código de la página. Estos scripts o módulos de programa, están
escritos en un lenguaje de programación idóneo. El código del script está incrustado o, como suele decirse en la
jerga del oficio, embebido en el código html, de modo que cuando el navegador recibe una página web,
interpreta y da formato al contenido de la página y entrega el código de los scripts al programa intérprete
correspondiente, que deberá haber sido instalado en el navegador como un plug-in.

Otra posibilidad, para dar efectos dinámicos a una página web, consiste en que las instrucciones
correspondientes estén escritas en un lenguaje de script, que es interpretado en el servidor para convertirlo en
etiquetas htmlde forma oculta u opaca para el navegador. De ese modo, el cliente recibe desde el servidor el
código htmlya terminado y no necesita tener instalado ningún plug-in. En este caso, el intérprete del código del
script debe residir en el servidor.

Así pues, podemos encontrar lenguajes de programación de scripts que residen en el lado del cliente y lenguajes
que residen en el lado del servidor. Cada uno de ellos tiene sus ventajas e inconvenientes:

 Un lenguaje del lado cliente es totalmente independiente del servidor, lo cual permite que la página
pueda ser albergada en cualquier sitio. Pero nuestra página no se verá bien si el ordenador cliente no
tiene instalados los plug-in adecuados. El código, tanto del hipertexto como de los scripts, es accesible a
cualquiera y ello puede afectar a la seguridad.

 Un lenguaje del lado servidor es independiente del navegador utilizado, que no necesitará plug-in
especiales para visualizar correctamente cualquier página. Además, el código de los script puede
ocultarse al terminal cliente, que sólo verá el código htmlterminado. Por contra, la prueba y depuración
de un script deberá hacerse desde el servidor.
 Portales de Centros Educativos
 Al realizar un básico análisis de la mayor parte de los sitios web en general, y de los centros educativos
españoles en particular, el resultado suele ser bastante desalentador: Páginas que no se actualizan nunca,
tablones de información planos sin interacción alguna entre usuarios, carencia de planificación y de
uniformidad estructural, plantillas de diseño obsoletas y repetitivas, uso de enormes ficheros de imagen,
películas flash destinadas solo a "decorar" sin ningún tipo de interactividad, etc.
 Los motivos de esta baja calidad de los websites, aunque muy variados, por lo general encajan en alguna
de las siguientes categorías:
 1. Se utilizan herramientas de desarrollo inadecuadas, con nula o escasa capacidad para administrar un
sitio web de manera eficiente a medio y largo plazo.
2. La página no es accesible ni comprensible para todos los participantes en el proyecto.
3. La estructura del sitio no permite separar los contenidos de los elementos de diseño.
  

 Usar editores de páginas Web como FrontPage o Dreamweaversuele ser la opción más frecuente entre
quienes se inician en el diseño de páginas web. De hecho, los Centros de Profesores satisfacen una
buena parte de la demanda formativa en T.I.C. ofertando cursos sobre estos programas. Ciertamente, el
dominio de alguna de estas plataformas de diseño puede constituir una buena baza para crear páginas de
aspecto atractivo, incluso para embarcarse en pequeños proyectos en los que la permanente actualización
de contenidos, la gestión avanzada de usuarios o el flujo de información en tiempo real no sean factores
a tener en cuenta. Sin embargo, todas estas herramientas resultarán bastante inadecuadas para
administrar y mantener de forma sencilla cualquier proyecto web de cierta complejidad, dado que el
código, los elementos estructurales, los scripts de programación y los elementos de diseño no son
totalmente independientes de los contenidos. Cambiar el texto de una página, incluso una tilde mal
puesta, supone el largo y tedioso proceso de descargar dicha página del servidor, editarla con la misma
herramienta de diseño empleada en el proyecto y volver a subirla vía FTP navegando, en todo momento,
por una densa selva de carpetas y subcarpetas en la que lo más fácil es acabar completamente perdido.
 Imaginemos una situación algo más compleja, pero muy frecuente en todos los centros: La profesora "x"
abandonan el centro dejando un reguero de datos personales en unos quince lugares de nuestro sitio web.
¿Cómo proceder? Descargando una a una todas las páginas y renovando manualmente esta información.
¿Quién lo hace? ... ¿Y si "el de siempre" es quien se marcha? A poco que meditemos, acabaremos por
comprender, he incluso disculpar a los responsables de la gran marabunta de sitios cuya información se
actualiza de forma errática y fragmentaria.
  

  
 La conclusión que podemos sacar es obvia: En el mundo educativo son necesarias plataformas de
desarrollo web en las que el diseño sea independiente de los contenidos, el proceso de actualización
resulte accesible a todos los usuarios (autorizados) desde cualquier ordenador y no se requieran
permanentemente los servicios de un webmaster: la incuestionable y todopoderosa presencia "del que
sabe". En resumidas cuentas ha llegado el momento de contemplar muy prioritariamente a los
contenidos sobre el continente en el que se encuentren.
 Modelo Cliente-Servidor
 El término ordenador local se utiliza para referirse al ordenador que el usuario utiliza para entrar en la
red Internet. Desde ese ordenador el usuario establece conexiones con otros ordenadores, denominados
ordenadores remotos, a los que solicita algún servicio. Estos ordenadores remotos que ofrecen servicios
reciben también el nombre de servidores o host. 
 La utilización de las diferentes aplicaciones o servicios de Internet se lleva a cabo respondiendo al
llamado modelo cliente-servidor.
 Cuando se utiliza un servicio en Internet, como consultar una base de datos, transferir un fichero o
participar en un foro de discusión, se establece un proceso en el que entran en juego dos partes. Por un
lado, el usuario, quien ejecuta una aplicación en el ordenador local: el denominado programa cliente.
Este programa cliente se encarga de ponerse en contacto con el ordenador remoto para solicitar el
servicio deseado. El ordenador remoto por su parte responderá a lo solicitado mediante un programa que
esta ejecutando. Este último se denomina programa servidor. Los términos cliente y servidor se utilizan
tanto para referirse a los programas que cumplen estas funciones, como a los ordenadores donde son
ejecutados esos programas. 
 El programa o los programas cliente que el usuario utiliza para acceder a los servicios de Internet
realizan dos funciones distintas. Por una parte, se encargan de gestionar la comunicación con el
ordenador servidor, de solicitar un servicio concreto y de recibir los datos enviados por éste; y por otra,
es la herramienta que presenta al usuario los datos en pantalla y que le ofrece los comandos necesarios
para utilizar las prestaciones que ofrece el servidor.

World Wide Web

La World Wide Web, WWW, o simplemente Web, es uno de los sistemas que ha contribuido de forma decisiva
al acercamiento de la red Internet a un gran número de personas. Y ello por dos razones: 

1. La sencillez en el uso 
2. La atractiva presentación de la información que se consigue con las técnicas multimedia.

Los programas para explorar la información son tan sencillos de utilizar que, una vez conectado, el único
conocimiento informático que se le exige al usuario es pulsar el ratón.

Y por lo que se refiere a la presentación, con un navegador de Web el usuario puede ver imágenes integradas
en un texto e incluso escuchar el contenido de un fichero de sonido o ver una secuencia grabada en vídeo si
dispone del hardware y del software apropiados. 
Curiosamente, la Web no fue creada con el fin de proporcionar una plataforma de fácil acceso para personas
con unos conocimientos rudimentarios de informáticas. Se desarrolló en el centro CERN (el laboratorio europeo
de física de partículas, en Ginebra) como un medio de compartir información entre los físicos de alta energía de
todo el mundo. De ahí se difundió su aplicación a la red Internet, y en solo unos pocos años se ha extendido
tanto que el caudal de información disponible vía Web es de tal magnitud que resulta prácticamente
inabarcable. 

La Web se fundamenta en dos conceptos: 

La navegación por medio de hipertexto 


La posibilidad de acceder a documentos multimedia 

Páginas estáticas Vs. dinámicas

En la web podemos encontrar, o construir, dos tipos de páginas:

 Las que se presentan sin movimiento y sin funcionalidades más allá de los enlaces. (Pulsa sobre la
imagen para visualizar el ejemplo)
 Las páginas que tienen efectos especiales y en las que podemos interactuar. (Pulsa sobre la imagen para
visualizar el ejemplo)

Las primeras páginas son las que denominamos páginas estáticas, se construyen con el lenguaje HTML, que no
permite grandes florituras para crear efectos ni funcionalidades más allá de los enlaces.

Estas páginas son muy sencillas de crear, aunque ofrecen pocas ventajas tanto a los desarrolladores como a los
visitantes, ya que sólo se pueden presentar textos planos acompañados de imágenes y a lo sumo contenidos
multimedia como pueden ser videos o sonidos

El segundo tipo de páginas se denomina página dinámica. Una página es dinámica cuando se incluye cualquier
efecto especial o funcionalidad y para ello es necesario utilizar otros lenguajes de programación, aparte del
simple HTML.

Mientras que las páginas estáticas todo el mundo se las puede imaginar y no merecen más explicaciones, las
páginas dinámicas son más complejas y versátiles. Para aclarar este concepto, veremos con detalle a
continuación qué son las páginas dinámicas.

En realidad el HTML no es lenguaje de programación sino, más bien, se trata de un lenguaje descriptivo que
tiene como objeto dar formato al texto y las imágenes que pretendemos visualizar en el navegador.

A partir de este lenguaje somos capaces de introducir enlaces, seleccionar el tamaño de las fonts o intercalar
imágenes, todo esto de una manera prefijada y en ningún caso inteligente. En efecto, el HTML no permite el
realizar un simple cálculo matemático o crear una página de la nada a partir de una base de datos. A decir
verdad, el HTML, aunque muy útil a pequeña escala, resulta bastante limitado a la hora de concebir grandes
sitios o portales.

Es esta deficiencia del HTML la que ha hecho necesario el empleo de otros lenguajes accesorios mucho más
versátiles y de un aprendizaje relativamente más complicado, capaces de responder de manera inteligente a las
demandas del navegador y que permiten la automatización de determinadas tareas tediosas e irremediables
como pueden ser las actualizaciones, el tratamiento de pedidos de una tienda virtual...

Supongamos que hemos decidido realizar un portal de televisión donde una de las informaciones principales a
proveer podría ser la programación semanal. Efectivamente, esta información suele ser dada por las televisiones
con meses de antelación y podría ser muy fácilmente almacenada en una base de datos. Si trabajásemos con
páginas HTML, tendríamos que construir una página independiente para cada semana en la cual
introduciríamos "a mano" cada uno de los programas de cada una de las cadenas. Asimismo, cada semana nos
tendríamos que acordar de descolgar la página de la semana pasada y colgar la de la anterior. Todo esto podría
ser fácilmente resuelto mediante páginas dinámicas. En este caso, lo que haríamos sería crear un programa (solo
uno) que se encargaría de recoger de la base de datos de la programación aquellos programas que son
retransmitidos en las fechas que nos interesan y de confeccionar una página donde aparecerían ordenados por
cadena y por hora de retransmisión. De este modo, podemos automatizar un proceso y desentendernos de un
aspecto de la página por unos meses.

Lenguajes del lado servidor o cliente

El navegador es una especie de aplicación capaz de interpretar las órdenes recibidas en forma de código HTML
fundamentalmente y convertirlas en las páginas que son el resultado de dicha orden.

Cuando nosotros pinchamos sobre un enlace hipertexto, en realidad lo que pasa es que establecemos una
petición de un archivo HTML residente en el servidor (un ordenador que se encuentra continuamente conectado
a la red) el cual es enviado e interpretado por nuestro navegador (el cliente).

Así pues, podemos hablar de lenguajes de lado servidor que son aquellos lenguajes que son reconocidos,
ejecutados e interpretados por el propio servidor y que se envían al cliente en un formato comprensible para él.
Por otro lado, los lenguajes de lado cliente (entre los cuales no sólo se encuentra el HTML sino también el Java
y el JavaScript los cuales son simplemente incluidos en el código HTML) son aquellos que pueden ser
directamente "digeridos" por el navegador y no necesitan un pretratamiento.
 

Cada uno de estos tipos tiene por supuesto sus ventajas y sus inconvenientes. Así, por ejemplo, un lenguaje de
lado cliente es totalmente independiente del servidor, lo cual permite que la página pueda ser albergada en
cualquier sitio sin necesidad de pagar más ya que, por regla general, los servidores que aceptan páginas con
scripts de lado servidor son en su mayoría de pago o sus prestaciones son muy limitadas. Inversamente, un
lenguaje de lado servidor es independiente del cliente por lo que es mucho menos rígido respecto al cambio de
un navegador a otro o respecto a las versiones del mismo.

Lenguajes del lado cliente

HTML

El lenguaje llamado HTML indica al navegador donde colocar


cada texto, cada imagen o cada video y la forma que tendrán
estos al ser colocados en la página.

Elel lenguaje consta de etiquetas que tienen esta forma <B> o


<P>. Cada etiqueta significa una cosa, por ejemplo <B> significa
que se escriba en negrita (bold) o <P> significa un párrafo, <A>
es un enlace, etc. Casi todas las etiquetas tienen su
correspondiente etiqueta de cierre, que indica que a partir de ese
punto no debe de afectar la etiqueta. Por ejemplo </B> se utiliza
para indicar que se deje de escribir en negrita. Así que el HTML
no es más que una serie de etiquetas que se utilizan para definir
la forma o estilo que queremos aplicar a nuestro documento.
<B>Esto está en negrita</B>.

Esta página es un claro ejemplo de uso del HTML.


JAVASCRIPT

Javascript es un lenguaje de programación utilizado para crear


pequeños programitas encargados de realizar acciones dentro
del ámbito de una página web. Se trata de un lenguaje de
programación del lado del cliente, porque es el navegador el que
soporta la carga de procesamiento. Su uso se basa
fundamentalmente en la creación de efectos especiales en las
páginas y la definición de interactividades con el usuario.

Las sentencias escritas en javascript se encapsulan entre las


etiquetas <script> y </script>. por ejemplo, si en el código de
una página Web incluimos la sentencia

<script>
window.alert("Bienvenido a mi sitio web. Gracias...")
</script>

al abrir la página con el navegador se nos mostrará una ventana

de bienvenida
APPLETS DE JAVA

Es otra manera de incluir código a ejecutar en los clientes que


visualizan una página web. Se trata de pequeños programas
hechos en Java, que se transfieren con las páginas web y que el
navegador ejecuta en el espacio de la página.

Los applets de Java están programados en Java y


precompilados, es por ello que la manera de trabajar de éstos
varía un poco con respecto a los lenguajes de script como
Javascript. Los applets son más difíciles de programar que los
scripts en Javascript y requerirán unos conocimientos básicos o
medios del lenguaje Java.

La principal ventaja de utilizar applets consiste en que son


mucho menos dependientes del navegador que los scripts en
Javascript, incluso independientes del sistema operativo del
ordenador donde se ejecutan. Además, Java es más potente que
Javascript, por lo que el número de aplicaciones de los applets
podrá ser mayor.

Como desventajas en relación con Javascript cabe señalar que


los applets son más lentos de procesar y que tienen espacio muy
delimitado en la página donde se ejecutan, es decir, no se
mezclan con todos los componentes de la página ni tienen acceso
a ellos. Es por ello que con los applets de Java no podremos
hacer directamente cosas como abrir ventanas secundarias,

controlar Frames, formularios, capas, etc.


VISUAL BASIC SCRIPT

Es un lenguaje de programación de scripts del lado del cliente,


pero sólo compatible con Internet Explorer. Es por ello que su
utilización está desaconsejada a favor de Javascript.

Está basado en Visual Basic, un popular lenguaje para crear


aplicaciones Windows. Tanto su sintaxis como la manera de
trabajar están muy inspirados en él. Sin embargo, no todo lo que
se puede hacer en Visual Basic lo podremos hacer en Visual
Basic Script, pues este último es una versión reducida del
primero.

El modo de funcionamiento de Visual Basic Script para


construir efectos especiales en páginas web es muy similar al
utilizado en Javascript y los recursos a los que se puede acceder
también son los mismos: el navegador.
FLASH

Flash es una tecnología, y un programa, para crear efectos


especiales en páginas web. Con Flash también conseguimos
hacer páginas dinámicas del lado del cliente. Flash en realidad
no es un lenguaje; Sin embargo, si tuvieramos que catalogarlo en
algún sitio quedaría dentro del ámbito de las páginas dinámicas
de cliente.

Para visualizar las "películas" Flash, nuestro navegador debe


tener instalado un programita (plug-in) que le permita
visualizarlas.
CSS

CSS, es una tecnología que nos permite crear páginas web de


una manera más exacta. Gracias a las CSS somos mucho más
dueños de los resultados finales de la página, pudiendo hacer
muchas cosas que no se podía hacer utilizando solamente
HTML, como incluir márgenes, tipos de letra, fondos, colores...
Incluso podemos definir nuestros propios estilos en un archivo
externo a nuestras páginas; así, si en algún momento queremos
cambiar alguno de ellos, automáticamente se nos actualizarán
todas las páginas vinculadas de nuestro sitio.

CSS son las siglas de Cascading Style Sheets, en español Hojas


de estilo en Cascada.

 
Lenguajes del lado servidor

CGI

Es el sistema más antiguo que existe para la programación de las


páginas dinámicas de servidor. Actualmente se encuentra un
poco desfasado por diversas razones entre las que destaca la
dificultad con la que se desarrollan los programas y la pesada
carga que supone para el servidor que los ejecuta.

Los CGI se escriben habitualmente en el lenguaje Perl, sin


embargo, otros lenguajes como C, C++ o Visual Basic pueden
ser también empleados para construirlos.
PERL

Perl es un lenguaje de programación interpretado, al igual que


muchos otros lenguajes de Internet como Javascript o ASP. Esto
quiere decir que el código de los scripts en Perl no se compila
sino que cada vez que se quiere ejecutar se lee el código y se pone
en marcha interpretando lo que hay escrito. Además es
extensible a partir de otros lenguajes, ya que desde Perl
podremos hacer llamadas a subprogramas escritos en otros
lenguajes. También desde otros lenguajes podremos ejecutar
código Perl.
ASP

ASP (Active Server Pages) es la tecnología desarrollada por


Microsoft para la creación de páginas dinámicas del servidor.
ASP se escribe en la misma página web, utilizando el lenguaje
Visual Basic Script o Jscript (Javascript de Microsoft).
PHP

PHP es el acrónimo de HipertextPreprocesor. Es un lenguaje de


programación del lado del servidor gratuito e independiente de
plataforma, rápido, con una gran librería de funciones y mucha
documentación.
JSP

JSP es un acrónimo de Java Server Pages, que en castellano


vendría a decir algo como Páginas de Servidor Java. Es, pues,
una tecnología orientada a crear páginas web con programación
en Java.

Con JSP podemos crear aplicaciones web que se ejecuten en


variados servidores web, de múltiples plataformas, ya que Java
es en esencia un lenguaje multiplataforma. Por tanto, las JSP
podremos escribirlas con nuestro editor HTML/XML habitual.

 
Lenguajes del lado cliente-servidor
DHTML

DHTML no es precisamente un lenguaje de programación. Más


bien se trata de una nueva capacidad de la que disponen los
navegadores modernos, por la cual se puede tener un mayor
control sobre la página que antes.

Cualquier página que responde a las actividades del usuario y


realiza efectos y funcionalidades se puede englobar dentro del
DHTML, pero en este caso nos referimos más a efectos en el
navegador por los cuales se pueden mostrar y ocultar elementos
de la página, se puede modificar su posición, dimensiones, color,
etc.

DHTML nos da más control sobre la página, gracias a que los


navegadores modernos incluyen una nueva estructura para
visualizar en páginas web denominada capa. Las capas se
pueden ocultar, mostrar, desplazar, etc.

Para realizar las acciones sobre la página, como modificar la


apariencia de una capa, seguimos necesitando un lenguaje de
programación del lado del cliente como Javascript o VBScript.

En la actualidad, DHTML también puede englobar la


programación en el servidor.

Dentro del concepto de DHTML se engloban también las Hojas


de Estilo en Cascada o CSS (Cascade Style Sheets), que veremos
a continuación.
XML

XML es una tecnología en realidad muy sencilla que tiene a su


alrededor otras tecnologías que la complementan y la hacen
mucho más grande y con unas posibilidades mucho mayores.

XML, con todas las tecnologías relacionadas, representa una


manera distinta de hacer las cosas, más avanzada, cuya
principal novedad consiste en permitir compartir los datos con
los que se trabaja a todos los niveles, por todas las aplicaciones y
soportes.

XHTML
Saltar a: navegación, búsqueda
Extensible HyperText Markup Language
(XHTML)

Desarrollador
World Wide Web Consortium
Información general
.xhtml, .xht,
Extensión de archivo
.xml, .html, .htm

Tipo de MIME application/xhtml+xml

Tipo de formato Lenguaje de marcado


Extendido de XML y HTML
1.0 (recomendación),
1.1 (recomendación),
1.1 SE (borrador),
Estándar(es)
5 (borrador),

2.0 (borrador)
Formato abierto ?

XHTML, Siglas del inglés eXtensibleHyperTextMarkupLanguage. XHTML es básicamente HTML expresado


como XML válido. Es más estricto a nivel técnico, pero esto permite que posteriormente sea más fácil al hacer
cambios o buscar errores entre otros. En su versión 1.0, XHTML es solamente la versión XML de HTML, por
lo que tiene, básicamente, las mismas funcionalidades, pero cumple las especificaciones, más estrictas, de
XML. Su objetivo es avanzar en el proyecto del World Wide Web Consortium de lograr una web semántica,
donde la información, y la forma de presentarla estén claramente separadas. La versión 1.1 es similar, pero parte
a la especificación en módulos. En sucesivas versiones la W3C planea romper con los tags clásicos traídos de
HTML.

Contenido
 [ocultar] 
 1 Ventajas respecto del HTML
 2 Apéndice
 3 Diferencias entre HTML y XHTML
o 3.1 Reglas para DTDs estrictos
 4 Véase también
 5 Referencias
 6 Enlaces externos

[editar] Ventajas respecto del HTML


Las principales ventajas del XHTML sobre el HTML son:

 Se pueden incorporar elementos de distintos espacios de nombresXML (como MathML y Scalable


Vector Graphics).
 Un navegador no necesita implementar heurísticas para detectar qué quiso poner el autor, por lo que el
parser puede ser mucho más sencillo.
 Como es XML se pueden utilizar fácilmente herramientas creadas para procesamiento de documentos
XML genéricos (editores, XSLT, etc.).

[editar] Apéndice
El estándar XHTML indica en un apéndice informativo una manera de escribir XHTML de modo tal que los
navegadores actuales que sólo entienden HTML, lo procesen como si fuera éste. Para esto se deberá crear un
documento con algunas restricciones y consideraciones, y servirlo con el «content-type» text/html, en vez del
correcto para XHTML.

Algunas de las reglas propuestas para que XHTML «parezca» HTML son:

 No usar instrucciones de proceso.


 Los elementos vacíos (como <br>) deberán escribirse <br />, es decir en forma abreviada y con un
espacio antes de «/».
 No se debe utilizar la forma abreviada para elementos no vacíos que no tengan contenido, es decir: no se
debe escribir <p/>.

Para algunos autores, la inclusión de este apéndice en el estándar fue un error y consideran que es un error usar
XHTML de esta manera.1

[editar] Diferencias entre HTML y XHTML


Artículo principal:Anexo:Etiquetas HTML/XHTML.

La siguiente lista muestra algunas reglas de XHTML 1.0 que lo diferencian de HTML 4.01. Muchas de estas
diferencias vienen con el cambio de ser una aplicación SGML a ser una aplicación del más estricto XML:

 Los elementos vacíos deben cerrarse siempre:


o Incorrecto: <br>
o Correcto: <br></br> o <br/> o <br />
Nota: Cualquiera de las tres formas es válida en XHTML. Para compatibilidad según el
"Apéndice C" debe usarse <br />.
 Los elementos no vacíos también deben cerrarse siempre:
o Incorrecto: <p>Primer párrafo<p>Segundo párrafo
o Correcto: <p>Primer párrafo</p><p>Segundo párrafo</p>
 Los elementos anidados deben tener un correcto orden de apertura/cierre (el que se abre último, debe
cerrarse primero).
o Incorrecto: <em><strong>Texto</em></strong>
o Correcto: <em><strong>Texto</strong></em>
 Los valores de los atributos deben siempre ir encerrados entre comillas (simples o dobles).
o Incorrecto: <tdrowspan=3>
o Correcto: <tdrowspan="3">
o Correcto: <tdrowspan='3'>
 Los nombres de elementos y atributos deben ir en minúsculas.
o Incorrecto: <A HREF="http://www.domname.com">Domname</A>
o Correcto: <a href="http://www.domname.com">Domname</a>
 No está permitida la minimización de atributos (se usa el nombre del atributo como valor).
o Incorrecto: <textareareadonly>Solo-lectura</textarea>
o Correcto: <textareareadonly="readonly">Solo-lectura</textarea>
 Los atributos desaprobados en HTML 4.01 no forman parte de XHTML.
o Incorrecto: <font color="#0000FF">Blue text</font>
o Correcto: <span style="color: #0000FF;">Blue text</span>

[editar] Reglas para DTDs estrictos

 El texto no debe ser insertado directamente en el cuerpo (dentro de la etiqueta body).


o Incorrecto: <body>Texto plano</body>
o Correcto: <body><span>Textoplano</span></body>
 No se deben insertar elementos de bloque dentro de elementos de línea.
o Incorrecto: <em><h2>Título</h2></em>
o Correcto: <h2><em>Título</em></h2>

HTML dinámico
(Redirigido desde DHTML)

Saltar a: navegación, búsqueda

El HTML Dinámico o DHTML (del inglés Dynamic HTML) designa el conjunto de técnicas que permiten
crear sitios web interactivos utilizando una combinación de lenguaje HTML estático, un lenguaje interpretado
en el lado del cliente (como JavaScript), el lenguaje de hojas de estilo en cascada (CSS) y la jerarquía de objetos
de un DOM.

Una página de mi libro HTML Dinámico es cualquier página web en la que los scripts en el lado del cliente
cambian el HTML del documento, después de que éste haya cargado completamente, lo cual afecta a la
apariencia y las funciones de los objetos de la página. La característica dinámica del DHTML, por tanto, es la
forma en que la página interactúa con el usuario cuando la está viendo, siendo la página la misma para todos los
usuarios.
En contraste, el término más general "página web dinámica" lo usamos para referirnos a alguna página
específica que es generada de manera diferente para cada usuario, en cada recarga de la página o por valores
específicos de variables de entorno. Este término no debe ser confundido con DHTML. Estas páginas dinámicas
son el resultado bien de la ejecución de un programa en algún tipo de lenguaje de programación en el servidor
de la página web (como por ejemplo ASP.NET, PHP o Perl), el cual genera la página antes de enviarla al
cliente, o bien de la ejecución en la parte cliente de un código que crea la página completa antes de que el
programa cliente (usualmente, un navegador) la visualice.

En una página DHTML, una vez ésta ha sido cargada completamente por el cliente, se ejecuta un código (como
por ejemplo en lenguaje JavaScript) que tiene efectos en los valores del lenguaje de definición de la
presentación (por ejemplo CSS), logrando así una modificación en la información presentada o el aspecto visual
de la página mientras el usuario la está viendo.

[editar]Usos

Entre los usos más habituales del DHTML están el hacer menús desplegables, imágenes que cambian al pasar el
cursor sobre ellas, objetos en movimiento, botones que permiten desplazar el texto que se está mostrando, textos
explicativos que aparecen al situar el cursor sobre ciertas palabras clave, cronómetros, etc.

Otro uso interesante de esta tecnología es la creación de juegos de acción que utilizan el navegador web para
funcionar, aunque tradicionalmente este tipo de desarrollos han sido complicados debido a las diferencias en el
lenguaje y las características soportadas por los distintos navegadores existentes. Recientemente los
navegadores más populares han empezado a soportar estándares comunes, como el DOM, lo cual ha facilitado
mucho la creación de este tipo de aplicaciones.

Extensible MarkupLanguage
(Redirigido desde XML)

Saltar a: navegación, búsqueda

Extensible MarkupLanguage (XML)

Desarrollador

World Wide Web Consortium


Información general

Extensión de archivo .xml

Tipo de MIME application/xml, text/xml

Tipo de formato Lenguaje de marcado

1.0 (FourthEdition)
Estándar(es)
1.1 (SecondEdition)

Formato abierto ?

XML, siglas en inglés de eXtensibleMarkupLanguage ('lenguaje de marcas extensible'), es un metalenguaje


extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y
adaptación del SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML
es a su vez un lenguaje definido por SGML). Por lo tanto XML no es realmente un lenguaje en particular, sino
una manera de definir lenguajes para diferentes necesidades, de ahí que se le denomine metalenguaje.1 Algunos
de estos lenguajes que usan XML para su definición son XHTML, SVG, MathML.

XML no ha nacido sólo para su aplicación en Internet, sino que se propone como un estándar para el
intercambio de información estructurada entre diferentes plataformas. Se puede usar en bases de datos, editores
de texto, hojas de cálculo y casi cualquier cosa imaginable.

XML es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen mucho más
grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la actualidad ya que
permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil.
Contenido
 [ocultar] 

 1Historia
 2Críticas
 3Ventajas del XML
 4Estructura de un documento XML
o 4.1Documentos XML bien formados y control de errores
o 4.2Partes de un documento XML
 4.2.1Prólogo
 4.2.2Cuerpo
o 4.3Elementos
o 4.4Atributos
o 4.5Entidades predefinidas
o 4.6Secciones CDATA
o 4.7Comentarios
 5Validez
o 5.1DocumentTypeDefinition
 5.1.1Declaraciones tipo elemento
 5.1.2Modelos de contenido
 5.1.3Declaraciones de lista de atributos
 5.1.4Tipos de atributos
 5.1.5Declaración de entidades
 5.1.6Espacios de nombres
o 5.2XML Schemas (XSD)
 5.2.1Ventajas de los Schemas frente a los DTD
 6Herramientas para trabajar con documentos XML
 7Lenguajes creados usando XML
o 7.1Extensible StylesheetLanguage (XSL)
o 7.2Lenguaje de enlace XML (XLINK)
o 7.3Otras tecnologías
 8Véase también
 9Enlaces externos
 10Referencias

[editar]Historia

XML proviene de un lenguaje inventado por IBM en los años setenta, llamado GML
(GeneralizedMarkupLanguage), que surgió por la necesidad que tenía la empresa de almacenar grandes
cantidades de información. Este lenguaje gustó a la ISO, por lo que en 1986 trabajaron para normalizarlo,
creando SGML (Standard GeneralizedMarkupLanguage), capaz de adaptarse a un gran abanico de problemas.
A partir de él se han creado otros sistemas para almacenar información.2

En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML. Este lenguaje se definió en el
marco de SGML y fue de lejos la aplicación más conocida de este estándar. Los navegadores web sin embargo
siempre han puesto pocas exigencias al código HTML que interpretan y así las páginas web son caóticas y no
cumplen con la sintaxis. Estas páginas web dependen fuertemente de una forma específica de lidiar con los
errores y las ambigüedades, lo que hace a las páginas más frágiles y a los navegadores más complejos.
Otra limitación del HTML es que cada documento pertenece a un vocabulario fijo, establecido por el DTD. No
se pueden combinar elementos de diferentes vocabularios. Asimismo es imposible para un intérprete (por
ejemplo un navegador) analizar el documento sin tener conocimiento de su gramática (del DTD). Por ejemplo,
el navegador sabe que antes de una etiqueta <div> debe haberse cerrado cualquier <p> previamente abierto. Los
navegadores resolvieron esto incluyendo lógica ad hoc para el HTML, en vez de incluir un analizador genérico.
Ambas opciones, de todos modos, son muy complejas para los navegadores.

Se buscó entonces definir un subconjunto del SGML que permita:

 Mezclar elementos de diferentes lenguajes. Es decir que los lenguajes sean extensibles.
 La creación de analizadores simples, sin ninguna lógica especial para cada lenguaje.
 Empezar de cero y hacer hincapié en que no se acepte nunca un documento con errores de sintaxis.

Para hacer esto XML deja de lado muchas características de SGML que estaban pensadas para facilitar la
escritura manual de documentos. XML en cambio está orientado a hacer las cosas más sencillas para los
programas automáticos que necesiten interpretar el documento.

[editar]Críticas

XML y sus extensiones han sido regularmente criticadas por su nivel de detalle y complejidad.3 El mapeo del
modelo de árbol básico de XML hacia los sistema de tipos de lenguajes de programación o bases de datos puede
ser difícil, especialmente cuando se utiliza XML para el intercambio de datos altamente estructurados entre
aplicaciones, lo que no era su objetivo primario de diseño. Otras críticas intentan refutar la afirmación de que
XML es una lenguaje autodescriptivo4 (aunque la especificación XML no hace ninguna afirmación de este tipo).
Se propone a JSON y YAML frecuentemente como alternativas, centrándose ambas en la representación de
datos estructurados, en lugar de en documentos narrativos .

[editar]Ventajas del XML

 Es extensible: Después de diseñado y puesto en producción, es posible extender XML con la adición de nuevas
etiquetas, de modo que se pueda continuar utilizando sin complicación alguna.
 El analizador es un componente estándar, no es necesario crear un analizador específico para cada versión de
lenguaje XML. Esto posibilita el empleo de cualquiera de los analizadores disponibles. De esta manera se evitan
bugs y se acelera el desarrollo de aplicaciones.
 Si un tercero decide usar un documento creado en XML, es sencillo entender su estructura y procesarla. Mejora
la compatibilidad entre aplicaciones. Podemos comunicar aplicaciones de distintas plataformas, sin que importe
el origen de los datos, es decir, podríamos tener una aplicación en Linux con una base de datos Postgres y
comunicarla con otra aplicación en Windows y Base de Datos MS-SQL Server.
 Transformamos datos en información, pues se le añade un significado concreto y los asociamos a un contexto,
con lo cual tenemos flexibilidad para estructurar documentos.

[editar]Estructura de un documento XML

La tecnología XML busca dar solución al problema de expresar información estructurada de la manera más
abstracta y reutilizable posible. Que la información sea estructurada quiere decir que se compone de partes bien
definidas, y que esas partes se componen a su vez de otras partes. Entonces se tiene un árbol de trozos de
información. Ejemplos son un tema musical, que se compone de compases, que están formados a su vez por
notas. Estas partes se llaman elementos, y se las señala mediante etiquetas.
Una etiqueta consiste en una marca hecha en el documento, que señala una porción de éste como un elemento.
Un pedazo de información con un sentido claro y definido. Las etiquetas tienen la forma <nombre>, donde
nombre es el nombre del elemento que se está señalando.

A continuación se muestra un ejemplo para entender la estructura de un documento XML:

<?xmlversion="1.0"encoding="UTF-8"?>
<!DOCTYPE Edit_Mensaje SYSTEM "Edit_Mensaje.dtd">

<Edit_Mensaje>
<Mensaje>
<Remitente>
<Nombre>Nombre del remitente</Nombre>
<Mail> Correo del remitente </Mail>
</Remitente>
<Destinatario>
<Nombre>Nombre del destinatario</Nombre>
<Mail>Correo del destinatario</Mail>
</Destinatario>
<Texto>
<Asunto>
Este es mi documento con una estructura muy sencilla
no contiene atributos ni entidades...
</Asunto>
<Parrafo>
Este es mi documento con una estructura muy sencilla
no contiene atributos ni entidades...
</Parrafo>
</Texto>
</Mensaje>
</Edit_Mensaje>

Aquí está el ejemplo de código del DTD del documento «Edit_Mensaje.dtd»:

<?xmlversion="1.0"encoding="ISO-8859-1"?>
<!-- Este es el DTD de Edit_Mensaje -->

<!ELEMENT Mensaje (Remitente, Destinatario, Texto)*>


<!ELEMENT Remitente (Nombre, Mail)>
<!ELEMENT Nombre (#PCDATA)>
<!ELEMENT Mail (#PCDATA)>
<!ELEMENT Destinatario (Nombre, Mail)>
<!ELEMENT Nombre (#PCDATA)>
<!ELEMENT Mail (#PCDATA)>
<!ELEMENT Texto (Asunto, Parrafo)>
<!ELEMENT Asunto (#PCDATA)>
<!ELEMENT Parrafo(#PCDATA)>

[editar]Documentos XML bien formados y control de errores

Los documentos denominados como «bien formados» (del inglés wellformed) son aquellos que cumplen con
todas las definiciones básicas de formato y pueden, por lo tanto, analizarse correctamente por cualquier
analizador sintáctico (parser) que cumpla con la norma. Se separa esto del concepto de validez que se explica
más adelante.

 Los documentos han de seguir una estructura estrictamente jerárquica con lo que respecta a las etiquetas que
delimitan sus elementos. Una etiqueta debe estar correctamente incluida en otra, es decir, las etiquetas deben
estar correctamente anidadas. Los elementos con contenido deben estar correctamente cerrados.
 Los documentos XML sólo permiten un elemento raíz del que todos los demás sean parte, es decir, solo pueden
tener un elemento inicial.
 Los valores atributos en XML siempre deben estar encerrados entre comillas simples o dobles.
 El XML es sensible a mayúsculas y minúsculas. Existe un conjunto de caracteres llamados espacios en blanco
(espacios, tabuladores, retornos de carro, saltos de línea) que los procesadores XML tratan de forma diferente
en el marcado XML.
 Es necesario asignar nombres a las estructuras, tipos de elementos, entidades, elementos particulares, etc. En
XML los nombres tienen alguna característica en común.
 Las construcciones como etiquetas, referencias de entidad y declaraciones se denominan marcas; son partes del
documento que el procesador XML espera entender. El resto del documento entre marcas son los datos
«entendibles» por las personas.

[editar]Partes de un documento XML

Un documento XML está formado por el prólogo y por el cuerpo del documento así como texto de etiquetas que
contiene una gran variedad de efectos positivos o negativos en la referencia opcional a la que se refiere el
documento, hay que tener mucho cuidado de esa parte de la gramática léxica para que se componga de manera
uniforme.

[editar]Prólogo

Aunque no es obligatorio, los documentos XML pueden empezar con unas líneas que describen la versión
XML, el tipo de documento y otras cosas.

El prólogo de un documento XML contiene:

 Una declaración XML. Es la sentencia que declara al documento como un documento XML.
 Una declaración de tipo de documento. Enlaza el documento con su DTD (definición de tipo de documento), o el
DTD puede estar incluido en la propia declaración o ambas cosas al mismo tiempo.
 Uno o más comentarios e instrucciones de procesamiento.

[editar]Cuerpo

A diferencia del prólogo, el cuerpo no es opcional en un documento XML, el cuerpo debe contener solo un
elemento raíz, característica indispensable también para que el documento esté bien formado. Sin embargo es
necesaria la adquisición de datos para su buen funcionamiento.

[editar]Elementos

Los elementos XML pueden tener contenido (más elementos, caracteres o ambos), o bien ser elementos vacíos.

[editar]Atributos

Los elementos pueden tener atributos, que son una manera de incorporar características o propiedades a los
elementos de un documento. Deben ir entre comillas.

Por ejemplo, un elemento «estudiante» puede tener un atributo «Mario» y un atributo «tipo», con valores «come
croquetas» y «taleno» respectivamente.

<Estudiante Mario="come croquetas" tipo="taleno">Esto es un día que Mario va paseando…</Estudiante>


[editar]Entidades predefinidas

Entidades para representar caracteres especiales para que, de esta forma, no sean interpretados como marcado
en el procesador XML.

Ejemplo: entidad predefinida: & carácter: &.

[editar]Secciones CDATA
Artículo principal:Anexo:Etiquetas HTML/XHTML.

Es una construcción en XML para especificar datos utilizando cualquier carácter sin que se interprete como
marcado XML. No confundir con 2(#PCDATA) que es para los elementos. Permite que caracteres especiales no
rompan la estructura. Ejemplo:

<![CDATA[ contenido especial: áéíóúñ&]] >

[editar]Comentarios

Comentarios a modo informativo para el programador que han de ser ignorados por el procesador. Los
comentarios en XML tienen el siguiente formato:

<!--- Esto es un comentario --->


<!-- Otro comentario -->

[editar]Validez

Que un documento esté «bien formado» solamente se refiere a su estructura sintáctica básica, es decir, que se
componga de elementos, atributos y comentarios como XML especifica que se escriban. Ahora bien, cada
aplicación de XML, es decir, cada lenguaje definido con esta tecnología, necesitará especificar cuál es
exactamente la relación que debe verificarse entre los distintos elementos presentes en el documento.

Esta relación entre elementos se especifica en un documento externo o definición (expresada como DTD —
DocumentTypeDefinition, 'Definición de Tipo de Documento'— o como XSchema). Crear una definición
equivale a crear un nuevo lenguaje de marcado, para una aplicación específica.

[editar]DocumentTypeDefinition

La DocumentTypeDefinition o DTD (en español "definición de tipo de documento") define los tipos de
elementos, atributos y entidades permitidas, y puede expresar algunas limitaciones para combinarlos. Los
documentos XML que se ajustan a su DTD son denominados válidos.

[editar]Declaraciones tipo elemento

Los elementos deben ajustarse a un tipo de documento declarado en una DTD para que el documento sea
considerado como válido.

[editar]Modelos de contenido

Un modelo de contenido es un patrón que establece los subelementos aceptados, y el orden en que se aceptan.
[editar]Declaraciones de lista de atributos

Los atributos se usan para añadir información adicional a los elementos de un documento.

[editar]Tipos de atributos

 Atributos CDATA y NMTOKEN


 Atributos enumerados y notaciones
 Atributos ID e IDREF

[editar]Declaración de entidades

XML hace referencia a objetos que no deben ser analizados sintácticamente según las reglas XML, mediante el
uso de entidades. Las entidades pueden ser:

 Internas o externas
 Analizadas o no analizadas
 Generales o parametrizadas

[editar]Espacios de nombres

Los espacios de nombres XML permiten separar semánticamente los elementos que forman un documento
XML.

[editar]XML Schemas (XSD)

Un Schema es algo similar a un DTD. Define qué elementos puede contener un documento XML, cómo están
organizados y qué atributos y de qué tipo pueden tener sus elementos.

[editar]Ventajas de los Schemas frente a los DTD

 Usan sintaxis de XML, al contrario que los DTD.


 Permiten especificar los tipos de datos.
 Son extensibles.

[editar]Herramientas para trabajar con documentos XML

De hecho cualquier procesador de texto, que sea capaz de producir archivos .txt es capaz de generar XML,
aunque en los entornos de desarrollo como Eclipse o Visual Studio, se facilita, ya que reconoce los formatos y
ayuda a generar un XML bien formado.

[editar]Lenguajes creados usando XML


[editar]Extensible StylesheetLanguage (XSL)

El Lenguaje de Hoja de Estilo Extensible (eXtensibleStylesheetLanguage, XSL) es una familia de lenguajes que
permiten describir como los archivos codificados en xml serán formateados (para mostrarlos) o transformados.
Hay tres lenguajes en esta familia: XSL Transformations (XSLT), XSL FormattingObjects (XSL-FO)y XML
PathLanguage.
[editar]Lenguaje de enlace XML (XLINK)

XLink es una aplicación XML que intenta superar las limitaciones que tienen los enlaces de hipertexto en
HTML. XLink 1.1 es ya una recomendación W3C.

[editar]Otras tecnologías

 Hojas de estilo
o XSL-FO
o XSLT
o XLink
o XPointer
o XSL
o hojas de estilo en cascada (CSS)
o XLT (XML representation of Lexicons and Terminologies)
 Programación
o JDOM
o SAX
o STAX
o VTD-XML
 Consulta de datos
o XQuery
o Xpath
 Seguridad
o Xades (XML Advanced Electronic Signatures)

Hay quien opina que XML es demasiado pesado para algunas aplicaciones y difícil de editar con un editor de
texto simple. Por ello merece la pena mencionar algunas alternativas más ligeras y simples. Los lenguajes de
marcas ligeros:

 Simple Outline XML: es un XML simplificado que se puede convertir sin problemas en XML completo.
 YAML y OGDL. Estos dos son ficheros de solo texto que no están emparentados con XML como el SOX, antes
comentado.
 BBCode. Éste tiene un uso muy restringido para dar formato nada más.

También hay por lo menos un lenguaje basado en XML en formato binario, llamado EBML.