Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LENGUAJE DE
MARCADO
2.1. INTRODUCCIÓN AL
LENGUAJE DE MARCADO
El lenguaje de marcado
Separa un texto en los elementos de los que se compone, como por ejemplo un
párrafo, un capítulo, un encabezamiento, etc.
• Un lenguaje de marcado o de marcas
se basa en instrucciones “WEB”, es
decir, etiquetas de programación que
podemos estructurar de manera
manual o automática mediante
programas de diseño como Adobe
Dreamweaver, Adobe Muse, Web
Evolution x6, etc
Existen 3 utilizaciones básicas de los lenguajes de
marcas:
La opción clásica y en Recuperación de Información es optar por los términos sencillos (palabras)
obtenidos directamente de los documentos. Este enfoque recibe el nombre de Bag of Words (literalmente
Bolsa de Palabras) y considera las palabras sencillas directamente como términos de indización,
asumiendo la correspondencia entre los términos y los conceptos que estos representan.
MODELADO DE OBJETO DE DOCUMENTO
Lenguajes de Marcado
Tipos de Datos básicos
Este tema describe los tipos básicos de datos que pueden
aparecer como contenido de un elemento o valor de un atributo:
• Mayúsculas o minúsculas
En la definición de cada atributo se incluye información sobre la importancia que tiene para sus valores
la distinción entre mayúsculas y minúsculas.
CS
El valor distingue entre mayúsculas y minúsculas (es decir, los agentes de usuario interpretan "a" y "A" de manera
diferente).
CI
El valor no distingue entre mayúsculas y minúsculas (es decir, los agentes de usuario interpretan "a" igual que "A").
CN
No puede haber diferencias entre mayúsculas y minúsculas, p.ej., porque es un número o un carácter del conjunto de
caracteres del documento.
CA
La definición del elemento o atributo ya da la información sobre la distinción entre mayúsculas y minúsculas.
CT
Consultar la definición del tipo para detalles sobre la distinción entre mayúsculas y minúsculas.
Tipos de Datos básicos
• Cadenas de Texto: Ciertos atributos toman por valor un texto que
se supone debe ser "legible por humanos".
• URL’s: En general los URIs hacen distinción entre mayúsculas y
minúsculas. Puede haber URIs, o partes de URIs, donde la
diferencia no importe (p.ej., nombres de máquinas), pero la
identificación de éstas puede no ser fácil. Los usuarios deberían
considerar que en los URIs se distingue siempre entre mayúsculas
y minúsculas (para quedarse del lado de la seguridad).
Tipos de Datos básicos
• Colores: El tipo de valor de atributo "color" se refiere a las
definiciones de colores según se especifican en [SRGB] (Un espacio
estándar de colores por defecto para Internet). Un valor de color
puede ser o bien un número hexadecimal (anteponiendo un signo
"#") o uno de los siguientes dieciséis nombres de colores.
Tipos de Datos básicos
• Longitudes:
Píxeles (Pixels): El valor %pixel es un entero que representa un número de píxeles del lienzo
(papel, pantalla). Así, el valor "50" significa cincuenta píxeles.
Longitud (Length): El valor %lenght puede ser o bien un %Pixel; o bien un porcentaje del
espacio horizontal o vertical disponible. Así, el valor "50%" significa la mitad del espacio
disponible.
donde:
AAAA = año con cuatro dígitos
MM = mes con dos dígitos (01=enero, etc.)
DD = día del mes con dos dígitos (de 01 a 31)
hh = hora con dos dígitos (de 00 a 23) (NO se permite am/pm)
mm = minuto con dos dígitos (00 a 59)
ss = segundo con dos dígitos (00 a 59) DZH = designador de zona
horaria
Tipos de Datos básicos
• Tipos de Vínculos: Los autores pueden usar los siguientes tipos de
vínculos reconocidos, enumerados aquí junto con sus
interpretaciones convencionales. Los agentes de usuario, los
motores de búsqueda, etc. pueden interpretar estos tipos de
vínculos de diferentes maneras.
Tipos de Datos básicos
Alternate
Designa una versión alternativa del documento en que aparece el vínculo. Cuando se usa con el atributo hreflang, implica que hay una versión traducida del documento. Cuando se usa conjuntamente con el
atributo media, implica que hay una versión diseñada para un medio (o medios) diferentes.
Stylesheet
Se refiere a una hoja de estilo externa. Véase la sección sobre hojas de estilo externas para más detalles. Se usa junto al tipo de vínculo "Alternate" para ofrecer hojas de estilo alternativas seleccionables por el
usuario.
Start
Se refiere al primer documento de un conjunto de documentos. Este tipo de vínculo dice a los motores de búsqueda qué documento es considerado por el autor como el punto de inicio de un conjunto.
Next
Se refiere al siguiente documento en una secuencia lineal de documentos. Los agentes de usuario pueden optar por precargar el documento marcado como "next", para reducir el tiempo de carga aparente.
Prev
Se refiere al documento anterior en una serie ordenada de documentos. Algunos agentes de usuario también soportan el sinónimo "Previous".
Contents
Se refiere a un documento que sirve como tabla de contenidos. Algunos agentes de usuario también soportan el sinónimo ToC (de "Table of Contents").
Index
Se refiere a un documento que proporciona un índice para el documento actual.
Glossary
Se refiere a un documento que proporciona un glosario de términos que pertenecen al documento actual.
Copyright
Se refiere al aviso de copyright del documento actual.
Chapter
Se refiere a un documento que actúa como capítulo en una colección de documentos.
Section
Se refiere a un documento que actúa como sección en una colección de documentos.
Subsection
Se refiere a un documento que actúa como subsección en una colección de documentos.
Appendix
Se refiere a un documento que actúa como apéndice en una colección de documentos.
Help
Se refiere a un documento que ofrece ayuda (más información, vínculos a otros recursos informativos, etc.)
Bookmark
Se refiere a una señal de lectura. Una señal de lectura (bookmark) es un vínculo a un punto de entrada importante dentro de un documento extenso. Se puede utilizar el atributo title, por ejemplo, para dar un rótulo
a la señal de lectura. Obsérvese que pueden definirse varias señales de lectura en cada documento.
Tipos de Datos básicos
• Descriptores de Medios: La siguiente es una lista de
los descriptores de medios reconocidos:
screen
Para pantallas no paginadas de computadora.
tty
Para medios que utilicen una cuadrícula de caracteres de ancho fijo, como teletipos, terminales y dispositivos portátiles con posibilidades limitadas de representación.
tv
Para dispositivos tipo televisión (baja resolución, en color, desplazamiento limitado).
projection
Para proyectores.
handheld
Para dispositivos de mano (pantalla pequeña, monocromos, gráficos por mapas de bits, ancho de banda limitado).
print
Para material paginado, opaco, y para documentos que se ven en una pantalla en modo de presentación preliminar a la impresión.
braille
Para dispositivos táctiles braille.
aural
Para sintetizadores de voz.
all
Apropiado para todos los dispositivos.
Tipos de Datos básicos
• Datos de Scripts: Los datos de scripts pueden aparecer como contenido del elemento SCRIPT y como valor
de los atributos de eventos intrínsecos. Los agentes de usuario no deben evaluar los datos de script como
código HTML, sino que deben pasarlos tal y como están como datos para un motor de scripts. La
importancia de la distinción entre mayúsculas y minúsculas en los datos de scripts depende del lenguaje de
programación del script.
• Datos de hojas de Estilo: Los datos de hojas de estilo pueden aparecer como contenido de un
elemento STYLE y como valor de un atributo style . Los agentes de usuario no deben evaluar los datos de
estilo como código HTML. La importancia de la distinción entre mayúsculas y minúsculas en los datos de
estilo depende del lenguaje de la hoja de estilo.
• Nombres de Marcos de Destino: Excepto los nombres reservados enumerados a
continuación, los nombres de marcos destino deben empezar con un carácter alfabético (a-z A-Z). Los
agentes de usuario deberían ignorar otros nombres de destino.
_blank
El agente de usuario debería cargar el documento designado en una ventana nueva y sin nombre.
_self
El agente de usuario debería cargar el documento en el mismo marco que el elemento que hace referencia a
este destino.
_parent
El agente de usuario debería cargar el documento en el FRAMESET padre inmediato del marco actual. Este
valor es equivalente a _self si el marco actual no tiene padre.
_top
El agente de usuario debería cargar el documento en la ventana original completa (cancelando así todos los
demás marcos). Este valor es equivalente a _self si el marco actual no tiene padre.
2.4 Estructura global de un
documento.
El HTML es uno de los primeros lenguajes de marcas que surgieron.
Este lenguaje servirá como base para explicar la estructura general
de los lenguajes de marcado.
2.4 Estructura global de un documento.
• La mayoría de los efectos se especifican de la misma forma:
rodeando el texto que se quiere marcar entre dos etiquetas o
directivas (tags, en inglés).
2.4 Estructura global de un documento.
• Los tags pueden tener uno ó más atributos.
Para un documento completo podría usar las fuentes de google con un línea en el head como está:
Es la piedra angular de HTML, este tag se utiliza para crear hipervínculos: el texto en cual podemos
hacer clic en un navegador para ir a otra página web. La sintaxis es la siguiente:
href
Este atributo específica la localización de un recurso de la Web, definiendo así un vínculo entre el elemento actual (el
origen del vínculo) y el destino del vínculo definido por este atributo. El destino de un vinculo puede ser: una página web
interna o externa, o un título, imagen, parrafo dentro de la misma página con el vinculo de origen (enlaces internos)
target
Destino del hiperenlace
self: Abrir el enlace en la misma ventana que se encuentra el documento actual (valor por defecto). En el caso que existe
un iframe, la ventana se abrirá en el mismo marco
blank: independientemente de si el enlace esta o no dentro de un iframe, el valor '_blank' creará una ventana nueva
Listas
Listas desordenadas
Están englobadas por las etiquetas <ul>...</ul> (unordered list). Cada uno de los elementos de la lista
comenzará con una etiqueta <li>.
•Café
<ul> <li>Café</li> <li>Leche</li> <li>Té</li> </ul> •Leche
•Té
Esto hará que tu página sea compatible, dado que algunos navegadores tienen problemas al mostrar
celdas vacías.
Estado del tiempo
Usando enlaces a otra página para obtener el pronostico del tiempo de nuestra ciudad.
La línea cinco es una llamada a una hoja de estilo.
Observe que las líneas 1,2,3 y 12hacen referencia a la misma cadena. No cambie un solo carácter
de está cadena o su página dejara de funcionar.
iframes
Un iframe es un marco flotante que puede estar colocado en cualquier parte de la página. Las
propiedades de un iframe son:
<nav>: Dentro de nav pondremos siempre las ligas más importantes del sitio.
<aside> Representa una sección de una página que consiste en contenido que está
tangencialmente relacionado con el contenido que le rodea, que podría ser considerado
independiente de ese contenido.
<section> se usa para representar un bloque de nuestra página que tiene valor semántico, es decir,
que aporta un significado a la página. Realmente si tenemos que clasificar por la importancia del
significado, el ranking sería: article sería la etiqueta que contiene la información más relevante,
section la que contiene información menos relevante, y div que contiene información que no aporta
significado ninguno.
Un aspecto importante de la etiqueta section es que debe tener un título. La etiqueta section crea
una sección de manera explícita en el outline del documento, por lo tanto debemos siempre
asignarle un encabezado (h1-h6) ya que si no se le aplicará directamente untitle.
Por lo tanto, una buena forma de identificar cuando es necesario usar una etiqueta section es
cuando tengamos la necesidad de aplicar un encabezado.
Los datos del autor de un elemento <article> pueden ser proporcionados a través del
elemento <address>, pero no se aplica a los elementos <article>anidados.
<address>. Es el elemento encargado de contener la información de contacto con los autores del
documento.
tributo descripción valor por omisión
title Texto informativo o título del elemento. Texto legible. Sensible a M/m.. Lo fija el navegador.
Suele mostrarse a modo de 'tool tip'.
class Asigna nombres de clases al elemento. Por Lista de clases separadas por espacio en Lo fija el navegador.
defecto, clases CSS. blanco. Sensible a M/m. cdata
lang Información sobre el idioma del contenido Un código de idioma. Lo fija el navegador. PD.: "desconocido".
del elemento y del valor de sus atributos.
dir Indica la dirección de texto y tablas. Uno de los siguientes: 'ltr' o 'rtl'. Lo fija el navegador. PD.: En castellano 'ltr'.
Eventos: onclick, ondblclick, onmousedown, onmouseup, onmouseover, onmousemove, onmouseout, onkeypress, onkeydown, onkeyup.
<footer>: dentro de footer generalmente se ponen cosas como otras ligas, derechos de autor etc,
pero no es exclusivo, podemos usarlos para desplegar lo que necesitemos, siempre y cuando este
en el 'pie' de la pagina.
2.7 Formularios
Los formularios son una característica del estándar HTML que permite a los autores llevar datos del
exterior al interior de nuestro sistema. Esto se logra mediante componentes que transportan diversos
tipos de datos para múltiples aplicaciones donde tu imaginación es el límite
Los formularios están delimitados con la etiqueta <form> ... </form>, que permite reunir varios
elementos de formulario, como botones y casillas de texto y que debe poseer los siguientes
atributos:
method indica cómo se enviarán las respuestas "post" es el valor que envía los datos al agente de
procesamiento almacenándolos en el cuerpo del formulario, en tanto que "get" envía los datos
agregándolos a la dirección URL y separándolos de la dirección con un signo de interrogación.
action indica la dirección a la que se enviará la información (una url o dirección de correo
electrónico: mailto:dirección_de_correo@equipo)
target nos permite mostrar el resultado en la ventana deseada:
target = '_blank' Fuerza que el documento referenciado por el enlace sea mostrado en una
nueva ventana del navegador.
target = '_self' El documento referenciado se mostrara en la misma ventana
Se puede insertar cualquier elemento HTML en una etiqueta form (como botones,
hipervínculos, tablas y texto), pero los elementos interactivos son los más interesantes. Estos
elementos interactivos son:
•La etiqueta input: Todos los botones y casillas de texto
•La etiqueta textarea: una casilla de texto
•La etiqueta select: una lista de opciones múltiples
Opción
Reset
Send 1
Opción 2
Opción 3
Ejemplo de un formulario:
Fieldset
La etiqueta “fieldset” se usa en formularios para agrupar campos relacionados entre sí.
La sintaxis es:
<fieldset>Ejemplo<fieldset>
El efecto que conseguimos gracias a la etiquetas fieldset es un rectángulo enmarcando el texto que
esté incluido dentro de él.
Ejemplo: Observe que fieldset se ensanchará al 100% de la página. Modificar las caraterísticas de
este elemento es tema de CSS.
Legend
La sintaxis es:
<fieldset><legend>Leyenda</legend>Ejemplo<fieldset>
Label
Observe que en la línea 2 el código action='#' indica que los datos del formulario serán enviados a la
página que lo envia
En html5 se introduce el atributo placeholder cuyo valor es un mensaje para que el usuario sepa
que información debe introducir (Líneas 7 y 12).
Envío de datos
Cuando se envía un formulario (haciendo clic en el botón de envío), los datos del formulario se
envían a un script CGI bajo la forma de pares nombre/valor, es decir conjuntos de datos
representados por el nombre del elemento formulario, un signo igual ('=') y luego el valor asociado.
Estos pares nombre/valor se separan unos de otros mediante el símbolo de unión ('&'). Por lo tanto,
los datos que se envían al script se verán así:
Con el método get (enviar los datos mediante una dirección URL), la URL será una cadena como la
siguiente: