Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Por el 1989 Tim Berners-Lee se dedicaba a encontrar una solucin efectiva al problema de la proliferacin y la
heterogeneidad de la informacin disponible en la Red. Integrando servicios ya existentes en Internet (como el
muy utilizado Gopher por esa poca) Berners-Lee desarroll la arquitectura bsica de lo que actualmente es la
Web. El mismo Berners-Lee la describa de la siguiente manera: "La WWW es una forma de ver toda la
informacin disponible en Internet como un continuo, sin rupturas.Utilizando saltos hipertextuales y
bsquedas, el usuario navega a travs de un mundo de informacin parcialmente creado a mano,
parcialmente generado por computadoras de las bases de datos existentes y de los sistemas de informacin ".
Web o la web, la red o www de World Wide Web, es bsicamente un medio de comunicacin de texto,
grficos y otros objetos multimedia a travs de Internet como mecanismo de transporte.
En el 1993 se desarrollo el primero cliente grfico para la WWW, Mosaic
CARACTERSTICAS GENERALES DE UN
SERVICIO WEB.
COMPONENTES Y FUNCIONAMIENTO.
El Servidor web se ejecuta en un ordenador mantenindose a la espera de peticiones por parte de un cliente
(un navegador web) y que responde a estas peticiones adecuadamente, mediante una pgina web que se
exhibir en el navegador o mostrando el respectivo mensaje si se detect algn error.
A modo de ejemplo, al teclear www.wikipedia.org en nuestro navegador, ste realiza una peticin HTTP al
servidor de dicha direccin. El servidor responde al cliente enviando el cdigo HTML de la pgina; el cliente,
una vez recibido el cdigo, lo interpreta y lo exhibe en pantalla.
Como vemos con este ejemplo, el cliente es el encargado de interpretar el cdigo HTML, es decir, de mostrar
las fuentes, los colores y la disposicin de los textos y objetos de la pgina; el servidor tan slo se limita a
transferir el cdigo de la pgina sin llevar a cabo ninguna interpretacin de la misma.
Web Services (WS) ofrece una un significado estndar para interoperar entre diferentes aplicaciones
de software corriendo en diferentes plataformas y/o marcos de trabajo. El W3C pretende disear la
arquitectura, definirla y crear el ncleo de tecnologas que hagan posible los Servicios Web. Esta arquitectura
se basa en los siguientes componentes:
Disear un marco de mensajera:
Web Services Description Language (WSDL): Lenguaje de Descripcin de los Servicios Web. lenguaje
bsico que puede usarse para describir servicios Web basados en el modelo que ofrece el servicio en
cuestin
Aunque se acostumbra llamar URLs a todas las direcciones Web, URI es un identificador ms completo. Un URI
(Uniform Resource Identifier) se diferencia de un URL en que permite incluir en la direccin una subdireccin,
determinada por el fragmento. Esto se comprende mejor analizando la estructura de un URI.
URI: El Identificador Universal de Recursos es la forma de encapsular un nombre en un espacio de
nombres ya registrados, etiquetndolo dentro de ste.
URL: Los Localizadores Uniformes de Recursos. Se trata de la codificacin del algoritmo de acceso, es
decir, es la direccin que se le asigna al recurso para ser localizado.
URN: El objeto principal de los Nombres Uniformes de Recursos es etiquetar de forma persistente un
recurso con un identificador,
3. Protocolo HTTP.
El Protocolo de Transferencia de HiperTexto (Hypertext Transfer Protocol) es un protocolo cliente servidor que
articula los intercambios de informacin entre los clientes Web y los servidores HTTP. La especificacin
completa del protocolo HTTP 1/0 est recogida en el RFC 1945. Fue propuesto por Tim Berners-Lee
Desde el punto de vista de las comunicaciones, est soportado sobre los servicios de conexin TCP/IP.
Un proceso servidor escucha en un puerto de comunicaciones TCP (por defecto, el 80), y espera las solicitudes
de conexin de los clientes Web. Una vez que se establece la conexin, el protocolo TCP se encarga de
mantener la comunicacin y garantizar un intercambio de datos libre de errores.
HTTP se basa en sencillas operaciones de solicitud/respuesta. Un cliente establece una conexin con un
servidor y enva un mensaje con los datos de la solicitud. El servidor responde con un mensaje similar, que
contiene el estado de la operacin y su posible resultado
Funcionamiento bsico
Cada vez que un cliente realiza una peticin a un servidor, se ejecutan los siguientes pasos:
1. Un usuario accede a una URL,
2. El cliente Web descodifica la URL, separando sus diferentes partes. As identifica el protocolo de acceso, la
direccin DNS o IP del servidor, el posible puerto opcional (el valor por defecto es 80) y el objeto requerido del
servidor.
3. Se abre una conexin TCP/IP con el servidor, llamando al puerto TCP correspondiente. Se realiza la peticin.
Para ello, se enva el comando necesario (GET, POST, HEAD,), la direccin del objeto requerido(URN), la
versin del protocolo HTTP empleada (casi siempre HTTP/1.0) y un conjunto variable de informacin, que
incluye datos sobre las capacidades del browser, datos opcionales para el servidor,
4. El servidor devuelve la respuesta al cliente. Consiste en un cdigo de estado y el tipo de dato MIME de la
informacin de retorno, seguido de la propia informacin.
5. Se cierra la conexin TCP.
- Mensajes HTTP.
En una comunicacin HTTP slo existen dos tipos de mensajes, los de peticin (request) y los de respuesta
(reply).
Solicitud HTTP
Una solicitud HTTP es un conjunto de lneas que el navegador enva al servidor. Incluye:
Una lnea de solicitud: es una lnea que especifica el tipo de documento solicitado, el mtodo que se
aplicar y la versin del protocolo utilizada.
Los campos del encabezado de solicitud: es un conjunto de lneas opcionales que permiten aportar
informacin adicional sobre la solicitud y/o el cliente (navegador, sistema operativo, etc
El cuerpo de la solicitud: es un conjunto de lneas opcionales que, por ejemplo, permiten que se
enven datos por un comando POST durante la transmisin de datos al servidor utilizando un formulario.
Respuesta HTTP
Una respuesta HTTP es un conjunto de lneas que el servidor enva al navegador. Est constituida por: Incluye:
Una lnea de estado: es una lnea que especifica la versin del protocolo utilizada y el estado de la
solicitud en proceso mediante un texto explicativo y un cdigo.
Los campos del encabezado de respuesta: es un conjunto de lneas opcionales que permiten aportar
informacin adicional sobre la respuesta y/o el servidor
El cuerpo de la respuesta: contiene el documento solicitado.
- Cabeceras.
Las Cabeceras HTTP o Metatags, son los parmetros que se envan en una peticin o respuesta HTTP al cliente
o al servidor para proporcionar informacin esencial sobre la transaccin en curso.
Estas cabeceras proporcionan informacin mediante la sintaxis 'Cabecera: Valor' y son enviadas
automticamente por el navegador o el servidor Web.
Connection (conexin): Permite especificar diferentes opciones para la conexin. Por ejemplo:
Connection: close
Content-Language (idioma del contenido) Esta cabecera indica el idioma de los destinatarios del recurso
Content-Length (longitud del contenido) Indica la longitud del cuerpo del recurso, expresada en nmero de
octetos.
Content-Location (localizacin del contenido) Direccin complementaria que ofrece el servidor en su
respuesta. Esta nueva direccin (una URI absoluta o relativa) no corrige la direccin original del recurso
solicitado por el cliente, sino que ofrece una ruta a un recurso que complementa al solicitado originalmente.
Content-Type (tipo de contenido) Indica, como su nombre indica, el tipo de contenido del recurso.
Date (fecha) Indica la fecha de creacin del recurso. Tiene la forma:
Expect (espera) Mediante esta cabecera, el cliente indica qu tipo de respuesta espera del servidor. Si el
servidor no est preparado para responder como el cliente espera, debe indicarlo mediante el envo de un
cdigo de estatus 417 (Expectation Failed).
Expires (expiracin) Indica la fecha a partir de la cual el recurso debe considerarse obsoleto.
IP (remote adress) No es estrictamente una cabecera del protocolo HTTP, sino del protocolo TCP/IP. Expresa la
identificacin numrica de una mquina.
Host (servidor) Nombre del servidor.
Location (localizacin) Mediante este campo el servidor indica la direccin (la URL) de un recurso cuando no se
encuentra en la direccin en que se ha solicitado. De esta forma, el servidor invita al navegador (o al software
del cliente en general) a que se redirija a la nueva localizacin.
Request (solicitud) Indica el fichero solicitado y el mtodo y versin del protocolo que se van a emplear para
realizar la conexin.
Status Code (cdigo de estado) Mediante el cdigo de estado el servidor informa al navegador sobre cmo ha
resuelto la solicitud de un documento. Errores 400, 500 y 600
User-Agent (agente de usuario) El user-agent identifica el software de la mquina cliente
Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)
Cdigos mediante los cuales indicamos una redireccin al usuario, o que la pgina actual ha cambiado de
direccin.
- Almacenamiento en cache.
Se llama cach web a la cach que almacena documentos web Un cach web almacena copias de los
documentos que pasan por l, de forma que subsiguientes peticiones pueden ser respondidas por el propio
cach, si se cumplen ciertas condiciones.
TIPOS DE CACH:
Las cachs web pueden utilizarse de diversas formas.
Cachs de agente de usuario (User-Agent), como las presentes en los navegadores web, son cachs privados,
que funcionan solo para un nico usuario. Tambin existen paquetes especficos que se instalan como proxy
local y actan como cach adems de realizar otras tareas,
Los intermediarios en la comunicacin cliente-servidor tambin pueden implementar cachs compartidos
(tambin llamadas proxy-cachs directos) que sirvan pginas a varios usuarios. Los proxy-cachs suelen ser
usados por los proveedores de servicios de Internet (ISP), universidades y empresas para ahorrar ancho de
banda.
Las cachs pasarela (llamadas tambin proxy-cachs inversos o aceleradores web) funcionan a cargo del
propio servidor original, de forma que los clientes no distinguen unos de otros. Puede hacerse funcionar
conjuntamente varias cachs pasarela para implementar una Content Delivery Network (CDN)
Varios cachs pueden ser coordinados entre s con las ayuda de protocolos especficos tales como ICP o HTCP.
Control de los cachs web
El protocolo HTTP define tres mecanismos bsicos para controlar las cachs:
Frescura, que permite que una respuesta sea usada sin comprobar de nuevo el servidor origen, y puede ser
controlada tanto por el servidor como el cliente.
Validacin, que puede usarse para comprobar si una respuesta cacheada sigue siendo buena tras caducar.
Invalidacin, que normalmente es un efecto secundario de otra peticin que pasa por la cach.
- Redirecciones.
Cundo se necesita una redireccin web?
Existen diferentes casos de real necesidad para los cuales se debe de usar la redireccin:
por ejemplo en caso de cambio en la Url de nuestro portal, variacin del nombre de un fichero, o cambio de
carpeta en la arborescencia de nuestro sitio web.
Su funcionamiento:
Necesitamos que el encabezamiento enviado por la pgina consultada corresponda a su estatus.
Por ejemplo, si una pgina ha cambiado de lugar en nuestro portal, es de vital importancia que la antigua Url
haga un redireccionamiento hacia la nueva, utilizando un encabezamiento HTTP que precise que esta pgina
ha cambiado de manera definitiva de direccin (cdigo 301) Esto permitir al robot el no volver a indexar
nunca la antigua Url, poniendo al da su base de datos aplicando la nueva Url a la pgina en cuestin. Si no
aplicamos la redireccin desde la antigua Url, el robot y los visitantes obtendrn un error 404.
- Comprensin.
Es una capacidad que se puede utilizar en servidores web y clientes web para hacer un mejor uso de ancho de
banda disponible, y proporcionar mayores velocidades de transmisin entre ambos.
Los datos HTTP se comprimen antes de ser enviados desde el servidor. Para ello el navegador del cliente
informa al servidor web de los mtodos de compresin que soporta. El servidor en base a dichos valores,
comprimir el contenido antes de ser enviado al cliente.
Existen diferentes esquemas de compresin de contenido, pero los ms comunes son deflate y gzip.
La compresin se da del servidor al cliente, no del cliente al servidor. El cliente al momento de enviar una
peticin enva en su cabecera la lnea:
Accept-Encoding: gzip, deflate
Esto le permite saber al servidor que el cliente soporta http comprimido, al momento que el servidor entrega
los datos aade en la cabecera.
- Cookies.
Una cookie, se utiliza para; un sitio web de origen, enviar informacin de estado del navegador del usuario y
para el navegador, volver la informacin de estado para el sitio de origen. El Estado informacin puede ser
utilizada para la autenticacin, identificacin de un usuario de la sesin, las preferencias del usuario, cesta de
la compra contenido, o cualquier cosa que se puede lograr a travs de datos de texto almacenar en el
ordenador del usuario.
Las cookies no pueden ser programadas, no pueden llevar virus, y no pueden instalar programas maliciosos en
el ordenador anfitrin. Sin embargo, pueden ser utilizados por el software espa.
- Autenticacin.
Es el proceso de identificar si un cliente es apto para tener acceso a un recurso. El protocolo HTTP soporta la
autenticacin como un medio de negociar el acceso a un recurso seguro.
La solicitud inicial de un cliente es normalmente una solicitud annima, que no contiene ninguna informacin
de autenticacin. Las aplicaciones de servidor HTTP pueden denegar la solicitud annima indicando que se
requiere la autenticacin.
AUTENTICACIN BSICA
Cuando el usuario accede a un recurso del servidor web protegido mediante autenticacin bsica, tiene lugar
el siguiente proceso:
1. El navegador presenta al usuario la ventana de autenticacin, para que introduzca su nombre y contrasea.
2. El navegador intenta establecer una conexin con el servidor utilizando esta informacin.
3. Si el servidor rechaza la informacin de autenticacin, el navegador le presenta nuevamente la ventana al
usuario hasta que ste introduce por fin una contrasea vlida o cierra la ventana.
4. Cuando el servidor web verifica con xito los datos de autenticacin, se establece la conexin de acceso al
recurso protegido.
- Conexiones persistentes.
Las conexiones persistentes del HTTP, tambin llamadas HTTP keep-alive, o reutilizacin de la conexin del
HTTP, son la idea de usar la misma conexin del TCP para enviar y recibir mltiples Peticiones del
HTTP/responses, en comparacin con abrir una nueva conexin para cada par de la peticin/respuesta.
Permiten que varias peticiones y respuestas sean transferidas usando la misma conexin TCP.
Se usan por omisin en HTTP 1.1.
Si se enva la cabecera Connection: close, el servidor cierra la conexin despus de la respuesta.
Un servidor puede cerrar la conexin antes de enviar todas las respuestas.
El servidor cerrar las conexiones inactivas pasado un plazo de tiempo
El ahorro del establecimiento de una conexin TCP para cada conexin Web reduce el tiempo en el caso de las
conexiones secuenciales. El tiempo de respuesta de las conexiones paralelas persistentes es el mismo que el
de las conexiones no persistentes, aunque la carga para el servidor suele ser menor cuando son persistentes.
De Error: Apache enviar cualquier informacin de diagnstico y registrar cualquier error que
encuentre al procesar peticiones al archivo de registro seleccionado. ErrorLog y LogLevel
De Acceso: informacin sobre todas las peticiones que procesa. CustomLog, LogFormat, SetEnvIf
De ficheros PIF, actividad de Script y Actividad del mdulo Rewrite
- Tipos MIME.
Multipurpose Internet Mail Extensions o MIME (en espaol "extensiones multipropsito de correo de
internet") son una serie de especificaciones dirigidas al intercambio de archivos a travs de Internet (texto,
audio, vdeo, etc.) de forma transparente para el usuario. Una parte importante del MIME est dedicada a
mejorar las posibilidades de transferencia de texto en distintos idiomas y alfabetos. En sentido general
las extensiones de MIME van encaminadas a soportar:
Texto en conjuntos de caracteres distintos de US-ASCII;
adjuntos que no son de tipo texto;
informacin de encabezados con conjuntos de caracteres distintos de ASCII.
Prcticamente todos los mensajes de correo electrnico escritos por personas en Internet y una
proporcin considerable de estos mensajes generados automticamente son transmitidos en formato
MIME a travs de SMTP. Los mensajes de correo electrnico en Internet estn tan cercanamente
asociados con el SMTP y MIME que usualmente se les llama mensaje SMTP/MIME.
Los tipos de contenido definidos por el estndar MIME tienen gran importancia tambin fuera del
contexto de los mensajes electrnicos. Ejemplo de esto son algunos protocolos de red tales como HTTP de
la Web. HTTP requiere que los datos sean transmitidos en un contexto de mensajes tipo e-mail aunque los
datos pueden no ser un e-mail propiamente dicho.
- WebDAV.
El objetivo de WebDAV es hacer de la World Wide Web un medio legible y editable, en lnea con la visin
original de Tim Berners-Lee. Este protocolo proporciona funcionalidades para crear, cambiar y mover
documentos en un servidor remoto (tpicamente un servidor web). Esto se utiliza sobre todo para permitir la
edicin de los documentos que sirve un servidor web, pero puede tambin aplicarse a sistemas de
almacenamiento generales basados en web, que pueden ser accedidos desde cualquier lugar. La
mayora de los sistemas operativos modernos proporcionan soporte para WebDAV,
WebDAV aade los siguientes mtodos a HTTP:
PROPFIND - Usado para recuperar propiedades, almacenadas como XML, desde un recurso. Tambin est
sobrecargado para permitir recuperar la estructura de jerarqua de directorios
PROPPATCH - Usado para cambiar y borrar mltiples propiedades de un recurso en una simple
operacin atmica
MCOL - Usado para crear colecciones
COP - Usado para copiar un recurso desde un URI a otro.
MOVE - Usado para mover un recurso desde un URI a otro.
LOC - Usado para bloquear (lock) un recurso. WebDAV soporta tanto bloqueos compartidos como
exclusivos.
UNLOC - Para desbloquear un recurso.
El grupo de trabajo WebDAV est todava trabajando en unas cuantas extensiones a WebDAV,
incluyendo: control de redirecciones, enlaces, lmites de espacio en disco y mejoras en la especificacin base
para que alcance el nivel de madurez del resto de estndares de Internet.
5. Navegadores Web.
Aplicacin que opera a travs de Internet, interpretando la informacin de archivos y sitios web para que
podamos ser capaces de leerla
La funcionalidad bsica de un navegador web es permitir la visualizacin de documentos de texto,
posiblemente con recursos multimedia incrustados. Los documentos pueden estar ubicados en la
computadora en donde est el usuario, pero tambin pueden estar en cualquier otro dispositivo que est
conectado a la computadora del usuario o a travs de Internet, y que tenga los recursos necesarios para la
transmisin de los documentos (un software servidor web).
El seguimiento de enlaces de una pgina a otra, ubicada en cualquier computadora conectada a la
Internet, se llama navegacin, de donde se origina el nombre navegador del original en ingls, browser,
aunque su uso es minoritario.
Algunos navegadores web incluyen una Suite. Estas Suite disponen de varios programas integrados para
leer noticias de Usenet y correo electrnico mediante los protocolos NNTP, IMAP y POP.
- Alojamientos hbridos.
Por medio de un software simulamos dividir una computadora en nmero de servidores que deseemos. As,
cada servidor virtual trabaja como si fuera una computadora independiente con un alojamiento dedicado. La
diferencia con los servidores compartidos es que en stos slo abrimos carpetas en el disco duro para las
diferentes pginas.
No son tan baratos como los compartidos, ni tan caros como los dedicados. Sin tantas ventajas tcnicas como
stos ltimos, pero sin tantos inconvenientes como los primeros. Una buena eleccin intermedia.
Debido a la cantidad de clientes de vitalizacin generalmente se ejecuta en una sola mquina, en general esta
prctica est limitada el tiempo de procesador, memoria RAM y espacio en disco.