Sei sulla pagina 1di 88

Informatica Generale

Informatica Distribuita e Reti


di Calcolatori: la rete Internet
Dove siamo adesso ?

• L’era della connessione:


Informazione +
Accesso +
Comunicazione

Corso di Informatica Generale – a.a. 2008/2009


Cosa è successo ?

IT Spending ($B)
IT Users (M)
Le tre ondate
1,000 5,000

100 500
Internet:
la rete delle reti
PC e
10 le reti 50
Mainframe

1970 1980 1990 2000 2010


Source: http://www.rpolillo.it/

Corso di Informatica Generale – a.a. 2008/2009


Le prime due ondate: dal “computing centralizzato” al “computing
distribuito”

• Informatica Centralizzata
– Un elaboratore centrale, con molti terminali non intelligenti
(terminali e stampanti)
– Gestione centralizzata dell’IT (“CED”)
– Un solo computer (“mainframe”), molti utenti
– Grandi capacità di calcolo
– Architetture multiprocesso e Sistemi Proprietari
(IBM/360)

• Informatica Distribuita
– Il Personal Computer (Avvento
WAN del PC e dei Minicomputer)
– Nascita e boom delle reti (locali,
LAN
geografiche, miste)
MA – Evoluzione verso sistemi aperti
N LAN – Gestione decentralizzata
MA
N LAN
– Periferia eterogenea ed
LAN LAN intelligente
– Nascita degli standard per:
• Cablaggi strutturati
• Protocolli di Comunicazione
Corso di Informatica Generale – a.a. 2008/2009
L’evoluzione: la condivisione dell’informazione

LA RETE

Mainframe PC & WS & RETE

condivisione delle risorse  condivisione dell’informazione

Corso di Informatica Generale – a.a. 2008/2009


La terza ondata: Internet

Posta elettronica
Una rete di reti

INTERNET

World wide web

INTERNET

Source: http://www.rpolillo.it/

Corso di Informatica Generale – a.a. 2008/2009


RETI: riassumendo

• Sistema di collegamento tra due o più


computer che rende possibile lo scambio
di informazioni e la condivisione delle
risorse

• Vantaggi:
– Informazione distribuita tra più utenti
– Condivisione dell’informazione e delle risorse
– Maggiore affidabilità
– Possibile crescita incrementale di un sistema
– Possibilità di avere dei costi incrementali

Corso di Informatica Generale – a.a. 2008/2009


Reti – Caratteristiche/1

• Estensione: LAN (Local Area Network), MAN


(Metropolitan Area Network), WAN (Wide Area
Network)
• Velocità del flusso dei dati (larghezza di banda):
bps (bit per secondo)
• Organizzazione: client-server, peer-to-peer
• Protocolli (metodi di comunicazione):
– TCP/IP
– HTTP
– FTP
– SMTP
– POP3
– ecc…

Corso di Informatica Generale – a.a. 2008/2009


Reti – Caratteristiche/2

Numero di host connessi


Dimensione della rete

 LAN (Local Area Network) Rete locale


• Collega computer disposti in uno stesso edificio e stessa
organizzazione
 MAN (Metropolitan Area Network) Rete metropolitana
• Collega computer disposti in diversi edifici di un stesso
territorio (quartieri, città)
 WAN (Wide Area Network) Rete geografica
• Collega un numero elevato di computer in diversi edifici
dislocati su vaste zone di territorio (es. Internet)

Corso di Informatica Generale – a.a. 2008/2009


Reti eterogenee

• Gli esempi presentati non sono mutuamente esclusivi.


• Nella maggior parte dei casi, soluzioni architetturali
differenti coesistono in un singolo sistema distribuito
complesso
• L’esempio per eccellenza: Internet

WAN

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: gli albori

• Il progetto iniziale risale agli anni ‘60 su


commissione del Ministero della Difesa degli
Stati Uniti d'America
– Sistema sperimentale denominato ARPANet.
– Per connettere in rete computer delle diverse
basi militari statunitensi
– Un requisito fondamentale: tolleranza ai guasti
derivanti da un attacco atomico!

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: l’altro ieri

• Nel 1984 la parte militare di ARPANET si separa


(MILNET), ARPANET diventa una rete di “servizio”
• Nello stesso tempo altre reti nascono e si connettono
– CSNET (1978-80): una rete con una semplice topologia
a stella
– NSFNET (1984): L’NSF finanzia un backbone TCP-IP
ed una serie di 20 reti regionali. Da 56 Kbps a 448
kbps.
– ANS (1990): NSF smette di finanziare la rete e cede
la struttura ad una organizzazione no-profit.
– Nel 1995 la rete diventa un service di tipo
commerciale: AOL, NAP (PacBell, Ameritech, MFS,
Sprint)
– Altre reti si uniscono: SPAN, BITNET (IBM), EARN

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: ieri

• 13.000 domini autonomi


• 100.000 reti
• 160.000.000 di calcolatori host
• Un tasso di crescita esponenziale fino al
1995
– un nuovo dominio ogni 2 minuti
– una nuova rete ogni 10 minuti
– crescita del numero di host del 6%
mensile
• Oggi la crescita è lineare
• Da una rete sperimentale e di ricerca ad
un servizio commerciale… ma gratuito

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: oggi

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: oggi

Source: http://www.glreach.com/globstats/index.php3

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: oggi

Source: http://navigators.com/stats.html

Corso di Informatica Generale – a.a. 2008/2009


Breve storia di Internet: oggi

Source: http://navigators.com/stats.html

Corso di Informatica Generale – a.a. 2008/2009


Commutazione di Pacchetto

• La natura discontinua della trasmissione di dati digitali può essere


sfruttata per far sì che flussi di dati differenti possano
condividere la stessa connessione, a patto di poterli distinguere
• Questo principio è alla base della tecnica detta “commutazione di
pacchetto” (packet switching)

pacchetti

destinatario, mittente, ecc.

file da spedire

Corso di Informatica Generale – a.a. 2008/2009


Protocollo IP e commutazione di pacchetto

a
b
f
BOOM c
e
d

Corso di Informatica Generale – a.a. 2008/2009


Commutazione di Pacchetto
• Nel Packet Switching ciascun flusso di dati è diviso in
pacchetti, cioè in entità composte da:
– un’intestazione (header), utilizzata ai fini dell’identificazione e
gestione,
– dai dati veri e propri (payload)

Header Payload

• Una rete a commutazione di pacchetto è composta da:


– sistemi terminali (End System o host): producono o ricevono dati
– apparati che si occupano dell’instradamento dei pacchetti tra
sorgente e destinazione, detti nodi della rete (Network Nodes)
• Ogni nodo memorizza i pacchetti in ingresso, per poi
instradarli verso il nodo successivo
• I collegamenti fisici tra i nodi sono detti link

Corso di Informatica Generale – a.a. 2008/2009


Commutazione di Pacchetto (3)

A Multiplexing statistico C

B
Coda di pacchetti
in attesa di
essere trasmessi

D E

Corso di Informatica Generale – a.a. 2008/2009


Commutazione di Pacchetto: modello a datagram

• In linea di principio, ciascun pacchetto può essere


trattato dalla rete in modo indipendente, venendo,
ad esempio, instradato su un percorso differente
(routing path) da quello seguito dagli altri pacchetti
dello stesso flusso logico di dati (modello a
datagram)
• Percorsi differenti possono comportare tempi di
comunicazione differenti (link con caratteristiche
differenti, tempi di servizio differenti nei vari nodi)

P Node P

Communication
Node Node Communication
Subsystem Subsystem

Node

Corso di Informatica Generale – a.a. 2008/2009


Commutazione di Pacchetto: modello a circuiti virtuali

• In alcune applicazioni viene richiesto che tutti i


pacchetti di un flusso siano elaborati nello stesso modo
• Una possibile soluzione è quella di instradarli lungo lo
stesso percorso: un Circuito Virtuale
• Alcune reti a pacchetto si basano su questo modello

P Node P

Communication
Node Node Communication
Subsystem Subsystem

Node

Corso di Informatica Generale – a.a. 2008/2009


Circuiti Virtuali: protocollo di segnalazione

• Viene aperta una connessione


prima di inviare dati

6. Rcevi dati
application 5. Inizia flusso dati application
transport 4. Connessione 3. Accetta call transport
network 1. Inizia call 2. Ricevi call network
data link data link
physical physical

Corso di Informatica Generale – a.a. 2008/2009


Internet: reti a Datagramma

• Non esiste la fase di call setup a livello network


• Nei router non esiste il concetto di connessione
• I pacchetti sono indirizzati usando un ID destinazione
– pacchetti fra la stessa coppia sorgerte-destinazione possono
seguire strade diverse

application
transport 1. manda data 2. ricevi data application
network transport
data link network
physical data link
physical

Corso di Informatica Generale – a.a. 2008/2009


I servizi Internet

• E-mail
• World Wide Web
• Mailing List
• Newsgroup
• Chat
• FTP (File Transfer Protocol)
• …

Corso di Informatica Generale – a.a. 2008/2009


Accesso residenziale ad Internet: come connettersi ?

• Bisogna trovare qualcuno già connesso e


disposto a lasciarci entrare
• Esistono i Network Provider
– Sono di vari livelli, da quelli cittadini, a quelli
nazionali, fino ad arrivare a quelli internazionali
• Se mi connetto da casa con un provider
della mia città il costo del collegamento è
pari a quello di una telefonata urbana,
anche se sto girando per il mondo !!!

Corso di Informatica Generale – a.a. 2008/2009


Reti telefoniche

• PSTN (Public Switched Telephone Network): la


tradizionale rete pubblica commutata
• ISDN (Integrated Services Digital Network)
comunicazione digitale attraverso linee
telefoniche; due linee (per voce o dati) capaci di
trasferire dati ciascuna alla velocità di 64Kbps
(insieme 128Kbps)
• ADSL (Asymmetric Digital Subscriber Line):
linea digitale ad alta velocità che utilizza la
tradizionale rete pubblica

Corso di Informatica Generale – a.a. 2008/2009


Connessione ad Internet/1

• Modem e linea telefonica


– analogico - PSTN
– digitale – ISDN o ADSL
• Contratto con Provider Internet (ISP)
• Software per la connessione in rete
(TCP/IP)
• Software per l’uso dei servizi
– browser per la navigazione
– mail client per la gestione della posta elettronica
– news client per l’accesso ai newsgroup
– ecc.

Corso di Informatica Generale – a.a. 2008/2009


Connessione ad Internet/2

• MODEM (MODdulatore-DEModulatore):
dispositivo di interconnessione tra
computer e rete telefonica per la
trasmissione dati
• Converte i segnali digitali provenienti dal
computer in segnali analogici e trasforma i
segnali analogici della linea in segnali
digitali (modem analogico)

Corso di Informatica Generale – a.a. 2008/2009


Tipi di connessioni

• diretta permanente: le workstation


facenti parte di una LAN (Local Area
Network) hanno accesso permanente alla
rete Internet
• on-demand: si tratta di una connessione
individuale e diretta via modem attivabile
secondo necessità
• accesso remoto: tramite tale tipo di
connessione, il collegamento viene
effettuato con il server dell’ISP il quale,
a sua volta, si collega con il computer
host

Corso di Informatica Generale – a.a. 2008/2009


Accesso ad Internet residenziale

Personal Computer +
Modem
Internet

ISP
Rete
Telefonica
• Modem analogico
• fino a 56Kbps
• ISDN (Integrated Services Digital Network)
• fino a 128Kbps
• ADSL (Asymmetric Digital Subscriber Line)
• fino ad 1 Mbps upstream e fino ad 12 Mbps downstream

Corso di Informatica Generale – a.a. 2008/2009


Collegamento ad Internet di LAN aziendali

Internet
• Collegamento
mediante:
– Modem analogico,
ISDN, ADSL ISP
• Per reti aziendali di
piccole dimensioni
– Linea dedicata con
collegamento
permanente con l’ISP
• Per reti aziendali di
medie/grandi dimensioni

Corso di Informatica Generale – a.a. 2008/2009


Fattori che influenzano le prestazioni di accesso ad una risorsa (ad
esempio, sito web)

Banda verso UAP


User
Caratteristiche
dell’UAP
User Access Provider

Congestione della
rete
Internet
Caratteristiche
del SAP
Site Access Provider

Banda verso SAP


Web Server

Dinmensionamento
del server

Corso di Informatica Generale – a.a. 2008/2009


Internet in Italia

• Esistono degli Internet Service Provider commerciali che


operano a livello nazionale fornendo la connessione ad
Internet a privati ed aziende
– Telecom Italia Net (TIN)
– Albacom
– Wind-Infostrada (Libero)
– Kataweb
–…
• Esistono anche molti medi e piccoli ISP che operano su
scala locale

Corso di Informatica Generale – a.a. 2008/2009


La rete GARR-B

L’accesso ad Internet per le Università è gestito dal GARR


Gruppo
Armonizzazione
Reti
di Ricerca

Corso di Informatica Generale – a.a. 2008/2009


Una vista parziale su Internet negli USA

Corso di Informatica Generale – a.a. 2008/2009


Request For Comment

• Un RFC (Request For Comment) è un


documento pubblico sottoposto alla
comunità Internet al fine di essere
valutato.
• Un RFC rappresenta uno standard de facto
nella comunità Internet.
• Tutti gli RFC possono essere reperiti al sito
dell’Internet Engineering Task Force
(http://www.ietf.org)

Corso di Informatica Generale – a.a. 2008/2009


Gli indirizzi in Internet

• Internet è suddivisa in domini


– Tutti i computer che fanno parte di uno
stesso dominio hanno un indirizzo che
finisce allo stesso modo (ad es.
.unina.it)
• Ogni computer ha un suo indirizzo
– L’indirizzo di un computer è scritto nella
forma: grid.unina.it
• Ogni utente ha un suo indirizzo
– L’utente è identificato da un nome e da
una macchina o dominio di appartenenza:
spromano@unina.it
Corso di Informatica Generale – a.a. 2008/2009
Il DNS: L’utilità di un servizio di risoluzione dei nomi

• Tutti noi siamo oggi abituati a raggiungere un


servizio (e quindi il calcolatore che lo offre)
utilizzando nomi simbolici di facile
memorizzazione:
– www.google.com
– www.hotmail.com
– pippo@unina.it
• Questi nomi non sono immediatamente adatti ad
essere compresi dai dispositivi che costituiscono la
rete Internet.
• Un nome di questo tipo, infatti, non dà
informazioni esatte sulla dislocazione sul territorio
della macchina che si desidera contattare.
• I router (dispositivi utilizzati per instradare il
traffico), di conseguenza, non saprebbero come
instradare i dati in maniera tale da raggiungere la
destinazione.
Corso di Informatica Generale – a.a. 2008/2009
Il DNS: Nomi simbolici vs Indirizzi IP (1/2)

• La rete Internet è stata progettata invece per lavorare con


indirizzi di tipo numerico. Per es.:
– 143.225.229.3
– 217.9.64.225
• Questi indirizzi, detti indirizzi IP, sono formati da 4 numeri
che vanno da 0 a 255, separati da un punto.
• Ogni dispositivo nella rete Internet ha un tale indirizzo; esso
permette l’identificazione univoca a livello globale e la
localizzazione.
• A differenza dei nomi simbolici, essendo gli indirizzi IP di
lunghezza fissa, sono più facilmente gestibili dalle macchine
• Data la loro natura gerarchica forniscono inoltre precise
informazioni sulla loro dislocazione sul territorio:
– leggendo l’indirizzo da sinistra verso destra si ottengono
informazioni sempre più dettagliate circa la rete di
appartenenza (all’interno di tutte le reti di Internet)

Corso di Informatica Generale – a.a. 2008/2009


Il DNS: Nomi simbolici vs Indirizzi IP (2/2)

• Gli indirizzi Internet sono sequenze di numeri


– Possono essere statici o dinamici.
– Gli indirizzi sono univocamente assegnati da una specifica
autorità internazionale.
• Ogni computer ha un suo indirizzo che dipende dalla
rete cui appartiene
– Internet prevede tre classi di reti a seconda del numero di
host che devono includere (100,1000,100000)
– Esiste comunque la possibilità di strutturare reti in sottoreti

143.225.229.29
Identificativo di Rete (+ sottorete) Identificativo di Host

Corso di Informatica Generale – a.a. 2008/2009


Il servizio DNS

• Non volendo rinunciare alla comodità di


lavorare con nomi simbolici, è stato
necessario progettare un servizio di
risoluzione dei nomi simbolici in indirizzi IP.
• Tale servizio associa ad un nome simbolico
univoco (www.grid.unina.it) un indirizzo IP
(143.225.229.3) permettendo così di
raggiungere la macchina.
• Questo servizio si chiama Domain Name
System (DNS) ed è definito in RFC1034 e
RFC1035
• Esso funziona attraverso lo scambio di
messaggi UDP sul porto 53.
• nslookup
Corso di Informatica Generale – a.a. 2008/2009
URL (Uniform Resource Locator)

• La struttura di un URL è la seguente:


– Protocollo://Nome_Computer/Nome_Documento
• Esempio:
– http://www.unina.it/corso.html

http protocollo (regole di comunicazione)


www Nome del server (indica che è un
server Web)
unina Dominio di II livello (organizzazione)
it Dominio di I livello (gestito da 1 o +
enti)
corso.html indica il nome e l’estensione del file

Corso di Informatica Generale – a.a. 2008/2009


Pagine WEB

• Le pagine Web visualizzano testo, disegni,


immagini animate e riproducono suoni

• Le pagine Web possono contenere dei


particolari collegamenti detti collegamenti
ipertestuali

• Un collegamento ipertestuale è un indirizzo


virtuale chiamato URL (Uniform Resource
Locator)

• Le pagine Web sono documenti creati in


linguaggio HTML (Hypertext Markup Language)

Corso di Informatica Generale – a.a. 2008/2009


Ipertesti

Documenti in cui ad alcune parole (e/o


immagini, e/o …) sono associati dei pagina
collegamenti verso altri documenti
locali o in rete. link

Corso di Informatica Generale – a.a. 2008/2009


HTML: HyperText Markup Language

• È il linguaggio usato per preparare le pagine


visualizzate nel browser
• Permette di specificare (tra l’altro):
– Il tipo e il colore dei caratteri
– L’allineamento
– La presenza di figure
– La presenza di collegamenti ad altri documenti
• Non richiede particolari conoscenze di informatica
• Consente di esaltare la semantica di un documento e le
sue interconnessioni con altre fonti

Corso di Informatica Generale – a.a. 2008/2009


HTML: source file …

<html>
<head>
<title>Ciao</title>
</head>
<body>
<p>Ciao !!!</p>
<p>
Benvenuto al corso di &quot;Metodi e Tecniche della Produzione Multimediale&quot; del corso
di Laurea Specialistica in Scienze dello Spettacolo dell'Università degli Studi Suor Orsola di
Napoli.
</p>
<p>
Il sito del corso e' <a href="http://www.grid.unina.it/Didattica/ScienzeDelloSpettacolo">
www.grid.unina.it/Didattica/ScienzeDelloSpettacolo</a>.
</p>
<p>Vienici e trovare presto.</p>
</body>
</html>

Corso di Informatica Generale – a.a. 2008/2009


HTML: … come appare nel browser

Corso di Informatica Generale – a.a. 2008/2009


Tab Bottone

Immagine attiva

Testo attivo

Corso di Informatica Generale – a.a. 2008/2009


Il world wide web

La Killer Application !!!!

INTERNET

Corso di Informatica Generale – a.a. 2008/2009


Il world wide web: architettura

File HTML

browser

Internet
Client

Server web server il protocollo: HTTP

52
Corso di Informatica Generale – a.a. 2008/2009
Il protocollo HTTP

• HTTP, HyperText Transfer Protocol, è il protocollo che regola la


comunicazione tra un Web browser ed un Web server
• http0.9
• http1.0: RFC 1945 HTTP

• http1.1: RFC 2068

Corso di Informatica Generale – a.a. 2008/2009


Il protocollo HTTP (2)

• Protocollo di livello
applicativo
• Usa il modello
client/server PC con
Explorer
– Client è il
browser che
richiede, riceve
e “mostra” Server Linux
oggetti Web con
– Server è il Web
Server
software “Web APACHE
server” che
invia oggetti in Mac con
risposta alle Navigator
richieste

Corso di Informatica Generale – a.a. 2008/2009


L’utilità di un protocollo per lo scambio di file

• Internet oggi si presenta come una rete ad estensione globale che


connette molti milioni di macchine sparse su tutto il globo.
• Spesso sorge l’esigenza di copiare un file da una macchina ad un’altra per
poterlo utilizzare localmente:
– un documento di Office;
– un file eseguibile;
– un file di testo;
– etc…

• Ciò può accadere sia


tra macchine molto
distanti tra di loro che
tra macchine
direttamente
connesse, presenti
nello stesso locale.

Corso di Informatica Generale – a.a. 2008/2009


Il trasferimento file

• È una delle più vecchie, ma utili


applicazioni
• Permette di spostare grosse quantità
di informazione da un host all’altro
sulla rete
• Spesso si parla di FTP
– File Transfer Protocol

Corso di Informatica Generale – a.a. 2008/2009


Come funziona FTP

FTP file transfer


FTP FTP
user client server
interface
user
at host local file
system

• trasferisce files da o verso una macchina remota


• usa il modello client/server
• client: è l’entità che dà luogo al trasferimento
(sia in un senso che nell’altro)
• server: è l’entità remota che è in continua attesa
di connessioni FTP da parte di altre entità
• ftp server: numero di porto 21
Corso di Informatica Generale – a.a. 2008/2009
Il trasferimento file

• Accesso a biblioteche di file


– Freeware (PD o Public Domain)
• Gratuiti
– Shareware
• Distribuiti liberamente dall’autore che richiede una piccola somma
dopo un primo periodo di utilizzo gratuito
• E-mail e FTP sono cose diverse !!!
– Un grosso file può non essere trasferibile via e-mail
– Un messaggio di posta elettronica può essere spedito
senza che l’utente si connetta al destinatario. C’è un
postino che fa questo per noi.

Corso di Informatica Generale – a.a. 2008/2009


E-commerce (1/2)

Acquisto e vendita tramite supporti digitali: ha


rappresentato la sfida più significativa al
modello aziendale sin dall’avvento
dell’informatica.

Nella definizione più


semplice non è altro che
un canale di vendita e
rappresenta quella parte
della supply chain che
riguarda il collegamento
fra fornitore e cliente,
che può essere il
consumatore finale o a
sua volta un’azienda.

Corso di Informatica Generale – a.a. 2008/2009


E-commerce (2/2)

• Il Web si è confermato un ottimo veicolo


commerciale
• E’ possibile accedere a milioni di negozi virtuali in
giro per il Mondo
– Dati aggiornati in tempo reale (non vecchi
cataloghi)
– Immagini e Suoni
– Possibilità di saltare la distribuzione riducendo i
costi
• E’ necessario progettare soluzioni tecnologiche in
grado di fornire sicurezza
– Non è sicura la transazione di vendita
– Non è sicuro l’oggetto della vendita
– Non è sicura l’identità dell’acquirente

Corso di Informatica Generale – a.a. 2008/2009


Corso di Informatica Generale – a.a. 2008/2009
Corso di Informatica Generale – a.a. 2008/2009
Il CSCW e la telecollaborazione

• CSCW sta per Computer Supported Cooperative Work

• Richiede
– Trasmissione di Video
– Trasmissione di Audio
– Condivisione di Dati e Programmi
– Teleconferenze virtualmente globali

• Esistono limitazioni tecniche

• Dovrebbe permettere
– …telelavoro
– …teleformazione e teledidattica
– …telemedicina
– ………….

Corso di Informatica Generale – a.a. 2008/2009


Cercare informazioni sul Web (1/3)

• Il World Wide Web contiene oggi


molte pagine

• Per cercare informazioni in


questo oceano di documenti si
possono usare due tipi di
strumenti
• Cataloghi Sistematici
• Motori di Ricerca

Corso di Informatica Generale – a.a. 2008/2009


Cercare informazioni sul Web (2/3)

• I cataloghi sistematici
sono degli elenchi di siti e
pagine Web compilati da
esseri umani e organizzati
in base a uno schema di
classificazione per
argomento
• La classificazione parte da
categorie molto generali
(ad esempio ‘arti e scienze
umane’) e scende fino a
categorie molto particolari
(ad esempio gli ‘scritti di
Dante Alighieri), passando
per un certo numero di
categorie intermedie

Corso di Informatica Generale – a.a. 2008/2009


Cercare informazioni sul Web (3/3)

• I motori di ricerca sono


degli enormi archivi che
indicizzano interamente il
contenuto testuale di milioni
e milioni di singole pagine
Web e che possono essere
interrogati
• La ricerca avviene indicando
uno o più termini chiave che
delimitano il concetto o il
tema di nostro interesse
• Come risultato si ottiene un
elenco attivo di pagine Web
che contengono i termini
indicati

Corso di Informatica Generale – a.a. 2008/2009


Posta elettronica

INTERNET

Corso di Informatica Generale – a.a. 2008/2009


Il protocollo SMTP

• Una volta che una e-mail è stata scritta attraverso


l’uso di un programma su un personal computer, è
necessario inviarla al destinatario
• Come è noto, il destinatario potrebbe non essere in
quel momento disponibile ad accettare e-mail
– utente impegnato
– computer spento
• La posta elettronica sfrutta degli intermediari per
il trasferimento delle e-mail tra le parti, alla
stregua degli uffici postali che ospitano pacchi
nell’attesa che i destinatari passino a ritirarli
• Per trasferire messaggi di posta elettronica tra gli
intermediari si utilizza un apposito protocollo
• Si chiama Simple Mail Transfer Protocol definito
in RFC821
Corso di Informatica Generale – a.a. 2008/2009
Le entità in gioco

Tre entità principali: user


agent
• user agents mail
user
• mail servers server
agent
• protocollo SMTP SMTP mail
server user
User Agent
• anche detto mail reader SMTP agent

• composizione, modifica, lettura di SMTP


messaggi mail user
server agent
• p.es., Eudora, Outlook, Netscape
Messenger user
• messaggi in uscita ed in entrata outgoing
agent
message queue
immagazzinati sul server user
agent user mailbox

Corso di Informatica Generale – a.a. 2008/2009


I mail server

Mail Server
user
• mailbox contenente messaggi in agent
entrata (non letti) per l’utente mail
user
• coda dei messaggi in uscita server
agent
contenente i messaggi non ancora
recapitati
SMTP mail
server user
• protocollo smtp a cavallo di due
mail server. SMTP agent

– “client”: mail server mittente SMTP


user
– “server”: mail server mail
server agent
destinatario
• Un “mail server” funge in momenti user
diversi da client o da server a coda dei
agent
messaggi in uscita
seconda del ruolo che ricopre nello user
scambio del messaggio agent mailbox

Corso di Informatica Generale – a.a. 2008/2009


Caratteristiche di SMTP (1)

• Usa il protocollo TCP (porto 25) per consegnare in


modo affidabile messaggi dal client al server
• Trasferimento diretto dal server mittente al
server destinatario
• Tre fasi durante il trasferimento:
– handshaking (“stretta di mano”)
– trasferimento del messaggio
– chiusura della connessione
• interazione comando/risposta (command/response)
– comandi: testo ASCII
– risposta: codice di stato e descrizione
(facoltativa)
• messaggi codificati con caratteri ASCII a 7-bit

Corso di Informatica Generale – a.a. 2008/2009


Formato del messaggio SMTP

header
• Linee di linea
intestazione vuota
(header), per es.
– To:
– From: body
– Subject:
differenti da comandi
smtp!
• corpo (body)
– il “messaggio” vero
e proprio, solo
caratteri ASCII

Corso di Informatica Generale – a.a. 2008/2009


Il prelievo della posta : POP3

• Fino ad ora abbiamo visto come sia possibile


trasferire messaggi tra i vari mail server
• Non abbiamo però ancora parlato di come un
utente possa in un momento qualsiasi accedere alla
propria casella di posta elettronica per leggere i
propri messaggi
• Per questa operazione è previsto un ulteriore
protocollo
• Esso è chiamato POP3 (Post Office Protocol –
versione 3) ed è definito in RFC 1939
• Si tratta sempre di un protocollo client server:
– lo user agent ancora una volta gioca il ruolo di client POP
– il mail server gioca il ruolo di server POP

Corso di Informatica Generale – a.a. 2008/2009


La catena dei protocolli per la posta

SMTP SMTP POP3 o user


user
agent IMAP agent

mail server mail server


mittente destinatario

• SMTP: consegna di messaggi


• Protocolli di accesso alla mail: recupero dei
messaggi dai server
– POP: Post Office Protocol
• autorizzazione (agent  server) e download
– IMAP: Internet Mail Access Protocol [RFC
1730]
• più complicato e potente
• manipolazione dei messaggi sul server
– HTTP: Hotmail , Yahoo! Mail, etc.

Corso di Informatica Generale – a.a. 2008/2009


L’accesso alla posta via WEB

• Molti siti web forniscono accesso alle


proprie caselle di posta (libero, inwind, tin,
hotmail, Yahoo!, etc…)
• In questo caso non serve avere uno user
agent installato e correttamente
configurato ricevere ed inviare posta.
• È sufficiente disporre di un qualsiasi
browser.
POP3 HTTP
browser
SMTP
mail server web server
destinatario

Corso di Informatica Generale – a.a. 2008/2009


Le liste di discussione (mailing list)

• Le liste di discussione sono basate sulla


posta elettronica.
• Una lista è un elenco di indirizzi e-mail
gestito da un programma denominato list-
server, a sua volta dotata di un suo
indirizzo.
• Il list-server è una specie di infaticabile
segretario comune a tutti i partecipanti:
quando uno di loro scrive all’indirizzo della
lista, il list-server lo spedisce
automaticamente a tutti gli altri.
Corso di Informatica Generale – a.a. 2008/2009
Le liste di discussione

Lista@pippo.it
(indirizzo lista)

Listserver

Listserv@pippo.it
(indirizzo list-server)
Messaggio alla lista (ritrasmesso agli altri utenti)
Messaggio al listserver (ufficio abbonamenti)

Corso di Informatica Generale – a.a. 2008/2009


I newsgroup

• I newsgroup sono
‘bacheche elettroniche’
dedicate ciascuna a uno
specifico argomento
gestite da particolari
programmi denominati
news-server
• Chiunque può leggere e
scrivere messaggi sulla
bacheca

Corso di Informatica Generale – a.a. 2008/2009


I newsgroup

• Per consultare i newsgroup o per inviare


messaggi occorre collegarsi mediante un
apposito programma client ad una sorta di
‘stanza delle bacheche’, il news- server, e
scegliere la conferenza che ci interessa

Letteratura
Italiana

News-server

Corso di Informatica Generale – a.a. 2008/2009


Comunicare in tempo reale

• Posta elettronica e conferenze sono


strumenti di comunicazione asincrona
• Ma su internet possiamo comunicare
anche in tempo reale

• Internet Relay Chat (IRC)

Corso di Informatica Generale – a.a. 2008/2009


Comunicare in tempo reale

• IRC è uno spazio virtuale suddiviso in


stanze (canali) in cui diversi utenti
possono incontrarsi e fare delle
chiacchierate attraverso Internet
• La comunicazione avviene attraverso
lo scambio di brevi messaggi testuali

Corso di Informatica Generale – a.a. 2008/2009


Comunicare in tempo reale

• In realtà tutti i partecipanti ad


un canale chat, mediante un
apposito programma, si collegano
contemporaneamente ad un nodo
della rete, il quale ospita un
software ‘ripetitore’
• Questo riceve i brevi messaggi
scritti inviati da ciascuno di loro,
e li rimanda in tempo reale a tutti
gli altri
• Esistono anche chat p2p

Corso di Informatica Generale – a.a. 2008/2009


Comunicare in tempo reale

• Un’evoluzione del
tradizionale IRC è
costituita dai chat 3D
• Si tratta di ambienti
tridimensionali in cui
gli utenti si possono
introdurre per
interagire con altri
utenti
• Ogni utente collegato
assume le vesti di un
personaggio virtuale o
avatar

Corso di Informatica Generale – a.a. 2008/2009


Streaming vs. Download

• Download
– Si scarica il dato multimediale utilizzando un protocollo
affidabile
– Si effettua una visualizzazione del file scaricato
localmente
• Scarico il film da Emule la mattina, lo metto sul PC, e la sera a
casa con gli amici lo guardiamo insieme.
• Streaming
– Si effettua una fruizione continua durante il “download”
del file (lo streaming audio e video permette di inviare
immagini e suoni come un flusso costante di bit)
– Dovrebbe essere possibile controllare il flusso da remoto
• Guardiamo in “diretta” il concerto sul web…

Corso di Informatica Generale – a.a. 2008/2009


Formati e visualizzatori

• Esistono vari formati di streaming con


altrettanti programmi di riproduzione

Real video Apple QuickTime Microsoft Media

Corso di Informatica Generale – a.a. 2008/2009


I plug-in

• Un plug-in è un modulo software in grado di


visualizzare particolari formati di dati
multimediali che si integra pienamente con il
browser Web e ne estende le funzionalità

Browser + Plug-in

Corso di Informatica Generale – a.a. 2008/2009


I plug-in

• Una volta
installato il plug-in
che gestisce un
dato formato, il
browser è in grado
di visualizzare
nella sua finestra i
dati codificati in
quel formato

Corso di Informatica Generale – a.a. 2008/2009


References

• www.rpolillo.it
• http://crilet.scu.uniroma1.it/didattica
/insegnamenti/index.htm

Corso di Informatica Generale – a.a. 2008/2009