Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Edizione 2015-16
Una visualizzazione [di una parte] del web
3
La immagine mostra una porzione di Internet costituita da 535.000 nodi e più di 600.000 links
WALRUS Visualization tool, 2001 http://www.caida.org/tools/visualization/walrus/
Una visualizzazione [di una parte] del web
4
Una visualizzazione [di una parte] del web
5
Come trovare l'informazione in rete
6
Directories
Indici strutturati di argomenti (gestiti da una redazione)
Wikipedia
Enciclopedia collaborativa
Motori di ricerca
Query Risultati
Motori semantici
www.wolframalpha.com, …
Sistemi di Q&A sociale
Yahoo! Answer, …
Esplorazione
Browsing, serendipity
Web directories
7
http://en.wikipedia.org/wik
i/Internet_Archive
The Open Directory Project (ODP)
10
Dmoz Yahoo!
Wikipedia come strumento di ricerca
12
(http://en.wikipedia.org/wiki/Portal:Contents/Portals)
Motori di ricerca per il Web
13
Fonte:
http://www.netmarketshare.com
Motori di ricerca: struttura
16
Query
Query
Interfaccia
processing
Risultat
i
(SERP)
Ranking Indici + cached
dei risultati pages
Front-end process
Back-end process
Richiest Pagine
Crawler web
e Crawler
WWW Crawler Indicizzatore
Pagine
web
Web crawling
18
www.domain.com /
robots.t
xt
User-agent: Google
Disallow /utenti/foto
about utenti
Allow: *
Crawl-delay: 20 sec
foto
Deep vs surface Web
20
Informativa
Obiettivo: trovare un'informazione
Navigazionale
Obiettivo: trovare una pagina web, che conosco già
Risorsa
Obiettivo: trovare una risorsa (non informativa) disponibile sul
web
1
1 7
1
1
6
http://en.wikipedia.org/wiki/PageRank
Per la spiegazione dell'algoritmo: http://www.cs.cornell.edu/home/kleinber/networks-book/networks-
R.Polillo - Marzo 2014
L’algoritmo: altri criteri
28
I motori di ricerca…
setacciano periodicamente il web rintracciando le
pagine grazie ai loro contenuti
aggiornano i propri indici fotografando la realtà
documentaria in un dato momento
possono non trovare tutti i risultati utili
classificano le pagine web con criteri in gran parte non
noti
algoritmi proprietari, base di ricerca non dichiarata
x + y addizione
x – y sottrazione
x / y divisione (es. 10 / 2)
x * y moltiplicazione (es. 2 * 4)
x% of y percentuale (es. 25% of 10)
x % y resto della divisione (es. 5 % 2)
x^y elevamento a potenze (es. 2^4)
Ricerca avanzata
40
lingua
area geografica
ultimo aggiornamento
sito o dominio
posizione delle parole
formato delle pagine
diritti di utilizzo (licenza d’uso)
I campi della ricerca avanzata
43
Da ricordare
44
http://books.google.it
Consultazione gratuita di parti di volumi
http://scholar.google.it/
Nato nel 2004 per la ricerca della letteratura
accademica, sia online sia conservata in specifiche
biblioteche
documenti pubblicati o in corso di stampa
libri
tesi
atti di congressi
articoli
abstract
report tecnici
Google scholar: copertura disciplinare e fonti
49
1
2 3
4 7
5 6
http://www.google.com/trends