Sei sulla pagina 1di 4

HISTORY OF SCIENCE AND TECHNOLOGY

EUROPEAN PUPILS MAGAZINE

EUROPEAN PUPILS MAGAZINE

EUROPEAN PUPILS MAGAZINE

THE META SEARCH ENGINES AN EXTRAORDINARY RESOURCE

UNA RISORSA STRAORDINARIA:

I META MOTORI DI RICERCA

Antonino Porto

Liceo Scientifico “Enrico Boggio Lera” - www.boggiolera.it Via Vittorio Emanuele 346 – Catania, Italia - boggiolera@interbusiness.it antport@tin.it

As all navigators of Internet know, in the World Wide Web news, documents, texts and articles of all types can be found and on whatever argument, but to trace the exact resource that is looked up, owing to masses of textual information, can often be equivalent to look for a needle in a haystack. The pages published on Internet are billions, and to catch up those of interest to us in specific way would be impossible without the help of a search engine. These instruments have grown and are themselves more and more perfect of equal step with the development of the Net, and every navigator is accustomed to consult one or more search engines, those that, for his experience, he thinks more reliable. Using key-words that delimit the subject of the search and Boolean operator*, the research can be refined and we can obtain more and more accurate results:

AND: it combines two terms and restricts the search.

The phrase “coffee AND chocolate” indicates that the

pages must be tried all are those in which these words appear both;

OR: it separates two terms and enlarges the search.

The phrase “coffee OR chocolate” indicates that the pages that contain one word, the other or both, must be tried all;

Come tutti i navigatori di Internet sanno, nella rete delle reti si possono trovare notizie, documenti, saggi, articoli di tutti i tipi e su qualsiasi argomento, ma rintracciare la risorsa esatta che si sta cercando, a causa dell’enorme massa di documenti, spesso può equivalere a cercare un ago in un pagliaio. Le pagine pubblicate su Internet ammontano a miliardi, e raggiungere quelle che ci interessano in modo specifico sarebbe impossibile senza l’ausilio di un motore di ricerca. Questi strumenti sono cresciuti e si sono sempre più perfezionati di pari passo con lo sviluppo della Rete ed ogni navigatore è abituato a consultare uno o più motori di ricerca, quelli che, per sua esperienza, gli sembrano più affidabili. Servendosi di parole-chiavi che delimitano il soggetto della ricerca e degli operatori booleani*, si può raffinare l’indagine e si possono ottenere dei risultati sempre più precisi:

AND: congiunge due termini e restringe la ricerca.

L’espressione “caffè AND cioccolata” indica che devono

essere cercate tutte le pagine in cui compaiono entrambe le parole;

OR: disgiunge due termini e allarga la ricerca.

L’espressione “caffè OR cioccolata” indica che devono essere cercate tutte le pagine che contengono una parola, l’altra o entrambe;

OR cioccolata” indica che devono essere cercate tutte le pagine che contengono una parola, l’altra o

HISTORY OF SCIENCE AND TECHNOLOGY

EUROPEAN PUPILS MAGAZINE

EUROPEAN PUPILS MAGAZINE

EUROPEAN PUPILS MAGAZINE

AND NOT: it excludes the pages containing the second word: “coffee AND NOT chocolate” excludes from the search the word “chocolate”. Obviously, these terms could be represented by symbols that vary according to engines, also: we must read their instructions: i.e. if a sentence is to be find as it is written, we must use the quotations. However, also using the same keywords, different search engines show different results because of their different technologies. Everyone, in fact, bases the search on its own algorithms **, which calculates the

degree of authority and reliability of the sites, and then

a list of those addresses that obtain the higher percentage

is compiled; nearly always, therefore, we find it difficult to understand, among ten, hundred or many more addresses, which sites come up totally to our expectations. In order to solve this problem, therefore, we must consult one powerful instrument - a meta search engine

- that is able to organize the outputs of many other

search engines at the same time and then it can offer

a greater number of highly authoritative web pages

relevant and useful to our search. Among so many meta search engines available today in the web, we want to draw attention on two of them that are, in our opinion, truly useful and facilitating the search, discarding those superfluous or little readable documents in respect of the topics indicated by key- words. The next two instruments use new technologies and different indices of search, but they are much more effective and, somehow, complementary.

AND NOT: esclude le pagine che contengono la seconda parola: “caffè AND NOT cioccolata” esclude dalla ricerca la parola “cioccolata”. Ovviamente, questi operatori possono essere rappresentati anche da simboli che variano a seconda dei motori: bisogna leggerne le istruzioni. Se si vuole trovare una frase intera esattamente come è scritta bisogna usare le virgolette. Comunque, anche usando le stesse parole-chiave, con motori di ricerca diversi i risultati non sono mai uguali a causa della diversa tecnologia di cui si servono. Ciascuno, infatti, basa la ricerca su propri algoritmi**, che calcolano il grado di autorevolezza e di attendibilità

dei siti, e viene stilato un elenco a partire da quelli che ottengono la percentuale più alta; quasi sempre, perciò,

si fa fatica a comprendere, in mezzo alle decine o

centinaia di indirizzi trovati, quali siti e quali documenti rispondono pienamente alle nostre aspettative. Per risolvere questo problema bisogna consultare uno strumento ancora più potente, un “meta motore”,ovvero un motore di ricerca che è in grado di interrogare contemporaneamente più motori e di offrirci

un numero maggiore di risultati attendibili e soprattutto utili. Tra i moltissimi meta-motori disponibili oggi in rete

vogliamo segnalarne due che, a nostro giudizio, risultano veramente utili e facilitano la ricerca, scartando quei documenti che risultano superflui o poco attendibili rispetto al tema indicato dalle parole chiavi immesse. Questi due strumenti utilizzano tecnologie e indici

di ricerca differenti, ma risultano assai efficaci e, in

qualche modo, complementari.

risultano assai efficaci e, in qualche modo, complementari. www.vivisimo.com The meta-search engine www.vivisimo.com ,

www.vivisimo.com The meta-search engine www.vivisimo.com, organises documents into groups or clusters that render the consultation of links easier when they are several.

Vivisimo, in fact, just uses a heuristic algorithm ** in order to group textual documents. This algorithm is based on an ingenious idea: grouping documents showing a good, readable description in one well- defined cartel. Therefore, rather than form clusters and

www.vivisimo.com

Il primo meta-motore di ricerca www.vivisimo.com, organizza i suoi risultati in cartelle tematiche che

rendono più facile la consultazione dei link, soprattutto quando sono molti. Vivisimo, infatti, usa un proprio algoritmo** euristico per raggruppare i documenti di testo. Questo algoritmo

è basato su un principio ingegnoso: un buon gruppo di

documenti è quello che possiede una descrizione chiara

e leggibile. Così, piuttosto che formare le cartelle e poi

HISTORY OF SCIENCE AND TECHNOLOGY

EUROPEAN PUPILS MAGAZINE

EUROPEAN PUPILS MAGAZINE

EUROPEAN PUPILS MAGAZINE

then figure out how to describe them, Vivisimo forms well-described clusters grouped in different associations. No databases of web pages are stored in Vivisimo, but it organizes the search by other engines. Fully automated, it quickly finds meaningful groups that are concisely described and the specially-developed heuristic algorithm** achieves good results to find web pages, patent abstracts, scholarly publications, magazines, an so on. The layout of the page showing the results of its search is more or less this: on the left column you find the names-indexes of the cartels with the number of found sites; in the middle column you find the description of every site opened by clicking on the directory. See and try yourself to believe your eyes.

calcolare come descriverle, Vivisimo mette in ordine

al primo posto solo le cartelle ben definite. Non esiste

pertanto un database di pagine immagazzinate in Vivisimo, ma viene organizzata la ricerca sugli altri motori. In maniera pienamente automatizzata vengono trovati rapidamente i gruppi significativi descritti concisamente e l’innovativo algoritmo**, cui abbiamo

accennato, riesce a raggiungere degli ottimi risultati nel raggruppamento di pagine web, riassunti, pubblicazioni scolastiche, riviste, ecc. La pagina dei risultati si presenta così:

la

colonna sinistra contiene i nomi-indice delle cartelle

di

raggruppamento con il numero di siti raccolti; quella

al

centro riporta la descrizione sintetica e ordinata del

contenuto dei siti e dei documenti di ogni cartella man mano che questa viene aperta.

documenti di ogni cartella man mano che questa viene aperta. www.teoma.com The second meta-engine , www.teoma.com

www.teoma.com

The second meta-engine, www.teoma.com, uses the same research style from many sites, but ordering the results in a different way. Teoma offers three kinds of grouping:

- Results: list the very useful pages through the key- words only;

- Refine: suggestions to narrow the research for

particular topics;

- Resources: web pages created by experts or other surfers, containing lists of links.

The layout of the results page is this: on the left you find the most useful found sites; on the top right the most useful addresses to refine the search, and below you can find the most useful links for your purposes.

We can say that Internet is an instrument to research useful documents using many ways: it offers a lot of information always updated; it connects us to the world; it gives you the possibility to work staying at home or at school; it gives more recent news than the books or the magazines. Remember what it is necessary to know:

- To find the right results you have to learn the tricks we wrote about before;

www.teoma.com

Il secondo meta motore, www.teoma.com, si serve anch’esso della consultazione in contemporanea di

diversi motori di ricerca, ma utilizza una diversa tecnica

di raggruppamento dei risultati. Teoma, infatti, offre tre tipi di raggruppamenti di

risposte alle parole chiavi immesse:

Results: elenco di pagine altamente autorevoli attinenti alla ricerca; Refine: suggerimenti per circoscrivere la ricerca a temi specifici; Resources: pagine web che contengono raccolte di link sui soggetti generali attinenti alla ricerca. Queste sono compilate da esperti o appassionati di tutto il mondo. La pagina dei risultati della ricerca è ordinata in questo modo:

la colonna sinistra riporta gli indirizzi dei siti più

autorevoli trovati; la colonna destra in alto suggerisce gli indirizzi più utili per il raffinamento della ricerca e in basso riporta le collezioni di link sui vari generi di soggetti generali scovati.

HISTORY OF SCIENCE AND TECHNOLOGY

EUROPEAN PUPILS MAGAZINE

OF S CIENCE AND T ECHNOLOGY EUROPEAN PUPILS MAGAZINE - You have to know English well
OF S CIENCE AND T ECHNOLOGY EUROPEAN PUPILS MAGAZINE - You have to know English well

- You have to know English well to use internet in the best way;

- Everyone can publish a web site, then, be sure in the evaluation when visiting each site;

- You can always find the best information in the

traditional documents, like books and magazines.

in the traditional documents, like books and magazines. * - it is a symbol of mathematical
in the traditional documents, like books and magazines. * - it is a symbol of mathematical

* - it is a symbol of mathematical logic.

** - Algorithm comes from Arab al - Khuwarizmi and is a group of commands useful to one executor (a human or a machine) to operate to solve a specific kind of problem.

a machine) to operate to solve a specific kind of problem. In conclusione, possiamo dire che

In conclusione, possiamo dire che Internet è uno

strumento di ricerca dalle molteplici risorse: offre una vastissima gamma di informazioni ed è in continua espansione; ci collega con tutto il mondo; permette di lavorare senza muoversi da casa o da scuola; per la sua natura dà accesso ad informazioni più aggiornate di quelle fornite da riviste o libri. Bisogna ricordare però che:

- per ottenere le informazioni che servono bisogna imparare le tecniche di cui abbiamo parlato;

- per sfruttare pienamente le risorse di Internet è bene conoscere le lingue straniere, soprattutto l’inglese;

- chiunque può aprire un sito, dunque la valutazione

della qualità e serietà dell’informazione è ancora più importante che per le fonti tradizionali;

- non sempre la rete è lo strumento più adatto ad una

ricerca: non bisogna dimenticare le fonti tradizionali, soprattutto libri e riviste specializzati.

* Simboli della logica matematica.

** Un Algoritmo (che prende nome dal matematico arabo al - Khuwarizmi) si definisce in modo intuitivo come un complesso di ordini espressi con un numero finito di parole, tali che rendano possibile ad un esecutore, uomo o macchina, al quale vengano forniti i dati di ingresso individuanti il problema in questione, di operare per la risoluzione del problema stesso.