Sei sulla pagina 1di 2

I contenuti du plicati

Con il termine “contenuto duplicato” si intende generalmente blocchi sostanziali di contenuto che corrispondono (sono
uguali o simili) all'interno della stessa struttura del sito o tra siti diversi.

Per ch é i motori di ric er ca p en aliz za no i con ten uti du p licati ?

In generale i motori di ricerca operano per indicizzare contenuti distinti nel tentativo di fornire agli utenti informazioni
esclusive, differenziate e rilevanti. La presenza di più siti o più pagine con lo stesso contenuto porta il motore a scartare
i risultati duplicati percependole come copie di un contenuto originale. In questa operazione, il motore opera per indivi-
duare la copia originale.
La copia ritenuta ‘contraffatta’ può essere completamente o parzialmente rimossa dall’indice dei risultati e risultare
quindi non presente nei risultati delle ricerche.

Con qu ali crit eri il motor e di ri c erc a i ndi vid ua o confr onta le p agin e?

L’algoritmo nel suo complesso non è noto, ma si può supporre che il confronto avvenga durante la scansione del te-
sto, la rilevazione delle metriche fondamentali ed il confronto del sito con altri con metriche simili (esempio, tipo di ke-
ywords e numero delle stesse, presenza e posizione delle keywords nel testo, etc.). Nel fare questo confronto il testo è
normalizzato, ossia privato di elementi grafici e di ortografia (esempio di doppi spazi, andate a capo, punteggiatura,
etc.) e dei markup (ossia elementi di codice in HTML), degli elementi di navigazione e di disturbo (immagini, banners,
css, etc).

Ci sono casi le citi d i cont enuti dupli c ati?

In generale non è possibile segnalare siti con contenuti uguali, copiati in forma lecita. In ogni caso il motore di ricerca
tenderà sempre a percepire la copia come SPAM (ossia il tentativo di aumentare la propria presenza sul web per au-
mentare la visibilità ed il traffico).

Esistono dei casi dove il contenuto duplicato è lecito, ad esempio nella versione “printer-friendly” di una pagina di con-
tenuto, o anche nella condivisione di contenuti con feed RSS.

Come co mpor tarsi n el caso si a pres en te d el cont enu t o du pli cato ?

Il modo migliore di comportarsi è sempre la redazione di testi originali. Questo permette di aumentare il posizionamento
ma anche l’autorevolezza del sito e la credibilità verso i visitatori.

via croce conta 930 ph.: 051 0546 653 email: info@neting.it
40024 - castel s. pietro terme mob.: 329 29 12 069 web: www.neting.it
bologna – italia fax: 051 0544 799
p.iva 02566791204 num. verde: 800 030615 - lun/ven-9.00/18.00

1
Nel caso sia presente del contenuto duplicato, per evitare di venire penalizzati e quindi scomparire dagli indici dei mo-
tori di ricerca, occorre implementare una serie di azioni:

1. Aiutare gli algoritmi a determinare quale sia la versione del documento che si vuole far indicizzare, per esem-
pio, disabilitando le versioni stampabili o usando espressioni regolari nel file robots.txt
2. Usare i redirect per indirizzare gli utenti verso i contenuti originali
3. Usare NO FOLLOW o NO INDEX tags sui siti che pubblicano contenuto duplicato
4. Canonizzare le pagine, indicando il sito o la pagina preferenziale. Per esempio se ci sono due pagine con lo
stesso contenuto (www.pagina1.com e www.pagina2.com) basta indicare che la seconda è una copia inse-
rendo nella head di www.pagina2.com il tag rel=canonical come segue: <link rel="canonical" href="
http://www.pagina1.com">

Come posso s cov ar e s e qu alc uno s ta co pi ando del c ontenu to dal mio sito?

Uno strumento utile per capire se qualcuno sta duplicando del contenuto è quello offerto dal sito Copyscape
(http://www.copyscape.com/) che individua contenuti duplicati registrati nelle pagine dei motori di ricerca. Un altro
strumento molto interessante è http://www.duplicatecontent.net/ che permette di confrontare due siti e fornisce una
serie di metriche per il confronto. Molti esempi di quello che potrebbero essere giudicato copia di contenuto sono mol-
to utili per la veicolazione di contenuti. Come fanno moltissimi aggregatori di blog o strumenti di condivisione dei con-
tenuti (tipico del web 2.0).

via croce conta 930 ph.: 051 0546 653 email: info@neting.it
40024 - castel s. pietro terme mob.: 329 29 12 069 web: www.neting.it
bologna – italia fax: 051 0544 799
p.iva 02566791204 num. verde: 800 030615 - lun/ven-9.00/18.00