Cosa sono i contenuti duplicati e che effetti possono avere sul mio sito?

Un contenuto duplicato (o Duplicate Content) è quel contenuto al quale è possibile avere accesso tramite più URL e che dovrebbe quindi essere assolutamente evitato. È importante che ogni pagina di un sito sia infatti accessibile da un solo URL, altrimenti sarà Google a decidere quale tra gli URL mostrare nei Ranking e quali segnali positivi assegnare a ciascuno di essi. In questo articolo spiegheremo nel dettaglio i diversi tipi di contenuti duplicati, dandoti utili informazioni su come scoprire e risolvere il problema.

Cosa sono i contenuti duplicati?

I contenuti duplicati, abbreviati spesso con “DC” (Duplicate Content), indicano dei contenuti identici all’interno di uno o più siti. Si distingue inoltre tra contenuti duplicati interni ed esterni.

I contenuti duplicati interni possono essere creati semplicemente rendendo accessibile lo stesso contenuto attraverso più URL dello stesso sito (ad esempio con un parametro in un filtro dell’URL).

I contenuti duplicati esterni possono verificarsi quando un sito è disponibile in più versioni linguistiche, ma appare in più di una lingua all’interno di uno specifico mercato di ricerca.

Qual è la differenza tra contenuti duplicati interni ed esterni?

I contenuti duplicati interni sono limitati al livello di dominio/ nome host.

Invece i contenuti duplicati esterni sono “domain overlapping”, cioè riguardano due o più domini.

Esempi di contenuti duplicati interni

Sono spesso gli e-commerce che si trovano a combattere contro questo tipo di contenuti duplicati. Ecco un caso davvero comune in cui le pagine di dettaglio del prodotto sono accessibili senza che la categoria o il prodotto corrispondenti si trovino all’interno dell’indirizzo:

  • https://www.shop-dominio.com/categoria/paginaprodotto/paginadettaglioprodotto
  • https://www.shop-dominio.com/paginadettaglioprodotto

Non è raro che queste pagine siano indicizzate dai motori di ricerca, soprattutto quando entrambi gli URL ricevono link esterni oppure nel caso manchi una strategia efficace per i link interni.

Esempi di contenuti duplicati esterni

Molti siti possono essere raggiunti da più nomi di dominio, cosa che non causa problemi se tutte le diverse versioni indirizzano al dominio principale attraverso un Redirect 301.

Tuttavia, se non è questo il caso, Google si troverà davanti a domini differenti aventi tutti lo stesso contenuto, per cui GoogleBot potrebbe non riuscire a determinare la rilevanza di ciascuna pagina, causando problemi di posizionamento al sito.

Indice visibilità contenuti duplicati esterni
Contenuti duplicati esterni

In questo caso è chiaro che il dominio radio-sws.de è quello principale. Il suo contenuto può essere però trovato, esattamente identico, anche in altri 2 domini diversi. In questo caso si parla di contenuti duplicati esterni, in quanto esistono più nomi di dominio per un solo sito. Google non sa con certezza quale dei 3 domini sia il più rilevante, per cui li posiziona alternandoli.

Cosa non sono i contenuti duplicati

Se una parte di contenuto è disponibile in molte lingue, per esempio in tedesco e in inglese, allora non si parla di contenuto duplicato. Le citazioni o i paragrafi citati non sono identificati come contenuti duplicati.

Se citate parte di un contenuto, ricordate di usare il markup semantico corretto all’interno del codice sorgente:

<blockquote>Qui si trova un testo citato - <cite>Qui si trova l'autore o la fonte</cite></blockquote>

I contenuti duplicati sono un problema?

Sicuramente. Prima di tutto, non portano alcun valore aggiunto all’utente perché non sono unici. Inoltre, dal punto di vista di Google, possono essere paragonati ad una sorta di tentato inganno mirato ad impedire la reperibilità del miglior risultato possibile per l’utente.

Google cerca di indicizzare e visualizzare pagine contenenti informazioni distinte. […] In alcuni casi, tuttavia, i contenuti vengono deliberatamente duplicati tra i domini nel tentativo di controllare il posizionamento nei motori di ricerca o acquisire un traffico maggiore. Pratiche ingannevoli come questa possono peggiorare il servizio offerto agli utenti, i quali vedono sempre gli stessi contenuti ripetuti in un insieme di risultati di ricerca.

Fonte: Guida di Search Console

Nei casi più estremi, i contenuti duplicati potrebbero quindi portare Google a penalizzare il dominio.

I contenuti duplicati possono essere responsabili di fluttuazioni nel posizionamento nelle SERP (le pagine dei risultati), in quanto Google non comprende quale pagina offre il contenuto più rilevante per la query. Questo lo costringe ad alternare gli URL di destinazione, cercando di trovare quello più adatto. A lungo andare, questo procedimento può danneggiare i posizionamenti del dominio.

Google cerca autonomamente una soluzione ai contenuti duplicati

Quando si verifica un problema di contenuti duplicati, Google cerca d’identificare quale contenuto sia più rilevante per la ricerca effettuata dall’utente e mostra questo risultato nelle SERP.

Nella fase d’indicizzazione, Google cerca la migliore versione (URL) disponibile del contenuto, indicizzando solo quest’ultima, se possibile.

Se i Ranking e il traffico di un sito sono costanti, nonostante esso mostri problemi di contenuti duplicati e fluttuazioni nella quantità di pagine indicizzate, è probabile che il problema non sia allora così serio.

Controllare il proprio sito per verificare la presenza di contenuti duplicati

L’optimizer SISTRIX offre un’analisi automatica OnPage dei tuoi siti e mostra tutti gli errori e consigli rilevanti per la SEO. Le spiegazioni di ogni tipo di errore e le istruzioni concrete per intervenire completano l’introduzione all’ottimizzazione OnPage.

L’optimizer SISTRIX analizza i contenuti duplicati in dettaglio per ogni singolo URL e li riporta come segnalazione.

Contenuti duplicati individuati dal Toolbox SISTRIX

Cosa dice Google?

Google si preoccupa molto di indicizzare e visualizzare pagine con informazioni diverse. (...) Nei rari casi in cui sospettiamo che vengano visualizzati contenuti duplicati con l'intento di manipolare le classifiche o di ingannare i nostri utenti, effettuiamo le opportune correzioni all'indice e al ranking dei siti in questione. Di conseguenza, questi siti possono essere classificati più in basso nei risultati di ricerca o addirittura rimossi dall'indice di Google e quindi non più visualizzati nei risultati di ricerca.

Fonte: https://developers.google.com/search/docs/advanced/guidelines/duplicate-content

La nostre conclusioni

Secondo Google i contenuti duplicati non forniscono agli utenti alcun valore aggiunto e possono addirittura venire classificati come spam se i testi sono semplicemente copiati da altre pagine, ostacolando Google nei suoi sforzi per trovare il miglior risultato possibile per l’utente. I contenuti duplicati esterni non comportano sempre e sicuramente una penalizzazione da parte di Google, ma un problema persistente può causare danni duraturi al sito.

Google parla dei contenuti duplicati

Informazioni aggiuntive sull’argomento

Google

Blog di SISTRIX