Da circa un anno il sito guardiacostiera.gov.it naviga in acque agitate: il dominio guadagna e riperde due terzi di visibilità ogni poche settimane, imboccando un trend a zigzag segno di problemi tecnici. Afferriamo il cannocchiale e vediamo insieme cosa sta succedendo.
Un naufragio digitale: la situazione attuale del dominio
Guardiacostiera.gov.it è il sito ufficiale delle capitanerie di porto e della Guardia Costiera italiana ed esiste almeno dal 2013, ma ha cominciato a guadagnare visibilità su Google a partire dal 2015, raggiungendo un massimo di circa 3 punti (paragonabile come grandezza a mulinobianco.it o enel.com).
Il sito riunisce contenuti dedicati a “la disciplina e la vigilanza su tutte le attività marittime e portuali” (fonte), tra cui i servizi per i cittadini, il personale e gli operatori marittimi, le comunicazioni relative alla pesca e alle capitanerie di porto, le normative e le regolamentazioni della sicurezza in mare, e tanto altro.
A partire da maggio 2023 il dominio ha imboccato un trend “a zigzag” che lo porta a perdere quasi l’80% della sua visibilità nelle SERP di Google nel giro di poche settimane: se il 20 novembre 2023 aveva 2,9 punti, il 18 dicembre 2023 (cioè circa 5 settimane dopo) ne aveva solo 0,7, per poi ripassare a 2,7 il 15 gennaio 2024, e così via.
Questo tipo di trend dell’Indice di Visibilità indica normalmente errori tecnici di base che non permettono a Google di posizionare a lungo termine i contenuti nelle SERP. Vediamo insieme da cosa potrebbe derivare.
Un dominio, due versioni
Già da diversi anni Google predilige siti web sicuri: la maggior parte dei domini ha quindi effettuato un passaggio da http a https. Solitamente questa migrazione interessa tutti i contenuti del sito in contemporanea, come vediamo nello screenshot qui sopra relativo a tripadvisor.it.
Il sito guardiacostiera.gov.it ha invece ancora dei contenuti in http, e quindi non crittografati (e non sicuri).
Dal confronto dell’Indice di Visibilità vediamo che non solo i due protocolli si posizionano su Google, ma che i contenuti in http (in blu nel grafico) hanno avuto finora maggiore visibilità di quelli in https (in rosso).
Gli URL del dominio erano presenti in entrambe le versioni e venivano alternati nelle SERP: qui vediamo ad esempio la visibilità dell’URL www.guardiacostiera.gov.it/servizi-al-cittadino/Pages/meteo.aspx in http e in https. Questo ciclo sembrerebbe essere stato interrotto: ora l’URL in http è completamente sparito dai ranking, e quello in https non è stato comunque posizionato al suo posto.
Questo processo ha probabilmente interessato molti altri contenuti del sito.
Analizzando gli URL posizionati un anno fa (il 24 aprile 2023) abbiamo notato che il 70% delle pagine in https erano PDF, mentre per i contenuti in html Google posizionava principalmente le versioni in http.
Nel corso dei mesi scorsi questi contenuti sono stati definitivamente spostati alla versione https usando (e qui casca l’asino) Redirect 302. Questo tipo di reindirizzamenti normalmente indica un passaggio temporaneo e non duraturo, quindi dà a Google un segnale non del tutto corretto (a meno che il sito non stia effettivamente pianificando di andare controcorrente e tornare alla versione http in futuro).
Keyword perse: contenuti duplicati, Thin Content e pagine 404
Se valutiamo i ranking persi del dominio tra il 19 febbraio e il 25 marzo 2023 (cioè subito prima e subito dopo l’ultimo crollo di visibilità) riscontriamo due tipi di problemi:
- Molte pagine sono considerabili come “Thin Content” perché contenenti liste di link a siti esterni o poche righe di testo
- Molti ranking derivavano da PDF che ora mostrano un errore 404
- Le due versioni del sito hanno comportato numerosi casi di contenuti duplicati
Quest’ultimo punto non sembrerebbe però aver intaccato troppo i ranking perché, nella maggior parte dei casi, Google è riuscito comunque a comprendere che si trattava dello stesso contenuto.
Lo vediamo dall’immagine qui sopra, che mostra i ranking del dominio per la keyword “omologazione natanti da diporto”: la versione http (URL con l’icona del lucchetto aperto) e https dell’URL sono state alternate nelle SERP, ma i ranking sono rimasti in prima pagina. La variazione maggiore è avvenuta quando si è posizionata la pagina /faq e il dominio è slittato in terza pagina di Google (posizione 21).
Problemi con il robots.txt
Se utilizziamo il comando site: per cercare su Google il sito della Guardia Costiera notiamo un fatto interessante: quasi solo il sito in http si posiziona. Gli unici risultati in https continuano ad essere solo i PDF (nonostante nel sito esistano anche contenuti testuali in html raggiungibili tramite link interni).
Se si tenta di raggiungere il robots.txt del dominio si viene reindirizzati ad un altro URL che riporta un errore 500. L’URL indica che il file si trova nella versione http del dominio, che però non è raggiungibile.
Anche questo problema però non dovrebbe essere il colpevole della perdita di visibilità perché, in teoria, nei casi in cui il robots.txt non risulta disponibile Googlebot lo ignora e scansiona semplicemente l’intero sito:
Se il file robots.txt non è raggiungibile per più di 30 giorni, Google utilizzerà l’ultima copia del file memorizzata nella cache. Se non è disponibile, Google presume che non vi siano restrizioni di scansione.
Google Search Central
Canonical e Redirect: Googlebot in un loop?
Se però apriamo gli URL che hanno perso completamente visibilità e ranking, notiamo che molti di essi contengono un Canonical verso la versione http, che a sua volta redireziona Googlebot (tramite Redirect 302, come abbiamo visto in precedenza) alla versione https.
In sostanza il sito indica a Google di preferire una pagina, che a sua volta reindirizza a quella di partenza.
Questo “loop” non comporta problemi per gli utenti, ma non è certamente un buon segnale per Googlebot, soprattutto se ripetuto su molte pagine del sito.
I PDF, non avendo Canonical ed essendo sempre stati in https, sono stati probabilmente gli unici contenuti a rimanere costanti nel tempo, e quindi hanno continuato a portare visibilità al dominio. Tuttavia, molti di essi sono attualmente diventati pagine di errore 404 e hanno a loro volta perso tutti i posizionamenti.
Conclusione
Il sito guardiacostiera.gov.it si appoggia da anni alla versione sia in http, sia in https. Sembrerebbe che da un anno a sta parte i contenuti abbiano cominciato ad essere migrati verso la versione https del sito.
È possibile che Google, fin quando possibile, abbia posizionato entrambe le versioni, alternandole nelle SERP. Ora che la versione in http sta venendo gradualmente smantellata, Googlebot non riesce a capire quali contenuti mostrare per le keyword, per cui degrada gradualmente i ranking e la visibilità all’intero dominio.
La causa di questa “confusione” potrebbe derivare da più fattori contemporanei: contenuti su web server differenti, Redirect 302 al posto dei 301, Canonical verso pagine http, errori 404, magari persino lo zampino dello Spam Update a causa di pagine con Thin Content. Si tratta di un caso studio in cui la sola analisi di un tool esterno non può spiegare l’intero background tecnico e decisionale che si nasconde dietro al sito.
Quello che importa alla fine è che gli utenti non stanno trovando i contenuti di guardiacostiera.gov.it nelle pagine dei risultati di Google.
Trattandosi di temi governativi relativi spesso a normative e regolamentazioni, è di fondamentale importanza che i cittadini possano averne accesso: il rischio è che, non trovando il dominio ufficiale, gli utenti aprano un risultato in cui sono presenti informazioni datate o non veritiere.