I filtri Upload hanno rimodellato il dibattito pubblico che circonda la direttiva sul copyright dell’Unione Europea, facendo naufragare un’altra normativa: la cosiddetta Copyright Law for Press Publishers. Abbiamo voluto verificare quanto sono effettivamente rilevanti tali contenuti per Google, ed il risultato dimostra che la parte più importante del suo business non viene realizzata grazie agli editori.
Il tema della Copyright Law for Press Publishers ha raggiunto l’Europa nell’ambito della nuova direttiva dell’UE relativa al diritto d’autore. Si tratta di una normativa proposta dal governo tedesco che richiede, tra le altre cose, di coprire gli Snippet relativi a contenuti di natura giornalistica con una licenza, costringendo Google a pagare gli editori.
Per capire quanto tali contenuti siano importanti per Google, abbiamo deciso di verificare ed analizzare le nostre banche dati per individuare la dimensione e la rilevanza di questo settore nei risultati di ricerca. I dati seguenti si riferiscono unicamente all’Italia.
La nostra analisi dei dati
Siamo partiti con il definire quali risultati di ricerca sarebbero interessati da questa normativa. Non esistendo una lista pubblica e vincolante, abbiamo deciso di considerare tutti quei domini che hanno pubblicato almeno cinque articoli durante l’ultima settimana su Google News.
Da questa lista abbiamo poi mantenuto solo quelli di cui almeno la metà dei contenuti tratta temi giornalistici, rimanendo con 1.645 domini come base per l’analisi seguente.
Solo lo 0,75% delle query di ricerca commerciali sono di natura giornalistica
Per cominciare volevamo naturalmente capire quanto siano rilevanti le query di ricerca attinenti a contenuti di natura giornalistica da cui Google ottiene dei guadagni (la sezione News non contiene alcun annuncio).
Abbiamo quindi analizzato quali domini della lista si posizionavano con almeno cinque risultati (nel totale dei dieci) all’interno della pagina dei risultati organici, prendendone in considerazione la quantità di query. Inoltre, abbiamo valutato per quanti di essi fosse mostrata anche della pubblicità (Google Ads o Google Shopping) per verificare il valore di tale query per Google.
Il risultato che ci siamo trovati davanti si è rivelato estremamente basso: dei circa 9 milioni (precisamente 9.134.568) delle query analizzate, solo 68.282 di esse erano di natura giornalistica e mostravano anche annunci. Da qui si deduce che solo lo 0,75% delle query giornalistiche sono anche commercialmente rilevanti per Google.
L’8,18% delle query sono di natura giornalistica
Il secondo punto dell’analisi mirava a capire quante query offrono contenuti giornalistici su Google. Per farlo, abbiamo misurato la quantità di query per le quali i domini della lista si posizionano in almeno cinque risultati dei dieci totali nella prima pagina di Google.
Si tratta di 747.562 query su 9 milioni, indicandoci che l’8,18% delle query di Google è di natura giornalistica. Attuando la stessa valutazione, ma prendendo in considerazione non cinque, bensì sette risultati nella prima pagina, la percentuale si riduce al 2,81%.
Il 15,59% dei risultati totali deriva da domini giornalistici
Per concludere volevamo sapere quanti risultati derivano da domini giornalistici. In totale abbiamo valutato circa 160 milioni di risultati di Google (per essere precisi, 162.711.161), in modo da avere un’immagine rappresentativa del comportamento di ricerca in Italia su google.it.
Di questi 160 milioni, circa 25 milioni di risultati (o meglio 25.368.454) derivavano dalla lista dei domini della lista precedente. Da qui si può dedurre che, sulla base della nostra analisi di dati, al momento il 15,59% dei risultati di Google sarà interessato dalla nuova normativa dell’UE.
I 50 domini giornalistici più grandi su Google occupano da soli il 6,71% dei risultati, risultando per la maggior parte quelli più colpiti.
Conclusione
La cosiddetta Copyright Law for Press Publishers esiste in Germania dal 2013 e non ha costretto Google a pagare le testate giornalistiche per la licenza degli Snippet. In Spagna una direttiva analoga ha comportato la sospensione di Google News e di molti servizi simili, causando una perdita di traffico per una notevole percentuale di editori più piccoli (studio) e portando le grandi testate giornalistiche come El Pais a schierarsi pubblicamente contro questa normativa.
Il controllo completo sull’indicizzazione dei risultati nelle pagine di ricerca di Google è già possibile oggi. Ogni Webmaster ha il potere di vietare completamente l’indicizzazione (robots.txt) o di modificare, anche in modo granulare e individuale, gli Snippet di ogni documento (meta robots).
Tuttavia nessuno è ancora riuscito a fare la quadratura del cerchio: non è possibile avere una lista di Snippet nelle pagine dei risultati di Google, per approfittare dei visitatori, e allo stesso tempo ottenere una licenza per gli stessi. Sulla base della nostra valutazione è palese che i contenuti di natura giornalistica non sono commercialmente rilevanti per Google, per cui, eventualmente, egli potrebbe anche decidere di rinunciarvi all’interno delle pagine dei risultati.