Un sito web può essere trovato tramite la ricerca Google solo se è stato precedentemente incluso nell’indice di Google. Per questo, Googlebot esegue la scansione di miliardi di pagine ogni giorno alla ricerca di contenuti nuovi o aggiornati, assicurando che quasi tutti i siti disponibili sul web possano essere trovati tramite le pagine dei risultati di ricerca.
I webmaster hanno una certa influenza su Googlebot o sul suo processo di scansione: tra le altre cose, possono decidere quali contenuti del proprio sito dovrebbero essere inclusi nell’indice di Google e quali no.
Per facilitare a Googlebot la scansione e la comprensione del proprio sito, è importante prestare attenzione a una buona ottimizzazione OnPage, con una solida struttura della pagina (Sitemap) e dei link interni.
Tramite una scansione (o “Crawling“) vengono trovate pagine nuove o aggiornate: un crawler di Google esegue la scansione della pagina o, in altre parole, la richiede. I termini “scansione” e “indicizzazione” sono spesso utilizzati con lo stesso significato, ma in realtà (anche se strettamente correlati) trattano processi diversi.
È importante e utile conoscere i diversi sistemi utilizzati da Google per analizzare un sito, in modo da essere preparati nel caso qualcosa non funzionasse.
Video: “How Search Works”
Una spiegazione di circa cinque minuti (in inglese) di come funziona la ricerca su Google: