In questo articolo vedremo come sia possibile spingere o indurre Google a ripassare su un URL a nostra scelta: come diretta conseguenza, i contenuti di quell’URL verranno reindicizzati (ammesso che ci siano le pre-condizioni perchè ciò possa avvenire senza errori, ovviamente). Andiamo per ordine e vediamo tutto, pertanto.
Metodo funzionante per indicizzare l’URL di un sito
Bisogna:
- accedere alla Search Console del sito (solo i proprietari del dominio possono farlo);
- cercare la proprietà corrispondente al sito;
- copia-incollare in alto l’URL o indirizzo internet completo che si desidera indicizzare;
- premere invio
- non appena appare un messaggio di conferma, clicca su Richiesta di indicizzazione
- l’URL sarà indicizzato dopo pochi minuti, in genere.
Il messaggio di conferma può essere l’URL si trova in Google (per cui stiamo re-indicizzando una pagina aggiornata da poco, ad esempio), oppure può essere L’URL non si trova in Google, se è la prima volta che provate ad indicizzare quella pagina.
Gestione del crawl budget – Non serve in genere indicizzare tutte le pagine: basta farlo con quelle fondamentali come pagine, articoli e home page. Le pagine di archivio categorie e tage è bene indicizzarle ma nei siti piccoli se ne potrebbe anche fare a meno, in genere.
Se l’URL non fosse indicizzabile devi cercare di capire perchè accade, come spiegato in seguito.
Come funziona l’indicizzazione dei siti
Quando pubblichiamo un sito web la prima cosa che vogliamo fare, ovviamente, è quella di farlo apparire nei risultati di ricerca di Google: per fare questo, in effetti, non serve fare solitamente nulla di particolare. La cosa essenziale è che il vostro sito sia fatto a regola d’arte, sia privo di errori lato server e che tutte le pagine più importanti da indicizzare siano opportunamente collegate dalla struttura del sito (menà¹, link interni, widget, ecc.).
Nello specifico, perchè una pagina web sia indicizzabile devono in genere verificarsi una delle seguenti condizioni:
- la pagina deve restituire un codice server 200 OK
- la pagina deve deve essere scaricabile secondo le indicazioni del robots.txt
- la pagina deve contenere un meta tag robots con valore INDEX (o, al limite, non contenere affatto questo meta tag);
A livello pratico cosa significhi è presto detto:
Usa il codice
189ed7ca010140fc2065b06e3802bcd5
per ricevere 5 € dopo l'iscrizione
- Per verificare il codice restituito dal nostro sito si usa in genere httpstatus.io o tool simili
- Per verificare le condizioni del robots.txt basta aprire nomedelvostrosito.it/robots.txt (se il file non fosse presente, varrebbe come “semaforo verde” e non porrebbe quindi alcun impedimento alla scansione)
- Per verificare i meta tag robots basta visualizzare il sorgente e verificare che sia presente qualcosa del genere (le varie forme di meta tag robots sono discusse qui):
<meta name="robots" content="INDEX" />
Per quanto riguarda un discorso di completezza lato SEO, è anche opportuno che nel sito sia presente una mappa del sito o sitemap, generalmente reperibile come nomedelvostrosito.it/sitemap.xml (se non si trova a questo indirizzo, significa che la sitemap ha un nome diverso oppure non è stata generata).
L’indicizzazione dei contenuti del nostro sito segue pertanto, di solito, un processo naturale: se il sito è ben fatto ed il server configurato a dovere, entro qualche ora, o al limite un giorno o due da quando abbiamo pubblicato il sito, ogni nuova pagina che pubblichiamo e che rispetti determinati requisiti (sia scansionabile, sia presente nel feed RSS e/o nella sitemap XML del sito) sarà automaticamente acquisita dai motori di ricerca.
Che cosa impedisce l’indicizzazione dei siti?
Di fatto, quello che blocca l’indicizzazione del vostro sito la prima volta è di solito legato:
- a siti fatti male tecnicamente (e qui spesso la cosa migliore è buttare gi๠il sito e rifarlo da zero);
- a problemi sull’hosting del sito (pagine web che vengono caricate in modo parziale o non vengono caricate, tempi troppo lunghi di caricamento per problemi sul server e cosଠvia);
- alla presenza impropria di meta tag robots noindex e/o nofollow
- a direttive restrittive nel file robots.txt che impediscono a Google di scaricare la pagina.
Ci sono casi, tuttavia, in cui questo non accade: nella mia esperienza può capitare un ritardo di diversi giorni, per una sorta di effetto sandbox o, detta diversamente, un “rallentamento” dell’indicizzazione di alcune pagine. Questo, secondo alcuni (me incluso), avviene soprattutto per le chiavi di ricerca più concorrenziali, proprio al fine di evitare o limitare il fenomeno dello spamdexing (spam dei motori di ricerca). Questo avviene anche su siti web ben realizzati ed impeccabile tecnicamente, probabilmente come misura di analisi preventiva affinchè si eviti di indicizzare siti inutili di spam o keyword stuffing.
Richiedere la scansione di una pagina a Google
Nel caso in esame, tuttavia, le cose sono più semplici, e cosଠcercheremo di mantenerle nel seguito: se (caso tipico) gli ultimi articoli del vostro blog non venissero indicizzati, potete tentare una indicizzazione “mirata” mediante Search Console. Ovviamente prima di farlo dovrete assicurarvi che il vostro sito funzioni, che non restituisca errori e che le pagine vengano caricate, in media, in meno di 1 o 2 secondi al massimo (limite orientativo pratico anche piuttosto permissivo: secondo Google il tempo medio di caricamento di una pagina dovebbe essere di soli 200 ms)
Per verificare se una pagina o un sito è indicizzato, cerca su Google site:nometuosito.com oppure cerca direttamente l’URL che non ti sembra indicizzato correttamente nella casella di ricerca. In alternativa, leggi la guida contro le penalizzazioni per saperne di più.
Come chiedere a Google di indicizzare un sito (o una pagina)
Storicamente (e NON è un modo consigliato oggi) questa operazione si può effettuare da una storica pagina di Google, quella del submit di un sito:
Questo servizio non è mai stato ufficialmente dismesso negli anni, ma non è raccomandabile di eseguire l’operazione di indicizzazione mediante esso. Questo perchè non avremmo alcun controllo sul processo di sottoposizione, indicizzazione e posizionamento, quindi invieremmo il sito senza avere alcun feedback successivo, quando oggi esistono strumenti più moderni per fare questa operazione – e ne vedremo subito uno, gratuito ed ufficialmente supportato da Google.
Come prima cosa sarà necessario registrare il nostro sito sulla Search Console di Google, ovvero andremo ad inserire l’indirizzo del nostro sito web all’interno dei siti che controlliamo nella SC stessa. Dopo aver fatto questo ed aver validato il sito con file HTML fornito da Google, via DNS oppure con il meta tag HTML sempre fornito da Google, saremo pronti a cominciare la nostra avventura.
- Apriamo la Search Console, facciamo login con Gmail ed andiamo a scegliere l’indirizzo del sito che ci interessa verificare o indicizzare. In questa accezione possiamo ovviamente solo far indicizzare siti web di cui abbiamo il controllo (in proprietà o in delega) sulla Search Console stessa, diversamente si potrebbe fare pure ma, per il momento, restiamo sul pezzo.
- Inseriamo nella casella di testo al centro, in alto, l’URL che ci interessa indicizzare.
- La ricerca potrà avere esito positivo, ed in questo caso vedremo un messaggio in verde che ci dice che è tutto ok. Potrà avere anche esito parziale (in giallo), ed in qeusto caso saranno presenti azioni da intraprendere. Potrà infine essere in grigio, il che vuol dire che l’URL non è noto a Google.
- Per forzare l’indicizzazione, facciamo click su RICHIESTA DI INDICIZZAZIONE: Google farà un check di verifica e, se tutto è ok, ci dirà che lo è, e confermeremo l’operazione (dopo qualche minuto l’URL dovrebbe essere presente su Google).
Fate attenzione, inoltre, ad una cosa fondamentale: il numero di invii con questa tecnica è limitato, per cui non si tratta di uno strumento di cui abusare. Per indicizzare (o tentare di farlo) il numero massimo di pagine possibili, eseguitelo sulla home (non scrivete nulla nel box testo) e spuntate l’opzione “Esegui la scansione di questo URL e dei relativi link diretti“.
Se 1) il sito è ben strutturato come link interni e navigazionali, e 2) se non ci sono direttive noindex inserite in modo scorretto, dovreste riuscire a forzare la reindicizzazione globale del sito – che comunque rimane un “caso limite”, neanche troppo comune nella mia esperienza. Il più delle volte è meglio reindicizzare singole pagine importanti, ma questo soltanto se avete fatto modifiche di rilievo alla pagina o se la stessa sembra “invisibile” a Google.
La cosa davvero interessante che ho osservato, in questi casi, è che l’acquisizione nell’indice è in molti casi instantanea: questo permette di caricare la vostra pagina, ammesso che ci siano le condizioni per farlo, in modo diretto all’interno di Google e renderla immediatamente ricercabile.
👇 Contenuti da non perdere 👇
- Domini Internet 🌍
- Gratis 🎉
- Informatica 🖥
- intelligenza artificiale 👁
- Internet 💻
- Lavoro 🔧
- Reti 💻
- Sicurezza & Privacy 👁
- 💬 Il nostro canale Telegram: iscriviti
- 🟢 Come effettuare il trasloco di una linea fissa
- 🔵 Tome AI: cos’è e come funziona
- 🔵 Come rinnovare o installare HTTPS via terminale SSH [Let’s Encrypt]