Al momento stai visualizzando Come indicizzare un URL specifico su richiesta (Google)

Come indicizzare un URL specifico su richiesta (Google)

  • Autore dell'articolo:
  • Categoria dell'articolo:Guide

In questo articolo vedremo come sia possibile spingere o indurre Google a ripassare su un URL a nostra scelta: come diretta conseguenza, i contenuti di quell’URL verranno reindicizzati (ammesso che ci siano le pre-condizioni perchè ciò possa avvenire senza errori, ovviamente). Andiamo per ordine e vediamo tutto, pertanto.

Metodo funzionante per indicizzare l’URL di un sito

Bisogna:

  • accedere alla Search Console del sito (solo i proprietari del dominio possono farlo);
  • cercare la proprietà corrispondente al sito;
  • copia-incollare in alto l’URL o indirizzo internet completo che si desidera indicizzare;
  • premere invio
  • non appena appare un messaggio di conferma, clicca su Richiesta di indicizzazione
  • l’URL sarà indicizzato dopo pochi minuti, in genere.

Il messaggio di conferma può essere l’URL si trova in Google (per cui stiamo re-indicizzando una pagina aggiornata da poco, ad esempio), oppure può essere L’URL non si trova in Google, se è la prima volta che provate ad indicizzare quella pagina.

Pubblicità - Continua a leggere sotto :-)

Gestione del crawl budget – Non serve in genere indicizzare tutte le pagine: basta farlo con quelle fondamentali come pagine, articoli e home page. Le pagine di archivio categorie e tage è bene indicizzarle ma nei siti piccoli se ne potrebbe anche fare a meno, in genere.

Se l’URL non fosse indicizzabile devi cercare di capire perchè accade, come spiegato in seguito.

Come funziona l’indicizzazione dei siti

Quando pubblichiamo un sito web la prima cosa che vogliamo fare, ovviamente, è quella di farlo apparire nei risultati di ricerca di Google: per fare questo, in effetti, non serve fare solitamente nulla di particolare. La cosa essenziale è che il vostro sito sia fatto a regola d’arte, sia privo di errori lato server e che tutte le pagine più importanti da indicizzare siano opportunamente collegate dalla struttura del sito (menà¹, link interni, widget, ecc.).

Nello specifico, perchè una pagina web sia indicizzabile devono in genere verificarsi una delle seguenti condizioni:

  1. la pagina deve restituire un codice server 200 OK
  2. la pagina deve deve essere scaricabile secondo le indicazioni del robots.txt
  3. la pagina deve contenere un meta tag robots con valore INDEX (o, al limite, non contenere affatto questo meta tag);

A livello pratico cosa significhi è presto detto:

Pubblicità - Continua a leggere sotto :-)
Cerchi alternative a Google Adsense per il tuo sito? Prova TheMoneytizer!
Usa il codice 189ed7ca010140fc2065b06e3802bcd5 per ricevere 5 € dopo l'iscrizione

  1. Per verificare il codice restituito dal nostro sito si usa in genere httpstatus.io o tool simili
  2. Per verificare le condizioni del robots.txt basta aprire nomedelvostrosito.it/robots.txt (se il file non fosse presente, varrebbe come “semaforo verde” e non porrebbe quindi alcun impedimento alla scansione)
  3. Per verificare i meta tag robots basta visualizzare il sorgente e verificare che sia presente qualcosa del genere (le varie forme di meta tag robots sono discusse qui):
    <meta name="robots" content="INDEX" />

Per quanto riguarda un discorso di completezza lato SEO, è anche opportuno che nel sito sia presente una mappa del sito o sitemap, generalmente reperibile come nomedelvostrosito.it/sitemap.xml (se non si trova a questo indirizzo, significa che la sitemap ha un nome diverso oppure non è stata generata).

L’indicizzazione dei contenuti del nostro sito segue pertanto, di solito, un processo naturale: se il sito è ben fatto ed il server configurato a dovere, entro qualche ora, o al limite un giorno o due da quando abbiamo pubblicato il sito, ogni nuova pagina che pubblichiamo e che rispetti determinati requisiti (sia scansionabile, sia presente nel feed RSS e/o nella sitemap XML del sito) sarà  automaticamente acquisita dai motori di ricerca.

Che cosa impedisce l’indicizzazione dei siti?

Di fatto, quello che blocca l’indicizzazione del vostro sito la prima volta è di solito legato:

  1. a siti fatti male tecnicamente (e qui spesso la cosa migliore è buttare gi๠il sito e rifarlo da zero);
  2. a problemi sull’hosting del sito (pagine web che vengono caricate in modo parziale o non vengono caricate, tempi troppo lunghi di caricamento per problemi sul server e cosଠvia);
  3. alla presenza impropria di meta tag robots noindex e/o nofollow
  4. a direttive restrittive nel file robots.txt che impediscono a Google di scaricare la pagina.

Ci sono casi, tuttavia, in cui questo non accade: nella mia esperienza può capitare un ritardo di diversi giorni, per una sorta di effetto sandbox o, detta diversamente, un “rallentamento” dell’indicizzazione di alcune pagine. Questo, secondo alcuni (me incluso), avviene soprattutto per le chiavi di ricerca più concorrenziali, proprio al fine di evitare o limitare il fenomeno dello spamdexing (spam dei motori di ricerca). Questo avviene anche su siti web ben realizzati ed impeccabile tecnicamente, probabilmente come misura di analisi preventiva affinchè si eviti di indicizzare siti inutili di spam o keyword stuffing.

Richiedere la scansione di una pagina a Google

Nel caso in esame, tuttavia, le cose sono più semplici, e cosଠcercheremo di mantenerle nel seguito: se (caso tipico) gli ultimi articoli del vostro blog non venissero indicizzati, potete tentare una indicizzazione “mirata” mediante Search Console. Ovviamente prima di farlo dovrete assicurarvi che il vostro sito funzioni, che non restituisca errori e che le pagine vengano caricate, in media, in meno di 1 o 2 secondi al massimo (limite orientativo pratico anche piuttosto permissivo: secondo Google il tempo medio di caricamento di una pagina dovebbe essere di soli 200 ms)

Per verificare se una pagina o un sito è indicizzato, cerca su Google site:nometuosito.com oppure cerca direttamente l’URL che non ti sembra indicizzato correttamente nella casella di ricerca. In alternativa, leggi la guida contro le penalizzazioni per saperne di più.

Come chiedere a Google di indicizzare un sito (o una pagina)

Storicamente (e NON è un modo consigliato oggi) questa operazione si può effettuare da una storica pagina di Google, quella del submit di un sito:

https://www.google.it/intl/it/add_url.html

Questo servizio non è mai stato ufficialmente dismesso negli anni, ma non è raccomandabile di eseguire l’operazione di indicizzazione mediante esso. Questo perchè non avremmo alcun controllo sul processo di sottoposizione, indicizzazione e posizionamento, quindi invieremmo il sito senza avere alcun feedback successivo, quando oggi esistono strumenti più moderni per fare questa operazione – e ne vedremo subito uno, gratuito ed ufficialmente supportato da Google.

Come prima cosa sarà  necessario registrare il nostro sito sulla Search Console di Google, ovvero andremo ad inserire l’indirizzo del nostro sito web all’interno dei siti che controlliamo nella SC stessa. Dopo aver fatto questo ed aver validato il sito con file HTML fornito da Google, via DNS oppure con il meta tag HTML sempre fornito da Google, saremo pronti a cominciare la nostra avventura.

  1. Apriamo la Search Console, facciamo login con Gmail ed andiamo a scegliere l’indirizzo del sito che ci interessa verificare o indicizzare. In questa accezione possiamo ovviamente solo far indicizzare siti web di cui abbiamo il controllo (in proprietà  o in delega) sulla Search Console stessa, diversamente si potrebbe fare pure ma, per il momento, restiamo sul pezzo.
  2. Inseriamo nella casella di testo al centro, in alto, l’URL che ci interessa indicizzare.
  3. La ricerca potrà  avere esito positivo, ed in questo caso vedremo un messaggio in verde che ci dice che è tutto ok. Potrà  avere anche esito parziale (in giallo), ed in qeusto caso saranno presenti azioni da intraprendere. Potrà  infine essere in grigio, il che vuol dire che l’URL non è noto a Google.
  4. Per forzare l’indicizzazione, facciamo click su RICHIESTA DI INDICIZZAZIONE: Google farà  un check di verifica e, se tutto è ok, ci dirà  che lo è, e confermeremo l’operazione (dopo qualche minuto l’URL dovrebbe essere presente su Google).

Fate attenzione, inoltre, ad una cosa fondamentale: il numero di invii con questa tecnica è limitato, per cui non si tratta di uno strumento di cui abusare. Per indicizzare (o tentare di farlo) il numero massimo di pagine possibili, eseguitelo sulla home (non scrivete nulla nel box testo) e spuntate l’opzione “Esegui la scansione di questo URL e dei relativi link diretti“.

Se 1) il sito è ben strutturato come link interni e navigazionali, e 2) se non ci sono direttive noindex inserite in modo scorretto, dovreste riuscire a forzare la reindicizzazione globale del sito – che comunque rimane un “caso limite”, neanche troppo comune nella mia esperienza. Il più delle volte è meglio reindicizzare singole pagine importanti, ma questo soltanto se avete fatto modifiche di rilievo alla pagina o se la stessa sembra “invisibile” a Google.

La cosa davvero interessante che ho osservato, in questi casi, è che l’acquisizione nell’indice è in molti casi instantanea: questo permette di caricare la vostra pagina, ammesso che ci siano le condizioni per farlo, in modo diretto all’interno di Google e renderla immediatamente ricercabile.

Pubblicità - Continua a leggere sotto :-)

(Tophost) l' hosting web più economico - Usa il coupon sconto: 7NSS5HAGD5UC2

Photo by NeONBRAND on Unsplash

👇 Contenuti da non perdere 👇



Trovalost.it esiste da 4657 giorni (13 anni), e contiene ad oggi 4351 articoli (circa 3.480.800 parole in tutto) e 23 servizi online gratuiti. – Leggi un altro articolo a caso

Numero di visualizzazioni (dal 21 agosto 2024): 0
Pubblicità - Continua a leggere sotto :-)
Segui il canale ufficiale Telegram @trovalost https://t.me/trovalost
Seguici su Telegram: @trovalost

Trovalost.it

Ho creato Trovalost.it e ho scritto quasi tutti i suoi contenuti relativi all'informatica. Credits immagini: pexels.com, pixabay.com, wikipedia.org, Midjourney, StarryAI, se non diversamente specificato.