Seguici su Telegram, ne vale la pena ❤️ ➡ @trovalost
Vai al contenuto

Come analizzare i log del sito a scopo SEO

I log del nostro sito – ottenibili solitamente da Plesk, cPanel e simili mediante un paio di semplici click – sono uno strumento molto utile, ed ampiamente sottovalutato, per ricavare dati sugli accessi e sui backlink in ingresso. Cosa ancora più interessante, sono uno strumento che contiene informazioni in merito più attendibili e, spesso, in tempo reale rispetto a quanto si legge sul Webmaster Tools e su Analytics, entrambi di Google.

Dal punto di vista SEO, in effetti, questo tipo di analisi è più annessa a skill tecnici che, ad esempio, di contenuti o di ottimizzazione globale: le informazioni che si possono ricavare dall’analisi dei log del sito possono essere utili per fornire un improvement sostanziale al sito, focalizzare la natura di eventuali penalizzazioni, individuare backlink inutili che il WMT potrebbe ignorare, oppure individuare caratteristiche interessanti dei visitatori, che ad esempio potrebbero esserci sfuggite su altri tool.

Ma cosa sono precisamente i log di un sito?

I log non sono altro che una “traccia” temporale di ciò che avviene nel sito, tipicamente ad un livello di complessità  prefissato. Si tratta di file leggibili con un editor di testo ordinario che contengono, riga per riga, informazioni tecniche sulle attività  tratte direttamente dal server che ospita il nostro sito.

I log tracciano quindi le attività  che avvengono sul sito, sia a livello automatico (cron job) che a livello di bot e visitatori che visualizzano le nostre pagine, salvando spesso al loro interno (non sono altro che file di testo eventualmente compressi, il più delle volte) anche informazioni sul referer che ha portato la visita.

Anche se non c’è molta uniformità  in merito, il formato più diffuso per i log è quello suggerito dal W3C:

remotehost rfc931 authuser [date] "request" status bytes

ovvero:

  • remotehost: host remoto o indirizzo IP del client
  • rfc931: logname remota dell’utente
  • authuser: eventuale identificatore (username) del client
  • [date]: data e ora della richiesta
  • request : stringa che riporta la richiesta cosଠcome è stata formulata dal client
  • status: lo status HTTP (ad esempio 404, 508, 500, 406 e via dicendo) restituito dal server relativamente alla richiesta
  • bytes: la dimensione del documento inviato
Ti potrebbe interessare:  10 cose che ti rendono insopportabile sul luogo di lavoro

Ad esempio nel nostro log potremmo trovarci una riga del genere:

127.0.0.1 user-identifier mario [01/Jun/2015:13:55:36 -0700] “GET /file.gif HTTP/1.0” 200 2266

che significa che l’utente identificato come “mario” da host locale (127.0.0.1) ha richiesto (GET) alle 13:55:36 di oggi il file file.gif (di 2266 byte di dimensione) e che il server ha risposto con uno status 200 (success).

Come accedere ai file di log

Ogni server permette l’accesso in modo diverso: sulla documentazione di Apache, uno dei server più usati, viene spiegato come accedere ai log per quanto, ai fini pratici, non venga detto molto sul “come” scaricare a queste informazioni. A livello pratico, infatti, i log sono scaricabili mediante i pannelli di controllo del nostro sito, e vedremo brevemente come farlo da Plesk e da cPanel. Vediamo nello specifico come gestire la situazione con Plesk.

Facciamo login nel pannello come al solito, ed in corrispondenza del sito che ci interessa andiamo a visualizzare le varie opzioni, come mostrato di seguito.

Schermata 2015-06-01 alle 11.35.47

Tra queste, troveremo l’icona relativa ai “Registri” (log in inglese) e sarà  questa la sezione che ci interessa visualizzare. All’interno, dopo averci cliccato, troveremo infatti l’elenco dei file di log del nostro sito: ci sono vari tipi di log, in effetti, ma quelli che ci servono sono solitamente due o tre.

Schermata 2015-06-01 alle 12.37.07

Possiamo ad esempio visualizzare i log di errore (error_log), che contengono informazioni accurate sulle ultime pagine 404 generate: in questo modo, possiamo individuarle e correggerle prima che il crawler di Google le notifichi, ad esempio. Altro genere di informazioni, sulla falsariga del formato visto poco fa, saranno invece contenute nel log access_log, che registra tutti gli accessi al sito e che, di solito, è di dimensioni considerevoli per i siti molto visitati.

In ottica SEO possono interessare inoltre i referrer del sito, che a volte devono essere configurati preventivamente sul server, come spiegato da un post molto interessante (in inglese) di Simone Carletti; in questo caso il log assume una forma tipo

79.28.43.25 – – [25/Jan/2009:13:18:02 +0000] “GET /blog/2007/01/internet-explorer-7-in-italiano/ HTTP/1.1” 200 14487 “http://www.google.it/search?hl=it&q=aggiornamento+internet+explorer+&btnG=Cerca+con+Google&meta=&aq=f&oq=” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)”

e può essere comodo estrarre queste informazioni per disporre di veri e propri analytics personalizzati.

Ti potrebbe interessare:  Differenze tra Google.it e Google.com nei risultati di ricerca: perchè?

Per leggere i log ed analizzarli al meglio, si possono usare editor di testo come TextPad e TextWrangler, Excel oppure strumenti ad hoc free e open source come ELK o Splunk.

 

Da non perdere 👇👇👇



Questo portale esiste da 4433 giorni (12 anni), e contiene ad oggi 4016 articoli (circa 3.212.800 parole in tutto) e 12 servizi online gratuiti. – Leggi un altro articolo a caso
Non ha ancora votato nessuno.

Ti sembra utile o interessante? Vota e fammelo sapere.

Questo sito contribuisce alla audience di sè stesso.
Il nostro network informativo: Lipercubo.it - Pagare.online - Trovalost.it.