I log del nostro sito – ottenibili solitamente da Plesk, cPanel e simili mediante un paio di semplici click – sono uno strumento molto utile, ed ampiamente sottovalutato, per ricavare dati sugli accessi e sui backlink in ingresso. Cosa ancora più interessante, sono uno strumento che contiene informazioni in merito più attendibili e, spesso, in tempo reale rispetto a quanto si legge sul Webmaster Tools e su Analytics, entrambi di Google.
Dal punto di vista SEO, in effetti, questo tipo di analisi è più annessa a skill tecnici che, ad esempio, di contenuti o di ottimizzazione globale: le informazioni che si possono ricavare dall’analisi dei log del sito possono essere utili per fornire un improvement sostanziale al sito, focalizzare la natura di eventuali penalizzazioni, individuare backlink inutili che il WMT potrebbe ignorare, oppure individuare caratteristiche interessanti dei visitatori, che ad esempio potrebbero esserci sfuggite su altri tool.
Ma cosa sono precisamente i log di un sito?
I log non sono altro che una “traccia” temporale di ciò che avviene nel sito, tipicamente ad un livello di complessità prefissato. Si tratta di file leggibili con un editor di testo ordinario che contengono, riga per riga, informazioni tecniche sulle attività tratte direttamente dal server che ospita il nostro sito.
I log tracciano quindi le attività che avvengono sul sito, sia a livello automatico (cron job) che a livello di bot e visitatori che visualizzano le nostre pagine, salvando spesso al loro interno (non sono altro che file di testo eventualmente compressi, il più delle volte) anche informazioni sul referer che ha portato la visita.
Anche se non c’è molta uniformità in merito, il formato più diffuso per i log è quello suggerito dal W3C:
remotehost rfc931 authuser [date] "request" status bytes
ovvero:
- remotehost: host remoto o indirizzo IP del client
- rfc931: logname remota dell’utente
- authuser: eventuale identificatore (username) del client
- [date]: data e ora della richiesta
- request : stringa che riporta la richiesta cosଠcome è stata formulata dal client
- status: lo status HTTP (ad esempio 404, 508, 500, 406 e via dicendo) restituito dal server relativamente alla richiesta
- bytes: la dimensione del documento inviato
Ad esempio nel nostro log potremmo trovarci una riga del genere:
127.0.0.1 user-identifier mario [01/Jun/2015:13:55:36 -0700] “GET /file.gif HTTP/1.0” 200 2266
che significa che l’utente identificato come “mario” da host locale (127.0.0.1) ha richiesto (GET) alle 13:55:36 di oggi il file file.gif (di 2266 byte di dimensione) e che il server ha risposto con uno status 200 (success).
Come accedere ai file di log
Ogni server permette l’accesso in modo diverso: sulla documentazione di Apache, uno dei server più usati, viene spiegato come accedere ai log per quanto, ai fini pratici, non venga detto molto sul “come” scaricare a queste informazioni. A livello pratico, infatti, i log sono scaricabili mediante i pannelli di controllo del nostro sito, e vedremo brevemente come farlo da Plesk e da cPanel. Vediamo nello specifico come gestire la situazione con Plesk.
Facciamo login nel pannello come al solito, ed in corrispondenza del sito che ci interessa andiamo a visualizzare le varie opzioni, come mostrato di seguito.
Tra queste, troveremo l’icona relativa ai “Registri” (log in inglese) e sarà questa la sezione che ci interessa visualizzare. All’interno, dopo averci cliccato, troveremo infatti l’elenco dei file di log del nostro sito: ci sono vari tipi di log, in effetti, ma quelli che ci servono sono solitamente due o tre.
Possiamo ad esempio visualizzare i log di errore (error_log), che contengono informazioni accurate sulle ultime pagine 404 generate: in questo modo, possiamo individuarle e correggerle prima che il crawler di Google le notifichi, ad esempio. Altro genere di informazioni, sulla falsariga del formato visto poco fa, saranno invece contenute nel log access_log, che registra tutti gli accessi al sito e che, di solito, è di dimensioni considerevoli per i siti molto visitati.
In ottica SEO possono interessare inoltre i referrer del sito, che a volte devono essere configurati preventivamente sul server, come spiegato da un post molto interessante (in inglese) di Simone Carletti; in questo caso il log assume una forma tipo
79.28.43.25 – – [25/Jan/2009:13:18:02 +0000] “GET /blog/2007/01/internet-explorer-7-in-italiano/ HTTP/1.1” 200 14487 “http://www.google.it/search?hl=it&q=aggiornamento+internet+explorer+&btnG=Cerca+con+Google&meta=&aq=f&oq=” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)”
e può essere comodo estrarre queste informazioni per disporre di veri e propri analytics personalizzati.
Per leggere i log ed analizzarli al meglio, si possono usare editor di testo come TextPad e TextWrangler, Excel oppure strumenti ad hoc free e open source come ELK o Splunk.
👇 Da non perdere 👇
- Cellulari 📱
- Informatica 🖥
- Mondo Apple 🍎
- monitoraggio servizi online 📈
- Programmare 🖥
- Reti 💻
- Scrivere 🖋
- Svago 🎈
- 💬 Il nostro canale Telegram: iscriviti
- 🔵 Spoofing di una email, spiegato bene
- 🟠 Come aprire un file .zip
- 🔴 Come fare backup di un sito in WordPress senza plugin esterni