I log del nostro sito – ottenibili solitamente da Plesk, cPanel e simili mediante un paio di semplici click – sono uno strumento molto utile, ed ampiamente sottovalutato, per ricavare dati sugli accessi e sui backlink in ingresso. Cosa ancora più interessante, sono uno strumento che contiene informazioni in merito più attendibili e, spesso, in tempo reale rispetto a quanto si legge sul Webmaster Tools e su Analytics, entrambi di Google.
Dal punto di vista SEO, in effetti, questo tipo di analisi è più annessa a skill tecnici che, ad esempio, di contenuti o di ottimizzazione globale: le informazioni che si possono ricavare dall’analisi dei log del sito possono essere utili per fornire un improvement sostanziale al sito, focalizzare la natura di eventuali penalizzazioni, individuare backlink inutili che il WMT potrebbe ignorare, oppure individuare caratteristiche interessanti dei visitatori, che ad esempio potrebbero esserci sfuggite su altri tool.
Ma cosa sono precisamente i log di un sito?
I log non sono altro che una “traccia” temporale di ciò che avviene nel sito, tipicamente ad un livello di complessità prefissato. Si tratta di file leggibili con un editor di testo ordinario che contengono, riga per riga, informazioni tecniche sulle attività tratte direttamente dal server che ospita il nostro sito.
I log tracciano quindi le attività che avvengono sul sito, sia a livello automatico (cron job) che a livello di bot e visitatori che visualizzano le nostre pagine, salvando spesso al loro interno (non sono altro che file di testo eventualmente compressi, il più delle volte) anche informazioni sul referer che ha portato la visita.
Anche se non c’è molta uniformità in merito, il formato più diffuso per i log è quello suggerito dal W3C:
remotehost rfc931 authuser [date] "request" status bytes
ovvero:
- remotehost: host remoto o indirizzo IP del client
- rfc931: logname remota dell’utente
- authuser: eventuale identificatore (username) del client
- [date]: data e ora della richiesta
- request : stringa che riporta la richiesta cosଠcome è stata formulata dal client
- status: lo status HTTP (ad esempio 404, 508, 500, 406 e via dicendo) restituito dal server relativamente alla richiesta
- bytes: la dimensione del documento inviato
Ad esempio nel nostro log potremmo trovarci una riga del genere:
127.0.0.1 user-identifier mario [01/Jun/2015:13:55:36 -0700] “GET /file.gif HTTP/1.0” 200 2266
che significa che l’utente identificato come “mario” da host locale (127.0.0.1) ha richiesto (GET) alle 13:55:36 di oggi il file file.gif (di 2266 byte di dimensione) e che il server ha risposto con uno status 200 (success).
Come accedere ai file di log
Ogni server permette l’accesso in modo diverso: sulla documentazione di Apache, uno dei server più usati, viene spiegato come accedere ai log per quanto, ai fini pratici, non venga detto molto sul “come” scaricare a queste informazioni. A livello pratico, infatti, i log sono scaricabili mediante i pannelli di controllo del nostro sito, e vedremo brevemente come farlo da Plesk e da cPanel. Vediamo nello specifico come gestire la situazione con Plesk.
Facciamo login nel pannello come al solito, ed in corrispondenza del sito che ci interessa andiamo a visualizzare le varie opzioni, come mostrato di seguito.
Tra queste, troveremo l’icona relativa ai “Registri” (log in inglese) e sarà questa la sezione che ci interessa visualizzare. All’interno, dopo averci cliccato, troveremo infatti l’elenco dei file di log del nostro sito: ci sono vari tipi di log, in effetti, ma quelli che ci servono sono solitamente due o tre.
Possiamo ad esempio visualizzare i log di errore (error_log), che contengono informazioni accurate sulle ultime pagine 404 generate: in questo modo, possiamo individuarle e correggerle prima che il crawler di Google le notifichi, ad esempio. Altro genere di informazioni, sulla falsariga del formato visto poco fa, saranno invece contenute nel log access_log, che registra tutti gli accessi al sito e che, di solito, è di dimensioni considerevoli per i siti molto visitati.
In ottica SEO possono interessare inoltre i referrer del sito, che a volte devono essere configurati preventivamente sul server, come spiegato da un post molto interessante (in inglese) di Simone Carletti; in questo caso il log assume una forma tipo
79.28.43.25 – – [25/Jan/2009:13:18:02 +0000] “GET /blog/2007/01/internet-explorer-7-in-italiano/ HTTP/1.1” 200 14487 “http://www.google.it/search?hl=it&q=aggiornamento+internet+explorer+&btnG=Cerca+con+Google&meta=&aq=f&oq=” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)”
e può essere comodo estrarre queste informazioni per disporre di veri e propri analytics personalizzati.
Per leggere i log ed analizzarli al meglio, si possono usare editor di testo come TextPad e TextWrangler, Excel oppure strumenti ad hoc free e open source come ELK o Splunk.
👇 Da non perdere 👇
- 📈 Analizza Cellulari 📱
- 🔐 AI che dolor, Chat 🏴
- 🎯 Targetizza Database SQL 🗄
- 📊 Analizza Errori più comuni 📛
- 🚧 Costruisci Evergreen 📟
- 👩💻 Programma Gratis 🎉
- 💻 Configura Hosting a confronto 💑
- 🔒 Conosci Hosting reti e domini 💻
- 👩💻 Tapioca Informatica 🖥
- 💻 Iconizza Internet 💻
- 🔒 Gestisci Lavoro 🔧
- 💡 Mostra Marketing & SEO 🌪
- 🔑 Apprendi Meteo ⛅
- 🤯 Visiona Mondo Apple 🍎
- 🔍 Supervisiona Mondo Domini 🌐
- 🚀 Metti in cloud monitoraggio servizi online 📈
- 🔮 Anatomizza Nuove tecnologie 🖥
- 🔒 Antani PEC e firma digitale 📩
- 👀 Prematura Programmare 🖥
- 🎮 Lonfa Scrivere 🖋
- 🔒 Conosci Servizi di SMS 📶
- 👀 Guarda Sicurezza informatica e privacy digitale 🖥
- 🎮 Ricorda Siti web 🌎
- 🤖 Ottimizza Spiegoni artificiali 🎓
- 🧠 Neuralizza Svago 🎈
- 📡 Quantizza Usare Excel 🌀
- 🤖 Sovrascrivi Windows 😲
- 🎨 Personalizza Wireless 🚁
- 🔑 Decifra WordPress 🤵
- 💬 Il nostro canale Telegram: iscriviti
- 🟢 Guida pratica alla scelta dell’hosting
- 🟢 Come aggiornare un tema WordPress
- 🔴 Quiz patente – Conosci la segnaletica?