Che cos’è il data mining (in parole semplici) Scoprire uno dei concetti chiave dell'informatica di oggi

<span class="entry-title-primary">Che cos’è il data mining (in parole semplici)</span> <span class="entry-subtitle">Scoprire uno dei concetti chiave dell'informatica di oggi</span>

Noto ufficialmente con il termine Knowledge Discovery from Data (o in sigla, KDD), il data mining corrisponde ad un processo di scoperta di pattern, temi o tendenze all’interno di grosse quantità di dati, per le quali ovviamente non siano note effettive utilità in precedenza. Scoprire pattern utili non è nulla di realmente nuovo, in quanto parla di data mining almeno dagli anni ’70, ed il termine ha dovuto attendere circa un ventennio prima che riuscisse a consolidarsi.

Scoprire pattern riconoscibili o particolarità all’interno di dataset disordinati è alla base di operazioni di vario genere e tipologia, tra cui diagnosi mediche assistite, rilevazione di contenuti interessanti sul web, prevenzione del terrorismo, determinazione di campagne di marketing mirate e molto altro ancora.

Le applicazioni di data mining permettono, a vari livello, di trovare risposte a domande del tipo:

Pubblicità
  • web marketing: come si presenta un cliente “tipico”?
  • medicina: quali tipi di analisi cliniche sono più a rischio di altre?
  • settore finanziario e bancario: quali transazioni su carta di credito potrebbero rivelarsi fraudolente?

Si lavora su grossi raggruppamenti di dati, quindi, con lo scopo di ricavarne (mining in questo senso) informazioni utili. A fare uso delle tecniche di data mining vi sono soprattutto le aziende che lavorano nel settore della finanza e del marketing, e che tendono ad utilizzarlo allo scopo di effettuare profilazione dei clienti o degli utenti dei social. Se ad esempio avete ricevuto offerte personalizzate nella vostra email da parte di grossi retailer, è plausibile che siano stati generati attraverso tecniche di data mining, la cui matematica sottostante è tipicamente complessa e raggruppabile in varie tipologie (apprendimento supervisionato, machine learning, ecc.). Molto probabilmente anche Google fa uso di tecniche di data mining (e del concetto di coda lunga, tra l’altro) per estrarre i dati più importanti dalle pagine web ed indirizzare gli utenti pubblicità mirata, o stabilire quali siano i trend del momento. Il colosso Netflix, del resto, non dovrebbe essere da meno: mediante data mining probabilmente suggerisce i film e le serie TV da vedere per gli utenti sulla base delle precedenti preferenze e visioni effettuate.

Il data mining è un insieme di strategie ed algoritmi basati su una complessa matematica, e che permette utilizzi anche poco etici dei dati: profilazione degli utenti, classificazione in base alle preferenze, schedatura di massa, tendenza all’acquisto e molto altro ancora. In genere ciò si riflette in una tendenza, da parte di molte società informatiche, a salvare tutti i dati disponibili e non solo quelli prettamente necessari: una particolare forma di “persistenza” (noto anche come first use) dei dati che spesso nasconde possibilità future ancora da scoprire disponendo, nel tempo, dell’adeguato know-how.

In genere alla base del data mining esiste un processo di tipo predittivo, che può essere esplicato ed affrontato attraverso varie tecniche. Senza scendere in dettagli su cui mi pare opportuno approfondire altrove, tecniche classiche di data mining sono ad esempio:

  • riconoscimento di pattern
  • reti Bayesiane
  • reti neurali
  • alberi di classificazione (classification tree)
Ti piace questo articolo?

1 voto

Su Trovalost.it puntiamo sulla qualità dei contenuti da quando siamo nati: la tua sincera valutazione può aiutarci a migliorare ogni giorno.

Che cos’è il data mining (in parole semplici)

Votato 8 / 10, da 1 utenti