Seguici su Telegram, ne vale la pena ❤️ ➡ @trovalost
Vai al contenuto

Che cos’è il data mining (in parole semplici)


Cerchi un hosting economico per il tuo sito o blog? Tophost ti aspetta (clicca qui)

Noto ufficialmente con il termine Knowledge Discovery from Data (o in sigla, KDD), il data mining corrisponde ad un processo di scoperta di pattern, temi o tendenze all’interno di grosse quantità  di dati, per le quali ovviamente non siano note effettive utilità  in precedenza. Scoprire pattern utili non è nulla di realmente nuovo, in quanto parla di data mining almeno dagli anni ’70, ed il termine ha dovuto attendere circa un ventennio prima che riuscisse a consolidarsi.


Cerchi un hosting economico per il tuo sito o blog? Tophost ti aspetta (clicca qui)

Scoprire pattern riconoscibili o particolarità  all’interno di dataset disordinati è alla base di operazioni di vario genere e tipologia, tra cui diagnosi mediche assistite, rilevazione di contenuti interessanti sul web, prevenzione del terrorismo, determinazione di campagne di marketing mirate e molto altro ancora.


Cerchi un hosting economico per il tuo sito o blog? Tophost ti aspetta (clicca qui)

Le applicazioni di data mining permettono, a vari livello, di trovare risposte a domande del tipo:

  • web marketing: come si presenta un cliente “tipico”?
  • medicina: quali tipi di analisi cliniche sono più a rischio di altre?
  • settore finanziario e bancario: quali transazioni su carta di credito potrebbero rivelarsi fraudolente?

Si lavora su grossi raggruppamenti di dati, quindi, con lo scopo di ricavarne (mining in questo senso) informazioni utili. A fare uso delle tecniche di data mining vi sono soprattutto le aziende che lavorano nel settore della finanza e del marketing, e che tendono ad utilizzarlo allo scopo di effettuare profilazione dei clienti o degli utenti dei social. Se ad esempio avete ricevuto offerte personalizzate nella vostra email da parte di grossi retailer, è plausibile che siano stati generati attraverso tecniche di data mining, la cui matematica sottostante è tipicamente complessa e raggruppabile in varie tipologie (apprendimento supervisionato, machine learning, ecc.). Molto probabilmente anche Google fa uso di tecniche di data mining (e del concetto di coda lunga, tra l’altro) per estrarre i dati più importanti dalle pagine web ed indirizzare gli utenti pubblicità  mirata, o stabilire quali siano i trend del momento. Il colosso Netflix, del resto, non dovrebbe essere da meno: mediante data mining probabilmente suggerisce i film e le serie TV da vedere per gli utenti sulla base delle precedenti preferenze e visioni effettuate.

Ti potrebbe interessare:  Come la tecnologia ha rivoluzionato l’esperienza gastronomica negli aeroporti: smart ordering, applicazioni e realtà virtuale

Il data mining è un insieme di strategie ed algoritmi basati su una complessa matematica, e che permette utilizzi anche poco etici dei dati: profilazione degli utenti, classificazione in base alle preferenze, schedatura di massa, tendenza all’acquisto e molto altro ancora. In genere ciò si riflette in una tendenza, da parte di molte società  informatiche, a salvare tutti i dati disponibili e non solo quelli prettamente necessari: una particolare forma di “persistenza” (noto anche come first use) dei dati che spesso nasconde possibilità  future ancora da scoprire disponendo, nel tempo, dell’adeguato know-how.

In genere alla base del data mining esiste un processo di tipo predittivo, che può essere esplicato ed affrontato attraverso varie tecniche. Senza scendere in dettagli su cui mi pare opportuno approfondire altrove, tecniche classiche di data mining sono ad esempio:

  • riconoscimento di pattern
  • reti Bayesiane
  • reti neurali
  • alberi di classificazione (classification tree)

Da non perdere 👇👇👇



Questo sito esiste da 4440 giorni (12 anni), e contiene ad oggi 4024 articoli (circa 3.219.200 parole in tutto) e 12 servizi online gratuiti. – Leggi un altro articolo a caso
Non ha ancora votato nessuno.

Ti sembra utile o interessante? Vota e fammelo sapere.

Questo sito contribuisce alla audience di sè stesso.
Il nostro network informativo: Lipercubo.it - Pagare.online - Trovalost.it.