Oltre i Big data: cosa sono davvero e perchè possono essere utili

Pubblicato in GuideTaggato
Pubblicato il: 21-05-2021 09:59

I big data rientrano da sempre in un settore veramente ampio, forse uno dei più estesi in ambito informatico e, per sua stessa natura, meno verticalizzabili e collocabili in uno specifico ambito. Di loro, l’analisi dei big data coinvolge un’indagine multisettoriale in cui, di fatto, si tende a gestire dataset o insiemi di dati che siano eterogenei tra loro e abbiano tipicamente un gran numero di colonne. Se è vero che questi dati multidimensionali offrono maggiori potenzialità, è altrettanto vero che possono portare ad un maggiore numero di falsi positivi, e questo si riflette in una sostanziale sovra-mitizzazione del fenomeno (che viene visto molto spesso come “salvifico” e funzionale a prescindere, quando non lo è).  L’uso dei big data, ovviamente, richiede computer ed elaboratori che lavorino in parallelo su decine di migliaia di server differenti, con tutti i problemi di calcolo distribuito che ne possono derivare.

Quanti dati sono disponibili da elaborare?

I big data superano i limiti dell’informatica tradizionale e si pongono, almeno ad oggi, come una serie sostanziale di innovazioni sulle quali è anche difficile fare previsioni troppo precise. La dimensione e il numero di disponibili stanno entrambe aumentando nel corso degli ultimi anni, e sono aumentati i dispositivi in grado di raccoglierli ed elaborarli (sensori, RFID, telecamere, microfoni e via dicendo). Ogni giorno, secondo stime attendibili, è disponibile una nuova quantità di dati a livello mondiale pari a circa 2,5 exabyte di nuove informazioni (1 exabyte = 1.000.000.000 GB). Al netto di chiedersi, da un lato, chi deterrà la proprietà di questi dati da qui a qualche anno, è altrettanto opportuno comprendere cosa faremo con questi dati e quanto, di fatto, sarà effettivamente utile avere a disposizione tale quantità immane di informazioni.

Che si tratti di ricerche semantiche di Facebook o di Internet delle cose, i big data hanno conosciuto uno sviluppo ed una diffusione esponenziali, soprattutto negli ultimi anni, e riflettono già di loro un modello di gestione sempre a più ampio spettro. Quello che rende unico il mondo dei big data e lo distingue, ad esempio, da quello delle ordinarie business intelligence, è dovuto alle possibilità di approccio più flessibili e spesso basate su modelli non lineari, in cui la fanno da padrone sia il calcolo distribuito che le tecniche usate per l’estrazione ed il filtraggio delle informazioni (data mining).

Big data trova applicazione in ambiti così diversi tra loro da essere, di fatto, quasi difficile da formalizzare in forma assoluta: del resto, come abbiamo visto, per sua stessa definizione tende a travalicare i confini del singolo supporto e si estende nelle direzioni parallele dettate dalle 3 V (data velocity, data volume e data variety).

Esempi di applicazioni basate sui big data

Molto spesso gli articoli ed i libri che discutono i big data si perdono in definizioni e collocazione di ambiti, che a loro volta richiedono parole specialistiche ed eventuali neologismi; il tragicomico risultato finale è che, di fatto, si perde di vista il quid, e si finisca per sviluppare quello che definirei “l’effetto blockchain” (una sorta di cortina fumogena per sparlare su un argomento, senza mai toccarlo con mano nè conoscerlo a dovere). Tutti parlano di big data senza considerare, ad esempio, che è la fantascienza (o almeno una buona parte di essa) ad averne formalizzata inconsciamente alcune caratteristiche:

  • analisi del rischio di mercato;
  • identificazione frodi in ambito economico o bancario;
  • monitoraggio della reputazione di un brand;
  • l’uso dei big data trova un ambito concreto, ad esempio, nelle tecniche di schedatura e riconoscimento facciale, utilizzato spesso da alcuni stati in una dimensione quasi sempre borderline di controllo e repressione della popolazione;
  • grazie a big data possiamo, ad esempio, effettuare delle stime in ambito economico, statistico e di gestione dell’ordine pubblico e della sicurezza;
  • i big data consentono anche di effettuare simulazioni del comportamento del DNA umano in presenza di alcuni tipi di farmaci, senza che ciò richieda la sperimentazione diretta (o almeno ne razionalizzi la possibilità)

Gli esempi che sono riuscito a trovare, di fatto, vogliono mostrare un’ambiguità insita nei big data stessi, che sono uno strumento potente che pero’ necessita di una regolamentazione, cosa che non sempre c’è stata come vari casi di deregulation ed abusi in termini di privacy hanno dimostrato negli ultimi anni.

Big data e innovazione

Le sfide lanciate dall’uso dei big data, oltre ad una sostanziale autocritica di fondo (che ancora in pochi, di fatto, stanno facendo) includono i vari processi di acquisizione, archiviazione, analisi, ricerca, trasferimento, condivisione, interrogazione, aggiornamento, riservatezza e origine dei dati stessi, che possono di fatto provenire da più fonti differenti. Secondo la teoria classica, le dimensioni in cui si muovono i big data sono quelle del volume, della varietà e della velocità dei dati, che poi devono essere comunque presentati in forma innovativa per potersi prestare ad ulteriori analisi.

L’accezione comune dei big data tende a fare riferimento all’uso di analisi predittive, del comportamento degli utenti o che siano in grado di estrarre mediante data mining le informazioni che davvero servono all’applicativo in questione. Al netto di quanto suggerisca il nome, pertanto, i big data non riguardano tanto il fatto che i dati siano “tanti” ma che esistano solo alcuni modi (più o meno al riparo da errori) per combinarli ed elaborarli. Al giorno d’oggi l’elaborazione dei big data si pone come problematica all’ordine del giorno, investendo dimensioni e proporzioni fino a ieri sconosciute e ponendosi come dato fondamentale ad esempio per il tracciamento dei contagi in casi di pandemia da Covid-19, come abbiamo visto. Le applicazioni dei big data vanno dal settore sanitario a quello economico indistintamente, e spesso finiscono per essere interdisciplinari tra di loro.

I sistemi di gestione di database relazionali e i pacchetti software statistici desktop utilizzati per visualizzare i dati spesso hanno difficoltà a elaborare e analizzare i big data.  [14] Ciò che viene qualificato come “big data” varia a seconda delle capacità di coloro che lo analizzano e dei loro strumenti. Inoltre, le capacità in espansione rendono i big data un obiettivo in movimento. “Per alcune organizzazioni, affrontare centinaia di gigabyte di dati per la prima volta può far scattare la necessità di riconsiderare le opzioni di gestione dei dati. Per altre, potrebbero essere necessarie decine o centinaia di terabyte prima che la dimensione dei dati diventi una considerazione significativa.” [15]

 

Photo by fabio on Unsplash

Nessun voto disponibile

Che te ne pare?

Grazie per aver letto Oltre i Big data: cosa sono davvero e perchè possono essere utili di Salvatore Capolupo su Trovalost.it
Oltre i Big data: cosa sono davvero e perchè possono essere utili (Guide, Fuori dalle righe)

Articoli più letti su questi argomenti:
Trovalost.it è gestito, mantenuto, ideato e (in gran parte) scritto da Salvatore Capolupo