Deepfake: cosa sono e come funzionano i video falsi sul web

Deepfake: cosa sono e come funzionano i video falsi sul web

Deepfake è una delle tendenze tecnologiche del momento, che sta avendo molto spazio all’interno dei mezzi di comunicazione generalisti: i media, insomma, ormai da tempo parlano di questa tecnologia, spesso spiegandola in termini spesso fin troppo semplicistici. Un certo allarmismo si è diffuso attorno a questo tipo di algoritmi di AI (Artificial Intelligence), soprattutto per un eventuale uso improprio che se ne potrebbe fare. Molto utilizzati (e con risultati molto realistici) nel cinema e nelle animazioni CGI, se avete sentito parlare dei deepfake è ora di fare un po’ di chiarezza in merito e capire bene di cosa si tratti.

E così, oggi, vi spieghiamo come funzionano le contraffazioni realistiche di immagini e video.

Cosa sono i deepfake

Deepfake è un algoritmo di intelligenza artificiale per la sintesi e l’elaborazione di immagini umane, che viene utilizzato per combinare e sovrapporre immagini e video (ad esempio di una persona famosa) su altre immagini o video di origine (un’altra persona), al fine di generare un video molto realistico completamente fake (cioè finto).

I deepfake – che si possono tradurre in italiano con video falsi realistici – sono immagini, video o articoli creati interamente da un’intelligenza artificiale, in grado di analizzare campioni di dati (ad esempio foto e video di una persona) e creare video artificiali ex novo a partire da quegli esempi: ad esempio, far dire alla persona cose che non ha mai detto, nè fatto. La tecnologia è davvero inquietante e non è facile già adesso evitarne l’uso improprio, peraltro già analizzato – ad esempio – da film horror come CAM. Per fortuna, comunque, realizzare questo genere di lavori richiede una potenza computazionale non alla portata di chiunque, e si fonda su basi teoriche non banali che è necessario conoscere.

Storia dei deepfake

La tecnologia deep learning (da cui deriva il termine contratto deepfake) si lega alla tecnologia classica delle reti neurali, ovvero le varie tecniche automatiche per “addestrare” un algoritmo a riconoscere situazioni nuove, il tutto sulla base di un campione di casi noti. A differenza delle tecniche di programmazione classica che partono da un input e producono un output, banalmente un calcolo o l’applicazione di un filtro ad un’immagine, le tecniche per creare deepfake sono in grado di “apprendere” da un campione di dati simili e riprodurli sempre meglio – banalmente, imitare la scrittura di una persona sull’analisi di un grosso campione di testo scritto da quella persona. Anche Google, del resto, affina e migliora i propri risultati di ricerca sulla base dell’analisi di campioni di dati, ad esempio – sfruttando estensivamente tecniche di cosiddetto machine learning (apprendimento macchina).

Le primissime conoscenze in merito risalgono più o meno ai primi anni 2000, periodo in cui vengono sperimentate le prime tecniche automatiche di riconoscimento facciale. Alla base di tutto c’è infatti quest’ultima, per cui la tecnologia deepfake, pertanto, non è una vera e propria novità, anche se la parte davvero clamorosa è stata introdotta nel 2017, come vedremo tra un attimo.

Il riconoscimento facciale è alla base delle tecniche di sostituzione perfetta di una faccia con un’altra, come è possibile vedere in questa immagine (tratte dal blog del programmatore Alan Zucconi) in cui viene mostrata l’applicazione dell’algoritmo di face recognition su una foto di Ted Cruz e la conseguente creazione di una maschera (mask) che va a sostituirsi perfettamente a quella del presidente USA Donald Trump. Mediante un semplice algoritmo matematico che rileva la copertura convessa (convex hull) sui contorni del viso, può essere applicata una sostituzione su qualsiasi altro viso, con risultati davvero notevoli ed un tempo molto piccolo.

Vari software open source, già in questa fase, erano in grado di realizzare l’operazione anche senza saperne quasi nulla delle basi teoriche; ma se queste prime strategie erano in grado di produrre risultati del genere, non potevano spingersi oltre – cosa che l’introduzione delle reti neurali ha permesso di realizzare qualche anno dopo. La face detection, in altri termini, funzionava all’epoca soltanto su immagini pre-esistenti, cioè non è in grado di effettuare il morphing (o trasformazione) della faccia di Trump in modo che possa coincidere con quella di Cruz. Quello che sono in grado di fare i deepfake è superare questa limitazione, ed applicarla non solo ad immagini ma anche a brevi video – che quindi vengono creati sulla base dell’analisi e dell’elaborazione di un campione di video della stessa persona.

Alla fine del 2017, come dicevamo, avviene una scoperta clamorosa da parte di un utente di Reddit (il social network di contenuti molto utilizzato soprattutto negli USA): l’utente deepfake è riuscito a realizzare dei video fake partendo da video della stessa persona scaricati da internet, e realizzando dei “falsi realistici” davvero impressionanti. La tecnica si basa sulle neural networks (reti neurali), una tecnologia di analisi dei dati stratificata, in grado di effettuare il morph delle espressioni facciali di una persona partendo dalla mimica di quelli di un’altra – ad esempio, potrei fargli riprodurre le mie smorfie (riprese dalla webcam, ad esempio) applicandole alle fattezze di Donald Trump, oppure – per estensione – fargli addirittura dire qualsiasi altra cosa.

Nel cinema, per inciso, questa tecnica è stata in grado di riprodurre risultati impressionanti: ad esempio questo video, tratto dal film Rogue One del 2016, include una versione digitalizzata della Principessa Leia molto difficile da distinguere dalla versione originale. La tecnica utilizzata, in questa sede, è nota come deep learning. e richiede una potenza di calcolo che solitamente si ottiene sfruttando schede video di alto livello che siano in grado di parallelizzare le operazioni (un po’ come avviene per il mining di bitcoin, ad esempio).

Perchè sono diventati famosi

I deepfake sono diventati noti su internet grazie ad alcuni utenti Reddit che, anni fa, postavano delle originali realizzazioni di video, spesso di natura diffamatoria: realizzavano video fake in cui, in sostanza, era possibile vedere un politico muovere la bocca e parlare dicendo qualsiasi cosa il suo realizzatore volesse. Una cosa da vera e propria fantascienza distopica, in pratica degli alter ego digitali che hanno creato problemi a molti VIP e politici – tanto per capirci, spesso i deepfake vengono sfruttati impropriamente per creare video porno finti con protagonisti attori ed attrici famosi che mai ne farebbero. C’era un utente di Reddit che faceva esattamente questo (i suoi contenuti sono stati quasi tutti rimossi, ad oggi, ma potrebbe essercene ancora traccia nel dark web, per quel che ne sappiamo e per come funzionano di solito queste cose): prendeva la faccia di persone famose, e andava a metterla in modo realistico sui corpi di varie attrici ed attori hard. La cosa impressionante dei deep fakes è riuscire a far assumere espressioni facciali che gli originali non avevano, sulla base di un complesso calcolo algoritmico.

I deepfake sono quindi una tecnologia in grado di manipolare la realtà, creando video finti realistici, immagini fake realistiche e addirittura notizie o articoli in modo algoritmico, credibile e del tutto automatizzato. Questo, in prima istanza, dovrebbe farci riflettere su un maggiore scetticismo che ognuno di noi dovrebbe avere quando si imbatte in news, video e immagini che sembrano vere e che potrebbero essere state create da un software (ad esempio quando vi capita di leggere appelli allarmistici sulla rete 5g).

Molte delle critiche sui deepfake sono talmente aspre, del resto, che  ci si chiede a cosa questa tecnologia potrebbe davvero essere utile. Cinema e installazioni artistiche a parte, ovviamente.

DeepNude: l’app per spogliare le persone senza il loro consenso

Si tratta di una delle novità inquietanti uscite fuori a giugno, che in realtà erano già diffuse da qualche mese prima: un’app che era in grado di costruire sostituzioni di corpi di persone attraverso una semplice foto, soprattutto femminili, sfruttando la medesima tecnologia deepfake, in pratica riuscendo a spogliare persone vestite. Basta una singola foto del soggetto perchè l’app, entro pochi secondi, riuscisse a produrre un suo nudo realistico (finto, ovviamente). Secondo i risultati e le valutazioni che ho potuto fare da esempi messi in rete, il risultato ottenuto era tanto realistico da fare paura: gli esempi di uso erano ancora una volta eloquenti, e riguardavano soprattutto foto di attrici e VIP vestite di cui veniva prodotto un nudo artificiale e realistico mediante l’app stessa.

Distribuita per Linux e per Windows anche su GitHub in formato open source, il suo programmatore ha deciso (forse saggiamente) di farla sparire da internet, nonostante molte persone l’avessero già scaricata e nonostante ciò esponga a potenziali versioni fake dell’app piene di virus e malware. Ovviamente, ancora una volta: la tecnologia è potente, deve essere usata con saggezza e più che demonizzare l’uso dei deepfake si dovrebbe, secondo me, sensibilizzarsi sulle tematiche di privacy e sulla diffusione troppo indiscriminata di foto personali su internet, soprattutto se con visibilità pubblica o visibili senza autenticarsi nel sito o nel social network. Al momento, quindi, DeepNude non è più disponibile per il download.

Non seguite alcun link per il download di DeepNude: l’app è stata rimossa definitivamente, sia la versione free che quella a pagamento (per 50$ potevi portarti a casa una versione dell’app che era in grado di rimuovere il bollino Fake dalla foto risultato). Tutte le risorse che promettono il download di DeepNude sono quasi certamente dei virus o dei malware pericolosi per il vostro telefono o computer.

Software open source per fare deepfake: sono alla portata di tutti?

La cosa davvero inquietante è che si tratta di una tecnologia alla portata di chiunque, non nel senso di utilizzo bensì di facilità di reperire software del genere: il codice di queste applicazioni è quasi tutto open source, e spesso non viene citato apertamente (cosa che non faremo neanche qui, per ovvie ragioni) per paura che possa scatenarsi un meccanismo di emulazione di massa. Esistono anche interfacce piuttosto semplici da utilizzare per realizzarli, per quanto in molti casi il tipo di software sia impegnativo da utilizzare e non esattamente alla portata di chi non abbia un minimo di competenze tecniche specifiche: addestramento di modelli supervised, programmazione Python e così via.

Un recente esperimento finanziato da Elon Musk, tanto per fare un altro esempio, si basa probabilmente su una tecnologia su questa falsariga: è in grado di creare in automatico articoli credibili per il web (il codice ed i dettagli non sono stati divulgato, anche qui, per una forma di cautela). Le app per creare deepfake (sia per mobile che per desktop) sono periodicamente rimosse dal web e si preferisce non lasciarle online per evitare abusi. Esistono inoltre vari siti web che permettono di creare deepfake a partire da qualsiasi video direttamente online, senza dover installare nulla.

Non possiamo aspettarci che il segreto rimanga tale molto a lungo: la strategia security thought obscurity non è molto efficace, come i ripetuti casi di violazione di sicurezza informatica ci dimostrano ogni giorno. Tutto sta nella responsabilità dei singoli e sulla conoscenza a livello globale dell’esistenza di queste tecniche, in modo che ognuno possa valutare criticamente qualsiasi contenuto e sappia, almeno, che molti video realistici potrebbero essere semplici fake realizzati ad arte.

Esempi famosi di deepfake

Per capirci, un esempio di deepfake in forma di immagine è il seguente: a sinistra il modello di riferimento, a destra la riproduzione creata dall’algoritmo. Difficile o impossibile dire quale sia l’originale e quale, invece, la copia.

Ecco uno degli esempi più famosi tratti da 10 film diversi: le facce degli attori sono state sostituite in modo realistico da altri attori o persone comuni.

Un altro esempio riguarda i presidenti degli USA, la cui faccia è stata rimpiazzata con la medesima espressione da un’altro attore o persona.

Ulteriori esempi di deepfake sono ancora più inquietanti: l’intelligenza artificiale basata su reti neurali è riuscita, con una mole relativamente piccola di lavoro, a creare dei cloni digitali di qualsiasi genere, anche molto realistici (tanto da non risultare distinguibili dagli originali).

Un primo caso di deepfake diventato famoso riguarda l’ex Presidente degli Stati Uniti Obama.

Uno dei deepfake più famosi è un video fake di Putin, ad esempio.

Conclusioni (e niente allarmismo)

I deepfake fanno paura, ovviamente, ma non c’è da temere troppo: la loro popolarità sarà senza dubbio crescente, tanto che ci sono anche vere e proprie sotto-categorie di siti hard, ad oggi, che sono incentrati esclusivamente sui deepfake. E questo la dice lunga: l’utente Reddit di cui si parlava all’inizio, deepfake, aveva anche creato un’app per facilitare il compito della creazione di deepfake, che ad oggi è scomparsa pubblicamente. Ma per come funzionano internet ed il dark web, un giorno potrebbe tornare: e non sappiamo dire, ad oggi, che conseguenze potrebbe avere la cosa sulla vita di molte persone che già, di loro, badano poco o nulla alla propria privacy.

Per poter funzionare l’algoritmo deepfake necessita di centinaia, se non migliaia, di video della stessa persona: meglio pensarci bene, quindi, prima di postare centinaia di video in pubblico che ci ritraggono, e lasciarli a disposizione di chiunque. In ogni caso, come ricordato giustamente da un articolo su Focus, gli esseri umani sbattono gli occhi ogni 2 massimo 10 secondi, e ogni battito di ciglia richiede tra un decimo e quattro decimi di secondo. Difficilmente, a questo punto, si trovano sul web foto di persone con gli occhi chiusi: “un po’ perché” – scrive l’articolo – “trascorriamo la maggior parte del tempo con gli occhi aperti, e un po’ perché raramente un fotografo pubblica ritratti ad occhi chiusi in un servizio“. Per riconoscere un deep fake, a questo punto, basta fare caso ai battiti di ciglia, che nel caso di video artificiali sono del tutto assenti per via di un limite attualmente insito nell’algoritmo.

(Immagine di copertina tratta da wsj.com)


Informazioni sull'autore

Salvatore Capolupo

Consulente SEO, ingegnere informatico e fondatore di Trovalost.it, Pagare.online, Lipercubo.it e tanti altri. Di solito passo inosservato e non ne approfitto.
Ti piace questo articolo?

5 voti

Su Trovalost.it puntiamo sulla qualità dei contenuti da quando siamo nati: la tua sincera valutazione può aiutarci a migliorare ogni giorno.

Deepfake: cosa sono e come funzionano i video falsi sul web

Votato 10 / 10, da 5 utenti