Si chiama “Your Brain on ChatGPT” (letteramente “Il tuo cervello su ChatGPT”), ed è uno studio pubblicato da Nataliya Kosmyna per conto del MIT Media Lab. L’istituto di ricerca del MIT si è occupato, di fatto, di analizzare l’impatto cognitivo dell’uso di ChatGPT in un contesto educativo molto specifico (e ben noto agli studenti): scrivere un saggio. Come cambiano le prestazioni cognitive facendo uso di un LLM generativo, che sarà risaputamente in grado di fare i compiti e generare le risposte desiderate?
“Usare ChatGPT spegne il cervello!”
“Scrivi con l’IA, dimentichi tutto!”
“La prova: l’IA ti rende stupido!”
Anche meno 🙂
Per fare questo studio sono stati analizzati 54 studenti divisi in tre gruppi: il primo faceva uso di ChatGPT, il secondo di un motore di ricerca, il terzo era totalmente offline. Sono state previste tre sessioni di lavoro distinte, nelle quali i gruppi si scambiavano la modalità di approccio, in modo che ognuno potesse avere le stesse possibilità degli altri. Mentre si lavorava, un macchinario registrava la connettività cerebrale e il carico cognitivo coinvolto nelle attività (EEG o elettro-encefalogramma). I saggi prodotti, alla fine, sono stati giudicati da insegnanti in carne ed ossa e da uno basato su intelligenza artificiale.
Fermo restando che studio è un preprint e non è stato ancora sottoposto a peer review, queste risultanze sono interessanti quanto preliminari, ma nessuno – per intenderci – ad oggi dovrebbe trarre conclusioni definitive in merito. Un articolo peer-reviewed (o articolo sottoposto a revisione paritaria) è un lavoro scientifico che, prima di essere pubblicato in una rivista accademica, viene valutato da altri esperti del settore (pari o peers). Questo processo serve a garantire la qualità, l’affidabilità e la validità del contenuto scientifico. Non che questo articolo non abbia interesse, tutt’altro: è solo che siamo ad uno stadio dei lavori per cui possiamo solo aspettare ulteriori risultati da altre ricerche. 4 mesi di ricerche, peraltro, potrebbero non bastare per valutare l’impatto cognitivo o neurale a lungo termine.
EEG ha rilevato una diminuzione di connettività nelle reti neurali chiave: l’uso dell’IA potrebbe alterare la neuroplasticità legata alla scrittura e al pensiero critico. Sembra ragionevole che il passaggio da motore di ricerca a LLM mantenga livelli di prestazione migliori rispetto al gruppo LLM singoli (un motore di ricerca non è un LLM, come abbiamo più volte ribadito); questo semmai suggerisce l’importanza di effettuare un’integrazione graduale, non di renderli strumenti sostitutivi.
Il campione analizzato era molto piccolo (meno di 100 persone, peraltro omologate in termini demografici e geografici): motivo per cui potrebbe non essere stato significativo in termini statistici.Di più: non viene fornito nessun dettaglio su come i partecipanti abbiano usato ChatGPT (prompt, quantità di testo generato, editing, ecc.), e non sono state fatte distinzioni tra uso attivo (spunto creativo) e uso passivo (copia-incolla) dello strumento.
I risultati trovati, ad ogni modo, sono i seguenti:
-
- Connettività cerebrale: massima nel gruppo “brain”, intermedia nel gruppo con motore di ricerca, minima nel gruppo LLM. La connettività sembra decrescere all’aumentare dell’uso di supporti esterni.
- Sessione 4: i partecipanti passati da LLM a “brain” (LLM→Brain) hanno esibito under‑engagement in bande alfa e beta, mentre quelli passati da brain a LLM (Brain→LLM) mostrano un attivazione simile per il gruppo passato da brain a motore di ricerca, con richiamo mnemonico ottimizzato.
- Ownership / ricordo: il senso di proprietà sui saggi era chiaramente più basso nel gruppo ChatGPT, maggiore nel gruppo motore di ricerca e massimo nel gruppo brain; per lo stesso motivo, il gruppo ChatGPT – significativamente – faceva fatica a citare ciò che aveva scritto anche a distanza di pochi minuti.
- Prestazioni globali: nel corso di 4 mesi di sperimentazione, il gruppo che accedeva a ChatGPT ha avuto prestazioni inferiori rispetto agli altri nei livelli neurali, linguistici e valutativi.
Lo studio pertanto sostiene che l’uso di LLM (in certa misura) potrebbe generare una sorta di “debito cognitivo”, ovvero una riduzione dell’impegno mentale, capacità mnemoniche e capacità di attribuirsi la paternità di uno scritto. I benefici immediati (velocità, facilità) sembrano perdurare nel lungo termine, ma le competenze cognitive possono deteriorarsi. Ma allora viene spontaneo chiedersi:
L’uso costante di LLM potrebbe ridurre la capacità di pensare criticamente, ricordare e costruire strutture argomentative autonome—competenze fondamentali per l’apprendimento profondo?
Scrivere con ChatGPT potrebbe portare a un senso di estraneità rispetto al proprio prodotto creativo, con rischi di dipendenza dal tool e riluttanza a esercitare lo sforzo cognitivo necessario?
Se introdotti nelle scuole/università, gli LLM potrebbero alterare il modo in cui gli studenti apprendono, infliggendo un danno progressivo alle loro capacità mentali, anche dopo l’abbandono dell’uso?
Lo studio Your Brain on ChatGPT offre spunti interessanti sul possibile impatto neurocognitivo dell’uso di modelli linguistici come ChatGPT, ma va interpretato con prudenza. I risultati preliminari indicano una riduzione della connettività cerebrale e del senso di proprietà nei testi scritti con assistenza AI, suggerendo l’ipotesi di un “debito cognitivo”. Tuttavia, i limiti metodologici – campione ristretto, contesto sperimentale artificiale, mancanza di controllo qualitativo sull’interazione con l’IA – ne riducono la portata conclusiva. Più che una prova definitiva, il lavoro rappresenta un invito a esplorare con rigore scientifico e senza sensazionalismi le implicazioni cognitive dell’intelligenza artificiale. Il vero nodo, quindi, non è se usare l’IA, ma come farlo in modo consapevole, mantenendo attivo il pensiero critico e la partecipazione mentale dell’utente.
Glossario
LLM (Large Language Model)
Modello linguistico di grandi dimensioni addestrato su enormi quantità di testo per prevedere parole e generare frasi coerenti. ChatGPT è un esempio di LLM.
Cognitive Load (Carico Cognitivo)
La quantità di risorse mentali richieste per completare un compito. Un alto carico implica maggiore sforzo e coinvolgimento del sistema esecutivo del cervello.
EEG (Elettroencefalogramma)
Tecnica di neuroimaging che misura l’attività elettrica cerebrale tramite elettrodi sullo scalpo. Utilizzata per rilevare stati mentali (concentrazione, stanchezza, engagement, ecc.).
Connettività cerebrale funzionale
Misura statistica delle correlazioni tra diverse regioni del cervello. Una maggiore connettività indica che più aree stanno collaborando attivamente durante un compito cognitivo.
Bande EEG (Alfa, Beta, ecc.)
Alfa (8–12 Hz): associate a rilassamento e inibizione dei compiti cognitivi.
Beta (13–30 Hz): associate a concentrazione, pensiero attivo e attenzione sostenuta.
Variazioni in queste bande indicano livelli diversi di attivazione mentale.
Debito Cognitivo
Concetto ispirato al “debito tecnico”: si riferisce alla riduzione temporanea di impegno mentale che può avere effetti negativi a lungo termine su memoria, apprendimento e pensiero critico.
Ownership Cognitivo
Il senso di “proprietà mentale” su un contenuto generato, ovvero quanto un individuo percepisce un’idea, una frase o un testo come frutto del proprio pensiero.
NER (Named Entity Recognition)
Tecnica NLP (Natural Language Processing) che individua entità rilevanti in un testo (persone, luoghi, date, ecc.) e serve per valutare la complessità o specificità linguistica.
N-gram
Sequenze di parole contigue in un testo (es. bigrammi: “intelligenza artificiale”). Usati per analizzare struttura sintattica, ricorrenze e stile.
