L’utilizzo del machine learning e delle reti neurali nei contesti tecnologici più diversi sta producendo, anno dopo anno, risultati sempre più impressioni: dai Deepfake al gioco del poker, passando per il riconoscimento dei formaggi e la creazione di visi umani perfettamente credibili, sembrano incontestabili ulteriori vantaggi nell’uso di un modello, cioè di un modo per creare e “addestrare” il software, che possa essere, in qualche modo, unificato. Senza la necessità di dover creare policy di addestramento delle reti per ogni dominio (cosa che si è fatta fino a qualche tempo fa), infatti – con il rischio di falsare i risultati o, se preferite, sulla falsariga del bias del ricercatore in agguato - i tempi sembrano maturi per un ulteriore, nuovo passo: il progetto Gato di DeepMind, l’azienda inglese di IA controllata da Alphabet / Google, sembra virare proprio in questa direzione. Un’intelligenza artificiale (AI) unificata, nel senso di programmabile una volta per tutte a riconoscere tipologie di situazioni e scenari diversi tra loro, accomunati dall’idea di addestrare gli algoritmi a riconoscere situazioni anche non esattamente previste, oppure a fare cose tipo imitare una grafia, fare un disegno artistico, comporre musica e cosଠvia.
Una rete neurale, per sua definizione, è un dispositivo che riceve vari input in ingresso, a campione, li analizza statisticamente, li campiona, li elabora con varie strategie per poi proporre degli output. Con il tempo e l’uso, la rete neurale sarà in grado di processare anche campioni che non ha mai visto in precedenza.Â
Sulla carta il modello è relativamente semplice: si propone, infatti, un agente generalista (a generalist agent), ovvero ad uso generale (general purpose), in cui viene sfruttato uno ed un solo modello sui cui ingressi vengono calcolati dinamicamente dei pesi (weights). Gato può, a questo punto, fare un’ampia gamma di azioni utili: essere un chatbot intelligente, scrivere didascalie per immagini, navigare in ambienti 3D, giocare ai videogame meglio di qualsiasi videogiocare o seguire delle istruzioni per compiere operazioni complesse.
Nel dettaglio, immaginiamo di convogliare vari input eterogenei – diversi tra loro: testi, immagini, frame di videogiochi, domande e risposte corredate di immagini – all’interno di Gato, serializzando gli ingressi per un fatto di uniformità . A quel punto lo stesso sarà in grado di calcolare una funzione kernel e degli output, ovvero delle previsioni o stime, sui dati che ha ricevuto. Gato, nelle intenzioni dei suoi creatori, supera il limite secondo cui è impossibile, da un lato, addestrare una IA a processare la totalità degli input possibili, ma dall’altro addestrarlo a riconoscerne un gran numero diventa in qualche modo fattibile. Il prodotto sembra essere altresଠsfruttabile per effettuare policy smart, ovvero tecniche di controllo e di decisione che possano alternare attività di osservazione con altre di azione.
Nella pratica, in sostanza, Gato viene addestrato su dati che, essendo eterogenei come natura, devono essere tokenizzati ovvero normalizzati in termini di rappresentazione: in tal modo avremo davanti un enorme software che processa in modo smart risposte a domande, didascalie, gesture specifiche, immagini e azioni contestualizzate. Senza azzardare paragoni che rischierebbero di fuorviare, a questo punto, si potrebbe pensare a Gato come ad una forma di elaboratore molto simile al funzionamento a neuroni del cervello umano.
👇 Da non perdere 👇
- Lavoro 🔧
- Mondo Apple 🍎
- monitoraggio servizi online 📈
- Sicurezza & Privacy 👁
- WordPress 🤵
- 💬 Il nostro canale Telegram: iscriviti
- 🟠 Che cos’è il fandango – Wikilost
- 🔵 Cosa sono le equazioni di secondo grado
- 🟡 Cosa indica l’errore CT446?