Nano banana, la nuova AI di Google per l’editing fotografico

Una banana con gli occhiali da sole, il frac, un bastone in mano ed una tuba in testa con scritto sopra TrovaLost

Google sorprende il suo pubblico con un nuovo modello generativo per l’elaborazione e creazioni di immagini chiamato Gemini 2.5 Flash Image o più comunemente definito Nano Banana. Questo modello è stato in grado di stupire gli appassionati di IA generative per la sua coerenza nell’effettuare modifiche alle immagini fornite. Infatti, rispetto ai precedenti modelli generativi, Nano Banana può modificare immagini fornite dall’utente oppure generate da Gemini stesso senza rigenerarle nuovamente e quindi modificare elementi non voluti.

Questo permette agli utenti di poter fondere più immagini, cambiare i vestiti o il colore dei capelli ad una persona o, addirittura, aggiungere elementi generati de novo senza il rischio di alterare le proporzioni o modificare profondamente l’immagine fornita.

È possibile accedere al tool attraverso l’app di Gemini, la piattaforma Google AI Studio e Vertex Ai. Ovviamente sulla scia del successo della piattaforma sono sbucati su internet diversi servizi di terze parti che adottano combinazioni del nome Nano Banana per rivendere il servizio di editing grazie alle API fornite dal colosso di Mountain View.

Per evitare l’abuso di Gemini 2.5 Flash Image per la creazione di deepfake, Google ha deciso di applicare sulle immagini una filigrana in basso a destra (facilmente eliminabile) rappresentante il logo di Gemini e la filigrana digitale SynthID.

Generazione ed editing di immagini con IA: un confronto tra Gemini e Copilot

Viste le promesse della piattaforma ed il clamore che questa ha suscitato, abbiamo deciso di fare alcuni test tra Gemini e Copilot (usando il preset Smart con GPT-5).

Per questo test abbiamo voluto essere creativi e nostalgici chiedendo di mostrarci un tasso che beve del the, seduto su un ceppo, al tramonto con uno stile che ricordasse Le Avventure di Bosco Piccolo. Poi abbiamo deciso di modificare la vegetazione sullo sfondo, cambiare l’ora del giorno ed aggiungere una volpe al fianco del tasso. Ed infine, abbiamo deciso di mostrare l’immagine come se fosse stata scattata nella realtà. Poi non contenti abbiamo voluto testare la capacità del modello di aggiungere nuovi elementi da un’immagine fornita, in questo caso un simpatico gufo.

Immagine che mostra un gufo su un ceppo

Su Gemini il risultato è ottimo. Solo nell’ultima immagine decide di aumentare il campo dell’inquadratura ma non viene modificato nessun elemento e l’immagine resta completamente coerente.

Abbiamo deciso di fare la stessa cosa con Copilot, che decide dal nulla di far indossare al tasso un maglione, mantiene una bassa coerenza durante le varie modifiche richieste (la tazza di the cambia ad ogni iterazione, la vegetazione subisce piccole modifiche, il tasso perde e riacquista i baffi, cambia la forma del piattino della tazza da the) ed infine decide di far sbucare due gufi (non richiesto) che non somigliano alla foto fornita.

In conclusione possiamo affermare che Nano Banana è una svolta per quanto riguarda la manipolazioni di immagini con l’IA in quanto, rispetto ai competitor, riesce a mantenere una coerenza consistente, non inventa elementi non richiesti nella scena e mostra delle immagini qualitativamente superiori.