L’IA di Midjourney V5 non capisce come si mangiano gli spaghetti


Annunci:

(Tophost) l’ hosting web più economico – Usa il coupon sconto: 7NSS5HAGD5UC2

(Rankister) Vuoi pubblicare il tuo articolo su questo sito? scopri come fare!

i modelli di linguaggio, inclusi gli LLM ed i generatori di immagini come Midjourney, possono incontrare limitazioni significative quando applicati alla generazione di immagini, specialmente in contesti complessi come alcuni tipi di rappresentazioni. Una di questi è incredibilmente ovvia per un italiano, ma molto meno per un’IA: mangiare spaghetti. Proprio non riescono a rappresentarlo. Abbiamo raccolto una serie di immagini da Reddit dell’utente danlev, generate circa un anno fa.

Questo il grottesco risultato (credits: danlev).

Ci abbiamo riprovato poco fa e, come potete vedere, non è andata meglio.

La domanda è, a questo punto, per quale motivo? Comprendere le cause di tali limitazioni e esplorare soluzioni potenziali è fondamentale per avanzare nella creazione di modelli più robusti e versatili per la generazione di immagini. In generale, quando si utilizzano modelli di generazione di immagini o di testo, è importante considerare che i risultati potrebbero non essere sempre perfetti e potrebbero richiedere esperimenti aggiuntivi o affinamenti per ottenere i risultati desiderati. Quando chiedi a un modello di generare immagini di persone che mangiano spaghetti, la qualità dei risultati può variare per diversi motivi.

Alcuni potrebbero riguardare, ad esempio, la disponibilità e qualità dei dati di addestramento: se il modello non è stato addestrato su un ampio e diversificato set di dati che include immagini di persone che mangiano spaghetti, potrebbe non essere in grado di generare risultati di alta qualità per questa specifica richiesta. I modelli di intelligenza artificiale, inclusi quelli di generazione di immagini, tendono a riflettere ciò su cui sono stati addestrati.

Entra poi in gioco la relativa complessità della richiesta: La generazione di immagini di persone che mangiano spaghetti potrebbe essere una richiesta complessa in termini di dettagli, posizionamento delle mani, delle posate e degli spaghetti stessi. Se il modello non è in grado di comprendere appieno la complessità della richiesta, potrebbe generare risultati distorti o poco realistici. Esistono poi inevitabilmente delle limitazioni del modello: anche se i modelli di intelligenza artificiale hanno fatto progressi significativi nel generare immagini realistiche, possono ancora incontrare limitazioni nella comprensione del contesto e nella creazione di dettagli realistici, specialmente in scenari complessi o poco comuni come mangiare spaghetti.

Infine, non lo escludiamo, è possibile che la descrizione fornita a MidJourney per generare le immagini non sia stata sufficientemente dettagliata o chiara per il modello. Un input più dettagliato e specifico potrebbe aiutare il modello a produrre risultati migliori. Purchè nessuno naturalmente chieda di generare immagini della pizza con l’ananas, a questo punto…

👇 Da non perdere 👇

Annunci:

(Tophost) l’ hosting web più economico – Usa il coupon sconto: 7NSS5HAGD5UC2



Questo portale web esiste da 4559 giorni (12 anni), e contiene ad oggi 4194 articoli (circa 3.355.200 parole in tutto) e 20 servizi online gratuiti. – Leggi un altro articolo a caso
Privacy e termini di servizio / Cookie - Il nostro network è composto da Lipercubo , Pagare.online e Trovalost
Seguici su Telegram, ne vale la pena ❤️ ➡ @trovalost
Questo sito contribuisce alla audience di sè stesso.