Seguici su Telegram, ne vale la pena ❤️ ➡ @trovalost
Vai al contenuto

L’IA di Midjourney V5 non capisce come si mangiano gli spaghetti

i modelli di linguaggio, inclusi gli LLM ed i generatori di immagini come Midjourney, possono incontrare limitazioni significative quando applicati alla generazione di immagini, specialmente in contesti complessi come alcuni tipi di rappresentazioni. Una di questi è incredibilmente ovvia per un italiano, ma molto meno per un’IA: mangiare spaghetti. Proprio non riescono a rappresentarlo. Abbiamo raccolto una serie di immagini da Reddit dell’utente danlev, generate circa un anno fa.

Questo il grottesco risultato (credits: danlev).


Cerchi un hosting economico per il tuo sito o blog? Tophost ti aspetta (clicca qui) - Puoi anche usare il coupon sconto esclusivo 7NSS5HAGD5UC2 per spendere di meno ;-)

Ci abbiamo riprovato poco fa e, come potete vedere, non è andata meglio.

La domanda è, a questo punto, per quale motivo? Comprendere le cause di tali limitazioni e esplorare soluzioni potenziali è fondamentale per avanzare nella creazione di modelli più robusti e versatili per la generazione di immagini. In generale, quando si utilizzano modelli di generazione di immagini o di testo, è importante considerare che i risultati potrebbero non essere sempre perfetti e potrebbero richiedere esperimenti aggiuntivi o affinamenti per ottenere i risultati desiderati. Quando chiedi a un modello di generare immagini di persone che mangiano spaghetti, la qualità dei risultati può variare per diversi motivi.

Alcuni potrebbero riguardare, ad esempio, la disponibilità e qualità dei dati di addestramento: se il modello non è stato addestrato su un ampio e diversificato set di dati che include immagini di persone che mangiano spaghetti, potrebbe non essere in grado di generare risultati di alta qualità per questa specifica richiesta. I modelli di intelligenza artificiale, inclusi quelli di generazione di immagini, tendono a riflettere ciò su cui sono stati addestrati.

Entra poi in gioco la relativa complessità della richiesta: La generazione di immagini di persone che mangiano spaghetti potrebbe essere una richiesta complessa in termini di dettagli, posizionamento delle mani, delle posate e degli spaghetti stessi. Se il modello non è in grado di comprendere appieno la complessità della richiesta, potrebbe generare risultati distorti o poco realistici. Esistono poi inevitabilmente delle limitazioni del modello: anche se i modelli di intelligenza artificiale hanno fatto progressi significativi nel generare immagini realistiche, possono ancora incontrare limitazioni nella comprensione del contesto e nella creazione di dettagli realistici, specialmente in scenari complessi o poco comuni come mangiare spaghetti.

Infine, non lo escludiamo, è possibile che la descrizione fornita a MidJourney per generare le immagini non sia stata sufficientemente dettagliata o chiara per il modello. Un input più dettagliato e specifico potrebbe aiutare il modello a produrre risultati migliori. Purchè nessuno naturalmente chieda di generare immagini della pizza con l’ananas, a questo punto…

👇 Da non perdere 👇



Questo sito web esiste da 4489 giorni (12 anni), e contiene ad oggi 5444 articoli (circa 4.355.200 parole in tutto) e 15 servizi online gratuiti. – Leggi un altro articolo a caso
5/5 (1)

Ti sembra utile o interessante? Vota e fammelo sapere.

Questo sito contribuisce alla audience di sè stesso.
Il nostro network informativo: Lipercubo - Pagare online (il blog) - Trovalost.it