
Il mondo dell’intelligenza artificiale continua a evolversi a una velocità sorprendente e Midjourney ha recentemente annunciato il rilascio in alpha del suo modello di generazione di immagini V7. Questo nuovo modello è stato progettato per essere testato dalla comunità di AI, promettendo miglioramenti notevoli nella comprensione dei prompt testuali, nella qualità delle immagini e nella coerenza delle caratteristiche.
Secondo quanto dichiarato da Midjourney stesso, “V7 è un modello straordinario. È molto più intelligente nella gestione dei prompt testuali, le immagini generate appaiono fantastiche e la qualità visiva è nettamente superiore grazie a texture meravigliose. La coerenza nei dettagli di corpi, mani e oggetti di ogni tipo è significativamente migliorata”.
Una delle innovazioni chiave di questo nuovo modello è l’attivazione predefinita della personalizzazione del modello. Gli utenti dovranno sbloccare inizialmente questa funzione, un processo che richiede circa cinque minuti. La personalizzazione può essere attivata o disattivata in qualsiasi momento e mira a migliorare notevolmente la capacità dell’IA di interpretare i desideri e le preferenze estetiche degli utenti. Secondo Midjourney, questa funzionalità stabilisce un nuovo standard nella comprensione delle intenzioni degli utenti.
Modalità Draft: Velocità e Innovazione
Insieme al modello di generazione di immagini V7, Midjourney introduce anche una nuova funzionalità chiamata ‘Modalità Draft’, che promette di generare immagini dieci volte più rapidamente e a metà costo. Questa maggiore velocità ha consentito a Midjourney di implementare una modalità “conversazionale” unica nella sua interfaccia web. Gli utenti possono ora istruire il sistema a apportare modifiche, come sostituire un gatto con un gufo o cambiare l’ora del giorno in notturna, e l’IA regolerà automaticamente il prompt e avvierà un nuovo task di generazione immagine.
La Modalità Draft include anche la funzionalità di input vocale; premendo il pulsante del microfono, gli utenti possono esprimere verbalmente le proprie idee e osservare le immagini mentre vengono generate in tempo reale. Midjourney ritiene che questa modalità offra un modo senza precedenti per affinare i concetti creativi. Se un’immagine generata risulta gradevole, gli utenti possono selezionare le opzioni ‘migliora’ o ‘varia’ per rigenerarla in qualità elevata.
Costi e Modalità di Velocità
È importante notare che le immagini generate in Modalità Draft presentano una qualità inferiore rispetto alla modalità standard, ma il loro comportamento e le caratteristiche estetiche rimangono coerenti. Il modello di generazione di immagini V7 di Midjourney sarà inizialmente disponibile in due modalità di velocità: Turbo e Relax. Attualmente, la modalità di velocità standard è in fase di ulteriore ottimizzazione e si prevede che venga rilasciata a breve. Midjourney ha chiarito che i lavori in modalità Turbo costeranno il doppio rispetto a un lavoro standard, mentre i lavori in modalità Draft costeranno la metà.
L’azienda ha fornito aggiornamenti anche su altre funzionalità. Le caratteristiche come l’ingrandimento, l’editing e il ri-texturing torneranno inizialmente all’uso del modello V6, con aggiornamenti previsti nel prossimo futuro. Le funzionalità per mood board e SREF sono attualmente operative e si prevede che le prestazioni migliorino con gli aggiornamenti successivi.
Prospettive Future e Feedback
Guardando al futuro prossimo, Midjourney ha delineato un calendario di sviluppo attivo. Gli utenti possono aspettarsi nuove funzionalità ogni una o due settimane per i prossimi 60 giorni. Una caratteristica significativa in arrivo sarà la nuova capacità di riferimento per personaggi e oggetti V7. Infine, Midjourney ha avvisato gli utenti che V7 è un modello completamente nuovo con punti di forza e potenziali debolezze uniche. Invita tutti a sperimentare e fornire feedback sulle sue capacità, ricordando che potrebbe richiedere tecniche di prompting diverse rispetto alle versioni precedenti.
Con queste novità, Midjourney si prepara a ridefinire il modo in cui gli artisti e i creativi interagiscono con l’IA, aprendo la strada a possibilità artistiche senza precedenti. Non resta che esplorare questa nuova era della generazione di immagini.