OpenAI lancia Sora, l'IA che crea video dal testo. I primi filmati sono incredibili
L’ultima novità di OpenAI si chiama Sora ed è una vera e propria bomba per il mondo dell’informazione, della comunicazione e dell’intrattenimento. Il nuovo modello di intelligenza artificiale consente di creare video assolutamente realistici fornendo una semplice indicazione testuale. La visione delle immagini rilasciate da OpenAI è scioccante e solleva non poche preoccupazioni sulle conseguenze negative che potrebbero aversi in particolar modo sul mondo dell’informazione. Distinguere il vero dal falso sarà sempre più difficile.
Non è dunque un caso che Sora non sia stata ancora rilasciata al pubblico nemmeno in versione di prova. Prima di farlo OpenAI deve ancora capire come proteggerla da eventuali problemi dovuti alla produzione di video falsi, fatti passare per veri. Questa ipotesi purtroppo è una minaccia concreta anche perché il problema dei deep fake è già reale. A fine gennaio video falsi sessualmente espliciti della pop star più popolare del momento, Taylor Swift, sono apparsi su diverse piattaforme social diventando virali. Ma questo è solo il caso più noto. Secondo i dati stimati da Clarity, una società di machine learning, il numero di deepfake nel corso dell'ultimo anno è aumentato del 900%. Già oggi dunque non mancano le applicazioni che consentono di produrre video falsi ma è evidente che uno strumento come Sora amplifica il problema.
Per capire questo aspetto possiamo prendere un caso concreto: il filmato della ragazza giapponese che cammina in una via di Tokyo, mostrato all'inizio del video in primo piano. OpenAI ha spiegato che questo filmato è stato creato da Sora utilizzando un prompt molto semplice: a stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress and black boots, and carriera a black purse. She wears sunglasses and red liptstick. She walks confidently and casually. The street is damp.
Tradotto in italiano: una donna elegante cammina lungo una strada di Tokyo piena di neon caldi e luminosi e di segnaletica cittadina animata. Indossa una giacca di pelle nera, un lungo vestito rosso e stivali neri, e carriera una borsa nera. Indossa occhiali da sole e rossetto rosso. Cammina con sicurezza e disinvoltura. La strada è umida.
E' evidente che la nuova applicazione di OpenAI semplifica ulteriormente la produzione di video, rendendola davvero alla portata di tutti. Esattamente come già accaduto con la produzione di immagini.
Sora non è il primo modello text to video ma è l’unico in grado di generare un file lungo fino a 60 secondi simulando la presenza di più telecamere. Anche Google (e non è una sorpresa) sta facendo passi in avanti importanti nello sviluppo di questa tecnologia. Il progetto si chiama Lumiere ed è in grado di generare filmati partendo dalle immagini caricate dall’utente.
La buona notizia è che un gruppo di 20 importanti aziende tecnologiche ha annunciato un impegno congiunto per combattere la disinformazione creata con l’intelligenza artificiale, per evitare in particolare che possa condizione le elezioni politiche americane previste nell’autunno di quest’anno. Del gruppo fanno parte nomi importanti del panorama tecnologico come Microsoft, Meta, Google, OpenAI e X.
L’obiettivo principale è sviluppare nuovi standard tecnici di identificazione dei testi, delle immagini e dei video creati con la AI, perché quelli utilizzati fino a ora non sono riusciti a tenere il passo con i progressi della nuova tecnologia. Una possibilità è convincere tutte le piattaforme di IA generativa ad accettare di inserire watermark invisibili e metadata particolari nelle immagini e nei video generati. Elementi fondamentali per agevolare il riconoscimento. Ma anche questa ipotesi non è garanzia di successo perché ci sarebbero comunque modi per aggirare le misure di protezione. La battaglia dunque è difficile e l’esito non è per niente scontato.
GUARDA ALTRI FILMATI PRODOTTI DA SORA