ByteDance lancia OmniHuman, l'IA che dà vita alle foto. Il video di Einstein è uno shock
La società madre di TikTok potrebbe introdurre la nuova funzionalità sulla nota piattaforma social
Ogni giorno l’intelligenza artificiale compie passi in avanti che creano stupore ma anche preoccupazione. L’ultima novità arriva dalla società madre di TikTok, ByteDance, che ha svelato OmniHuman, un modello di intelligenza artificiale in grado di trasformare foto statiche in video fluidi. La differenza con altri software attualmente in circolazione è, secondo la compagnia cinese, la possibilità di animare l'intero contenuto di una foto e non solo i volti delle persone rappresentate nell'immagine. In uno degli esempi forniti da ByteDance si vede una foto di Albert Einstein prendere vita. Il realismo del risultato ottenuto è impressionante.
Confronto con l'IA Sora di OpenAI
ByteDance ha un modus operandi simile a quanto mostrato finora dall'IA Sora di OpenAI, che resta un progetto sperimentale, dedicato ai professionisti e ancora chiuso. Non è ancora chiaro se l'azienda cinese renderà disponibile a tutti OmniHuman ma, visto il pubblico di riferimento, è possibile che possa diventare un'opzione a pagamento della piattaforma social di TikTok.
Miglioramenti nella riproduzione dei gesti
"OmniHuman migliora significativamente la riproduzione dei gesti - si legge sul sito di riferimento del progetto - una vera e propria sfida per i metodi esistenti, e produce risultati altamente realistici". Il modello è stato addestrato su oltre 18.700 ore di video di fonti differenti. "Parliamo di cartoni animati, oggetti artificiali, animali e pose impegnative - continuano gli sviluppatori - per garantire che le caratteristiche del movimento corrispondano a quelle uniche di ogni stile".
Il video di Einstein è uno shock e alimenta la paura dei deep fake
Nel video rilasciato da ByteDance, Albert Einstein pronuncia un discorso in inglese con un realismo senza precedenti che, da un lato, mette in mostra i progressi cinesi nel campo dell'intelligenza artificiale, e, dall'altro, alimenta i timori su una possibile esplosione futura dei deep fake, ovvero di video falsi prodotti dall'intelligenza artificiale. E’ evidente che l’uso dell’IA richiede al più presto una regolamentazione utile per prevenire abusi, ma le classi dirigenti mondiali su questo punto appaiono in forte ritardo. Per il momento prevale l’idea che non ci debbano essere vincoli allo sviluppo dell’intelligenza artificiale. Il motivo è semplice: questa tecnologia è considerata fondamentale per gli equilibri geo politici del futuro, come conferma il testa a testa tra Stati Uniti e Cina. Una domanda però meriterebbe una risposta: un’AI senza regole è davvero un rischio che l’umanità può permettersi il lusso di correre?
Il testo pronunciato da Einstein nel video
"Come sarebbe l'arte senza emozioni? Sarebbe vuota. Come sarebbero le nostre vite senza emozioni? Sarebbero prive di valori. Catullo, un famoso poeta classico disse: ‘Odiamo e amiamo. Qualcuno può dirmi perché?’. La scienza non risponde alle domande sul perché."
"What would art be like without emotions? It would be empty. What would our lives be like without emotions? They would be empty of values. Catullus, a famous classical poet said, 'We hate and we love. Can one tell me why?’ Science does not answer why questions."
Chiediamolo all'IA: cosa è un deep fake?
Un deepfake è un contenuto multimediale (video, audio o immagine) manipolato tramite intelligenza artificiale per far sembrare reale qualcosa che non lo è. Il termine deriva dalla combinazione di "deep learning" (apprendimento profondo) e "fake" (falso). Questa tecnologia permette di alterare volti, voci e movimenti in modo estremamente realistico, spesso sostituendo il volto di una persona con quello di un’altra o facendo dire a qualcuno cose mai dette. I deepfake possono essere usati per scopi leciti, come il cinema o l'intrattenimento, ma anche per attività pericolose come disinformazione, truffe o diffamazione. (testo generato da ChatGpt)