Non solo DeepSeek, tecnologia cinese in grado di creare avatar che mostrano emozioni: il video
Non solo DeepSeek. La sfida cinese alla supremazia americana nell’intelligenza artificiale è ormai ad ampio raggio, come dimostra EMO2 (End-Effector Guided Audio-Driven Avatar Video Generation), una tecnologia innovativa sviluppata dall'Istituto di Intelligenza Artificiale di Alibaba per generare video di avatar guidati dall'audio.
Gesti delle mani generati automaticamente
Questo metodo è progettato per sincronizzare perfettamente l'audio con le espressioni facciali e i movimenti delle mani, creando un risultato naturale ed espressivo. La vera novità di EMO2 risiede nella sua capacità di generare automaticamente i gesti delle mani partendo direttamente dall'audio, sfruttando la naturale connessione tra il parlato e la gestualità.
L'avatar di Elon Musk come esempio delle potenzialità della tecnologia
Come dimostra l’avatar di Elon Musk trasformato in un provetto cantante i risultati sono incredibili. Qualcuno può obiettare che l’avatar non è ancora perfettamente naturale e questo è sicuramente vero, ma la tecnologia va valutata in prospettiva: quale livello di realismo sarà raggiunto nel giro di pochi anni? E’ uno scenario affascinante ma allo stesso tempo inquietante.
https://webcache2.fss.tiscali.com/flashpdit/cmsv/video_tv/012025/513b32bc6cc69c76bea6ee930203771a.mp4