Google presenta Gemini 2 e punta sull'era degli agenti: perché sarà una rivoluzione per tutti
Google segna un punto cruciale nella competizione per la supremazia nell'intelligenza artificiale con il lancio di Gemini 2.0, un modello che non solo ha l’ambizione di colmare il divario con la tecnologia di OpenAI ma anche di far compiere un passo in avanti decisivo all'era degli agenti, una rivoluzione che cambia il paradigma dell'intero settore e il modo in cui l'IA viene utilizzata dalle persone.
Rispetto alle versioni precedenti Gemini 2.0 introduce capacità di ragionamento superiori. Sundar Pichai, CEO di Google, ha spiegato che le nuove funzionalità avanzate saranno integrate anche su Google Search, migliorando la capacità del motore di ricerca di rispondere a domande complesse e multi-step. Demis Hassabis, CEO di Google DeepMind, ha descritto Gemini 2.0 Flash (una variante di Gemini 2.0) come un modello di punta, in grado di generare immagini, testo e voce senza il supporto di modelli esterni come Imagen.
Uno degli aspetti centrali di Gemini 2.0 è lo sviluppo delle capacità multimodali, una caratteristica che consente all’intelligenza artificiale di comprendere e processare simultaneamente informazioni provenienti da fonti diverse. Queste fonti possono includere testo, immagini, audio, video e dati sensoriali.
Le capacità multimodali sono alla base dello sviluppo degli agenti ovvero funzionalità dell'IA progettate per eseguire compiti in autonomia, senza la necessità di una guida costante da parte dell’uomo. Google ha presentato due progetti chiave denominati Project Astra e Project Mariner.
Project Astra è un assistente AI avanzato progettato per fornire assistenza in tempo reale nel mondo fisico attraverso l'utilizzo di dispositivi come smartphone e occhiali intelligenti. Può interpretare immagini, video, audio e rispondere in modo naturale alle richieste degli utenti. Per esempio, attraverso la fotocamera del telefono può identificare oggetti, opere d'arte o edifici e fornire informazioni dettagliate su di essi. Project Mariner funziona invece come un'estensione del browser Chrome, permettendo all'AI di navigare autonomamente sul web per eseguire compiti come effettuare acquisti online o raccogliere informazioni.
Gemini 2.0 può essere utilizzato anche per analizzare quello che viene visualizzato nello schermo del PC e dare supporto. Per esempio, se l'utente utilizza una nuova applicazione che non conosce può essere assistito nell'utilizzo, se sta guardando il grafico di borsa di un titolo azionario può chiedere un'analisi finanziaria. Anche in questo caso (come in Project Astra) Mariner è in grado di conversare nella nostra lingua preferita dall'utente.
I progressi di Gemini 2.0 rappresentano un passo significativo verso una maggiore integrazione dell'intelligenza artificiale nelle attività quotidiane delle persone e dunque segnano un nuovo punto di svolta fondamentale nella storia dell’IA. A questo punto non resta che aspettare la risposta di Open AI che certamente non resterà a guardare.
LA PRESENTAZIONE VIDEO DI GEMINI 2.0 SU YOU TUBE