Cosa è Gemini Live?
Google ha recentemente lanciato Gemini Live, una nuova funzione di chat vocale AI che si propone di competere direttamente con la modalità di chat vocale avanzata di ChatGPT.
Google ha recentemente lanciato Gemini Live, una nuova funzione di chat vocale AI che si propone di competere direttamente con la modalità di chat vocale avanzata di ChatGPT. La presentazione di questa innovazione è avvenuta durante l'evento Pixel 9, in cui è stata introdotta la nuova serie di smartphone Pixel 9, caratterizzata da un forte focus sulle funzionalità AI integrate. Tra queste, si distinguono i riassunti delle chiamate, l'integrazione con servizi come Google Calendar, Gmail e G-drive, la riprogettazione delle foto e gli aggiornamenti meteo.
Gemini Live è stato progettato per offrire conversazioni naturali e fluide, ed è ora disponibile per tutti gli utenti avanzati di Gemini. In contrasto, la funzione vocale di OpenAI è ancora limitata a un gruppo ristretto di tester. Gemini Live mette a disposizione 10 diverse voci, tra cui Lyra, Ursa, Capella e Orbit, tutte sviluppate con l'aiuto di attori professionisti. Per evitare problemi di copyright, come quelli che OpenAI ha incontrato con la voce "Sky" associata a Scarlett Johansson, Google ha limitato la funzione a queste voci, impedendo la riproduzione di canzoni o l'imitazione di altre voci.
Questa nuova funzione di chat vocale risponde rapidamente alle domande, gestisce le interruzioni, consente di mettere in pausa e riprendere le conversazioni in un secondo momento, e memorizza le chat precedenti per riprendere il discorso da dove era stato interrotto. Tutto ciò avviene senza la necessità di un'attivazione manuale, poiché Gemini Live può operare in background anche quando il telefono è bloccato.
Durante una dimostrazione, Gemini Live ha mostrato la sua capacità di comprendere e rispondere a richieste complesse, come quella di trovare "cantine adatte alle famiglie vicino a Mountain View con aree all'aperto e parchi giochi nelle vicinanze", compito che altri assistenti vocali come Siri avrebbero difficoltà a gestire. Tuttavia, nonostante le sue avanzate capacità, Gemini Live non è ancora in grado di comprendere l'intonazione emotiva, un aspetto su cui la funzione vocale di OpenAI è già avanti. Inoltre, la funzione non è ancora in grado di interpretare e utilizzare video per completare compiti complessi, una caratteristica che Google ha promesso di introdurre prossimamente, come annunciato durante la conferenza degli sviluppatori I/O di maggio.