L’intelligence artificielle conversationnelle est sur le point de redéfinir ce que c’est que de discuter avec un assistant numérique. Gemini Live de Google permet aux abonnés de discuter de manière interactive avec l’IA générative, offrant une interaction plus conversationnelle qu’avec Google Assistant. Mais Gemini Live n’est pas conçu uniquement pour paraître plus réaliste. La technologie comprend mieux le contexte que les premiers assistants numériques, ce qui permet de poser des questions de suivi ou même de faire en sorte que l’IA comprenne ce qui est affiché sur l’écran de votre smartphone, ce qui se trouve dans votre Gmail, ou ce qui est noté dans votre calendrier. En plus d’une conversation améliorée, Gemini Live est conçu pour être plus agentif, ce qui signifie que l’IA peut effectivement faire des choses pour vous, comme créer une liste de lecture ou rédiger un e-mail. Les utilisateurs peuvent interrompre l’IA, mettre en pause une conversation pour la reprendre ultérieurement, ou consulter la retranscription de leur chat.
Gemini Live a commencé à être déployé en anglais sur les appareils Android le 13 août, et nécessite un abonnement à Gemini Advanced, qui fait partie de l’option Google AI Premium mensuelle de 20 $. Certaines fonctionnalités, en particulier celles alimentées par des extensions, ne seront pas déployées avant une date ultérieure. Les utilisateurs d’iOS devront également attendre la fonctionnalité, qui devrait migrer sur les appareils mobiles d’Apple dans les « semaines à venir ».
Cependant, contrairement à d’autres assistants comme Hey Google ou Alexa, nombreux seront ceux qui mettront à jour l’application ou ouvriront les nouveaux appareils Pixel 9 ou même les Pixel Buds Pro 2 sans comprendre pleinement ce dont l’IA est capable. Voici dix choses que vous pouvez essayer avec Gemini Live.
Le nouveau Pixel 9 Pro et Pro XL haut de gamme de Google sont les smartphones les plus grands et les plus capables en matière d’IA que la société ait fabriqués, et les plus similaires à l’iPhone. Gemini Live est conçu pour paraître plus humain, et cela se traduit par la possibilité de choisir parmi 10 voix différentes. Les voix sont nommées et décrites dans l’application, comme une « voix calme et moyenne. » Les utilisateurs sont invités à choisir au début, mais la voix de Gemini peut toujours être modifiée ultérieurement dans les paramètres. Les nouveaux téléphones Google Pixel 9 proposent des fonctionnalités IA exclusives. L’une des principales différences entre Gemini Live et les précédents assistants numériques est sa capacité à comprendre le contexte, y compris ce qui est affiché sur votre écran. Cela signifie que vous pouvez entamer une conversation sur la vidéo YouTube que vous regardez, par exemple, ou la page web que vous lisez. Pendant la démonstration en direct lors de l’événement Made By Google, Live a également posé des questions sur l’utilisation d’une photo. Utiliser plusieurs formes d’entrée, comme la voix et une image, est appelé multimodal, une autre partie de Live qui n’est pas encore tout à fait prête au lancement mais qui arrivera bientôt. Le nouveau flagship pliable de Google, le Pixel 9 Pro Fold, est disponible dès maintenant en précommande et coûte 1 799 $. Un autre aspect qui place Gemini Live devant les précédents assistants est sa capacité à interagir avec d’autres applications, comme résumer une conversation Gmail, consulter votre calendrier ou créer une liste de lecture. Vous pouvez également demander à Gemini Live de commencer à rédiger un e-mail pour vous, de sorte que vous puissiez ensuite apporter des modifications dans l’application e-mail avant de l’envoyer. Cela fonctionne avec Live ainsi qu’en tapant la commande dans l’application Gemini. Ces fonctionnalités sont alimentées par des extensions comprenant Keep, Tasks et Utilities – elles ne sont pas disponibles immédiatement au lancement, mais Google indique que ces extensions et les compétences qui les accompagnent seront bientôt disponibles. Seul un petit groupe d’abonnés ChatGPT Plus aura accès initialement. Le va-et-vient conversationnel de Gemini Live ouvre davantage d’options pour le brainstorming. Plutôt que de le taper avec l’application Gemini, Live vous permet de demander des idées, puis de continuer à discuter pour trouver ou affiner ces pensées. Les exemples de Google pour cette capacité incluaient la planification d’activités scientifiques avec les enfants et la demande d’idées de cadeaux. Avec une option d’affichage plus grande de 45 mm, la Pixel Watch 3 est enfin sur mon radar. Les nouvelles capacités conversationnelles de Gemini font de l’assistant un meilleur outil pour se préparer à un entretien d’embauche. Alors qu’auparavant, vous auriez théoriquement pu poser des questions et taper des réponses avec Gemini, Live vous permet d’interagir avec l’IA de façon conversationnelle, plus proche de la réalité. Les nouveaux Pixels haut de gamme de Google sont très différents de leur prédécesseur, le Pixel 8 Pro, mais il est plus compliqué de savoir s’ils sont meilleurs. Comme le chatbot original, Gemini Live vous permet de demander des conseils, des astuces ou des suggestions. Dans les vidéos de promotion, Google a démontré cela en demandant des conseils pour rédiger un discours de mariage drôle, mais pas trop embarrassant. La nature conversationnelle de Gemini Live pourrait potentiellement permettre davantage d’échanges pour affiner ou clarifier les conseils donnés par l’IA. Gemini 1.5 Pro pourra bientôt répondre à des questions sur le monde qui vous entoure en utilisant la vidéo, parmi d’autres mises à jour clés de Google I/O. Plusieurs démonstrations de Google étaient centrées autour de la planification d’un événement, d’un dîner à avoir vos nièces et neveux pour le week-end. Une fois les extensions lancées, vous pourrez non seulement demander des idées, mais Gemini Live pourra consulter votre calendrier, chercher une recette dans vos e-mails, planifier des activités ou rédiger un texte d’invitation. Les utilisateurs de Fitbit ont certainement tiré le meilleur parti de cet accord. Google présente les écouteurs Pixel Buds Pro 2 comme les premiers écouteurs de l’ère Gemini. Les écouteurs permettent des conversations mains libres avec Live. Grâce à cette fonctionnalité, vous pouvez obtenir des indications pour marcher dans votre oreille ou demander de créer une nouvelle playlist pendant que vous faites votre séance d’entraînement. En tapotant et en maintenant enfoncé le bouton, puis en disant « let’s talk live », vous activez Gemini Live. Bien sûr, vous aurez probablement l’air de parler tout seul, mais c’est un moyen pratique d’interagir avec l’IA plus conversationnelle. La nouvelle fonctionnalité est alimentée par la puce Tensor de Google. Si vous avez commencé une conversation avec Hey Google, vous ne pouvez pas y revenir sans réintroduire le sujet. Avec Gemini Live, vous pouvez mettre en pause une conversation et la reprendre plus tard. Vous pouvez également interrompre Gemini lorsqu’il parle, si vous devez clarifier quelque chose ou si l’IA prend une mauvaise direction. La charge solaire sur votre poignet ? En théorie, c’est génial, mais est-ce que cela améliore ou nuit en réalité à la durée de vie de la batterie ? Vous n’avez pas besoin de prendre des notes car Gemini Live vous donne des conseils ou recherche des informations avec vous. Gemini Live enregistre les transcriptions complètes des conversations sur votre téléphone, ce qui facilite le retour sur ce que l’IA a dit à voix haute. Des fonctionnalités d’IA puissantes arrivent sur Gmail, mais il faudra payer pour les utiliser.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du