Le meilleur démo de Gemini de Google était truqué.

Google lance son nouveau modèle d’IA Gemini à un accueil mitigé après sa grande première hier, mais les utilisateurs peuvent avoir moins confiance en la technologie ou l’intégrité de la société après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie truquée. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues en moins d’une journée, ce qui n’est pas étonnant. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Pour commencer, il raconte une esquisse évolutive d’un canard d’un squiggle à un dessin terminé, qu’il dit être une couleur irréaliste, puis exprime sa surprise («What the quack!») Lorsqu’il voit un canard bleu en plastique. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme suivre une balle dans un jeu de transfert de tasse, reconnaître des gestes de marionnettes d’ombre, réorganiser des esquisses de planètes, etc. C’est tout très réactif, bien que la vidéo mette en garde contre «la latence a été réduite et les sorties de Gemini ont été raccourcies». Ils passent donc rapidement sur une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration assez impressionnante du domaine de la compréhension multimodale. Ma propre scepticisme quant à la capacité de Google à livrer un concurrent a pris un coup quand j’ai regardé le hands-on.

Share the Post: