La meilleure démonstration de Gemini de Google était truquée.

Le nouveau modèle Gemini AI de Google est accueilli avec scepticisme après sa grande démonstration d’hier, mais les utilisateurs ont moins confiance dans la technologie ou l’intégrité de la société après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie fausse. Une vidéo intitulée «Interaction avec l’IA multimodale Gemini» a dépassé un million de vues en moins d’une journée, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence quelques-unes de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif face à une variété d’entrées. Pour commencer, il raconte l’évolution d’un canard en squiggle à un dessin terminé, ce qui, dit-il, est une couleur irréaliste, puis il semble surpris («Quoi de neuf, canard!») En voyant un canard bleu en plastique. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, tels que le suivi d’une balle dans un jeu de transfert de tasse, la reconnaissance de gestes de marionnettes d’ombre, la réorganisation de croquis de planètes, etc. Tout est très réactif, bien que la vidéo indique que «la latence a été réduite et les sorties de Gemini ont été raccourcies». Ils passent donc une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration de force assez impressionnante dans le domaine de la compréhension multimodale. Mon scepticisme quant à la possibilité pour Google de mettre sur le marché un concurrent a pris un coup quand j’ai regardé la vidéo.

Share the Post: