‘La meilleure démonstration de Gemini de Google était truquée’

Le nouveau modèle Gemini AI de Google a reçu un accueil mitigé après sa grande présentation d’hier, mais les utilisateurs pourraient avoir moins confiance dans la technologie de la société ou dans son intégrité après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie fausse. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues au cours de la dernière journée, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Pour commencer, il raconte une évolution de croquis d’un canard d’un gribouillis à un dessin terminé, qu’il dit être une couleur irréelle, puis il manifeste de la surprise («What the quack!») Lorsqu’il voit un canard bleu en peluche. Il répond ensuite à diverses questions posées à voix haute sur ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme le suivi d’une balle dans un jeu de transfert de tasse, la reconnaissance de gestes de marionnettes d’ombre, la réorganisation de croquis de planètes, etc. Tout est très réactif, bien que la vidéo mette en garde contre «la latence a été réduite et les sorties de Gemini ont été raccourcies». Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, d’accord. Globalement, c’était une démonstration de force assez époustouflante dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la capacité de Google à expédier un concurrent a pris un coup quand j’ai regardé le hands-on.

Share the Post: