Le meilleur démonstration de Gemini de Google était truqué

Le nouveau modèle d’IA Gemini de Google a reçu un accueil mitigé après sa grande présentation d’hier, mais les utilisateurs pourraient avoir moins confiance dans la technologie ou l’intégrité de l’entreprise après avoir découvert que la plus impressionnante démo de Gemini était en grande partie truquée. Une vidéo intitulée «Mains-on avec Gemini: Interaction avec l’IA multimodale» a atteint un million de vues au cours des dernières 24 heures, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Pour commencer, il raconte une évolution de l’esquisse d’un canard d’un squiggle à un dessin complet, qu’il dit de couleur irréaliste, puis exprime sa surprise («What the quack !») Lorsqu’il voit un canard bleu en plastique. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démo passe à d’autres mouvements de démonstration, comme le suivi d’une balle dans un jeu de commutation de tasse, la reconnaissance des gestes de marionnettes d’ombre, la réorganisation des croquis de planètes, etc. C’est tout très réactif, aussi, bien que la vidéo suggère que «la latence a été réduite et les sorties de Gemini ont été abrégées». Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration assez étonnante de la force dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la capacité de Google à expédier un concurrent a pris un coup lorsque j’ai regardé le mains-on.

Share the Post: