Le meilleur démo Gemini de Google était truqué

Le nouveau modèle d’IA Gemini de Google a obtenu un accueil mitigé après sa grande démonstration d’hier, mais les utilisateurs pourraient avoir moins confiance dans la technologie de l’entreprise ou son intégrité après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie fausse. Une vidéo intitulée «Démonstration de Gemini : interaction avec l’IA multimodale» a atteint un million de vues au cours de la dernière journée, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Tout d’abord, il raconte une évolution de l’esquisse d’un canard d’un squiggle à un dessin terminé, qu’il dit être de couleur irréaliste, puis il montre de la surprise («What the quack!») Lorsqu’il voit un canard bleu en plastique. Il répond ensuite à diverses requêtes vocales à ce sujet, puis la démonstration passe à d’autres mouvements spectaculaires, comme suivre une balle dans un jeu de transfert de tasse, reconnaître les gestes de marionnettes d’ombre, réorganiser les esquisses de planètes, etc. Tout est très réactif, mais la vidéo prévient que «la latence a été réduite et les sorties de Gemini ont été abrégées». Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, compris. Dans l’ensemble, c’était une démonstration de force assez époustouflante dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la possibilité pour Google de proposer un concurrent a été ébranlé lorsque j’ai regardé la démonstration.

Share the Post: