La meilleure démonstration de Gemini de Google était falsifiée.

Le nouveau modèle Gemini AI de Google fait l’objet d’une réception mitigée après sa grande démonstration d’hier, mais les utilisateurs pourraient avoir moins confiance dans la technologie de la société ou dans son intégrité après avoir découvert que la plus impressionnante des démonstrations de Gemini était en grande partie truquée. Une vidéo intitulée «Interaction avec l’IA multimodale Gemini» a atteint un million de vues au cours de la dernière journée, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certaines de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Pour commencer, elle raconte une évolution de l’esquisse d’un canard d’un squiggle à un dessin terminé, qu’elle dit être d’une couleur irréaliste, puis elle manifeste sa surprise («What the quack!») Lorsqu’elle voit un canard bleu en plastique. Ensuite, elle répond à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme suivre une balle dans un jeu de permutation de tasses, reconnaître des gestes de marionnettes d’ombre, réorganiser des esquisses de planètes, etc. Tout est très réactif, bien que la vidéo indique que «les temps de latence ont été réduits et les sorties de Gemini ont été abrégées». Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, je l’ai eue. Dans l’ensemble, c’était une démonstration plutôt étonnante de la force dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la possibilité pour Google de livrer un concurrent a pris un coup lorsque j’ai regardé la démonstration en direct.

Share the Post: