Le meilleur démonstration de Gemini de Google était truqué.

Le nouveau modèle d’IA Gemini de Google reçoit un accueil mitigé après sa grande démonstration d’hier, mais les utilisateurs peuvent avoir moins confiance dans la technologie de l’entreprise ou son intégrité après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie fausse. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues au cours de la dernière journée, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant à quel point le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Pour commencer, il raconte une évolution croquis d’un canard d’un squiggle à un dessin terminé, ce qu’il dit est une couleur irréaliste, puis montre sa surprise («What the quack!») Lorsqu’il voit un canard bleu en plastique. Il répond ensuite à diverses questions vocales sur ce jouet, puis la démonstration passe à d’autres démonstrations, comme suivre une balle dans un jeu de tasses, reconnaître des gestes de marionnettes d’ombre, réorganiser des croquis de planètes, et ainsi de suite. Tout est très réactif, too, bien que la vidéo mette en garde que «latence a été réduite et les sorties Gemini ont été raccourcies.» Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration assez étonnante de la force dans le domaine de la compréhension multimodale. Ma propre scepticisme que Google pourrait livrer un concurrent a pris un coup quand je l’ai regardé de près.

Share the Post: