‘Le meilleur démo de Gemini de Google était truqué’

Le nouveau modèle d’IA Gemini de Google reçoit un accueil mitigé après sa grande début hier, mais les utilisateurs peuvent avoir moins confiance dans la technologie de l’entreprise ou son intégrité après avoir découvert que la démonstration la plus impressionnante de Gemini était presque truquée. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues au cours des dernières 24 heures, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif face à une variété d’entrées. Pour commencer, il raconte une évolution croquis d’un canard d’un squiggle à un dessin terminé, ce qui dit est une couleur irréaliste, puis évince la surprise («What the quack!») Lors de la vue d’un canard bleu en plastique. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de show-off, comme le suivi d’une balle dans un jeu de commutation de tasses, la reconnaissance de gestes de marionnettes d’ombre, la réorganisation de croquis de planètes, et ainsi de suite. C’est tout très réactif, même si la vidéo ne manque pas de préciser que «les temps de latence ont été réduits et les sorties Gemini ont été raccourcies». Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était un assez étonnant déploiement de force dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la possibilité pour Google de livrer un concurrent a pris un coup quand je l’ai regardé en action.

Share the Post: