Google a triché avec sa meilleure démonstration Gemini

Le nouveau modèle Gemini AI de Google a reçu un accueil mitigé après sa grande début hier, mais les utilisateurs peuvent avoir moins confiance en la technologie de l’entreprise ou son intégrité après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie truquée. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues au cours des dernières 24 heures, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence quelques-unes de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Pour commencer, elle raconte l’évolution d’un canard à partir d’un gribouillis à un dessin terminé, qu’elle dit avoir une couleur irréaliste, puis elle manifeste sa surprise («What the quack!») Lorsqu’elle voit un canard bleu en plastique. Elle répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme le suivi d’une balle dans un jeu de transfert de tasse, la reconnaissance de gestes de marionnettes d’ombre, la réorganisation de croquis de planètes, etc. Tout est très réactif, mais la vidéo prévient que «la latence a été réduite et les sorties de Gemini ont été raccourcies». Donc, ils sautent une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration assez étonnante de la force dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la possibilité pour Google de livrer un concurrent a pris un coup lorsque j’ai regardé le hands-on.

Share the Post: