Le meilleur démo de Gemini de Google était truqué

Le nouveau modèle d’IA Gemini de Google a reçu un accueil mitigé à la suite de sa grande présentation d’hier, mais les utilisateurs peuvent avoir moins confiance dans les technologies de la société ou dans son intégrité après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie fausse. Une vidéo intitulée « Hands-on with Gemini: Interacting with multimodal AI » a atteint un million de vues en moins d’une journée, ce qui n’est pas difficile à comprendre. La démonstration impressionnante « met en évidence certains de nos interactions préférées avec Gemini », montrant à quel point le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être souple et réactif face à une variété d’entrées. Pour commencer, il raconte l’évolution d’un canard à partir d’un squiggle jusqu’à un dessin complété, qu’il dit être de couleur irréaliste, puis il manifeste sa surprise (« What the quack! ») en voyant un canard bleu en peluche. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme le suivi d’une balle dans un jeu de transfert de tasses, la reconnaissance de gestes de marionnettes d’ombre, le réordonnancement de croquis de planètes, etc. Tout cela est très réactif, bien que la vidéo indique que « la latence a été réduite et les sorties Gemini ont été raccourcies ». Ils passent donc sur une hésitation ici et une réponse trop longue là-bas, c’est compris. Dans l’ensemble, c’était une véritable démonstration de force dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la capacité de Google à livrer un concurrent a été ébranlé lorsque j’ai regardé le hands-on.

Share the Post: