La meilleure démonstration de Gemini de Google était falsifiée.

Le nouveau modèle d’IA Gemini de Google suscite des réactions mitigées après son grand déploiement hier, mais les utilisateurs pourraient avoir moins confiance dans la technologie ou l’intégrité de l’entreprise après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie truquée. Une vidéo intitulée « Prise en main de Gemini : interaction avec une IA multimodale » a été visionnée un million de fois au cours de la dernière journée, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante « met en évidence certaines de nos interactions préférées avec Gemini », montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange le langage et la compréhension visuelle) peut être flexible et réactif à une variété de stimuli. Pour commencer, il raconte une esquisse d’un canard en pleine évolution à partir d’un griffonnage jusqu’à un dessin complet, qu’il affirme être d’une couleur irréaliste, puis manifeste sa surprise (« Hoquet de canard ! ») en voyant un canard bleu jouet. Il répond ensuite à diverses interrogations vocales sur ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme le suivi d’une balle dans un jeu d’inversion de gobelets, la reconnaissance de gestes de marionnettes d’ombres, la réorganisation d’esquisses de planètes, et ainsi de suite. Tout est très réactif également, bien que la vidéo précise que « la latence a été réduite et les sorties de Gemini ont été raccourcies ». Ainsi, ils passent sous silence une hésitation ici et une réponse trop longue là-bas, c’est clair. Dans l’ensemble, il s’agissait d’une démonstration impressionnante de force dans le domaine de la compréhension multimodale. Mon propre scepticisme quant à la possibilité pour Google de proposer un concurrent a été ébranlé lorsque j’ai regardé la prise en main.

Share the Post: