Le meilleur démonstration de Gemini de Google était un canular

Le nouveau modèle d’IA Gemini de Google est mal accueilli après sa grande debut hier, mais les utilisateurs peuvent avoir moins confiance en la technologie ou l’intégrité de la société après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie fausse. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues dans les dernières 24 heures, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif à une variété d’entrées. Tout d’abord, il raconte une évolution de l’esquisse d’un canard d’un squiggle à un dessin terminé, qu’il dit de couleur irréaliste, puis il montre une surprise («What the quack!») Lorsqu’il voit un canard bleu en peluche. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme le suivi d’une balle dans un jeu de transfert de tasse, la reconnaissance des gestes de marionnettes d’ombre, la réorganisation des esquisses de planètes, et ainsi de suite. C’est tout aussi réactif, bien que la vidéo mette en garde que «les temps de latence ont été réduits et les sorties de Gemini ont été raccourcies». Donc, ils passent par une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration assez impressionnante de la force dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la possibilité pour Google de livrer un concurrent a pris un coup lorsque j’ai regardé le Hands-on.

Share the Post: