‘La meilleure démo de Gemini de Google a été truquée’

Le nouveau modèle d’IA Gemini de Google reçoit un accueil mitigé après son grand début d’hier, mais les utilisateurs peuvent avoir moins confiance dans la technologie ou l’intégrité de l’entreprise après avoir découvert que la démonstration la plus impressionnante de Gemini était en grande partie truquée. Une vidéo intitulée «Hands-on with Gemini: Interacting with multimodal AI» a atteint un million de vues au cours des dernières 24 heures, et il n’est pas difficile de comprendre pourquoi. La démonstration impressionnante «met en évidence certains de nos interactions préférées avec Gemini», montrant comment le modèle multimodal (c’est-à-dire qu’il comprend et mélange la langue et la compréhension visuelle) peut être flexible et réactif face à une variété d’entrées. Pour commencer, il raconte une évolution de l’esquisse d’un canard d’un squiggle à un dessin terminé, qu’il dit de couleur irréaliste, puis exprime sa surprise («What the quack!») en voyant un canard bleu en peluche. Il répond ensuite à diverses requêtes vocales concernant ce jouet, puis la démonstration passe à d’autres mouvements de démonstration, comme suivre une balle dans un jeu de transfert de tasses, reconnaître des gestes de marionnettes d’ombre, réorganiser des esquisses de planètes, etc. Tout est très réactif, même si la vidéo recommande de «réduire la latence et de raccourcir les sorties de Gemini». Donc, ils passent outre une hésitation ici et une réponse trop longue là-bas, d’accord. Dans l’ensemble, c’était une démonstration de force assez étonnante dans le domaine de la compréhension multimodale. Ma propre scepticisme quant à la possibilité pour Google de livrer un concurrent a pris un coup quand j’ai regardé le hands-on.

Share the Post: