La vidéo générée par l’IA est là pour impressionner et tromper.

Un minuscule monstre pelucheux s’agenouille avec émerveillement à côté d’une bougie allumée. Deux petits navires de pirates se battent à l’intérieur d’une tasse de café remuante. Une pieuvre rampe le long du sol sablonneux de l’océan. Un chiot dalmatien saute d’un rebord de fenêtre à un autre. Ce sont parmi une série de vidéos de démonstration du Sora de OpenAI, révélées la semaine dernière, qui peuvent transformer une courte instruction textuelle en jusqu’à une minute de vidéo. Le modèle d’intelligence artificielle n’est pas encore accessible au public, mais OpenAI a publié les vidéos, ainsi que les instructions qui les ont générées. Cela a rapidement été suivi par des gros titres qualifiant le Sora de « époustouflant », « terrifiant » et « époustouflant ». Les chercheurs de OpenAI, Tim Brooks et Bill Peebles, ont déclaré au New York Times qu’ils ont choisi « sora », le mot japonais pour « ciel », pour mettre en avant l’idée de potentiel créatif illimité. Il y a cependant un autre terme que OpenAI utilise pour décrire le Sora : un potentiel « simulateur de monde », un qui, avec le temps, pourrait créer des simulateurs très capables du monde physique et numérique, et des objets, animaux et personnes qui y vivent. Ce n’en est pas encore là. Alors que les vidéos de démonstration disponibles du Sora en action peuvent sembler troublantes et réalistes, l’article technique de OpenAI sur le modèle souligne ses nombreuses « limites ». Alors que le Sora peut parfois représenter avec précision les changements sur une toile quand un pinceau chargé de peinture la balaye, ou créer des marques de dents dans un sandwich après avoir montré un homme en train de mordre dedans, le Sora « ne modélise pas avec précision la physique de bon nombres d’interactions de base », tel qu’un verre qui se casse. Les gens et les objets peuvent apparaître et disparaître spontanément, et comme beaucoup de modèles IA, le Sora peut « halluciner ». Certains experts en IA, comme Gary Marcus, ont soulevé des doutes sur le fait qu’un modèle comme le Sora puisse jamais apprendre à représenter fidèlement les lois de la physique. Mais tout comme DALL-E et ChatGPT ont progressé avec le temps, le Sora pourrait aussi le faire. Et si son objectif est de devenir un « simulateur de monde », il est bon de se demander : quel est le monde que le Sora pense simuler?

Share the Post: