Video générée par l’IA est ici pour impressionner et tromper.

Un minuscule monstre duveteux s’agenouille en admiration à côté d’une bougie allumée. Deux petits navires de pirates se battent à l’intérieur d’une tasse de café tourbillonnante. Une pieuvre rampe le long du fond sablonneux de l’océan. Un chiot Dalmatien bondit d’un rebord de fenêtre à un autre. Ce sont parmi une série de vidéos de démonstration de Sora d’OpenAI, révélées la semaine dernière, qui peuvent transformer une brève consigne textuelle en une vidéo d’une minute. Le modèle d’intelligence artificielle n’est pas encore ouvert au public, mais OpenAI a publié les vidéos, ainsi que les consignes qui les ont générées. Cela a rapidement été suivi de titres qualifiant Sora de « époustouflant », « terrifiant » et « étonnant ». Les chercheurs d’OpenAI, Tim Brooks et Bill Peebles, ont déclaré au New York Times qu’ils ont choisi « sora », japonais pour « ciel », pour mettre en avant « l’idée d’un potentiel créatif illimité ». Il y a cependant un autre terme qu’OpenAI utilise pour décrire Sora : un « simulateur de monde » potentiel, qui, avec le temps, pourrait créer des « simulateurs très capables du monde physique et numérique, ainsi que des objets, animaux et personnes qui y vivent ». Ce n’est pas encore le cas. Alors que les vidéos de démonstration disponibles de Sora au travail peuvent sembler troublantes et réalistes, l’article technique d’OpenAI sur le modèle souligne ses nombreuses « limitations ». Bien que Sora puisse parfois représenter avec précision les changements sur une toile lorsqu’un pinceau chargé de peinture la balaye ou créer des traces de dent dans un sandwich après avoir montré un homme en prendre une bouchée, Sora « ne modélise pas avec précision les lois de la physique de nombreuses interactions de base », telles que la casse d’un verre. Les personnes et les objets peuvent apparaître et disparaître spontanément, et comme de nombreux modèles d’IA, Sora peut « halluciner ». Certains experts en IA, comme Gary Marcus, ont exprimé des doutes quant à la capacité d’un modèle comme Sora à apprendre à représenter fidèlement les lois de la physique. Mais tout comme DALL-E et ChatGPT ont progressé au fil du temps, Sora pourrait également le faire. Et si son objectif est de devenir un « simulateur de monde », il est intéressant de se demander : quel est le monde que Sora pense simuler ?

Share the Post: