‘La vidéo générée par intelligence artificielle est là pour impressionner et induire en erreur.’

Un minuscule monstre duveteux s’agenouille avec émerveillement à côté d’une bougie allumée. Deux petits navires de pirates se battent à l’intérieur d’une tasse de café tourbillonnante. Une pieuvre se déplace le long du fond sablonneux de l’océan. Un chiot dalmatien saute d’un rebord de fenêtre à un autre. Ce sont parmi une série de vidéos de démonstration de Sora d’OpenAI, révélées la semaine dernière, qui peuvent transformer une brève incitation textuelle en jusqu’à une minute de vidéo. Le modèle d’intelligence artificielle n’est pas encore ouvert au public, mais OpenAI a diffusé les vidéos, ainsi que les incitations qui les ont générées. Cela a été rapidement suivi par des gros titres qualifiant Sora de « stupéfiant », de « terrifiant » et de « époustouflant ». Tim Brooks et Bill Peebles, chercheurs d’OpenAI, ont déclaré au New York Times qu’ils ont choisi « sora », un terme japonais signifiant « ciel », pour mettre en avant l' »idée d’un potentiel créatif illimité ». Il y a cependant un autre terme qu’OpenAI utilise pour décrire Sora : un potentiel « simulateur de monde », qui, avec le temps, pourrait créer des « simulateurs hautement capables du monde physique et numérique, et des objets, animaux et personnes qui y vivent ». Ils n’en sont pas encore là. Bien que les vidéos de démonstration disponibles de Sora au travail puissent paraître étranges et réalistes, l’article technique d’OpenAI sur le modèle note ses nombreuses « limites ». Alors que Sora peut parfois représenter de manière précise les changements sur une toile lorsqu’un pinceau chargé de peinture la traverse, ou créer des marques de morsure dans un sandwich après avoir montré un homme en manger une bouchée, Sora « ne modélise pas avec précision la physique de nombreuses interactions de base », telles qu’une vitre qui se brise. Les personnes et les objets peuvent apparaître et disparaître spontanément, et comme de nombreux modèles d’IA, Sora peut « halluciner ». Certains experts en IA, comme Gary Marcus, ont émis des doutes quant à savoir si un modèle tel que Sora pourrait jamais apprendre à représenter fidèlement les lois de la physique. Mais tout comme DALL-E et ChatGPT se sont améliorés avec le temps, Sora pourrait en faire autant. Et si son objectif est de devenir un « simulateur de monde », il est légitime de se demander : quel est le monde que Sora pense simuler ?

Share the Post: