Video généré par IA est là pour impressionner et tromper.

Un minuscule monstre duveteux s’agenouille avec émerveillement à côté d’une bougie allumée. Deux petits navires de pirates se battent à l’intérieur d’une tasse de café tourbillonnante. Une pieuvre rampe le long du sol sablonneux de l’océan. Un chiot Dalmatien saute d’un rebord de fenêtre à un autre. Ce sont parmi une série de vidéos de démonstration de Sora d’OpenAI, dévoilées la semaine dernière, qui peut transformer une courte consigne en une minute de vidéo. Le modèle d’intelligence artificielle n’est pas encore accessible au public, mais OpenAI a publié les vidéos, ainsi que les consignes qui les ont générées. Cela a rapidement été suivi de titres qualifiant Sora de « époustouflant », « terrifiant » et « époustouflant ». Les chercheurs d’OpenAI, Tim Brooks et Bill Peebles, ont déclaré au New York Times qu’ils ont choisi « sora », qui signifie « ciel » en japonais, pour souligner l’idée d’un « potentiel créatif illimité ». Cependant, il y a un autre terme qu’OpenAI utilise pour décrire Sora: un potentiel « simulateur de monde », qui, avec le temps, pourrait créer des simulateurs « hautement capables du monde physique et numérique, et des objets, animaux et personnes qui y vivent ». Il n’en est pas encore là. Bien que les vidéos de démonstration de Sora en action puissent parfois sembler troublantes et réalistes, l’article technique d’OpenAI sur le modèle note ses nombreuses « limitations ». Alors que Sora peut parfois représenter avec précision les changements sur une toile lorsqu’un pinceau chargé de peinture la balaye ou créer des marques de morsure dans un sandwich après avoir montré un homme en prendre une, Sora « ne modélise pas avec précision la physique de nombreuses interactions de base », comme une verre se brisant. Les personnes et les objets peuvent apparaître et disparaître de manière spontanée, et, comme de nombreux modèles d’IA, Sora peut « halluciner ». Certains experts en IA, comme Gary Marcus, ont émis des doutes sur la possibilité pour un modèle comme Sora d’apprendre à représenter fidèlement les lois de la physique. Mais tout comme DALL-E et ChatGPT se sont améliorés avec le temps, il en va de même pour Sora. Et si son objectif est de devenir un « simulateur de monde », il est bon de se demander : quel est le monde que Sora pense simuler ?

Share the Post: