La vidéo générée par intelligence artificielle est là pour impressionner et tromper.

Un petit monstre pelucheux s’agenouille émerveillé à côté d’une bougie allumée. Deux petits navires de pirates se battent à l’intérieur d’une tasse de café tourbillonnante. Une pieuvre rampe le long du plancher sablonneux de l’océan. Un chiot Dalmatien saute d’un rebord de fenêtre à un autre. Ce sont parmi une série de vidéos de démonstration du Sora d’OpenAI, révélées la semaine dernière, qui peuvent transformer une courte instruction textuelle en une minute de vidéo. Le modèle d’intelligence artificielle n’est pas encore accessible au grand public, mais OpenAI a publié les vidéos, ainsi que les instructions qui les ont générées. Cela a rapidement été suivi par des titres qualifiant Sora de « stupefiant », « terrifiant » et « sidérant ». Les chercheurs d’OpenAI, Tim Brooks et Bill Peebles, ont déclaré au New York Times qu’ils avaient choisi « sora », mot japonais pour « ciel », pour souligner l' »idée d’un potentiel créatif illimité ». Il y a cependant un autre terme que OpenAI utilise pour décrire Sora : un « simulateur de monde » potentiel, qui, avec le temps, pourrait créer des « simulateurs très capables du monde physique et numérique, ainsi que des objets, animaux et personnes qui y vivent ». Ce n’est pas encore le cas. Bien que les vidéos de démonstration disponibles de Sora au travail puissent sembler étrangement réalistes, l’article technique d’OpenAI sur le modèle note ses nombreuses « limitations ». Alors que Sora peut parfois représenter avec précision les changements sur une toile lorsqu’un pinceau chargé de peinture la balaye ou créer des traces de morsure dans un sandwich après avoir montré un homme en manger, Sora « ne modélise pas avec précision les lois de la physique dans de nombreuses interactions de base », telles que la casse d’un verre. Des personnes et des objets peuvent apparaître et disparaître de façon spontanée, et comme de nombreux modèles d’IA, Sora peut « halluciner ». Certains experts en IA, comme Gary Marcus, ont émis des doutes sur le fait qu’un modèle comme Sora puisse jamais apprendre à représenter fidèlement les lois de la physique. Mais tout comme DALL-E et ChatGPT s’améliorent avec le temps, Sora pourrait en faire de même. Et si son objectif est de devenir un « simulateur de monde », il est légitime de se demander : quel est le monde que Sora pense simuler ?

Share the Post: