Vidéo générée par intelligence artificielle est là pour impressionner et tromper

Un petit monstre duveteux s’agenouille avec émerveillement à côté d’une bougie allumée. Deux petits navires de pirates se battent à l’intérieur d’une tasse de café tourbillonnante. Une pieuvre rampe le long du sol sablonneux de l’océan. Un chiot dalmatien saute d’un appui de fenêtre à un autre. Ce sont parmi une série de vidéos de démonstration de Sora d’OpenAI, révélées la semaine dernière, qui peuvent transformer une courte instruction textuelle en jusqu’à une minute de vidéo. Le modèle d’intelligence artificielle n’est pas encore ouvert au grand public, mais OpenAI a publié les vidéos, ainsi que les instructions qui les ont générées. Cela a rapidement été suivi de gros titres qualifiant Sora de « stupéfiant », « terrifiant » et « époustouflant ». Les chercheurs d’OpenAI Tim Brooks et Bill Peebles ont déclaré au New York Times qu’ils ont choisi « sora », japonais pour « ciel », pour souligner l’idée d’un « potentiel créatif illimité ». Cependant, OpenAI utilise un autre terme pour décrire Sora : un potentiel « simulateur de monde, » qui, avec le temps, pourrait créer des simulateurs très performants du monde physique et numérique, ainsi que des objets, animaux et personnes qui y vivent. Il n’en est pas encore là. Bien que les vidéos de démonstration disponibles de Sora au travail puissent paraître étranges et réalistes, l’article technique d’OpenAI sur le modèle note ses nombreuses « limitations ». Alors que Sora peut parfois représenter avec précision les changements sur une toile lorsqu’un pinceau chargé de peinture la balaye ou créer des marques de dents dans un sandwich après avoir montré un homme en manger une bouchée, Sora « ne modèle pas avec précision la physique de nombreuses interactions de base », comme la casse d’un verre. Les gens et les objets peuvent apparaître et disparaître spontanément, et comme de nombreux modèles d’IA, Sora peut « halluciner ». Certains experts en IA, comme Gary Marcus, ont exprimé des doutes quant à savoir si un modèle comme Sora pourrait apprendre un jour à représenter fidèlement les lois de la physique. Mais tout comme DALL-E et ChatGPT ont progressé avec le temps, Sora pourrait également le faire. Et si son objectif est de devenir un « simulateur de monde », il est bon de se demander : quel est le monde que Sora pense simuler?

Share the Post: