« Ce que deux années de développement de l’IA peuvent nous dire sur Sora »

« Rappelez-vous quand les générateurs d’art IA sont devenus largement disponibles en 2022 et soudain, Internet était rempli d’images étranges qui étaient très cool mais qui semblaient inexactes de près ? Préparez-vous à vivre cela à nouveau — mais cette fois pour les vidéos. La semaine dernière, OpenAI a publié Sora, un modèle IA génératif qui produit des vidéos basées sur une simple commande. Il n’est pas encore disponible au public, mais le PDG Sam Altman a montré ses capacités en répondant aux demandes sur X, anciennement connu sous le nom de Twitter. Les utilisateurs ont répondu avec de courtes commandes : « un singe jouant aux échecs dans un parc », ou « une course de vélos sur l’océan avec différents animaux en tant qu’athlètes ». C’est étrange, hypnotisant, bizarre, beau — et suscite le cycle habituel de commentaires. Certaines personnes font des affirmations fermes sur les effets négatifs de Sora, s’attendant à une « vague de désinformation » — mais alors que moi (et les experts) pensons que les futurs systèmes IA puissants posent de réels risques, les affirmations selon lesquelles un modèle spécifique nous apportera la vague de désinformation ne se sont pas avérées jusqu’à présent. D’autres soulignent les nombreuses lacunes de Sora comme représentant des limites fondamentales de la technologie — ce qui a été une erreur lorsque les gens l’ont fait avec les modèles de générateurs d’images et qui, je le crains, sera à nouveau une erreur. Comme l’a souligné ma collègue A.W. Ohlheiser, « tout comme DALL-E et ChatGPT se sont améliorés avec le temps, il en ira de même pour Sora ». Les prédictions, à la fois optimistes et pessimistes, pourraient se concrétiser — mais la conversation sur Sora et l’IA générative serait plus productive si tous les camps prenaient en compte toutes les manières dont nous avons été prouvés avoir tort ces dernières années. Il y a deux ans, OpenAI a annoncé DALL-E 2, un modèle capable de produire des images fixes à partir d’une commande texte. Les images fantastiques haute résolution qu’il produisait étaient rapidement partagées sur les réseaux sociaux, tout comme les interprétations à en faire : Art réel ? Faux art ? Une menace pour les artistes ? Un outil pour les artistes ? Une machine à désinformation ? Deux ans plus tard, il est bon de prendre un peu de recul si nous voulons que notre point de vue sur Sora vieillisse mieux. »

Share the Post: