« Ce que deux ans de développement de l’IA peuvent nous dire sur Sora »

‘Vous souvenez-vous quand les générateurs d’art IA sont devenus largement disponibles en 2022 et soudainement internet était rempli d’images étranges qui étaient très cool mais qui ne semblaient pas tout à fait correctes à l’examen rapproché ? Préparez-vous à ce que cela se reproduise – mais cette fois-ci pour les vidéos. La semaine dernière, OpenAI a sorti Sora, un modèle IA génératif qui produit des vidéos basées sur une demande simple. Il n’est pas encore disponible pour le grand public, mais le PDG Sam Altman a montré ses capacités en prenant des demandes sur X, anciennement connu sous le nom de Twitter. Les utilisateurs ont répondu avec de courtes demandes : « un singe jouant aux échecs dans un parc », ou « une course de vélos sur l’océan avec différents animaux en tant qu’athlètes. » C’est étrange, hypnotisant, étrange, beau – et suscite le commentaire habituel. Certaines personnes font des affirmations fortes concernant les effets négatifs de Sora, s’attendant à une « vague de désinformation » – mais alors que moi (et les experts) pensons que les futurs systèmes IA puissants posent des risques vraiment sérieux, les affirmations selon lesquelles un modèle spécifique apportera la vague de désinformation sur nous n’ont pas été confirmées jusqu’à présent. D’autres pointent les nombreuses failles de Sora comme représentant des limites fondamentales de la technologie – une erreur que les gens ont commise avec les modèles de génération d’images et qui, je le soupçonne, se reproduira. Comme l’a souligné ma collègue A.W. Ohlheiser, « tout comme DALL-E et ChatGPT se sont améliorés avec le temps, Sora pourrait aussi le faire. » Les prédictions, à la fois optimistes et pessimistes, pourraient se réaliser – mais la conversation autour de Sora et de l’IA générative serait plus productive si tous en tenaient davantage compte des manières dont nous avons été prouvés tort ces dernières années. Il y a deux ans, OpenAI a annoncé DALL-E 2, un modèle qui pouvait produire des images fixes à partir d’une demande de texte. Les images fantastiques à haute résolution qu’il a produites se sont rapidement retrouvées partout sur les réseaux sociaux, tout comme les avis sur la manière de les interpréter: de l’art réel ? De l’art faux ? Une menace pour les artistes ? Un outil pour les artistes ? Une machine de désinformation ? Deux ans plus tard, il vaut la peine de faire un peu de rétrospective si nous voulons que nos avis sur Sora vieillissent mieux.’

Share the Post: