OpenAI affirme qu’il est « impossible » de créer des modèles d’IA utiles sans utiliser de matériel protégé par des droits d’auteur.

Le développeur de ChatGPT, OpenAI, a récemment reconnu la nécessité d’utiliser du matériel protégé par des droits d’auteur dans le développement d’outils d’IA tels que ChatGPT, selon The Telegraph. Ils ont déclaré que ces outils seraient « impossibles » sans cela. Cette affirmation a été faite lors d’une soumission à la commission des communications et de la sélection numérique de la Chambre des lords du Royaume-Uni dans le cadre d’une enquête sur les grands modèles de langage. Les modèles d’IA tels que ChatGPT et le générateur d’images DALL-E obtiennent leurs capacités lors de séances d’entraînement alimentées en partie par de grandes quantités de contenu récupéré sur Internet sans l’autorisation des détenteurs de droits (dans le cas d’OpenAI, une partie du contenu d’entraînement est sous licence). Ce type de récupération en libre accès fait partie d’une tradition ancienne dans la recherche universitaire en apprentissage automatique, mais en raison de la commercialisation récente des modèles d’IA d’apprentissage en profondeur, cette pratique est soumise à un examen attentif. « Parce que les droits d’auteur couvrent aujourd’hui pratiquement tous les types d’expression humaine, y compris les blogs, les photographies, les publications de forums, les extraits de code logiciel et les documents gouvernementaux, il serait impossible d’entraîner les principaux modèles d’IA d’aujourd’hui sans utiliser de matériel protégé par des droits d’auteur », a écrit OpenAI dans le dossier soumis à la Chambre des lords. De plus, OpenAI écrit que limiter les données d’entraînement aux livres et dessins du domaine public « créés il y a plus d’un siècle » ne fournirait pas de systèmes d’IA répondant « aux besoins des citoyens d’aujourd’hui ». Cette déclaration fait suite à une poursuite intentée le mois dernier par The New York Times contre OpenAI et Microsoft, un important investisseur dans OpenAI, pour utilisation présumée illégale du contenu du journal dans leurs produits. OpenAI a répondu à la poursuite sur son site Web lundi, affirmant que celle-ci était sans fondement et affirmant son soutien au journalisme et aux partenariats avec des organisations de presse.

Share the Post: