En réponse aux efforts juridiques visant à restreindre sa collecte de données, OpenAI soutient que la création d’outils d’intelligence artificielle générative avancée (genAI) est impossible sans utiliser du contenu protégé par le droit d’auteur pour les former.
Dans un rapport adressé au Comité de sélection des communications et du numérique de la Chambre des Lords du Royaume-Uni, OpenAI a déclaré que la formation de modèles linguistiques de grande envergure (LLM) tels que GPT-4, la technologie sous-jacente de ChatGPT, serait impossible sans l’utilisation de matériaux protégés par le droit d’auteur.
« Étant donné que le droit d’auteur couvre aujourd’hui pratiquement tous les types d’expressions humaines – y compris les articles de blog, les photographies, les publications de forum, les morceaux de code logiciel et les documents gouvernementaux – il serait impossible de former les modèles d’IA les plus avancés d’aujourd’hui sans utiliser de matériaux protégés par le droit d’auteur », a déclaré OpenAI dans sa soumission.
Les applications de genAI telles que ChatGPT ou l’outil de génération d’images Stable Diffusion sont construites à partir d’énormes quantités de données – dont une grande partie est protégée par le droit d’auteur – collectées sur Internet. Cela a suscité une opposition croissante de la part des éditeurs et des auteurs qui affirment que leur travail est utilisé sans crédit ni compensation.
Les développeurs utilisent des ressources telles que Google et StackOverflow depuis des décennies, a déclaré Daniel Li, PDG de Plus Docs, une société dont le logiciel utilise genAI pour concevoir, créer et modifier des présentations. Selon lui, ChatGPT facilite simplement encore plus l’utilisation du codage.
‘Le mini lune de la Terre pourrait être un morceau de la grande lune, disent les scientifiques’
‘La mini lune, qui est en orbite autour de la Terre depuis fin septembre, devrait se séparer de nous d’ici