La plus grande bataille de la révolution de l’intelligence générative fait rage en cour. Et non, ce n’est pas à propos du dernier scandale dans les coulisses d’OpenAI. Des auteurs de livres, des artistes et des codeurs mettent en question la pratique consistant à enseigner aux modèles d’IA de reproduire leurs compétences à l’aide de leur propre travail comme manuel d’apprentissage. Le débat porte sur les milliards de œuvres qui sous-tendent la habileté impressionnante des outils de ChatGPT pour rédiger des textes, la dextérité en codage de Copilot de Github et le flair artistique des générateurs d’images comme celui de la startup Midjourney. La plupart des œuvres utilisées pour former les algorithmes sous-jacents ont été créées par des personnes et beaucoup d’entre elles sont protégées par des droits d’auteur. Les constructeurs d’IA ont largement supposé que l’utilisation de matériel protégé par des droits d’auteur comme données d’entraînement est parfaitement légale au titre de la «utilisation équitable» – après tout, ils ne font que prêter l’œuvre pour extraire des signaux statistiques de celle-ci, et non pas essayer de la faire passer pour la leur. Mais comme les générateurs d’images et d’autres outils ont montré qu’ils étaient capables de mimer de manière impressionnante les œuvres de leurs données d’entraînement, et que l’ampleur et la valeur des données d’entraînement sont devenues évidentes, les créateurs s’élèvent de plus en plus contre cette pratique. Lors de LiveWIRED à San Francisco, l’événement anniversaire de 30 ans de WIRED magazine, deux leaders de cette résistance naissante ont affronté un défenseur des droits des entreprises d’IA de développer la technologie sans entraves. Croyaient-ils que l’entraînement en IA était une utilisation équitable? «La réponse est non, je ne le crois pas», a déclaré Mary Rasenberger, PDG de l’Authors Guild, qui représente les auteurs de livres et poursuit en justice OpenAI et son principal bailleur de fonds, Microsoft, pour violation du droit d’auteur de ses membres. De gauche à droite: Kate Knibbs, journaliste senior de WIRED, a discuté des droits des créateurs et de l’IA avec Mike Masnick, Mary Rasenberger et Matthew Butterick lors de LiveWIRED à San Francisco.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du