Le New York Times poursuit OpenAI et Microsoft en justice pour « des millions d’articles » utilisés pour former ChatGPT

Le New York Times a intenté une action en justice contre Microsoft et OpenAI, affirmant que les deux entreprises ont enfreint les droits d’auteur de la publication en utilisant ses articles sans permission pour construire ChatGPT et des modèles similaires. C’est le premier grand média américain à traîner les deux entreprises de la technologie devant les tribunaux pour l’utilisation de leurs histoires dans les données d’entraînement. Comme dans les cas similaires – y compris les actions entreprises par divers artistes et créateurs, tels que Sarah Silverman – la plainte du NYT [PDF] porte sur l’utilisation de matériel protégé par des droits d’auteur – dans ce cas, de The Times – dans la formation des grands modèles de langage (LLMs) derrière divers assistants de chat Microsoft et OpenAI et services génératifs d’IA. La plainte fait état de Microsoft, non seulement pour l’investissement qu’il a fait dans OpenAI, mais aussi pour des assistants tels que Microsoft 365 Copilot et Bing Chat, dont la plainte affirme : « Afficher le contenu du Times sous forme de résultats génératifs de deux manières : (1) en affichant des copies ou des dérivés « mémorisés » des œuvres du Times récupérés à partir des modèles eux-mêmes, et (2) en affichant des résultats de recherche synthetiques qui sont sensiblement similaires aux œuvres du Times générées à partir de copies mises en mémoire cache dans l’index de recherche de Bing. » Le journal est assez contrarié que « des millions » d’articles protégés par des droits d’auteur aient été collectés pour former une partie des modèles Microsoft et OpenAI sans permission, et que ces réseaux neuronaux vont régurgiter ce travail sur demande pour les utilisateurs, encore une fois sans permission. Dans sa plainte, le NYT donne des exemples qu’il affirme prouvent que ChatGPT a été formé à partir de son contenu. De plus, une simple question de contournement du paywall semble entraîner des réponses contenant du texte protégé par des droits d’auteur.

Share the Post: