Le New York Times intente une action en justice contre OpenAI et Microsoft au sujet de «millions d’articles» utilisés pour former ChatGPT

Le New York Times a intenté une poursuite contre Microsoft et OpenAI, affirmant que les deux ont enfreint les droits d’auteur du journal en utilisant ses articles sans autorisation pour construire ChatGPT et des modèles similaires. C’est le premier grand média américain à entraîner les deux pairs de la technologie devant les tribunaux pour l’utilisation des histoires dans les données d’entraînement. Comme dans les cas similaires – y compris les actions entreprises par divers artistes et créateurs, tels que Sarah Silverman – la plainte du NYT [PDF] porte sur l’utilisation de matériel protégé par le droit d’auteur – dans ce cas, de The Times – dans la formation des grands modèles de langage (LLMs) derrière divers assistants de chat et services d’apprentissage automatique génératifs de Microsoft et OpenAI. La plainte met en cause Microsoft, non seulement pour l’investissement qu’il a fait dans OpenAI, mais aussi pour les assistants tels que Microsoft 365 Copilot et Bing Chat, dont la plainte affirme: « Afficher le contenu du Times dans les résultats génératifs de au moins deux manières: (1) en montrant des copies ou des dérivés ‘mémorisés’ de travaux du Times récupérés directement des modèles, et (2) en montrant des résultats de recherche synthétiques sensiblement similaires aux travaux du Times générés à partir de copies stockées dans l’index de recherche Bing.  » Le journal est assez contrarié que « des millions » de ses articles protégés par le droit d’auteur aient été récoltés pour former une partie des modèles de Microsoft et OpenAI sans autorisation, et que ces réseaux neuronaux vont régurgiter ce travail sur demande pour les utilisateurs, encore une fois sans autorisation. Dans sa plainte, le NYT donne des exemples qu’il affirme prouver que ChatGPT a été formé à partir de son contenu. De plus, une simple question de contournement du paywall semble donner lieu à des réponses contenant un texte protégé par le droit d’auteur.

Share the Post: