Le New York Times a intenté une action en justice contre OpenAI et Microsoft, alléguant qu’ils ont utilisé «des millions d’articles» du New York Times pour entraîner ChatGPT

Le New York Times a intenté une action en justice contre Microsoft et OpenAI, affirmant que les deux entreprises ont enfreint les droits d’auteur du journal en utilisant ses articles sans permission pour créer ChatGPT et des modèles similaires. C’est la première grande entreprise médiatique américaine à poursuivre la paire de techniciens en justice pour l’utilisation de leurs histoires dans les données d’entraînement. Comme dans les cas similaires – y compris l’action entreprise par divers artistes et créateurs, tels que Sarah Silverman – la plainte du NYT [PDF] porte sur l’utilisation de matériaux protégés par des droits d’auteur – dans ce cas, ceux du Times – dans la formation des grands modèles de langage (LLMs) derrière divers assistants de discussion et services d’IA génératifs de Microsoft et OpenAI. La plainte épingle Microsoft, non seulement pour l’investissement qu’il a fait dans OpenAI, mais aussi pour les assistants tels que Microsoft 365 Copilot et Bing Chat, que la plainte prétend : « Afficher le contenu du Times dans une production générative de deux manières : (1) en montrant des copies ou des dérivés mémorisés des œuvres du Times récupérés directement des modèles, et (2) en montrant des résultats de recherche synthétiques sensiblement similaires aux œuvres du Times générés à partir des copies stockées dans l’index de recherche de Bing. » Le journal est assez perturbé que « des millions » de ses articles protégés par des droits d’auteur aient été récoltés pour former une partie des modèles de Microsoft et OpenAI sans permission, et que ces réseaux neuronaux recracheront ce travail sur demande pour les utilisateurs, encore une fois sans permission. Dans sa plainte, le NYT donne des exemples qu’il prétend prouver que ChatGPT a été formé à partir de son contenu. De plus, une simple question pour contourner le paywall semble entraîner des réponses contenant du texte protégé par des droits d’auteur.

Share the Post: