Le New York Times a intenté une poursuite contre OpenAI et Microsoft, affirmant que des millions d’articles du New York Times avaient été utilisés sans autorisation pour entraîner

Le New York Times a assigné Microsoft et OpenAI en affirmant que le duo a enfreint les droits d’auteur de la publication en utilisant ses articles sans permission pour développer ChatGPT et des modèles similaires. C’est le premier grand média américain à traîner les deux entreprises devant les tribunaux pour l’utilisation de leurs histoires dans les données d’entraînement. Comme dans d’autres procès – y compris les actions intentées par divers artistes et créateurs, tels que Sarah Silverman – la plainte du NYT [PDF] porte sur l’utilisation de matériel protégé par le droit d’auteur – dans ce cas, de The Times – dans la formation des grands modèles de langage (LLMs) derrière les différents assistants conversationnels de Microsoft et OpenAI ainsi que les services d’apprentissage automatique génératifs. La plainte accuse Microsoft, non seulement pour l’investissement qu’il a fait dans OpenAI, mais aussi pour les assistants tels que Microsoft 365 Copilot et Bing Chat, que la plainte prétend : «Afficher le contenu du Times dans une production générative de plusieurs manières : (1) en montrant des copies ou des dérivés «mémorisés» des oeuvres du Times récupérés directement des modèles, et (2) en montrant des résultats de recherche synthétiques qui sont sensiblement similaires aux oeuvres du Times générées à partir des copies stockées dans l’index de recherche de Bing.» Le journal est assez contrarié que «des millions» de ses articles protégés par le droit d’auteur aient été récoltés pour former une partie des modèles de Microsoft et OpenAI sans permission, et que ces réseaux neuronaux vont régurgiter ce travail sur demande pour les utilisateurs, encore une fois sans permission. Dans sa plainte, le NYT donne des exemples qu’il prétend prouver que ChatGPT a été formé à partir de son contenu. De plus, une simple question pour contourner le paywall semble donner lieu à des réponses contenant du texte protégé par le droit d’auteur.

Share the Post: