‘La bataille en cours sur les droits d’auteur entre The New York Times, OpenAI et Microsoft subit un revers après que des ingénieurs d’OpenAI auraient supprimé des données cruciales liées à l’affaire. The Times a signalé cet incident à la cour, notant que les données perdues auraient pu fournir des preuves essentielles concernant leurs allégations de violation des droits d’auteur.
La plainte, déposée par The New York Times à la fin de 2023, accusait OpenAI et Microsoft d’utiliser son contenu pour former le modèle de dialogue AI, ChatGPT, sans demander d’approbation. Le modèle, selon le Times, a montré qu’il reproduit systématiquement les articles de l’entreprise de médias sur demande.
OpenAI avait fourni un accès à des machines virtuelles qui détenaient les ressources nécessaires pour examiner les sources de données utilisées pour former le modèle d’IA. Ces ressources étaient dédiées à aider les plaignants à identifier le contenu protégé par le droit d’auteur. Dans la lettre déposée, Ian Crosby et Steven Lieberman, avocats du Times, ont souligné que les plaignants ont déjà investi plus de 150 heures-personnes dans cette enquête depuis le 1er novembre.
Cependant, il semblerait que les ingénieurs d’OpenAI aient par erreur supprimé toutes les données pertinentes dans l’une des deux machines virtuelles. Bien que des tentatives pour récupérer les données perdues aient été faites, les noms des fichiers, ainsi que les aspects qui organisent les données en une structure cohérente, ont été perdus, rendant les données récupérées inadmissibles. L’importance de cette structure réside dans sa capacité à retracer l’origine des articles copiés et à indiquer où ils auraient pu être utilisés pour construire les modèles d’IA des défendeurs.
Ce dernier développement présente un obstacle dans la bataille juridique en cours concernant l’IA et les lois sur le droit d’auteur, et souligne les complexités et les défis à naviguer dans les territoires inexplorés de l’utilisation de l’IA et des droits.’