Les entreprises de l’intelligence artificielle devraient divulguer les données d’entraînement protégées par le droit d’auteur en vertu du n

Par Emilia David, une reporter qui couvre l’IA. Avant de rejoindre The Verge, elle a couvert l’intersection entre la technologie, les finances et l’économie. Deux législateurs ont déposé un projet de loi exigeant que les créateurs de modèles de fondations divulguent les sources de données d’entraînement afin que les détenteurs de droits d’auteur sachent que leurs informations ont été prises. Le projet de loi sur la transparence des modèles de fondations d’IA – déposé par les représentants Anna Eshoo (D-CA) et Don Beyer (D-VA) – demanderait à la Commission fédérale du commerce (FTC) de collaborer avec l’Institut national de normes et de technologie (NIST) pour établir des règles de rapport sur la transparence des données d’entraînement. Les entreprises qui fabriquent des modèles de fondations devront signaler les sources de données d’entraînement et la façon dont les données sont conservées pendant le processus d’inférence, décrire les limitations ou les risques du modèle, comment le modèle s’aligne sur le cadre de gestion des risques en IA prévu par le NIST et tout autre norme fédérale pourrait être établie, et fournir des informations sur la puissance de calcul utilisée pour entraîner et exécuter le modèle. Le projet de loi stipule également que les développeurs d’IA doivent signaler les efforts déployés pour «équipe rouge» le modèle afin de prévenir qu’il ne fournisse des «informations inexactes ou nuisibles» autour des questions médicales ou de la santé, de la synthèse biologique, de la cybersécurité, des élections, de la police, des décisions de prêt financier, de l’éducation, des décisions d’emploi, des services publics et des populations vulnérables telles que les enfants. Le projet de loi met l’accent sur l’importance de la transparence des données d’entraînement en matière de droit d’auteur, car plusieurs procès ont été intentés contre des entreprises d’IA pour violation du droit d’auteur. Il mentionne spécifiquement le cas des artistes contre Stability AI, Midjourney et Deviant Art (qui a été largement rejeté en octobre, selon VentureBeat), et la plainte de Getty Images contre Stability AI. «Avec l’accroissement de l’accès public à l’intelligence artificielle, il y a eu une augmentation des poursuites et des préoccupations publiques concernant la violation du droit d’auteur», indique le projet de loi. «L’utilisation publique des modèles de fondations a conduit à d’innombrables cas où le public est présenté avec des informations inexactes, imprécises ou biaisées.»

Share the Post: