Nouveau groupe de normes en intelligence artificielle souhaite rendre le scraping de données facultatif.

La première vague d’outils majeurs d’IA générative a largement été formée sur des données « disponibles publiquement » – essentiellement tout ce qui pouvait être obtenu sur Internet. Maintenant, les sources de données d’entraînement restreignent de plus en plus l’accès et encouragent la conclusion d’accords de licence. Avec la recherche de sources de données supplémentaires qui s’intensifie, de nouvelles startups de licences ont émergé pour maintenir la circulation de la matière première. L’Alliance des Fournisseurs de Données, un groupe professionnel formé cet été, souhaite standardiser et rendre l’industrie de l’IA plus équitable. Dans cette optique, elle vient de publier un document de position détaillant ses positions sur les principaux enjeux liés à l’IA. L’alliance est composée de sept entreprises de licences d’IA, dont la société de gestion des droits d’auteur musical Rightsify, le marché japonais de photos de stock Pixta, et la startup de licences de droits d’auteur par IA générative Calliope Networks. (Au moins cinq nouveaux membres seront annoncés cet automne.) La DPA plaide en faveur d’un système d’adhésion volontaire, ce qui signifie que les données ne peuvent être utilisées qu’avec le consentement explicite des créateurs et des détenteurs de droits. Ceci représente une divergence significative par rapport à la façon dont fonctionnent la plupart des grandes entreprises d’IA. Certaines d’entre elles ont mis en place leurs propres systèmes de retrait, ce qui met le fardeau sur les propriétaires de données pour retirer leur travail au cas par cas. D’autres n’offrent aucun système de retrait. La DPA, qui s’attend à ce que les membres respectent sa règle d’adhésion volontaire, considère cette voie comme beaucoup plus éthique. « Les artistes et les créateurs devraient être à bord », déclare Alex Bestall, PDG de Rightsify et de la société de licences de données musicales Global Copyright Exchange, qui a dirigé l’effort. Bestall voit l’adhésion volontaire comme une approche pragmatique ainsi que morale : « Vendre des ensembles de données disponibles publiquement est un moyen de se retrouver poursuivi en justice et de perdre toute crédibilité. » Ed Newton-Rex, ancien cadre de l’IA qui dirige désormais l’organisation à but non lucratif d’IA éthique Fairly Trained, qualifie les retraits de fondamentalement injustes pour les créateurs, ajoutant que certains pourraient ne même pas savoir quand des retraits sont proposés. « Il est particulièrement bon de voir la DPA plaider pour des adhésions volontaires », déclare-t-il.

Share the Post: