Google ajoute une option pour les éditeurs de refuser de devenir des données d’entraînement en AI

Par Emma Roth, une journaliste d’actualités qui couvre les guerres de streaming, les technologies grand public, la crypto, les médias sociaux et bien plus encore. Auparavant, elle était rédactrice et éditrice chez MUO. Google vient d’annoncer qu’il donnera aux éditeurs de sites Web la possibilité de refuser que leurs données soient utilisées pour former les modèles d’IA de l’entreprise tout en restant accessible via la recherche Google. La nouvelle outil, appelé Google-Extended, permet aux sites de continuer à être passés en revue et indexés par des robots d’exploration tels que Googlebot tout en évitant que leurs données ne soient utilisées pour former des modèles d’IA au fil du temps. La société affirme que Google-Extended permettra aux éditeurs de sites de «gérer le fait que leurs sites aident à améliorer les API génératrices Bard et Vertex AI», ajoutant que les éditeurs de sites Web peuvent utiliser l’interrupteur pour «contrôler l’accès au contenu d’un site». Google a confirmé en juillet qu’il formait son chatbot IA, Bard, à partir de données publiquement disponibles collectées sur le Web. Google-Extended est disponible via robots.txt, également connu sous le nom de fichier de texte qui informe les robots d’exploration s’ils peuvent accéder à certains sites. Google note que «à mesure que les applications d’IA se développent», il continuera à explorer «d’autres approches lisibles par machine permettant aux éditeurs de sites Web de choisir et de contrôler» et qu’il aura bientôt d’autres choses à partager. Déjà, de nombreux sites ont bloqué le robot d’exploration du Web utilisé par OpenAI pour collecter des données et former ChatGPT, y compris The New York Times, CNN, Reuters et Medium. Cependant, des inquiétudes ont été émises quant à la manière de bloquer Google. Après tout, les sites Web ne peuvent pas bloquer complètement les robots d’exploration de Google, sinon ils ne seront pas indexés dans les recherches. Cela a conduit certains sites, tels que The New York Times, à bloquer légalement Google en mettant à jour leurs conditions d’utilisation pour interdire aux entreprises d’utiliser leur contenu pour former des IA.

Share the Post: