Google ajoute une option aux éditeurs pour qu’ils ne soient pas inclus dans les données d’entraînement de l’IA

Par Emma Roth, une journaliste d’information qui couvre les guerres de streaming, les technologies grand public, la crypto-monnaie, les médias sociaux et bien plus encore. Auparavant, elle était rédactrice et éditrice chez MUO. Google vient d’annoncer qu’il donne aux éditeurs de sites Web la possibilité de refuser que leurs données soient utilisées pour entraîner les modèles d’IA de l’entreprise tout en restant accessible via Google Search. La nouvelle fonctionnalité, appelée Google-Extended, permet aux sites de poursuivre leur référencement et leur indexation par des robots d’exploration tels que Googlebot tout en évitant que leurs données ne soient utilisées pour entraîner les modèles d’IA au fil du temps. La société indique que Google-Extended permettra aux éditeurs de sites Web de «gérer si leurs sites contribuent à améliorer les API génératrices Bard et Vertex AI», ajoutant que les éditeurs de sites Web peuvent utiliser l’interrupteur pour «contrôler l’accès au contenu d’un site». Google a confirmé en juillet qu’il formait son chatbot IA Bard à partir de données publiquement disponibles récoltées sur le Web. Google-Extended est disponible via robots.txt, également connu sous le nom de fichier de texte qui informe les robots d’exploration Web s’ils peuvent accéder à certains sites. Google note que «à mesure que les applications d’IA se développent», il continuera à explorer «des approches machine-lisibles supplémentaires pour le choix et le contrôle des éditeurs de sites Web» et qu’il aura bientôt d’autres éléments à partager. Déjà, de nombreux sites ont bloqué le robot d’exploration Web utilisé par OpenAI pour collecter des données et former ChatGPT, y compris The New York Times, CNN, Reuters et Medium. Cependant, des inquiétudes ont été exprimées quant à la manière de bloquer Google. Après tout, les sites Web ne peuvent pas entièrement bloquer les robots d’exploration de Google, sinon ils ne seront pas indexés dans les résultats de recherche. Cela a conduit certains sites, tels que The New York Times, à bloquer Google légalement en mettant à jour leurs conditions d’utilisation pour interdire aux entreprises d’utiliser leur contenu pour former des IA.

Share the Post: