Google ajoute un commutateur pour les éditeurs afin qu’ils puissent choisir de ne pas devenir des données d’entraînement en intelligence artificielle

Par Emma Roth, journaliste spécialisée dans les guerres du streaming, les technologies grand public, la crypto-monnaie, les réseaux sociaux, et bien plus encore. Auparavant, elle était rédactrice et éditrice pour MUO. Google vient d’annoncer qu’il donne aux éditeurs de sites Web la possibilité de refuser que leurs données soient utilisées pour entraîner les modèles d’IA de l’entreprise, tout en restant accessible via la recherche Google. La nouvelle fonctionnalité, appelée Google-Extended, permet aux sites de continuer à être extraits et indexés par des robots d’exploration tels que Googlebot, tout en évitant que leurs données ne soient utilisées pour entraîner les modèles d’IA au fil du temps. La société affirme que Google-Extended permettra aux éditeurs de «gérer si leurs sites contribuent à améliorer les API génératrices Bard et Vertex AI», ajoutant que les éditeurs de sites Web peuvent utiliser l’interrupteur pour «contrôler l’accès aux contenus d’un site». Google a confirmé en juillet qu’il entraînait son chatbot IA, Bard, sur des données publiquement disponibles extraites du Web. Google-Extended est disponible via robots.txt, également connu sous le nom de fichier texte qui informe les robots d’exploration Web s’ils peuvent accéder à certains sites. Google note que «à mesure que les applications d’IA se développent», il continuera à explorer «d’autres approches machine-lisibles pour le choix et le contrôle des éditeurs de sites Web» et qu’il aura bientôt d’autres choses à partager. Déjà, de nombreux sites ont bloqué le robot d’exploration Web utilisé par OpenAI pour extraire des données et entraîner ChatGPT, notamment The New York Times, CNN, Reuters et Medium. Cependant, des inquiétudes ont été exprimées quant à la manière de bloquer Google. Après tout, les sites Web ne peuvent pas bloquer complètement les robots d’exploration de Google, sinon ils ne seront pas indexés dans les résultats de recherche. Cela a poussé certains sites, tels que The New York Times, à bloquer légalement Google en mettant à jour leurs conditions d’utilisation pour interdire aux entreprises d’utiliser leur contenu pour entraîner les IA.

Share the Post: