Le PDG de Reddit, Steve Huffman, maintient la décision de Reddit de bloquer les entreprises qui récupèrent des données du site sans accord en matière d’IA. La semaine dernière, 404 Media a remarqué que les moteurs de recherche autres que Google ne référençaient plus les récents posts de Reddit dans les résultats. Cela était dû à une mise à jour du protocole d’exclusion de robots de Reddit (fichier txt) pour bloquer les robots qui récupèrent les données du site. Le fichier indique : « Reddit croit en un Internet ouvert, mais pas en l’abus du contenu public. » Depuis cette annonce, OpenAI a présenté SearchGPT, capable d’afficher les récents résultats de Reddit. Ce changement est intervenu un an après que Reddit ait commencé à lutter contre le scraping gratuit, que Huffman a initialement présenté comme une tentative d’empêcher les entreprises d’IA de tirer profit du contenu de Reddit gratuitement. Cette initiative a également incité Reddit à commencer à facturer l’accès à l’API (les tarifs élevés ont conduit à la fermeture de nombreuses applications Reddit tierces). Lors d’une interview avec The Verge aujourd’hui, Huffman a confirmé les changements qui ont abouti à ce que Google soit temporairement le seul moteur de recherche en mesure de montrer les discussions récentes de Reddit. Reddit et Google ont signé un accord de formation en IA en février d’une valeur de 60 millions de dollars par an. Il est encore flou de connaître la valeur de l’accord d’OpenAI de Reddit. Huffman a déclaré : « Sans ces accords, nous n’avons pas d’influence ni de connaissance sur la manière dont nos données sont affichées et utilisées, ce qui nous a poussés à bloquer les personnes qui n’ont pas accepté les conditions concernant l’utilisation ou la non-utilisation de nos données ».
Claude.ai : Une plateforme d’intelligence artificielle innovante
Claude.ai est une plateforme web qui utilise l’intelligence artificielle pour offrir divers services aux utilisateurs. Bien que les informations disponibles