« Reddit déploie un videur IA pour arrêter le harcèlement. »

Reddit améliore une fois de plus son jeu en matière d’IA, cette fois avec la mise en place d’un filtre de harcèlement alimenté par un LLM au bénéfice de son armée de modérateurs bénévoles. L’existence du nouveau filtre de harcèlement a été découverte lors d’une analyse APK par Android Authority, qui a repéré son existence dans la version 2024.10.0 de l’application officielle Reddit pour Android. Cette version de l’application Reddit Android officielle est apparue dans diverses sources non officielles en ligne, mais le Google Play Store montre toujours la version 2024.08.0 comme la plus récente généralement disponible. L’application contient des lignes de code faisant référence à un grand modèle de langage formé pour aider les modérateurs à empêcher la publication de messages de harcèlement, et est soutenue par une page d’aide Reddit mise à jour la semaine dernière qui reflète l’existence de nouvel outil. « Le filtre de harcèlement est un réglage facultatif de sécurité communautaire qui permet aux modérateurs de filtrer automatiquement les messages et les commentaires susceptibles d’être considérés comme harassants, » lit-on sur la page d’aide. « Le filtre est alimenté par un Grand Modèle de Langage (LLM) formé sur les actions des modérateurs et les contenus supprimés par les outils internes et les équipes d’application des règles de Reddit. » Le filtre peut être activé dans les outils de modération d’une communauté Reddit, mais les modérateurs individuels devront avoir les autorisations nécessaires pour modifier les paramètres du subreddit pour l’activer.

Share the Post: