Vous avez du mal à distinguer entre un texte écrit par un humain et celui généré par une IA ? Il est crucial, pour maintenir la confiance dans les données et répondre à des problèmes tels que la mauvaise attribution et la désinformation, de pouvoir identifier le contenu créé par IA. Google DeepMind et Hugging Face sont ravis de présenter SynthID Text dans Transformers v4.46.0, prévu pour une sortie plus tard aujourd’hui. SynthID Text a été technologiquement conçu pour faciliter l’incorporation de filigranes dans le texte écrit par IA à travers un processeur de logits, désigné pour les tâches de génération, et facilite l’identification de filigranes via un classificateur. Plongez-vous dans l’article de SynthID Text publié dans Nature pour une compréhension approfondie de cet algorithme, ou consultez le Responsible GenAI Toolkit de Google pour des directives complètes sur l’application de SynthID Text pour vos produits.
SynthID Text vise à intégrer un filigrane dans le texte créé par AI, aidant l’utilisateur à déterminer si le texte est généré par LLM. Cela n’interfère pas avec le fonctionnement de LLM ni ne détériore la qualité de la production générée. Google DeepMind a conceptualisé une méthode unique de filigranage impliquant un type de fonction pseudo-aléatoire, connu sous le nom de g-function. Cette fonction améliore tout processus de génération de LLM, aboutissant à un filigrane qui, bien qu’invisible à l’œil humain, est détectable par un modèle formé. Compatible avec tous les LLM sans modifications, cette fonction a été lancée en tant qu’utilitaire de génération, disponible sur l’API model.generate(). Vous trouverez également un exemple complet qui vous guide sur la formation de détecteurs pour identifier le texte filigrané. Pour des informations supplémentaires sur l’algorithme SynthID Text, nous vous recommandons de consulter l’article de recherche.
La g-fonction et son application dans le processus d’échantillonnage du tournoi sont paramétrées à l’aide d’une classe de données pour configurer les filigranes. Pour une sécurité et une confidentialité maximales, chaque modèle devrait posséder une configuration de filigranage unique, sinon votre filigrane pourrait être reproduit par d’autres. Assurez-vous de définir deux paramètres dans chaque configuration de filigrane :