« Présentation de SynthID Texte »

Comprendre l’opération

Mise en place d’un filigrane

Implémentation d’un filigrane

Identification d’un filigrane

Contraintes

Est-il difficile pour vous de différencier le texte produit par un humain de celui créé par une IA ? Reconnaître les informations générées par l’IA est crucial pour renforcer la confiance dans les données et traiter des problèmes tels que l’attribution erronée et la désinformation. En réponse, Google DeepMind et Hugging Face sont ravis de dévoiler SynthID Text dans Transformers v4.46.0, dont la sortie est prévue aujourd’hui. Cette technologie révolutionnaire permet d’incorporer des filigranes dans le texte généré par l’IA via un processeur logits conçu pour les tâches de génération et permet l’identification du filigrane à l’aide d’un classificateur. Plongez dans les détails techniques de cet algorithme dans l’article SynthID Text publié dans Nature, ou explorez le kit d’outils Responsible GenAI de Google pour obtenir des informations sur l’intégration de SynthID Text dans vos offres de produits.

L’objectif principal de SynthID Text est d’intégrer un filigrane dans le contenu généré par l’IA de manière à aider à déterminer si le texte a été produit par votre LLM. Il parvient à cela sans modifier le fonctionnement du LLM sous-jacent ou affecter négativement la qualité de la génération. Google DeepMind a conçu une méthode de marquage qui utilise une fonction pseudo-aléatoire, connue sous le nom de g-fonction. Cette fonction améliore le processus de génération de tout LLM de sorte que le filigrane n’est pas perceptible par les humains mais peut être identifié par un modèle entraîné. Cette fonctionnalité a été développée en un utilitaire de génération qui peut être intégré dans n’importe quel LLM sans modifications à l’aide de l’API model.generate(). Il comprend également la fourniture d’un exemple de bout en bout de la façon d’éduquer les détecteurs à identifier le contenu marqué d’un filigrane. Pour plus d’informations sur l’algorithme SynthID Text, veuillez consulter l’article de recherche.

La mise en place d’un filigrane implique l’utilisation d’une classe de données pour paramétrer la g-fonction et définir son application dans la procédure de sélection du tournoi. Chaque modèle que vous utilisez devrait avoir sa propre configuration de filigrane spécifique qui devrait être conservée de manière sécuritaire et privée, sinon, votre filigrane pourrait être dupliqué par d’autres. Il est obligatoire de spécifier deux paramètres dans chaque configuration de filigrane :

Share the Post: