« BEAST AI a seulement besoin d’une minute de temps GPU pour faire dérailler un LLM. »

Les informaticiens ont développé une manière efficace de concevoir des consignes qui suscitent des réponses préjudiciables des grands modèles linguistiques (LLM). Tout ce qui est nécessaire est un GPU Nvidia RTX A6000 avec 48 Go de mémoire, un code source ouvert bientôt disponible, et aussi peu qu’une minute de traitement GPU. Les chercheurs – Vinu Sankar Sadasivan, Shoumik Saha, Gaurang Sriramanan, Priyatham Kattakinda, Atoosa Chegini, et Soheil Feizi à l’Université du Maryland aux États-Unis – appellent leur technique BEAST, qui (en quelque sorte) signifie BEAm Search-based adversarial aTtack. BEAST, expliquent les chercheurs, fonctionne beaucoup plus rapidement que les attaques basées sur les gradients qui peuvent prendre plus d’une heure. Le titre de leur article, « Fast Adversarial Attacks on Language Models In One GPU Minute », dévoile un peu l’intrigue. « La principale motivation est la vitesse », a déclaré Vinu Sankar Sadasivan, co-auteur correspondant de l’article et doctorant à l’Université du Maryland (UMD), au Register.

Share the Post: