Les chasseurs de bogues chargent pour traquer les IA et espèrent gagner gros.

Google a élargi son programme de chasse aux bogues pour inclure ses produits d’IA et paiera les pirates informatiques éthiques pour trouver des failles classiques en matière de cybersécurité et des comportements de bots mauvais. La Fabrique de Chocolat veut que les chasseurs de bogues fouillent dans cinq catégories d’attaques. Ces attaques comprennent des techniques comme l’injection de prompts, dans laquelle un attaquant utilise des prompts adversaires pour manipuler la sortie des grands modèles de langage de telle sorte qu’ils annulent les instructions précédentes et fassent quelque chose de complètement différent. Aussi sur la liste, l’extraction de données d’apprentissage, qui consiste essentiellement à reconstruire les données d’apprentissage pour fuiter des informations sensibles, et d’autres attaques de manipulation de modèles qui contournent les systèmes ou fournissent des données d’apprentissage empoisonnées pour modifier le comportement du modèle. Google paiera également des récompenses pour les attaques de perturbation adversaire dans lesquelles un attaquant fournit des entrées pour déclencher une mauvaise classification dans un contrôle de sécurité, et enfin, la bonne vieille appropriation de données – en étant spécifique aux données confidentielles ou propriétaires de formation de modèles, dans ce cas.

Share the Post: