Les chercheurs mettent au point une « porte arrière universelle » pour les modèles d’images afin de provoquer des hallucinations chez les IA

Les trois scientifiques informaticiens canadiens ont développé ce qu’ils appellent une porte dérobée universelle pour empoisonner les grands modèles de classification d’images. Les chercheurs de l’Université de Waterloo – le boursier de recherche Benjamin Schneider, le candidat au doctorat Nils Lukas et le professeur de sciences informatiques Florian Kerschbaum – décrivent leur technique dans un article pré-publication intitulé « Attaques de porte dérobée universelle ». Les attaques précédentes de portes dérobées sur les systèmes de classification d’images ont tendance à cibler des classes spécifiques de données, par exemple pour faire classer un stop par un poteau ou un chien en tant que chat. L’équipe a trouvé un moyen de générer des déclencheurs pour leur porte dérobée dans n’importe quelle classe de données. «Si vous faites une classification d’images, votre modèle apprend un peu ce qu’est un œil, ce qu’est une oreille, ce qu’est un nez, et ainsi de suite», a expliqué Kerschbaum lors d’une entrevue avec The Register. «Au lieu de former une seule chose spécifique – c’est-à-dire une seule classe comme un chien ou quelque chose comme ça -, nous formons un ensemble diversifié de caractéristiques qui sont apprises en même temps que toutes les images». En le faisant avec seulement une petite fraction des images du jeu de données en utilisant la technique, les scientifiques prétendent pouvoir créer une porte dérobée généralisée qui provoque une mauvaise classification d’images pour toute classe d’images reconnue par un modèle.

Share the Post:

« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »

‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du

‘Plans de mi-parcours pour permettre à quiconque sur le web de modifier des images avec l’IA’

‘Développements récents Progrès de l’IA Mises à jour d’Amazon Applications logicielles Avancées en biotechnologie et santé’

‘Un message de John Furrier, co-fondateur de SiliconANGLE:’

Révisé 00:01 EDT / 21 OCTOBRE 2024 par Ken Patterson IBM Corp. intensifie aujourd’hui ses efforts pour une présence unique

‘iOS 18.1 se lance la semaine prochaine avec Apple Intelligence et tests d’audition et aides pour AirPods Pro’

‘Le iOS 18.1 d’Apple est prévu pour être officiellement lancé dans la semaine, arborant des mises à jour clés, y

« Gurman: Apple pense que sa technologie IA est en retard de deux ans sur ses rivaux »

Des rapports de Mark Gurman de Bloomberg indiquent que des initiés chez Apple ont des réserves sur la capacité d’IA

« Bambu Lab lance un nouveau générateur de modèles 3D IA »

Dans le but de renforcer leur position dans le secteur de la technologie d’impression 3D, le géant de la technologie

‘xAI, la startup IA d’Elon Musk, lance une API’

Développements Récents Intelligence Artificielle Aperçu sur Amazon Applications Sciences de la Vie & Santé

‘News Corp poursuit Perplexity pour avoir plagié le WSJ et le New York Post’

‘Par Emma Roth, journaliste renommée ayant une couverture étendue de l’industrie du streaming, des avancées dans la technologie grand public,