« Maintenant, tous les journaux scientifiques vont effectuer une vérification alimentée par l’IA pour la fraude des images. »

Le jeudi, l’éditeur de recherche Science a annoncé que tous ses journaux commenceront à utiliser un logiciel commercial qui automatise le processus de détection des images manipulées de manière incorrecte. Cette décision intervient plusieurs années après que nous avons pris conscience que la transition vers les données numériques et la publication rendait comiquement facile de commettre une fraude en modifiant les images. Bien que cette démarche soit une première étape importante, il est important de reconnaître les limites du logiciel. Bien qu’il puisse détecter certains des cas les plus flagrants de manipulation d’images, les fraudeurs ingénieux peuvent facilement échapper à la détection s’ils connaissent le fonctionnement du logiciel. Malheureusement, nous nous sentons obligés de le décrire (et, pour être honnête, la société qui a développé le logiciel le fait sur son site Web). Une grande partie de la fraude basée sur les images que nous avons observée découle d’un dilemme auquel de nombreux scientifiques sont confrontés : il n’y a pas de problème pour réaliser des expériences, mais les données qu’elles génèrent ne sont souvent pas celles que vous souhaitez. Peut-être que seules les expériences de contrôle fonctionnent, ou peut-être que les expériences produisent des données indiscernables des contrôles. Pour les personnes peu scrupuleuses, cela ne pose pas de problème puisque personne d’autre que vous ne sait quelles images proviennent de quels échantillons. Il est relativement simple de présenter des images de données réelles comme étant ce qu’elles ne sont pas. Pour rendre cela concret, nous pouvons examiner les données d’une procédure appelée western blot, qui utilise des anticorps pour identifier des protéines spécifiques dans un mélange complexe séparé en fonction de leur taille. Les données typiques du western blot ressemblent à l’image à droite, avec l’obscurité des bandes représentant des protéines présentes à différents niveaux dans différentes conditions. Notez que les bandes sont relativement sans caractéristiques et sont recadrées à partir d’images plus grandes des données brutes, ce qui les sépare de leur contexte d’origine. Il est possible de prendre des bandes d’une expérience et de les insérer dans une image d’une autre expérience complètement différente, générant frauduleusement des « preuves » là où il n’en existe pas. Des choses similaires peuvent être faites avec des graphiques, des photographies de cellules, et ainsi de suite.

Share the Post: