Tous les journaux scientifiques effectueront désormais une vérification alimentée par l’intelligence artificielle pour la fraude d’images.

Jeudi dernier, l’éditeur de recherche Science a annoncé que tous ses journaux commenceront à utiliser un logiciel commercial automatisant le processus de détection des images manipulées incorrectement. Cette décision intervient après plusieurs années de prise de conscience que la transition vers les données numériques et la publication a rendu facilement comique la fraude scientifique en modifiant les images. Bien que cette décision soit une première étape importante, il est important de reconnaître les limites du logiciel. Bien qu’il puisse détecter certains des cas les plus flagrants de manipulation d’images, les fraudeurs ingénieux peuvent facilement éviter d’être pris s’ils connaissent le fonctionnement du logiciel. Malheureusement, nous nous sentons obligés de le décrire (et, pour être juste, la société qui a développé le logiciel le fait également sur son site web). Une grande partie de la fraude basée sur les images que nous avons observée découle d’un dilemme auquel de nombreux scientifiques sont confrontés : il n’est pas difficile de réaliser des expériences, mais les données qu’elles génèrent ne correspondent souvent pas à celles souhaitées. Peut-être que seules les expériences de contrôle fonctionnent, ou peut-être que les expériences produisent des données indiscernables des contrôles. Pour les personnes peu scrupuleuses, cela ne pose pas de problème puisque personne d’autre que vous ne sait quelles images proviennent de quels échantillons. Il est relativement simple de présenter des images de données réelles comme quelque chose qu’elles ne sont pas. Pour rendre cela concret, nous pouvons examiner les données issues d’une procédure appelée western blot, qui utilise des anticorps pour identifier des protéines spécifiques dans un mélange complexe séparé selon leur taille. Les données typiques d’un western blot ressemblent à l’image à droite, où l’obscurité des bandes représente les protéines présentes à différents niveaux dans différentes conditions. Notez que les bandes sont relativement sans caractéristiques et sont découpées à partir d’images plus grandes des données brutes, les isolant de leur contexte initial. Il est possible de prendre des bandes d’une expérience et de les insérer dans une image d’une toute autre expérience, générant frauduleusement des « preuves » là où il n’en existe aucune. Des choses similaires peuvent être faites avec des graphiques, des photographies de cellules, et ainsi de suite.

Share the Post: