L’organisation Human Rights Watch (HRW) continue de révéler comment des photos d’enfants réels, postées en ligne il y a des années de manière décontractée, sont utilisées pour former des modèles d’IA alimentant des générateurs d’images, même lorsque les plateformes interdisent le scraping et que les familles utilisent des paramètres de confidentialité stricts. Le mois dernier, la chercheuse de HRW, Hye Jung Han, a trouvé 170 photos d’enfants brésiliens liés au LAION-5B, un ensemble de données AI populaire construit à partir de captures d’écran de la Common Crawl du web public. Maintenant, elle a publié un deuxième rapport, signalant 190 photos d’enfants provenant de tous les états et territoires de l’Australie, y compris des enfants autochtones qui pourraient être particulièrement vulnérables aux préjudices. Ces photos sont liées dans l’ensemble de données « sans le savoir ou le consentement des enfants ou de leurs familles ». Elles couvrent toute l’enfance, ce qui permet aux générateurs d’images AI de générer des deepfakes réalistes d’enfants australiens réels, selon le rapport de Han. Ce qui est peut-être encore plus préoccupant, c’est que les URL dans l’ensemble de données révèlent parfois des informations d’identification sur les enfants, y compris leurs noms et les lieux où les photos ont été prises, ce qui rend facile de retrouver des enfants dont les images pourraient ne pas être trouvables autrement en ligne. Cela met les enfants en danger de risques de confidentialité et de sécurité, a déclaré Han, et certains parents pensant qu’ils ont protégé la confidentialité de leurs enfants en ligne pourraient ne pas se rendre compte que ces risques existent. À partir d’un seul lien vers une photo montrant « deux garçons, âgés de 3 et 4 ans, souriant de toutes leurs dents alors qu’ils tiennent des pinceaux devant une fresque colorée », Han a pu retracer « les noms complets et les âges des deux enfants, ainsi que le nom de l’école maternelle qu’ils fréquentent à Perth, en Australie-Occidentale ». Et peut-être de manière plus inquiétante, « des informations sur ces enfants ne semblent pas exister ailleurs sur Internet », suggérant que les familles avaient été particulièrement prudentes pour protéger l’identité de ces garçons en ligne.
Donnez vie à vos histoires avec Epidemic Sound
Dans le monde numérique d’aujourd’hui, le contenu visuel est roi. Mais qu’est-ce qui transforme une bonne vidéo en une expérience