ByteDance utilise secrètement la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il a couvert l’industrie technologique pendant plus d’une décennie pour The Information et d’autres médias. Si vous achetez quelque chose depuis un lien Verge, Vox Media peut percevoir une commission. Consultez notre déclaration d’éthique. Le flux « For You » captivant de TikTok a propulsé sa société mère, ByteDance, au rang de leader mondial de l’IA. Mais cette même entreprise est maintenant tellement en retard dans la course à l’IA générative qu’elle a secrètement utilisé la technologie d’OpenAI pour développer son propre modèle linguistique à grande échelle concurrent, ou LLM. Cette pratique est généralement considérée comme un faux pas dans le monde de l’IA. Elle est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que sa sortie de modèle ne peut pas être utilisée « pour développer des modèles d’intelligence artificielle qui concurrencent nos produits et services ». Microsoft, à travers lequel ByteDance acquiert son accès à OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance qui m’ont été partagés confirment que l’API d’OpenAI a été utilisée pour développer son LLM fondationnel, baptisé Projet Seed, lors de presque chaque phase de développement, y compris pour la formation et l’évaluation du modèle. Les employés impliqués sont bien conscients des implications ; j’ai vu des conversations sur Lark, la plateforme de communication interne de ByteDance pour les employés, sur la façon de « blanchir » les preuves grâce à la « désensibilisation des données ». La mauvaise utilisation est si répandue que les employés du projet Seed atteignent régulièrement leur limite maximale d’accès à l’API.

Share the Post: