ByteDance utilise secrètement la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la lettre d’information Command Line. Il a couvert l’industrie technologique pendant plus d’une décennie à The Information et dans d’autres médias. Si vous achetez quelque chose via un lien Verge, Vox Media peut percevoir une commission. Consultez notre déclaration d’éthique. Le flux « Pour Toi » captivant de TikTok a fait de sa société mère, ByteDance, un leader de l’IA sur la scène mondiale. Mais cette même société est maintenant tellement en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie d’OpenAI pour développer son propre modèle de langage large compétitif, ou LLM. Cette pratique est généralement considérée comme un faux pas dans le monde de l’IA. Elle viole également les conditions d’utilisation d’OpenAI, qui stipulent que les sorties de son modèle ne peuvent pas être utilisées « pour développer des modèles d’intelligence artificielle en concurrence avec nos produits et services ». Microsoft, via lequel ByteDance accède à OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API d’OpenAI a été utilisée pour développer son LLM fondamental, codé sous le nom de projet Seed, lors de presque toutes les phases de développement, y compris pour la formation et l’évaluation du modèle. Les employés impliqués sont bien conscients des implications ; j’ai vu des conversations sur Lark, la plateforme de communication interne de ByteDance pour les employés, sur la façon de « blanchir » les preuves grâce à « la désensibilisation des données ». La mauvaise utilisation est si répandue que les employés du projet Seed atteignent régulièrement leur limite de quota d’accès à l’API.

Share the Post: