ByteDance utilise secrètement la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il a couvert l’industrie technologique pendant plus d’une décennie pour The Information et d’autres médias. Si vous achetez quelque chose via un lien de Verge, Vox Media peut toucher une commission. Consultez notre déclaration d’éthique. Le flux envoûtant « For You » de TikTok a fait de sa société mère, ByteDance, un leader de l’IA sur la scène mondiale. Mais cette même entreprise est tellement en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie d’OpenAI pour développer son propre modèle de langage large (LLM) concurrent. Cette pratique est généralement considérée comme un faux pas dans le monde de l’IA. Cela viole également les conditions d’utilisation d’OpenAI, qui stipulent que la sortie de son modèle ne peut pas être utilisée « pour développer des modèles d’intelligence artificielle qui concurrencent nos produits et services ». Microsoft, par lequel ByteDance accède à OpenAI, a la même politique. Néanmoins, des documents en interne de ByteDance que l’on m’a partagés confirment que l’API d’OpenAI a été utilisée pour développer son LLM fondamental, codé nommé « Project Seed », lors de presque chaque phase de développement, y compris pour l’entraînement et l’évaluation du modèle. Les employés impliqués sont bien conscients des implications ; j’ai vu des conversations sur Lark, la plateforme de communication interne de ByteDance pour les employés, sur la façon de « blanchir » les preuves grâce à « la désensibilisation des données ». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur limite maximale d’accès à l’API.

Share the Post: