ByteDance est en train de secretement utiliser la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il couvre le secteur des technologies depuis plus d’une décennie pour The Information et d’autres outlets. Si vous achetez quelque chose à partir d’un lien Verge, Vox Media peut percevoir une commission. Voir notre déclaration d’éthique. Le fascinant fil d’actualité « For You » de TikTok a fait de sa société mère, ByteDance, un leader mondial de l’IA. Mais cette même entreprise est si en retard dans la course à l’IA générative qu’elle a secrètement utilisé la technologie OpenAI pour développer son propre modèle de langage large concurrent, ou LLM. Cette pratique est généralement considérée comme une faute dans le monde de l’IA. C’est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que ses résultats de modélisation ne peuvent être utilisés « pour développer aucun modèle d’intelligence artificielle concurrent de nos produits et services ». Microsoft, avec lequel ByteDance achète son accès à OpenAI, a la même politique. Néanmoins, les documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer son LLM fondamental, nommé Project Seed, tout au long de presque chaque phase de développement, y compris pour former et évaluer le modèle. Les employés impliqués en sont parfaitement conscients; j’ai vu des conversations sur Lark, la plateforme de communication interne des employés de ByteDance, sur la manière de « blanchir » les preuves par « désensibilisation des données ». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur quota maximal d’accès à l’API.

Share the Post: