ByteDance est en train de construire un concurrent en secret en utilisant la technologie d’OpenAI.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il a couvert le secteur des technologies pendant plus de dix ans pour The Information et d’autres publications. Si vous achetez quelque chose via un lien Verge, Vox Media peut percevoir une commission. Consultez notre déclaration d’éthique. Le fascinant flux « Pour vous » de TikTok a fait de sa société mère, ByteDance, un leader mondial de l’IA. Mais cette même entreprise est si en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie OpenAI pour développer son propre modèle de langage large concurrent, ou LLM. Cette pratique est généralement considérée comme une faute dans le monde de l’IA. Elle est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que les résultats de son modèle ne peuvent pas être utilisés « pour développer de quelconques modèles d’intelligence artificielle concurrents à nos produits et services ». Microsoft, avec lequel ByteDance achète son accès à OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer son LLM de base, baptisé Project Seed, lors de pratiquement toutes les phases de développement, y compris pour l’entraînement et l’évaluation du modèle. Les employés impliqués sont parfaitement conscients des implications; j’ai vu des conversations sur Lark, la plateforme de communication interne aux employés de ByteDance, sur la façon de « blanchir » les preuves par une « désensibilisation des données ». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur quota maximal d’accès à l’API.

Share the Post: