ByteDance est en train de se servir secrètement de la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il a couvert l’industrie des technologies pendant plus de dix ans pour The Information et d’autres médias. Si vous achetez quelque chose via un lien Verge, Vox Media peut percevoir une commission. Consultez notre déclaration d’éthique. La fascinante fonction « For You » de TikTok a fait de son parent, ByteDance, un leader mondial de l’IA. Mais cette même entreprise est maintenant si en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie OpenAI pour développer son propre modèle de langage large, ou LLM. Cette pratique est généralement considérée comme une mauvaise manière dans le monde de l’IA. Cela contrevient également aux conditions d’utilisation d’OpenAI, qui stipulent que les résultats de son modèle ne peuvent pas être utilisés « pour développer des modèles d’intelligence artificielle concurrents de nos produits et services ». Microsoft, avec qui ByteDance achète son accès à OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer son LLM fondamental, nommé Project Seed, à presque toutes les étapes du développement, y compris pour former et évaluer le modèle. Les employés impliqués en sont bien conscients; j’ai vu des conversations sur Lark, la plateforme de communication interne pour les employés de ByteDance, sur la manière de « blanchir » les preuves par une « désensibilisation des données ». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur quota d’accès à l’API.

Share the Post: