ByteDance est en train de secrètement utiliser la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il a couvert l’industrie des technologies pendant plus de dix ans pour The Information et d’autres supports. Si vous achetez quelque chose à partir d’un lien Verge, Vox Media peut percevoir une commission. Voir notre déclaration d’éthique. Le fascinant flux « For You » de TikTok a fait de sa société mère, ByteDance, un leader mondial de l’IA. Mais cette même entreprise est si en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie OpenAI pour développer son propre modèle de langage large concurrent, ou LLM. Cette pratique est généralement considérée comme une impolitesse dans le monde de l’IA. Elle est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que les résultats de son modèle ne peuvent pas être utilisés « pour développer des modèles d’intelligence artificielle concurrents de nos produits et services ». Microsoft, avec lequel ByteDance achète son accès à OpenAI, a la même politique. Néanmoins, les documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer son LLM fondamental, codé sous le nom de Project Seed, tout au long de presque toutes les phases de développement, y compris pour la formation et l’évaluation du modèle. Les employés impliqués en sont bien conscients ; j’ai vu des conversations sur Lark, la plateforme de communication interne des employés de ByteDance, sur la façon de « blanchir » les preuves par une « désensibilisation des données ». La mauvaise utilisation est si répandue que les employés de Project Seed atteignent régulièrement le plafond de leur accès à l’API.

Share the Post: