ByteDance utilise secrètement la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la lettre d’information Command Line. Il a couvert l’industrie technologique pendant plus d’une décennie pour The Information et d’autres médias. Si vous achetez quelque chose via un lien Verge, Vox Media peut toucher une commission. Consultez notre déclaration éthique. Le flux fascinant « For You » de TikTok a propulsé sa société mère, ByteDance, au rang de leader de l’IA sur la scène mondiale. Cependant, la même société est à présent très en retard dans la course à l’IA générative, au point qu’elle utilise secrètement la technologie d’OpenAI pour développer son propre modèle de langage volumineux concurrent, ou LLM. Cette pratique est généralement considérée comme un faux pas dans le monde de l’IA. Elle viole également les conditions d’utilisation d’OpenAI, qui stipulent que la sortie du modèle ne peut pas être utilisée « pour développer des modèles d’intelligence artificielle concurrents à nos produits et services ». Microsoft, par lequel ByteDance achète son accès à OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer de manière intensive son LLM fondateur, baptisé Projet Seed, à toutes les étapes de son développement, y compris pour la formation et l’évaluation du modèle. Les employés impliqués sont bien conscients des implications ; j’ai vu des conversations sur Lark, la plateforme de communication interne de ByteDance pour les employés, sur la façon de « blanchir » les preuves par « désensibilisation des données ». L’utilisation abusive est si répandue que les employés du Projet Seed atteignent régulièrement leur limite maximale d’accès à l’API.

Share the Post: