ByteDance est en train de construire un concurrent en utilisant secrètement la technologie OpenAI.

Par Alex Heath, rédacteur adjoint et auteur de la newsletter Command Line. Il couvre le secteur des technologies depuis plus de 10 ans pour The Information et d’autres médias. Si vous achetez quelque chose via un lien Verge, Vox Media peut percevoir une commission. Consultez notre déclaration d’éthique. Le fascinant flux « For You » de TikTok a propulsé sa société mère, ByteDance, au rang de leader mondial de l’IA. Mais cette même entreprise est si en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie OpenAI pour développer son propre modèle de langage large, ou LLM. Cette pratique est généralement considérée comme une faute dans le monde de l’IA. Elle est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que les résultats de son modèle ne peuvent être utilisés « pour développer aucun modèle d’intelligence artificielle concurrent de nos produits et services ». Microsoft, avec lequel ByteDance achète son accès OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer son modèle de base LLM, baptisé Project Seed, pendant pratiquement toutes les phases du développement, y compris pour l’entraînement et l’évaluation du modèle. Les employés impliqués en sont bien conscients ; j’ai vu des conversations sur Lark, la plate-forme de communication interne pour les employés de ByteDance, sur la façon de « blanchir » les preuves par une « désensibilisation des données ». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur quota maximal d’accès à l’API.

Share the Post: