ByteDance utilise secrètement la technologie d’OpenAI pour construire un concurrent.

Par Alex Heath, rédacteur en chef adjoint et auteur de la newsletter Command Line. Il a couvert l’industrie technologique pendant plus d’une décennie pour The Information et d’autres médias. Si vous achetez quelque chose via un lien Verge, Vox Media peut toucher une commission. Consultez notre déclaration éthique. Le flux enchanteur « Pour Vous » de TikTok a fait de sa société mère, ByteDance, un leader de l’IA sur la scène mondiale. Mais cette même entreprise est désormais tellement en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie d’OpenAI pour développer son propre modèle de langage large concurrent, ou LLM. Cette pratique est généralement considérée comme un faux pas dans le monde de l’IA. Elle viole également clairement les conditions d’utilisation d’OpenAI, qui indiquent que ses sorties de modèle ne peuvent pas être utilisées « pour développer des modèles d’intelligence artificielle concurrents à nos produits et services ». Microsoft, qui facilite l’accès d’OpenAI à ByteDance, a la même politique. Néanmoins, les documents internes de ByteDance qui me sont parvenus confirment que l’API d’OpenAI a été utilisée pour développer le LLM fondamental, baptisé Projet Seed, à pratiquement toutes les étapes du développement, y compris pour la formation et l’évaluation du modèle. Les employés impliqués sont parfaitement conscients des implications ; j’ai vu des conversations sur Lark, la plateforme de communication interne de ByteDance, concernant des stratégies pour « effacer les preuves » grâce à la « désensibilisation des données ». L’utilisation abusive est si répandue que les employés du projet Seed atteignent régulièrement leur quota maximal d’accès à l’API.

Share the Post: