ByteDance est en train de développer en secret un outil concurrent de OpenAI en utilisant sa technologie.

Par Alex Heath, rédacteur en chef adjoint et auteur de la lettre d’information Command Line. Il couvre le secteur des technologies depuis plus de dix ans pour The Information et d’autres supports. Si vous achetez quelque chose via un lien Verge, Vox Media peut percevoir une commission. Consultez notre déclaration d’éthique. La fascinante fonction « For You » de TikTok a fait de son parent, ByteDance, un leader mondial de l’IA. Mais cette même entreprise est aujourd’hui si en retard dans la course à l’IA générative qu’elle utilise secrètement la technologie OpenAI pour développer son propre modèle de langage large, ou LLM. Cette pratique est généralement considérée comme une impolitesse dans le monde de l’IA. Elle est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que les résultats du modèle ne peuvent être utilisés « pour développer aucun modèle d’intelligence artificielle concurrent de nos produits et services ». Microsoft, par l’intermédiaire duquel ByteDance a accès à OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été utilisée pour développer son modèle fondamental LLM, appelé Project Seed, tout au long de pratiquement chaque phase de développement, y compris pour former et évaluer le modèle. Les employés concernés sont parfaitement conscients des implications ; j’ai vu des conversations sur Lark, la plateforme de communication interne pour les employés de ByteDance, sur la façon de « blanchir » les preuves par « désensibilisation des données ». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur quota d’accès à l’API.

Share the Post: