ByteDance est en train de développer en secret un concurrent en utilisant la technologie d’OpenAI.

Par Alex Heath, rédacteur adjoint et auteur de la lettre d’information Command Line. Il a couvert l’industrie des technologies pendant plus d’une décennie pour The Information et d’autres supports. Si vous achetez quelque chose via un lien Verge, Vox Media peut percevoir une commission. Voir notre déclaration d’éthique. Le fascinant flux « For You » de TikTok a permis à sa société mère, ByteDance, de devenir un leader mondial de l’IA. Mais cette même entreprise est maintenant si en retard dans la course de l’IA générative qu’elle utilise secrètement la technologie OpenAI pour développer son propre modèle de langage large concurrent, ou LLM. Cette pratique est généralement considérée comme une impolitesse dans le monde de l’IA. C’est également en violation directe des conditions d’utilisation d’OpenAI, qui stipulent que les résultats de son modèle ne peuvent pas être utilisés «pour développer des modèles d’intelligence artificielle concurrents de nos produits et services». Microsoft, avec lequel ByteDance achète son accès OpenAI, a la même politique. Néanmoins, des documents internes de ByteDance partagés avec moi confirment que l’API OpenAI a été largement utilisée pour développer son LLM de base, baptisé Project Seed, tout au long de son développement, y compris pour l’entraînement et l’évaluation du modèle. Les employés impliqués en sont bien conscients; j’ai vu des conversations sur Lark, la plateforme de communication interne des employés de ByteDance, sur la façon de «blanchir» les preuves par une «désensibilisation des données». L’utilisation abusive est si répandue que les employés de Project Seed atteignent régulièrement leur quota maximal d’accès à l’API.

Share the Post: