Une nouvelle start-up chinoise d’intelligence artificielle, menée par l’un des principaux experts en la matière, s’est lancée sur la scène mondiale cette semaine en publiant un modèle d’IA open source qui semble surpasser le modèle de Meta en termes de métriques critiques, offrant ainsi au pays une première victoire dans ce que le fondateur de la société voit comme une bataille entre les États-Unis et la Chine pour la suprématie de l’IA. La société, appelée 01.AI, est l’œuvre du PDG Kai-Fu Lee, ancien directeur de Google en Chine et co-président du Conseil de l’IA du Forum économique mondial, auteur du best-seller AI Superpowers : China, Silicon Valley and the New World Order, un livre de 2018 qui soutient que la Chine est capable de dépasser les États-Unis pour devenir le leader mondial de la technologie de l’IA. Selon ce qu’on dit, Lee n’a assemblé son équipe que depuis mars, mais il a rapidement embauché plus de 100 employés provenant à la fois de sociétés multinationales et de sociétés chinoises. 01.AI, qui a commencé ses opérations en juin, a déjà été évaluée à plus d’un milliard de dollars par ses investisseurs, dont le propre fonds de capital-risque de Lee, Sinovation Ventures, et Alibaba Cloud. Dimanche, 01.AI a fait irruption sur la scène en publiant Yi-34B, un modèle de langue large open source, ou LLM, que Lee a décrit cette semaine comme une «alternative convaincante» au LLaMA 2 de Meta. Les LLM sont des modèles d’IA similaires au ChatGPT entraînés sur une grande quantité de données pour générer du texte, bien qu’ils puissent être appliqués à d’autres tâches. Le modèle, disponible en anglais et en chinois, a rapidement attiré l’attention en se classant premier ce week-end sur les classements en open source de la communauté Hugging Face des soi-disant LLM de base pré-entraînés, surpassant même le célèbre modèle de Meta. Dans une interview avec Bloomberg, Lee a déclaré que le LLaMA 2 «était le standard d’or» pour la communauté open source, mais qu’il voulait «fournir une alternative supérieure non seulement pour la Chine, mais également pour le marché mondial», réitérant sur Twitter lundi que sa «vision sous-jacente» était de «rendre l’IA meilleure accessible à plus de monde». Il s’attend à ce que son modèle disponible dans le monde entier soit utile pour les banques et les assureurs multinationals, entre autres, a déclaré Lee à Bloomberg. Lee a déclaré à TechCrunch ce week-end que, bien que la Chine soit toujours en retard sur la technologie LLM aux États-Unis, il n’y a «aucun doute que les développeurs chinois peuvent créer de meilleures applications que les développeurs américains» en raison de «l’écosystème Internet mobile phénoménal du pays». C’est là qu’il semble que la société se concentrera. «Le devoir n’est pas seulement de publier de bons modèles de recherche, mais encore plus important de rendre le développement d’applications facile afin qu’il y ait des applications convaincantes», a-t-il déclaré. «À la fin de la journée, c’est un jeu d’écosystème.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du