L’entreprise de démarrage d’IA Hugging Face propose une large gamme d’outils d’hébergement et de développement de données scientifiques, notamment un portail GitHub-like pour les dépôts de code, les modèles et les jeux de données IA, ainsi que des tableaux de bord Web pour démonstration des applications alimentées par IA. Mais certains des outils les plus impressionnants et les plus performants de Hugging Face proviennent aujourd’hui d’une équipe de deux personnes qui n’a été formée qu’en janvier. H4, comme on l’appelle – « H4 » signifiant « utile, honnête, inoffensif et affectueux » – vise à développer des outils et des « recettes » pour permettre à la communauté IA de construire des chatbots alimentés par IA sur le modèle de ChatGPT. La sortie de ChatGPT a d’ailleurs été le catalyseur de la formation de H4, selon Lewis Tunstall, ingénieur en apprentissage machine chez Hugging Face et l’un des deux membres de H4. « Lorsque ChatGPT a été publié par OpenAI à la fin de 2022, nous avons commencé à brainstormer sur ce qu’il faudrait pour le reproduire avec des bibliothèques et des modèles open source », a déclaré Tunstall à TechCrunch dans une interview par e-mail. « La recherche principale de H4 porte sur l’alignement, qui consiste globalement à enseigner aux LLM comment se comporter en fonction des commentaires des humains (ou même d’autres IA) ». H4 est à l’origine d’un nombre croissant de grands modèles de langage open source, notamment Zephyr-7B-α, une version affinée et axée sur le chat du célèbre modèle Mistral 7B récemment publié par la startup française d’IA Mistral. H4 a également forked Falcon-40B, un modèle de l’Institut de technologie et d’innovation de Abu Dhabi – en modifiant le modèle pour qu’il réponde de manière plus utile aux requêtes en langage naturel.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du