L’entreprise de démarrage en intelligence artificielle Hugging Face propose une large gamme d’outils de développement et d’hébergement de données, notamment un portail ressemblant à GitHub pour les dépôts de code, les modèles et les jeux de données en intelligence artificielle, ainsi que des tableaux de bord Web pour démontrer les applications alimentées par IA. Mais certains des outils les plus impressionnants et les plus performants de Hugging Face proviennent actuellement d’une équipe de deux personnes formée en janvier. H4, comme on l’appelle, court pour «utile, honnête, inoffensif et aimant», vise à développer des outils et des «recettes» pour permettre à la communauté de l’IA de créer des chatbots alimentés par l’IA selon le modèle ChatGPT. La sortie de ChatGPT a d’ailleurs été le catalyseur de la formation de H4, selon Lewis Tunstall, un ingénieur en apprentissage machine chez Hugging Face et l’un des deux membres de H4. «Lorsque ChatGPT a été publié par OpenAI à la fin de 2022, nous avons commencé à brainstormer sur ce qu’il faudrait pour le reproduire avec des bibliothèques et des modèles open source», a déclaré Tunstall à TechCrunch dans une interview par e-mail. «La recherche principale de H4 porte sur l’alignement, qui consiste enseigner aux LM comment se comporter en fonction des commentaires des humains (ou même d’autres IA)». H4 est à l’origine d’un nombre croissant de modèles linguistiques larges open source, notamment Zephyr-7B-α, une version fine-tunée et centrée sur le chat du modèle éponyme Mistral 7B récemment publié par le démarrage français en intelligence artificielle Mistral. H4 a également forké Falcon-40B, un modèle de l’Institut de technologie et d’innovation d’Abou Dabi – en modifiant le modèle pour qu’il réponde plus utilement aux demandes en langage naturel.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du