L’entreprise de démarrage en intelligence artificielle Hugging Face propose une large gamme d’outils d’hébergement et de développement de science des données, notamment un portail ressemblant à GitHub pour les dépôts de code en intelligence artificielle, les modèles et les jeux de données, ainsi que des tableaux de bord Web pour démonstration des applications alimentées par l’IA. Mais certains des outils les plus impressionnants et les plus capables de Hugging Face ces jours-ci proviennent d’une équipe de deux personnes formée en janvier. H4, comme on l’appelle – « H4 » étant l’abréviation de « utile, honnête, inoffensif et affectueux » – vise à développer des outils et des « recettes » pour permettre à la communauté de l’IA de construire des chatbots alimentés par l’IA le long des lignes de ChatGPT. La sortie de ChatGPT a d’ailleurs été le catalyseur de la formation de H4, selon Lewis Tunstall, ingénieur en apprentissage machine chez Hugging Face et l’un des deux membres de H4. « Lorsque ChatGPT a été publié par OpenAI à la fin de 2022, nous avons commencé à brainstromer sur ce qu’il faudrait pour le reproduire avec des bibliothèques et des modèles open source », a déclaré Tunstall à TechCrunch dans une interview par e-mail. « La recherche principale de H4 porte sur l’alignement, qui consiste globalement à enseigner aux LLM comment se comporter en fonction des commentaires des humains (ou même d’autres IA) ». H4 est à l’origine d’un nombre croissant de modèles de langues larges open source, notamment Zephyr-7B-α, une version fine-tunée et centrée sur le chat du modèle éponyme Mistral 7B récemment publié par la startup française d’IA Mistral. H4 a également forké Falcon-40B, un modèle de l’Institut de technologie de l’innovation à Abu Dhabi – en modifiant le modèle pour répondre de manière plus utile aux demandes en langage naturel.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du