L’équipe de Hugging Face compte deux personnes qui développent des modèles de IA ChatGPT-like.

L’entreprise de démarrage en intelligence artificielle Hugging Face propose une large gamme d’outils d’hébergement et de développement de science des données, notamment un portail ressemblant à GitHub pour les dépôts de code en intelligence artificielle, les modèles et les jeux de données, ainsi que des tableaux de bord Web pour démonstration des applications alimentées par l’IA. Mais certains des outils les plus impressionnants et les plus capables de Hugging Face ces jours-ci proviennent d’une équipe de deux personnes formée en janvier. H4, comme on l’appelle – « H4 » étant l’abréviation de « utile, honnête, inoffensif et affectueux » – vise à développer des outils et des « recettes » pour permettre à la communauté de l’IA de construire des chatbots alimentés par l’IA le long des lignes de ChatGPT. La sortie de ChatGPT a d’ailleurs été le catalyseur de la formation de H4, selon Lewis Tunstall, ingénieur en apprentissage machine chez Hugging Face et l’un des deux membres de H4. « Lorsque ChatGPT a été publié par OpenAI à la fin de 2022, nous avons commencé à brainstromer sur ce qu’il faudrait pour le reproduire avec des bibliothèques et des modèles open source », a déclaré Tunstall à TechCrunch dans une interview par e-mail. « La recherche principale de H4 porte sur l’alignement, qui consiste globalement à enseigner aux LLM comment se comporter en fonction des commentaires des humains (ou même d’autres IA) ». H4 est à l’origine d’un nombre croissant de modèles de langues larges open source, notamment Zephyr-7B-α, une version fine-tunée et centrée sur le chat du modèle éponyme Mistral 7B récemment publié par la startup française d’IA Mistral. H4 a également forké Falcon-40B, un modèle de l’Institut de technologie de l’innovation à Abu Dhabi – en modifiant le modèle pour répondre de manière plus utile aux demandes en langage naturel.

Share the Post: