L’équipe de Hugging Face compte deux personnes qui développent des modèles de IA ChatGPT-like.

L’entreprise de démarrage en intelligence artificielle Hugging Face propose une large gamme d’outils d’hébergement et de développement en science des données, notamment un portail similaire à GitHub pour les dépôts de code, les modèles et les jeux de données en intelligence artificielle, ainsi que des tableaux de bord Web pour démonstration des applications alimentées par l’IA. Mais certains des outils les plus impressionnants et les plus performants de Hugging Face viennent aujourd’hui d’une équipe de deux personnes formée en janvier. H4, comme on l’appelle, – « H4 » étant l’abréviation de « helpful, honest, harmless and huggy » – vise à développer des outils et des « recettes » pour permettre à la communauté de l’IA de construire des chatbots alimentés par l’IA selon le modèle de ChatGPT. La sortie de ChatGPT a d’ailleurs été le catalyseur de la formation de H4, en fait, selon Lewis Tunstall, ingénieur en apprentissage machine chez Hugging Face et l’un des deux membres de H4. « Lorsque ChatGPT a été publié par OpenAI à la fin de 2022, nous avons commencé à brainstormer sur ce qu’il faudrait pour le dupliquer avec des bibliothèques et des modèles open source », a déclaré Tunstall à TechCrunch dans une interview par e-mail. « La recherche principale de H4 concerne l’alignement, qui consiste enseigner aux LLM comment se comporter en fonction des commentaires des humains (ou même d’autres IA) ». H4 est à l’origine d’un nombre croissant de modèles de langage large open source, notamment Zephyr-7B-α, une version fine-tunée et axée sur le chat du modèle éponyme Mistral 7B récemment publié par la startup française Mistral IA. H4 a également forké Falcon-40B, un modèle de l’Institut de technologie et d’innovation d’Abou Dabi – en modifiant le modèle pour qu’il réponde de manière plus utile aux demandes en langage naturel.

Share the Post: