Microsoft dévoile Phi-2, la prochaine de ses modèles de génération d’IA plus petits et plus agiles.

Microsoft a annoncé le prochain de sa suite de modèles d’intelligence artificielle (IA) plus petits et plus agiles ciblant des cas d’utilisation plus spécifiques. Au début de ce mois, Microsoft a présenté Phi-1, le premier de ce qu’il appelle les petits modèles de langage (SLM); ils ont beaucoup moins de paramètres que leur prédécesseur de grand modèle de langage (LLM). Par exemple, le GPT-3 LLM – la base de ChatGPT – a 175 milliards de paramètres. GPT-4, le dernier LLM d’OpenAI, en a environ 1,7 trillion. Phi-1 a été suivi par Phi-1,5, qui, par comparaison, a 1,3 milliard de paramètres. Phi-2 est un modèle de langage de 2,7 milliards de paramètres que la société prétend pouvoir dépasser LLM jusqu’à 25 fois plus grand. Microsoft est un important actionnaire et partenaire d’OpenAI, le développeur de ChatGPT, lancé il y a un peu plus d’un an. Microsoft utilise ChatGPT comme base de son assistant de génération d’IA Copilot. Les LLM utilisés pour les applications d’IA générative (genAI) telles que ChatGPT ou Bard peuvent consommer d’immenses cycles de processeur et être coûteux et longs à former pour des cas d’utilisation spécifiques en raison de leur taille. Les modèles plus petits et plus axés sur l’industrie ou les entreprises peuvent souvent fournir de meilleurs résultats adaptés aux besoins des entreprises.

Share the Post: