Microsoft a publié Orca 2, un ensemble de deux petits modèles de langage qui se montrent meilleurs que leurs equivalents plus grands.

Êtes-vous prêt à apporter une plus grande visibilité à votre marque? Pensez à devenir un commanditaire pour The AI Impact Tour. En savoir plus sur les opportunités ici. Même si le monde assiste au conflit de pouvoir et à la démission en masse d’OpenAI, Microsoft, le principal soutien d’AI, ne ralentit pas ses propres efforts en matière d’IA. Aujourd’hui, le bras de recherche de la société de Satya Nadella a lancé Orca 2, un ensemble de petits modèles de langage qui égalent ou surpassent de cinq à dix fois les modèles de langage plus grands, y compris Llama-2 Chat-70B de Meta, lorsqu’ils sont testés sur des tâches de raisonnement complexes dans des environnements sans données d’apprentissage. Les modèles existent en deux tailles, 7 milliards et 13 milliards de paramètres, et reposent sur le travail effectué sur le modèle Orca original de 13B qui a montré de fortes capacités de raisonnement en imitant les traces de raisonnement pas à pas de modèles plus grands et plus performants il y a quelques mois. «Avec Orca 2, nous continuons à montrer que des signaux et des méthodes d’entraînement améliorés peuvent donner aux modèles de langage plus petits les capacités de raisonnement améliorées, généralement trouvées uniquement dans les modèles de langage beaucoup plus grands», ont écrit les chercheurs de Microsoft dans un billet de blog conjoint.

Share the Post: