« Les petits modèles de langage gagnent en popularité – mais ils ont une ‘fausse idée cachée’ avec laquelle les entreprises doivent composer. »

Les petits modèles de langage (SML) sont sous les feux des projecteurs suite à la sortie du mini GPT-4o d’OpenAI, mais les experts ont averti ITPro que ces modèles plus légers et plus rentables ne seront pas une solution miracle pour les entreprises économes. Maintenant disponible pour tous les utilisateurs de ChatGPT, le mini GPT-4o se distingue par de solides performances, notamment dans les domaines du raisonnement mathématique. Il a obtenu un score de 82% en compréhension du langage multi-tâches (MMLU) et de 87% en mathématiques du primaire multilingues (MGSM). L’atout majeur de ce modèle réside dans son coût. Proposé à 5 cents par million de jetons en entrée et 60 cents par million de jetons en sortie, le GPT-4o est plus de 60% moins cher que le GPT-3.5 Turbo. OpenAI s’attend à ce que son nouveau modèle stimule le développement d’applications en rendant l’intelligence beaucoup plus abordable. Cela est vrai dans le domaine des SLM, alors que d’autres entreprises lancent leurs propres modèles de taille réduite. Prenez Phi 3 de Microsoft, par exemple, sorti plus tôt cette année. Phi-3 est une famille de SLM conçue pour rendre le « fine-tuning » ou la personnalisation plus facile et plus abordable, avec des exigences computationnelles inférieures qui réduisent les coûts opérationnels associés.

Share the Post: