« Les modèles d’IA de poche pourraient débloquer une nouvelle ère de l’informatique »

Lorsque ChatGPT a été lancé en novembre 2023, il ne pouvait être accessible que via le cloud car le modèle derrière était tout simplement énorme. Aujourd’hui, j’utilise un programme IA tout aussi performant sur un Macbook Air, et il n’est même pas chaud. La réduction de taille montre à quel point les chercheurs raffinent rapidement les modèles IA pour les rendre plus légers et plus efficaces. Cela montre également que passer à des échelles de plus en plus grandes n’est pas le seul moyen de rendre les machines significativement plus intelligentes. Le modèle qui alimente actuellement mon ordinateur portable avec la même esprit impliqué et la sagesse que ChatGPT est appelé Phi-3-mini. Il fait partie d’une famille de modèles IA plus petits récemment publiés par des chercheurs de Microsoft. Bien qu’il soit assez compact pour fonctionner sur un smartphone, je l’ai testé en le faisant fonctionner sur un ordinateur portable et en y accédant depuis un iPhone via une application appelée Enchanted qui fournit une interface de discussion similaire à l’application officielle ChatGPT. Dans un document décrivant la famille de modèles Phi-3, les chercheurs de Microsoft indiquent que le modèle que j’ai utilisé se mesure favorablement à GPT-3.5, le modèle OpenAI derrière la première version de ChatGPT. Cette affirmation est basée sur sa performance dans plusieurs référentiels AI standard conçus pour mesurer le bon sens et le raisonnement. Dans mes propres tests, il semble certainement tout aussi performant. Microsoft a annoncé un nouveau modèle « multimodal » Phi-3 capable de gérer l’audio, la vidéo et le texte lors de sa conférence annuelle de développeurs, Build, cette semaine. Cela s’est produit quelques jours seulement après qu’OpenAI et Google aient tous deux vanté de nouveaux assistants IA radicaux construits sur des modèles multimodaux accessibles via le cloud.

Share the Post: