Apple veut que l’IA fonctionne directement sur ses périphériques et non dans le cloud.

La dernière recherche d’Apple sur l’exécution de grands modèles de langage sur les smartphones offre le signal le plus clair jusqu’à présent que le fabricant d’iPhone compte rattraper ses concurrents de la Silicon Valley en matière d’intelligence artificielle générative. Le papier, intitulé «LLM in a Flash», offre «une solution à un goulot d’étranglement computationnel actuel», écrivent ses chercheurs. Son approche «ouvre la voie à une inférence efficace de LLM sur des appareils à mémoire limitée», ont-ils déclaré. L’inférence fait référence à la manière dont les grands modèles de langage, les vastes bases de données qui alimentent des applications comme ChatGPT, répondent aux requêtes des utilisateurs. Les chatbots et les LLM s’exécutent généralement dans de vastes centres de données disposant de beaucoup plus de puissance de calcul qu’un iPhone. Le papier a été publié le 12 décembre mais a attiré l’attention générale après que Hugging Face, un site populaire pour les chercheurs en IA, a mis en évidence mercredi soir. C’est le deuxième papier d’Apple sur l’IA générative ce mois-ci et suit des décisions prises plus tôt pour permettre aux modèles générateurs d’images tels que Stable Diffusion de s’exécuter sur ses puces personnalisées. Les fabricants d’appareils et les fabricants de puces espèrent que de nouvelles fonctionnalités d’IA aideront à relancer le marché des smartphones, qui a connu sa pire année en une décennie, avec une baisse des livraisons estimée à 5%.

Share the Post: