Apple veut que l’IA fonctionne directement sur son matériel au lieu du cloud.

La dernière recherche d’Apple sur l’exécution de modèles linguistiques complexes sur les smartphones offre le signal le plus clair jusqu’à présent que le fabricant d’iPhone compte rattraper ses concurrents de la vallée de Silicom en intelligence artificielle générative. L’article, intitulé «LLM en un éclair», offre «une solution à un goulot d’étranglement informatique actuel», écrivent ses chercheurs. Son approche «ouvre la voie à une inférence efficace de LLMs sur des appareils à mémoire limitée», ont-ils déclaré. L’inférence fait référence à la manière dont les grands modèles linguistiques, les grandes bases de données qui alimentent des applications telles que ChatGPT, répondent aux requêtes des utilisateurs. Les chatbots et les LLM s’exécutent généralement dans de vastes centres de données disposant de bien plus de puissance de calcul qu’un iPhone. L’article a été publié le 12 décembre, mais a suscité un plus large intérêt après que Hugging Face, un site populaire pour les chercheurs en IA souhaitant mettre en valeur leur travail, l’ait mis en évidence mercredi soir. C’est le deuxième article d’Apple sur l’IA générative ce mois-ci et suit des déplacements antérieurs pour permettre aux modèles générateurs d’images tels que Stable Diffusion de s’exécuter sur ses puces personnalisées. Les fabricants d’appareils et les fabricants de puces espèrent que de nouvelles fonctionnalités d’IA permettront de relancer le marché des smartphones, qui a connu sa pire année en une décennie, avec une baisse des expéditions estimée à 5 %, selon Counterpoint Research.

Share the Post: