« Intel, Ampere montrent que l’exécution de LLM sur les processeurs n’est pas aussi folle que cela puisse paraître. »
Les chatbots et services AI génératifs populaires tels que ChatGPT ou Gemini fonctionnent principalement sur des GPUs ou d’autres accélérateurs