« Hugging Face met la pression sur les ambitions logicielles de Nvidia »

‘Cette semaine, Hugging Face a dévoilé une nouvelle offre appelée HUGS, qui est présentée comme un concurrent des Inference Microservices (NIMs) de Nvidia. L’introduction de HUGS vise à faciliter et à élargir le déploiement et la mise en œuvre de grands modèles de langage et d’autres modèles d’IA, promettent les créateurs.

En essence, les services d’IA générative de Hugging Face (HUGS) sont des images de modèles conteneurisées. Ils peuvent fournir aux utilisateurs tous les outils nécessaires pour implémenter leurs modèles, éliminant ainsi la nécessité de lutter avec des modèles de langage spécifiques pour obtenir des performances optimales et une évolutivité. Les utilisateurs peuvent désormais lancer sans effort une image de conteneur pré-formatée via Docker ou Kubernetes et s’y connecter de manière transparente en utilisant des appels d’API OpenAI conventionnels.

La conception de HUGS repose fortement sur les cadres et les bibliothèques de Text Generation Inference (TGI) et Transformers en source ouverte. Cette base assure que HUGS peut être mis en œuvre sur diverses plateformes matérielles, y compris les GPU Nvidia et AMD. Les créateurs de HUGS prévoient également d’accueillir des accélérateurs d’IA spécialisés comme l’Inferentia d’Amazon ou les TPU de Google dans un avenir proche. Aucune information n’est encore disponible concernant le support pour les plateformes Intel Gaudi.

Bien que HUGS repose sur des technologies en source ouverte, elles ne sont pas proposées gratuitement, tout comme les NIMS de Nvidia. Lorsqu’il est déployé sur AWS ou Google Cloud, HUGS coûte environ 1$ par heure et par conteneur. Ce prix contraste fortement avec les tarifs des NIMs de Nvidia, qui coûtent 1$ de l’heure par GPU lorsqu’ils sont déployés dans le cloud ou 4 500$ par an par GPU sur site. De ce fait, l’avantage financier bascule considérablement en faveur de Hugging Face lors du déploiement de modèles plus importants, comme le Llama 3.1 405B de Meta, qui nécessite huit GPU.

En fin de compte, l’avantage distinct de HUGS est son support pour divers types de matériel, ce qui permet aux utilisateurs de ne pas être confinés à l’écosystème matériel de Nvidia. Le lancement de HUGS souligne un développement excitant dans l’espace de l’IA, apportant plus d’options, de personnalisation et de valeur pour les utilisateurs.’

Share the Post:

Informatique à Haguenau

Informatique à Haguenau : Solutions complètes pour tous vos besoins informatiques La ville de Haguenau, idéalement située en Alsace, est

Qu’est-ce qu’Apify et comment peut-il aider votre entreprise ?

Qu’est-ce qu’Apify et comment peut-il aider votre entreprise ? Dans le monde du web scraping et de l’automatisation des tâches,

Goose : L’agent IA local qui automatise les tâches d’ingénierie

Goose : L’agent IA local qui automatise les tâches d’ingénierie Dans le monde numérique, les développeurs peuvent perdre en productivité

DeepSeek : Une Nouvelle Ère pour l’Intelligence Artificielle et la Recherche en Ligne

L’intelligence artificielle évolue rapidement, et de nouvelles plateformes émergent pour révolutionner divers secteurs. L’une des innovations les plus prometteuses est

Équilibrer la Numérisation et la Sobriété Numérique dans la Formation Professionnelle : Solutions Actuelles et Besoins Émergents

La formation professionnelle tout au long de la vie (FTLV) connaît une transformation significative dans le contexte actuel de numérisation

Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle

Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)

Donnez vie à vos histoires avec Epidemic Sound

Dans le monde numérique d’aujourd’hui, le contenu visuel est roi. Mais qu’est-ce qui transforme une bonne vidéo en une expérience

KLING AI : Le Studio Créatif de Nouvelle Génération Alimenté par l’IA

Dans le monde en constante évolution de la création de contenu numérique, une nouvelle étoile brille de mille feux :