Cloudflare lance de nouveaux outils d’IA pour aider ses clients à déployer et à exécuter des modèles.

Dans le but de profiter de la fièvre des IA, Cloudflare, le fournisseur de services en nuage, lance une nouvelle gamme de produits et d’applications visant à aider les clients à construire, déployer et exécuter des modèles d’IA au niveau du réseau Edge. L’un des nouveaux services, Workers AI, permet aux clients d’accéder à des cartes graphiques localisées physiquement à proximité hébergées par les partenaires de Cloudflare afin de pouvoir exécuter des modèles d’IA sur une base pay-as-you-go. Un autre service, Vectorize, fournit une base de données vectorielle pour stocker des embeddings vectoriels – des représentations mathématiques de données – générées par des modèles issus de Workers AI. Enfin, AI Gateway est conçu pour fournir des métriques permettant aux clients de mieux gérer les coûts liés à l’exécution d’applications d’IA. Selon le PDG de Cloudflare, Matthew Prince, le lancement de la nouvelle suite de produits axée sur les IA a été motivé par un désir fort de la part des clients de Cloudflare d’une solution de gestion des IA plus simple et plus facile à utiliser, axée sur les économies de coûts. «Les offres déjà sur le marché sont toujours très complexes et nécessitent de regrouper de nombreux nouveaux fournisseurs, et cela devient vite coûteux», a déclaré Prince à TechCrunch dans une interview par e-mail. «Il y a également très peu de données disponibles sur la manière dont vous dépensez de l’argent en IA; l’observabilité est un gros challenge alors que les dépenses en IA augmentent rapidement. Nous pouvons aider à simplifier tous ces aspects pour les développeurs. » À cette fin, Workers AI s’efforce de s’assurer que l’inférence de l’IA a toujours lieu sur des cartes graphiques proches des utilisateurs (du point de vue géographique) afin de fournir une expérience utilisateur finale basée sur l’IA à faible latence. En s’appuyant sur ONNX, l’outil intermédiaire d’apprentissage machine soutenu par Microsoft utilisé pour convertir entre différents cadres d’IA, Workers AI permet aux modèles d’IA de s’exécuter là où le traitement a le plus de sens en termes de bande passante, de latence, de connectivité, de traitement et de contraintes de localisation.

Share the Post: