Cloudflare lance de nouveaux outils d’IA pour aider ses clients à déployer et à exécuter des modèles.

Cloudflare lance une nouvelle gamme de produits et d’applications visant à aider ses clients à développer, déployer et gérer des modèles d’IA au niveau du réseau. L’un des nouveaux produits, Workers AI, permet aux clients d’accéder à des cartes graphiques hébergées par des partenaires de Cloudflare situés à proximité physique, afin de pouvoir exécuter des modèles d’IA sur une base pay-as-you-go. Vectorize fournit quant à lui une base de données vectorielle pour stocker des plongements vectoriels – des représentations mathématiques de données – générées par des modèles issus de Workers AI. AI Gateway est enfin conçu pour fournir des métriques permettant aux clients de mieux gérer le coût de fonctionnement des applications d’IA. Selon le PDG de Cloudflare, Matthew Prince, le lancement de la nouvelle suite de produits axés sur l’IA était motivé par la forte demande de la part des clients de Cloudflare pour une solution de gestion de l’IA plus simple et plus facile à utiliser, axée sur les économies réalisables. «Les offres déjà disponibles sur le marché sont encore très complexes et nécessitent de coudre ensemble de nombreux nouveaux fournisseurs, ce qui devient vite coûteux», a déclaré Prince à TechCrunch dans une interview par courrier électronique. «Il y a également très peu d’informations disponibles actuellement sur la façon dont vous dépensez de l’argent en matière d’IA; l’observabilité est un gros challenge alors que les dépenses en IA augmentent exponentiellement. Nous pouvons aider à simplifier tous ces aspects pour les développeurs. » À cet effet, Workers AI s’efforce de s’assurer que l’inférence d’IA a toujours lieu sur des cartes graphiques proches des utilisateurs (du point de vue géographique) pour fournir une expérience utilisateur final basée sur l’IA à faible latence. En s’appuyant sur ONNX, l’outil intermédiaire d’apprentissage machine soutenu par Microsoft permettant de convertir entre différents cadres d’IA, Workers AI permet aux modèles d’IA de s’exécuter là où le traitement est le plus logique en termes de bande passante, de latence, de connectivité, de traitement et de contraintes de localisation.

Share the Post: