Dans le but de profiter de la fièvre entourant l’IA, Cloudflare, le fournisseur de services en nuage, lance une nouvelle gamme de produits et d’applications visant à aider les clients à créer, déployer et exécuter des modèles d’IA au niveau du réseau. L’une des nouvelles offres, Workers AI, permet aux clients d’accéder à des GPUs hébergés par des partenaires de Cloudflare, physiquement proches, afin d’exécuter des modèles d’IA sur une base à la consommation. Un autre, Vectorize, fournit une base de données vectorielles pour stocker des embeddings vectoriels – des représentations mathématiques de données – générées par des modèles issus de Workers AI. Enfin, AI Gateway est conçu pour fournir des métriques permettant aux clients de mieux gérer les coûts d’exécution d’applications d’IA. Selon le PDG de Cloudflare, Matthew Prince, le lancement de la nouvelle suite de produits axés sur l’IA était motivé par une forte envie de la part des clients de Cloudflare d’obtenir une solution de gestion de l’IA plus simple et plus facile à utiliser – une solution axée sur les économies réalisées. «Les offres déjà présentes sur le marché sont toujours très complexes – elles nécessitent de relier entre elles de nombreux nouveaux fournisseurs, et cela devient vite coûteux», a déclaré Prince à TechCrunch dans une interview par e-mail. «Il y a actuellement très peu de données disponibles sur la façon dont vous dépensez de l’argent en IA; l’observabilité est un gros problème alors que les dépenses en IA augmentent rapidement. Nous pouvons aider à simplifier tous ces aspects pour les développeurs. » À cette fin, Workers AI tente de s’assurer que l’inférence IA a toujours lieu sur des GPUs proches des utilisateurs (du point de vue géographique) afin de fournir une expérience utilisateur basée sur l’IA à faible latence. Grâce à ONNX, le kit d’interconnexion d’apprentissage machine mis en œuvre par Microsoft et destiné à convertir entre différents cadres d’IA, Workers AI permet aux modèles d’IA de s’exécuter là où le traitement est le plus logique en termes de bande passante, de latence, de connectivité, de traitement et de contraintes de localisation.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)