AWS a trouvé un nouveau moyen de gagner de l’argent – en laissant les clients désespérés de ressources GPU payer pour les réserver à des dates et des heures prévues, payées à l’avance, et sans modification de commande autorisée. Le nouveau modèle de consommation est connu sous le nom de Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML. Il permet aux clients d’accéder à des capacités de calcul GPU très recherchées afin de pouvoir exécuter des charges de travail d’apprentissage automatique courtes. La demande de capacité de GPU pour former et inférer des modèles d’apprentissage automatique a dépassé l’offre disponible dans l’industrie, rendant les GPUs une ressource rare. Ce que AWS ne reconnaît pas, bien sûr, c’est que c’est parce que les hyperscalers sont au premier rang de la file d’attente pour les GPUs, en aspirant l’offre, y compris AWS lui-même. Nvidia aurait déclaré que 22% de son chiffre d’affaires du deuxième trimestre de l’année civile étaient dus à un seul fournisseur de services dans le cloud. Les blocs de capacité EC2 sont initialement disponibles pour les instances de machine virtuelle Amazon EC2 P5, dont il n’existe actuellement qu’un seul type, le p5.48xlarge. Il dispose de 192 vCPUs, 2 To de mémoire système et huit GPUs Nvidia H100, ce qui en fait une instance assez conséquente.
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle
Les Problèmes Communs Rencontrés par la Société dans l’Utilisation Efficace des Derniers Développements de l’Intelligence Artificielle Introduction L’intelligence artificielle (IA)