« Les superamas sont trop grands, mais les serveurs individuels sont trop petits ? Oracle propose une zone de confort AI à la Goldilocks »

Oracle a créé une paire d’options d’infrastructure AI à louer destinées à des charges de travail AI d’entraînement et d’inférence de taille moyenne – et a teasé l’arrivée du superchip GH200 de Nvidia dans son cloud. Mercredi, le directeur du marketing produit d’Oracle Akshai Parthasarathy et le chef de produit principal Sagar Zanwar ont détaillé les deux nouveaux « shapes » – expression utilisée par Oracle pour désigner les types d’instances cloud – pour les charges de travail AI de gamme moyenne. L’un arbore le nom accrocheur de BM.GPU.L40S.4. Le BM signifie « bare metal », et dans cette forme, les boîtiers sont équipés de quatre Nvidia L40S GPUs – chacun avec 48GB de mémoire GDDR6, une capacité de stockage local NVMe de 7,38 To, des processeurs Intel Xeon de 4e génération avec 112 cœurs, et un téraoctet de mémoire système. La forme BM.GPU.L40S.4 est « commandable actuellement ». Si vous préférez des machines virtuelles, Oracle a défini deux autres formes, mais n’est pas encore prêt à les louer – les présentant plutôt comme étant bientôt disponibles.

Share the Post: