Un autre nuage GPU s’est formé au milieu du boom de l’IA en cours. Aujourd’hui, la startup d’infrastructures d’IA Foundry a annoncé que sa plateforme Cloud est désormais disponible en accès limité. Fondée en 2022 par l’ancien chercheur de DeepMind, Jared Quincy Davis, Foundry est un nouveau venu relatif sur la scène, se joignant à des acteurs tels que Lambda et CoreWeave, qui ont attiré des milliards de dollars dans la course à la monétisation de la demande d’infrastructures d’IA. Basée à Palo Alto, en Californie, cette start-up nuageuse vise à être plus qu’un simple prestataire de clusters de GPU en location. Un point central de la plateforme Cloud de Foundry (FCP) est d’aider les utilisateurs à naviguer à travers la complexité du déploiement d’entraînement, de l’ajustement fin et du déploiement de modèles d’inférence. Plus précisément, Foundry affirme que si un client réserve 1 000 GPU pour X nombre d’heures, que ce soit des jours ou des semaines, ils obtiendront réellement toute cette puissance de calcul. Ce n’est pas une tâche anodine, surtout avec de plus grands clusters utilisés pour des choses comme l’entraînement, car le temps moyen jusqu’à une défaillance peut être assez court. Comme on pourrait s’y attendre, la stratégie de Foundry pour contourner ce problème est de maintenir un pool de noeuds réservés qui fonctionnent effectivement comme des pièces de rechange immédiatement disponibles lorsque des problèmes surgissent inévitablement.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du