Les résultats de l’analyse comparative réalisée par Stability AI entre les accélérateurs Intel Gaudi 2 et les accélérateurs Nvidia H100 pour entraîner deux de ses modèles avancés, Stable Diffusion 3 et Stable Beluga 2.5, ont été révélateurs des capacités impressionnantes des puces Gaudi 2 en matière de vitesse d’apprentissage des modèles texte-image et langage.
Pour le modèle Stable Diffusion 3, les performances de l’accélérateur Gaudi 2 se sont révélées être 1,5 fois plus rapides que celles du H100-80GB, avec un débit d’apprentissage atteignant 927 images par seconde sur 2 nœuds. L’augmentation de la taille des lots à 32 par accélérateur a permis d’atteindre un taux d’entraînement de 1 254 images par seconde, grâce à la mémoire à large bande passante du système Gaudi 2.
En étendant la formation distribuée à 32 nœuds Gaudi 2, le cluster a traité trois fois plus d’images par seconde que les GPU A100-80GB, démontrant la compétitivité de cette solution. De plus, les tests d’inférence ont montré que les puces Gaudi 2 rivalisaient avec les puces Nvidia A100 en utilisant la base PyTorch, et devraient les surpasser avec une optimisation supplémentaire.
Quant au modèle Stable Beluga 2.5 70B, basé sur le modèle Stable Beluga 2, le benchmark de formation réalisé sur 256 accélérateurs Gaudi 2 a affiché un débit moyen total impressionnant de 116 777 jetons par seconde. Les tests d’inférence ont également montré des performances supérieures de Gaudi 2 par rapport aux puces A100, avec un potentiel d’amélioration supplémentaire avec l’utilisation de FP8.
Ces résultats mettent en lumière le potentiel des accélérateurs Intel Gaudi 2 comme une alternative intéressante aux Nvidia H100 pour les charges de travail IA. En plus d’offrir des performances supérieures, les puces Gaudi 2 répondent aux besoins du marché en termes d’abordabilité, de réduction des délais de livraison et d’amélioration du rapport prix/performance, permettant ainsi une plus large adoption des technologies avancées d’IA.
En fin de compte, le choix d’options informatiques plus diversifiées favorise une participation et une innovation étendues, rendant les avancées en matière d’IA plus accessibles à tous.