La startup Inflection a récemment annoncé le lancement de son nouveau modèle de langage, Inflection-2, qui a surpassé le PaLM 2 de Google sur plusieurs benchmarks communs en intelligence artificielle.
Le modèle Inflection-2 a été formé sur plus de 5 000 GPU NVIDIA, réalisant un impressionnant 1 025 quadrillions d’opérations à virgule flottante (FLOP), le plaçant dans la même catégorie que PaLM 2 Large. Cependant, les premiers tests ont montré que Inflection-2 surpasse le modèle de Google dans les tests de capacité de raisonnement, de connaissances factuelles et de preuves stylistiques.
Des tests effectués sur une gamme de références académiques courantes en matière d’IA ont démontré qu’Inflection-2 affiche des scores plus élevés que PaLM 2 dans la plupart des cas. Cela inclut des performances supérieures dans les tests multitâches de compréhension du langage au collège (MMLU), ainsi que dans les tests TriviaQA, HellaSwag et Grade School Math (GSM8k).
Le nouveau modèle sera bientôt intégré à l’application d’assistant personnel de la startup, Pi, permettant des conversations plus naturelles et des fonctionnalités plus utiles pour les utilisateurs.
Inflection prévoit de passer des GPU NVIDIA A100 aux GPU H100 pour l’inférence, ce qui augmentera la vitesse de service et réduira les coûts malgré la taille beaucoup plus importante de Inflection-2 par rapport à son prédécesseur.
Un porte-parole d’Inflection a déclaré que ce dernier modèle représente « une étape importante » vers l’accomplissement de la mission de fournir des assistants IA pour tous. L’équipe de la startup a également exprimé son impatience à former des modèles encore plus grands sur leur supercluster de 22 000 GPU.
La sécurité est une priorité absolue pour Inflection, en tant que l’un des premiers signataires des engagements volontaires de la Maison Blanche en matière d’IA. La société a déclaré que son équipe de sécurité travaille continuellement pour garantir que les modèles sont rigoureusement évalués et s’appuient sur les meilleures pratiques d’alignement.
Avec des références impressionnantes et des plans pour aller plus loin, le dernier effort d’Inflection pose un sérieux défi aux grands acteurs technologiques. Les progrès réalisés par Inflection soulignent la concurrence croissante dans le domaine des grands modèles de langage et met en lumière la course pour proposer la prochaine génération d’IA.