Une récente fuite de données a révélé des informations sur le prochain modèle d’intelligence artificielle multimodale appelé Gemini ainsi qu’un nouvel outil d’IA secret nommé Stubbs. Selon cette fuite, Gemini sera capable de prendre en charge différentes fonctionnalités telles que la reconnaissance de texte et d’objets, les légendes et la compréhension des images, et peut-être même le traitement audio et vidéo. Quant à Stubbs, il est décrit comme une plateforme d’IA permettant de créer des prototypes d’applications fonctionnels à partir d’une invite simple.
Gemini, également connu sous le nom de Google Gemini AI, est un ensemble intégré de grands modèles de langage (LLM) actuellement en développement chez Google. Selon Sundar Pichai, PDG de Google, les modèles de base de Gemini ont été spécifiquement conçus pour être multimodaux dès le départ. Cela signifie que les utilisateurs pourront traiter et générer du texte, des images, du code et du contenu audio à partir d’une seule interface utilisateur. Actuellement en phase de test bêta auprès d’un groupe restreint de développeurs sélectionnés, Gemini devrait remplacer PaLM 2, le modèle de langage qui alimente actuellement Google Bard, d’ici la fin de l’année 2023.
Jusqu’à présent, très peu d’informations fiables ont filtré concernant Gemini. Cependant, selon un rapport publié en août, Gemini devrait combiner les capacités de GPT-4 avec des techniques d’apprentissage tirées d’AlphaGo, telles que l’apprentissage par renforcement et la recherche arborescente. Cette combinaison pourrait potentiellement concurrencer ChatGPT en tant que solution d’IA générative dominante sur le marché. Il s’agit d’une réponse stratégique de la part de Google pour contrer la montée en puissance de ChatGPT. Le lancement de ChatGPT a en effet secoué les fondations de Google, poussant l’entreprise à investir massivement pour rattraper OpenAI. Outre Bard, Google a également créé Gemini pour tenter de s’emparer de la position dominante de ChatGPT sur le marché de l’IA générative. Selon Zoubin Ghahramani, vice-président de Google DeepMind, Gemini sera disponible en quatre tailles différentes : Gecko, Otter, Bison et Unicorn.
Gecko sera un modèle léger, idéal pour les appareils mobiles ; Otter, quant à lui, sera plus puissant que Gecko et adapté à un large éventail de tâches unimodales ; Bison sera plus grand et polyvalent que Otter, convenant à un nombre limité de tâches multimodales et rivalisera probablement avec le modèle GPT-4 en termes de part de marché ; et enfin, Unicorn sera le plus grand, le plus puissant et le plus polyvalent des quatre modèles Gemini, adapté à différentes tâches multimodales et dépassant largement les capacités de ChatGPT ou de tout autre concurrent.
La rumeur veut également que Gemini soit intégré à tous les services cloud basés sur l’IA que propose Google, notamment la recherche Google, Google Translate et Google Assistant. Une fois lancé, Gemini devrait s’intégrer facilement dans une variété d’applications de bureau et mobiles en temps réel grâce à sa scalabilité et ses capacités d’intégration avec des outils et des API flexibles. Selon la fuite de données, Google prévoit de publier Gemini directement dans MakerSuite, une sorte de studio qui permet de créer rapidement et facilement des applications basées sur des modèles d’IA génératifs. MakerSuite offre une interface utilisateur intuitive pour tirer parti des derniers modèles de Google et traduire facilement les invites en code prêt pour la production qui peut être intégré dans les applications. Google a récemment supprimé la liste d’attente pour MakerSuite, permettant désormais aux utilisateurs de 179 pays et territoires d’y accéder. De plus, la fuite indique que MakerSuite Autosave sera bientôt disponible pour permettre la sauvegarde automatique des invites, en plus de la sortie d’un nouvel outil appelé Stubbs, un outil de construction d’applications piloté par l’IA.
Selon le fuyard, Stubbs permettra aux utilisateurs de créer des applications fonctionnelles à partir d’un seul site web et d’une seule invite. Les utilisateurs pourront créer, déployer et publier des applications directement à partir de Stubbs. Cette fonctionnalité de création et de lancement d’applications depuis un seul site web avec une interface utilisateur simplifiée est révolutionnaire. Une fois l’application publiée, il suffira de partager le lien. Est-ce un nouveau territoire pour l’IA ? Probablement. La galerie Stubbs permettra aux utilisateurs de visualiser les applications créées par d’autres personnes. Lorsqu’une application est créée à partir de Stubbs, elle n’est pas automatiquement publiée, et il faudra explicitement la partager pour que le public puisse la voir. D’après les informations divulguées, Stubbs ne remplacera pas les développeurs d’applications, mais il pourrait donner un coup de pouce massif à l’industrie. Cependant, à en juger par ce que nous savons actuellement, il semble que Stubbs générera des prototypes d’applications fonctionnels plutôt que du code complet. La galerie Stubbs sera un espace communautaire où tout le monde pourra publier et consulter les créations des autres utilisateurs, et il sera également possible de remixer les Stubbs pour créer sa propre version d’une idée.
Bien que cette fuite de données nous donne un aperçu de l’avenir de Gemini et de l’outil d’IA Stubbs, il est important de noter que ces informations ne sont pas précises et qu’il est encore difficile de se faire une idée précise des véritables ambitions de Google avec ces deux technologies d’IA. Stubbs ressemble à un outil sans code basé sur l’IA. Les fuites d’informations sur cet outil secret de Google relancent le débat sur l’avènement des outils sans code basés sur l’IA qui pourraient potentiellement remplacer les développeurs dans un avenir proche. En attendant une déclaration officielle de Google concernant Stubbs, l’auteur de la fuite annonce qu’il pourrait y avoir d’autres fuites de données à venir concernant Gemini et Stubbs. Il a déclaré : « Bien que cette première fuite nous donne un aperçu, les détails techniques de Stubbs seront bientôt publiés dans une autre fuite, vous permettant ainsi de vous faire votre propre opinion sur ses fonctionnalités. »
Sources : source inconnue, Google
Et vous ? Quelle est votre opinion sur ce sujet ?
Que pensez-vous de l’outil d’IA « Stubbs » développé par Google ?
Selon vous, cet outil no-code peut-il prétendre remplacer les développeurs ?
Que pensez-vous des fonctionnalités potentielles du modèle Gemini AI de Google ?
Avec Gemini, Google pourrait-il surpasser ChatGPT et reprendre la tête dans la course à l’IA ?
Voir aussi : Le modèle Gemini AI de Google pourrait être cinq fois plus puissant que le modèle de langage GPT-4 d’OpenAI. Sergey Brin, co-fondateur de Google, revient pour aider au développement de Gemini, le concurrent de ChatGPT. L’ancien président d’Alphabet s’implique dans la stratégie d’IA et le recrutement. Comment Google DeepMind envisage de révolutionner l’IA générative et de dépasser ChatGPT avec Gemini, son système d’IA qui combine les atouts d’AlphaGo avec les capacités des grands modèles de langage.