Meta a récemment annoncé le lancement de son nouveau projet intitulé « Purple Llama », qui vise à promouvoir le développement et l’utilisation responsables des modèles d’intelligence artificielle génératifs. Face à la popularité grandissante des modèles d’IA open source, avec plus de 100 millions de téléchargements de modèles Llama, il est devenu nécessaire de trouver des moyens d’assurer la sécurité et de bloquer les contenus inappropriés.
Ce projet s’inspire du concept de cybersécurité « purple teaming », qui combine à la fois des approches offensives et défensives pour atténuer les risques liés aux modèles d’IA. Ainsi, Purple Llama propose des outils et des évaluations dans deux domaines clés : la cybersécurité et les garanties d’entrée et de sortie.
En ce qui concerne les risques de cybersécurité propres aux modèles d’IA génératifs, il est important de disposer d’un moyen de quantifier le risque de piratage d’un modèle d’IA. Des métriques peuvent être utiles en fournissant un score indiquant la probabilité d’un piratage réussi. De plus, les développeurs peuvent utiliser des outils pour évaluer la fréquence des suggestions de code dangereux, pour ainsi identifier et résoudre les problèmes de leurs modèles d’IA que les pirates pourraient exploiter.
Il existe également des outils pour se protéger contre l’utilisation malveillante des modèles d’IA. Ces outils peuvent aider à empêcher les pirates de voler ou d’utiliser des données pour diffuser de fausses nouvelles. Les organisations peuvent mettre en œuvre ces outils pour protéger leurs modèles d’IA contre toute utilisation à des fins malveillantes.
Les mesures de garantie entrées/sorties désignent les mesures de sécurité mises en œuvre pour protéger les données contre tout accès, manipulation ou divulgation non autorisés au point d’entrée et de sortie d’un système.
Ce projet s’inscrit dans une démarche de collaboration en matière de sécurité, visant à renforcer la confiance dans les développeurs qui conduisent cette nouvelle vague d’innovation et à favoriser la recherche et les contributions supplémentaires sur l’IA responsable. Il vise à offrir un écosystème ouvert pour le développement de l’IA et à faciliter la mise en œuvre de bonnes pratiques en matière de sécurité et de confiance pour le développement d’IA générative.
Le lancement de Purple Llama est une étape importante vers une confiance et une sécurité ouvertes dans le monde de l’IA générative. Ce projet cadre rassemblera des outils et des évaluations pour aider la communauté à construire de manière responsable avec des modèles d’IA génératifs ouverts. Sa première version comprend des outils et des évaluations pour la cybersécurité et les garanties d’entrée/sortie, et la publication d’outils supplémentaires est prévue dans un avenir proche.
Ainsi, avec le lancement de Purple Llama, le secteur de l’intelligence artificielle franchit une nouvelle étape vers un développement responsable et sécurisé des modèles d’IA génératifs.