Google a publié un trio de nouveaux modèles d'IA générative « ouverts » qu'il qualifie de « plus sûrs », « plus petits » et « plus transparents » que la plupart — une affirmation audacieuse, certes.
Ces nouveaux modèles viennent s'ajouter à la famille de modèles génératifs Gemma 2 de Google, qui a fait ses débuts en mai. Les nouveaux modèles, Gemma 2 2B, ShieldGemma et Gemma Scope, sont conçus pour des applications et des cas d'utilisation légèrement différents, mais partagent en commun une orientation vers la sécurité.
La série de modèles Gemma de Google diffère de ses modèles Gemini dans le sens où Google ne met pas à disposition le code source de Gemini, qui est utilisé par les propres produits de Google et est également disponible pour les développeurs. Gemma est plutôt une initiative de Google visant à encourager la bonne volonté au sein de la communauté des développeurs, un peu comme Meta tente de le faire avec Llama.
Gemma 2 2B est un modèle léger permettant de générer du texte d'analyse et pouvant être exécuté sur une gamme de matériels, notamment des ordinateurs portables et des appareils de pointe. Il est sous licence pour certaines applications de recherche et commerciales et peut être téléchargé à partir de sources telles que la bibliothèque de modèles Vertex AI de Google, la plateforme de science des données Kaggle et la boîte à outils AI Studio de Google.
ShieldGemma est un ensemble de « classificateurs de sécurité » qui tentent de détecter les éléments toxiques tels que les discours de haine, le harcèlement et les contenus sexuellement explicites. Construit sur la base de Gemma 2, ShieldGemma peut être utilisé pour filtrer les invites vers un modèle génératif ainsi que le contenu généré par le modèle.
Enfin, Gemma Scope permet aux développeurs de « zoomer » sur des points spécifiques d'un modèle Gemma 2 et de rendre son fonctionnement interne plus interprétable. Voici comment Google le décrit dans un article de blog : «[Gemma Scope is made up of] « Les chercheurs ont développé des réseaux neuronaux spécialisés qui nous aident à décortiquer les informations denses et complexes traitées par Gemma 2, en les développant sous une forme plus facile à analyser et à comprendre. En étudiant ces vues élargies, les chercheurs peuvent obtenir des informations précieuses sur la manière dont Gemma 2 identifie les modèles, traite les informations et, en fin de compte, fait des prédictions. »
La sortie des nouveaux modèles Gemma 2 intervient peu après que le ministère américain du Commerce a approuvé les modèles d'IA ouverts dans un rapport préliminaire. Les modèles ouverts élargissent la disponibilité de l'IA générative aux petites entreprises, aux chercheurs, aux organisations à but non lucratif et aux développeurs individuels, indique le rapport, tout en soulignant la nécessité de capacités de surveillance de ces modèles pour détecter les risques potentiels.