Meta vient de lancer Llama 2, une version ouverte de son modèle linguistique, s’attaquant ainsi aux ténors de l’IA générative tels que ChatGPT. Découvrez comment cette avancée dans l’open-source peut transformer l’expérience de l’IA et la manière dont Microsoft Azure joue un rôle clé dans cette démocratisation.
Les LLM, tels que le célèbre GPT-4 d’OpenAI propulsant ChatGPT, et PaLM 2 de Google, à l’origine de Bard, ont suscité un grand intérêt. Toutefois, il serait dommage de ne pas prêter attention aux efforts de Meta pour se positionner dans l’arène de l‘IA générative. Contrairement à GPT-4 et PaLM 2, qui restent des modèles fermés, Llama 2 est open-source (voir ci-dessous). D’ailleurs, il affiche déjà des résultats similaires sur certains critères de référence et devrait continuer à progresser avec l’implication du public.
L’ouverture de Llama 2 : un atout décisif
Meta a pris une décision audacieuse en rendant Llama 2 accessible en open-source, tant pour la recherche que pour une utilisation commerciale. Cette démarche vise à permettre au grand public de contribuer à façonner cette technologie transformative tout en en tirant profit.
Selon un billet de blog annonçant sa disponibilité, Meta souligne que cette initiative offre aux entreprises, aux startups, aux entrepreneurs et aux chercheurs un accès à des outils puissants qu’ils n’auraient pas pu construire seuls, en bénéficiant d’une puissance de calcul autrement inatteignable. Cette ouverture ouvre un monde de possibilités pour expérimenter, innover et, en fin de compte, générer des avantages économiques et sociaux.
Contrairement à Google et OpenAI, qui gardent jalousement leurs LLM propriétaires sans révéler les détails sur leur conception, Llama 2 est librement accessible via Hugging Face, Amazon Web Services et Microsoft Azure. Cela signifie que les développeurs peuvent accéder à son code source et à ses données, leur permettant de construire et d’améliorer le modèle. Llama 2 propose trois tailles de modèles pré-entraînés : 7 milliards, 13 milliards et 70 milliards de paramètres, tous accessibles.
Llama 2 et Microsoft Azure : une synergie fructueuse
En parallèle du lancement de Llama 2, Meta a annoncé un partenariat stratégique avec Azure, la plateforme cloud de Microsoft. Désormais, les clients d’Azure peuvent utiliser Llama 2 pour développer des applications. Bien sûr, Llama 2 peut également être téléchargé directement, mais l’intégration avec la plateforme d’IA d’Azure offre des fonctionnalités de réglage fin, de sécurité et d’inférence spécialement conçues pour travailler avec des LLM.
Cette alliance s’inscrit dans la démarche de démocratisation de l’IA prônée par les deux géants de la technologie. Si Azure est un abonnement payant, Microsoft a néanmoins rendu gratuits les outils Bing et Edge, tous deux propulsés par le puissant GPT-4 d’OpenAI, fruit d’investissements majeurs de la part de Microsoft. Cette collaboration renforce les efforts de Microsoft dans le domaine de l’IA générative et permet à Meta de rendre Llama 2 accessible aux développeurs Azure via un canal privilégié.
Le face-à-face entre Llama 2 et ChatGPT
Peut-on envisager que Llama 2 devienne le meilleur LLM et détrône ChatGPT ? La réponse brève est non, du moins pour l’instant.
Dans un document de recherche, Meta a comparé les performances de Llama 2 à d’autres modèles, dont GPT-3.5 et GPT-4 d’OpenAI, et PaLM et PaLM 2 de Google, sur divers critères académiques. Si Llama 2 n’a pas atteint les mêmes résultats sur des ensembles de données mesurant les connaissances générales, les compétences mathématiques ou les capacités de codage, il a néanmoins montré des résultats intéressants dans une autre étude basée sur des évaluations humaines.
Lors de cette évaluation, 4 000 prompts ont été soumis à des jugements humains concernant leur “utilité” en comparant différents modèles. Llama 2 a réussi à surpasser ChatGPT avec 35,9 % de “victoires” contre 32,5 % pour ChatGPT.
Bien que ces scores aient été établis par rapport à des modèles fermés, Llama 2 a démontré sa supériorité face à d’autres modèles open-source (tels que MPT et Falcon) dans tous les domaines.
En somme, l’intelligence de Llama 2 est considérée comparable à celle de GPT-3.5 et légèrement supérieure à celle de ChatGPT dans le rôle de chatbot. Avec l’engagement continu de la communauté des développeurs, Llama 2 a le potentiel pour continuer à s’améliorer.