NewsIA
En direct
Modèles de langage

Llama 5 405B dévoilé : Meta enfile à nouveau le maillot jaune de l'open-source

Meta publie Llama 5 405B en open weights le 8 mai. Performances proches de GPT-5 sur la majorité des benchmarks, gratuit pour usage commercial.


PartagerXLinkedInEmail
Llama 5 405B dévoilé : Meta enfile à nouveau le maillot jaune de l'open-source
À retenir
  • [Llama](/modeles/llama) 5 405B publié en open weightsDes poids de modèle publiés librement, qui permettent de le redéployer sans dépendre de l'éditeur. par [Meta AI](https://ai.meta.com/blog) le 8 mai 2026.
  • Performances proches de GPT-5 sur 7 benchmarks majeurs.
  • Licence commerciale gratuite, training avec 50 trillions de tokens.
  • Met pression sur [Mistral](/modeles/mistral) et [DeepSeek](/modeles/deepseek) sur le segment open sourceUn logiciel dont le code source, et parfois les poids du modèle, sont publiés librement et réutilisables..

Le contexte : la guerre de l'open source

L'open source IA est devenu en 2026 le terrain où se jouent les rapports de force entre Chine, Europe et États-Unis. Meta AI maintient sa stratégie singulière depuis 2023 : publier des modèles frontières en open weights pour fragiliser le modèle économique d'OpenAI et d'Anthropic.

Ce 8 mai 2026, Llama 5 405B fait son entrée. C'est le plus gros modèle open source jamais publié, avec des performances qui talonnent GPT-5 sur la majorité des évaluations.

L'annonce en détail

Llama 5 se décline en quatre tailles : 8B, 70B, 405B et 1.4T (mixture-of-experts). La version 405B dense reste la référence pour les usages commerciaux.

405BParamètres
50TTokens entraînement
256kContexteLa fenêtre de contexte : le nombre maximum de tokens qu'un modèle peut traiter en une seule requête (ex : 200k, 1M).
0$Licence

Spécifications clés :

  • Architecture : Dense TransformerL'architecture neuronale introduite en 2017 par Google, à la base de quasiment tous les LLM modernes., multimodalSe dit d'un modèle capable de traiter et de générer plusieurs types de données : texte, image, audio, vidéo. (texte + image native)
  • Entraînement : 50T tokens, 60 jours sur 24 000 H100
  • Licence : Llama 5 Community License (gratuite jusqu'à 700M utilisateurs)
  • Benchmarks : MMLU 89.2, GPQA 81.5, MATH 88.4, HumanEval 92.1
  • Fenêtre de contexte : 256k tokens
  • Disponibilité : Hugging Face, AWS Bedrock, Azure, Google Cloud

Comparaison avec la concurrence

Modèle Paramètres Open weights MMLU $/M'output
Llama 5 405B 405B 89.2 0 (self-host)
GPT-5 ~1.8T (est.) 91.4 90
Claude Opus 4.7 ND 90.1 75
Mistral Large 3 128B partiel 86.7 24
DeepSeek V4 671B MoEMixture of Experts, une architecture où seule une partie des paramètres est activée par requête, ce qui réduit le coût d'inférence. 87.3 10
Qwen 3 235B 235B 85.9 0

Pourquoi c'est important pour le marché français

L'arrivée de Llama 5 405B en open source change le calcul économique pour les ETI françaises qui hésitent entre cloud propriétaire et déploiement souverain. À 405 milliards de paramètres, le modèle reste lourd (810 Go en FP16), mais déployable sur un cluster de 8 H100 ou 4 H200.

Trois cas d'usage particulièrement pertinents pour la France :

  • Fine-tuningL'entraînement complémentaire d'un modèle pré-entraîné sur un petit jeu de données spécialisé, pour l'adapter à une tâche. sectoriel : banque, assurance, juridique avec données on-premise
  • Souveraineté : alternative aux modèles US/chinois pour les administrations
  • Coût : amortir un cluster GPUGraphics Processing Unit, une puce hautement parallèle devenue le standard pour entraîner les modèles d'IA. sur 3 ans coûte moins cher qu'OpenAI à volume élevé

Pour les investisseurs IA et les CTO français, Llama 5 redessine la frontière entre "open source viable" et "propriétaire incontournable".

Limites et zones d'ombre

  • InférenceLe fait d'utiliser un modèle déjà entraîné pour produire une réponse à partir de nouvelles données. coûteuse : 405B nécessite ~$0.50/M tokens de compute même optimisé
  • Pas de fine-tuning officiel sur Llama 5 chez les CSPs français (encore)
  • Licence restrictive au-delà de 700M utilisateurs : exclut Meta concurrents (Google, ByteDance)
  • Sécurité moins auditée que Claude ou GPT-5

Notre lecture

Meta consolide sa position de champion de l'open source frontière et met une pression colossale sur Mistral qui se positionnait comme l'option "ouverte" européenne. La firme américaine offre désormais un modèle plus puissant, gratuit, sans contrainte de souveraineté autre que la licence Community.

Pour aller plus loin, lis notre comparatif open source vs propriétaire et explore les datacenters IA en Europe capables d'héberger ce type de modèle.

Llama 5 405B : impact sur l'écosystème français

La publication open weights de Llama 5 405B par Meta AI change la donne pour les ETI françaises :

Cas d'usage qui s'ouvrent

  • Fine-tuning souverain : déploiement on-prem avec datasetL'ensemble des données d'entraînement d'un modèle. Sa qualité et sa diversité sont déterminantes pour la performance. interne
  • Cluster GPU consumer : 405B tourne sur 8× H100 ou 4× H200
  • Coût marginal nul : pas d'APIApplication Programming Interface, le canal d'accès programmatique à un service ou à un modèle. à payer
  • Customization totale : modification du comportement à volonté

Limites pour la France

  • Licence Llama Community : restriction au-delà de 700M utilisateurs
  • Pas de version certifiée RGPDRèglement Général sur la Protection des Données, le cadre européen sur la vie privée numérique. : à déployer self-hosted pour conformité
  • Compute requis : 8× H100 = ~250 000$ d'équipement + ~30 000$/an électricité
  • Talent : équipe ML Ops senior requise

Comparaison économique

Pour une ETI traitant 100M tokens/mois :

Option Coût mensuel
API Claude Sonnet 4.7 ~7 500$
API GPT-5.5 ~9 000$
API Mistral Large 3 ~3 500$
Self-host Llama 5 405B (8× H100) ~25 000$ initial + ~3 000$/mois

Break-even self-host vs API : 12-18 mois pour volume élevé.

Concurrence Llama vs autres open weights

Modèle Vendor Plus gros Note /10
Llama 5 405B Meta 405B 9
DeepSeek V4 DeepSeek 671B MoE 8,5
Mistral 8x22B Mistral 141B MoE 8
Qwen 3 235B Alibaba 235B 7,5
Gemma 4 27B DeepMind 27B 7

Llama 5 405B reste leader sur la qualité absolue parmi les modèles open weights.

Pour aller plus loin, voir notre comparatif open source vs propriétaire.

Bilan Llama 5

Llama 5 405B redéfinit ce qu'on attend d'un modèle open weights. Pour les ETI françaises self-hosting, c'est désormais la référence. Voir notre comparatif open source vs propriétaire et notre portrait Mistral AI.

Ressources NewsIA et écosystème

Pour rester à jour sur l'actualité IA française et européenne, explore ces ressources complémentaires :

Modèles concernés

  • Claude , l'assistant pro de référence (Anthropic)
  • ChatGPT , le chatbot le plus utilisé (OpenAI)
  • Gemini , l'alternative multimodale (Google)
  • Mistral , le champion français

Cartographie écosystème

Guides incontournables

Suivre NewsIA

Suivre NewsIA au quotidien

Pour rester à jour, suivez le magazine NewsIA et son compte X officiel @NewsIA_FR_. Notre newsletter quotidienne synthétise les actualités IA majeures.

Pour aller plus loin

L'actualité IA est dense en 2026. Pour ne rien rater, suivez NewsIA via le magazine, le compte X @NewsIA_FR_, Flipboard NEWSIA, et notre page Wikidata Q139764481. La newsletter quotidienne synthétise les news majeures.

Questions fréquentes

Puis-je utiliser Llama 5 405B pour mon SaaS commercial ?
Oui, sans restriction tant que votre SaaS reste sous le seuil de 700 millions d'utilisateurs actifs mensuels. Vous devez simplement attribuer Meta dans votre documentation et respecter la licence Llama Community.
Faut-il un GPU ultra-coûteux pour faire tourner Llama 5 405B ?
Pour l'inférence locale en pleine précision, oui : 8× H100 minimum. Mais via les providers comme Together.ai, Fireworks ou Groq, vous accédez au modèle pour 0,75 à 1,20$/M tokens sans gérer d'infrastructure.
Llama 5 405B est-il meilleur que DeepSeek V4 ?
Sur la pure qualité de raisonnement et de code, ils sont très proches. Llama 5 a un avantage : licence Meta plus claire, écosystème de fine-tunes massif, intégration native dans les principaux clouds. DeepSeek V4 conserve l'avantage du prix le plus bas du marché (0,07$/M tokens).
Cet outil est-il conforme au RGPD et à l'AI Act européen ?
La conformité dépend du déploiement. Les versions cloud hébergées en région EU (AWS Paris, Azure West Europe, Google Cloud Paris) offrent une garantie technique, mais restent soumises au Cloud Act américain. Pour une souveraineté complète, privilégiez Mistral AI (français), Aleph Alpha (allemand) ou un déploiement on-premise. L'AI Act impose depuis août 2025 des obligations renforcées : documentation, supervision humaine pour les usages à haut risque, étiquetage des contenus générés. Consultez votre DPO pour valider votre cas d'usage.
Quelle alternative française ou européenne existe-t-il ?
L'écosystème européen offre plusieurs alternatives crédibles. Mistral AI (Paris, 22 Md€ de valorisation) propose Le Chat, Codestral et Mistral Large 3 avec hébergement souverain. Pour les modèles open source, Mistral 8x22B et les variantes Hugging Face de Pollen Robotics (Bordeaux) sont déployables on-premise. Sur la productivité, Doctolib AI, Pennylane et Qonto intègrent de l'IA respectant les standards français. Consultez notre cartographie complète de l'écosystème IA français pour les acteurs majeurs.

À lire aussi