Claude Mythos : l'IA trop dangereuse pour le grand public
Claude Mythos, le modèle frontier d'Anthropic, trouve seul des failles zero-day vieilles de 27 ans et a poussé Trump à encadrer l'IA. Trop puissant pour être public ?

- → Anthropic a dévoilé Claude Mythos en avril : un modèle si puissant en cybersécurité qu'elle refuse de le rendre public
- → Il a trouvé seul un bug vieux de 27 ans dans OpenBSD et 112 failles dans Firefox ; 93,9 % sur SWE-benchUn benchmark qui évalue la capacité d'un modèle à résoudre de vrais problèmes GitHub en autonomie, comme un ingénieur. Verified
- → Réservé à ~150 organisations de défense (projet Glasswing), il a poussé Trump à signer un décret sur l'IA le 2 juin
- → Sa sortie grand public fait l'objet de rumeurs insistantes (prix, date), mais Anthropic ne l'a pas confirmée
C'est le modèle dont tout le monde parle, et que presque personne ne peut utiliser. Claude Mythos, dévoilé par Anthropic en avril 2026, est officiellement « trop dangereux » pour être mis entre les mains du public. En quelques semaines de tests, il a déniché des milliers de failles critiques dans les plus grands systèmes du monde, et a même poussé Donald Trump, longtemps hostile à toute régulation, à signer un décret sur l'IA. Alors que des rumeurs annoncent une ouverture imminente, voici ce qui est vrai, ce qui ne l'est pas, et pourquoi ce modèle change la donne.
Un modèle jugé trop dangereux par son propre créateur
Le 7 avril 2026, Anthropic a présenté Claude Mythos Preview, un modèle « frontier » généraliste, et a immédiatement annoncé une chose rare dans l'industrie : elle refuse de le commercialiser au grand public. La raison ? Ses capacités en cybersécurité offensive sont jugées trop puissantes pour être laissées en libre accès.
Détail piquant : Mythos n'a même pas été entraîné spécifiquement pour le piratage. Selon Anthropic, ses prouesses cyber découlent de ses progrès généraux en raisonnement et en codage autonome. Autrement dit, plus une IA devient forte en code, plus elle devient, par effet de bord, une redoutable arme informatique.
Des benchmarks qui écrasent la concurrence
Sur les tests de référence, Mythos ne fait pas que devancer les autres modèles : il creuse l'écart, surtout en sécurité informatique.
Le score de 100 % sur Cybench (35 défis de type Capture The Flag) est si net qu'Anthropic considère ce benchmarkUn test standardisé qui mesure la performance des modèles sur une tâche (ex : SWE-bench pour le code, MMLU pour les savoirs généraux). comme dépassé pour cette génération. L'Institut britannique de sécurité de l'IA (AISI), qui a eu un accès anticipé, confirme l'ampleur du saut.
Il y a deux ans, les meilleurs modèles disponibles pouvaient à peine accomplir des cybertâches de niveau débutant. Mythos peut découvrir et exploiter des vulnérabilités de manière autonome, des tâches qui prendraient des jours à des professionnels.
UK AI Safety Institute (AISI), évaluation des capacités cyber de Claude Mythos Preview
Des failles dénichées seul, que personne n'avait vues depuis des décennies
Le plus impressionnant n'est pas dans les chiffres, mais dans les découvertes réelles. Sans aucun guidage humain, Mythos a mis au jour des vulnérabilités que des milliers d'experts avaient manquées pendant des années.
Plus inquiétant encore : chez Anthropic, des ingénieurs sans aucune formation en sécurité ont demandé à Mythos de chercher des failles pendant la nuit, et ont trouvé au matin une vulnérabilité exploitable. La barrière de compétence, qui protégeait jusqu'ici les systèmes, s'effondre.
Project Glasswing : réservé aux défenseurs
Plutôt que de tout verrouiller, Anthropic a choisi une voie médiane : déployer Mythos uniquement à des fins défensives, via le Project Glasswing. L'idée : donner le modèle aux organisations qui protègent les infrastructures critiques, avant que des IA équivalentes ne tombent entre de mauvaises mains.
L'accès, d'abord limité à 12 partenaires (Amazon, Apple, Microsoft, Google, NVIDIA, CrowdStrike, la Linux Foundation…), a été élargi en juin à environ 150 organisations. Anthropic y engage 100 millions de dollars en crédits d'usage et 4 millions en dons à la sécurité open sourceUn logiciel dont le code source, et parfois les poids du modèle, sont publiés librement et réutilisables.. Le tout sous le régime de sécurité maximal de l'entreprise (ASL-3).
Le modèle qui a fait plier Donald Trump
L'onde de choc a atteint la Maison-Blanche. Le 2 juin 2026, Donald Trump, jusque-là farouchement opposé à toute régulation de l'IA (pour ne pas freiner la course face à la Chine), a signé un décret encadrant le secteur. Le texte reconnaît noir sur blanc que les capacités de l'IA présentent « de nouveaux risques pour la sécurité nationale ».
Le décret reste volontaire : les entreprises peuvent soumettre leurs nouveaux modèles à un examen du gouvernement 30 jours avant leur sortie. Mais le symbole est fort. Et l'enjeu économique l'est tout autant.
Une opération cyber sophistiquée nécessitait auparavant des dizaines de milliers de dollars et des semaines de travail. Désormais, il suffit de quelques heures. Pour la première fois, attaquer revient moins cher que se protéger.
Akram Azzam, responsable cyber chez Sia Partners, aux Échos
Une sortie publique imminente ? Ce qu'on sait vraiment
Depuis quelques jours, les réseaux s'enflamment : Mythos sortirait « demain », au grand public, avec une grille tarifaire premium (des montants de 25 $ et 125 $ par million de tokens circulent). Prudence. À ce stade :
Tous ne crient pas au loup. Une partie de la communauté cyber estime que l'effet d'annonce a surtout servi la communication d'Anthropic, qui a déposé son projet d'entrée en Bourse le 1er juin, valorisée 965 milliards de dollars, devant OpenAI.
L'annonce d'Anthropic était très spectaculaire et a été un succès en matière de relations publiques, à défaut d'autre chose.
Peter Swire, professeur de cybersécurité au Georgia Institute of Technology, à Scientific American
Les 6 à 12 prochains mois seront décisifs
Au-delà du buzz, Anthropic lance un avertissement clair : dans les 6 à 12 mois, plusieurs entreprises disposeront de modèles « de niveau Mythos », et toutes ne mettront pas les mêmes garde-fous. L'entreprise s'attend à des cyberattaques plus fréquentes et plus imprévisibles.
C'est tout le paradoxe de ce modèle : le même outil qui peut blinder un hôpital, une banque ou un système électoral peut aussi servir à l'attaquer. La « ruée vers Mythos » a déjà saisi le secteur bancaire américain, où les grands établissements s'en servent pour traquer leurs propres failles.
Mythos restera-t-il un privilège réservé aux géants, ou finira-t-il par s'ouvrir, avec les risques que cela implique ? La réponse dira beaucoup de la direction que prend l'IA en 2026 : entre course à la puissance et responsabilité, il va falloir choisir.
Pour aller plus loin
Notre décryptage du volet cyber de Mythos, le projet Glasswing et les 10 000 zero-days, détaille la mécanique de détection. Pour le modèle public actuel d'Anthropic, voir Claude Opus 4.8. Sur les usages malveillants de l'IA côté grand public, lisez notre enquête sur la désinformation par IA. Et toute l'actu dans la rubrique Régulation et éthique.
Sources
- Blog du Modérateur , « Claude Mythos : un modèle d'IA trop dangereux pour être rendu public » (avril 2026)
- TV5MONDE , « Pourquoi Mythos pousse Donald Trump à encadrer l'IA » (3 juin 2026)
- Les Échos , « Attaquer revient moins cher que se protéger : l'avantage 100 contre 1 »
- UK AI Safety Institute , évaluation des capacités cyber de Claude Mythos Preview
- Scientific American , « What is Mythos and why are experts worried? »
Questions fréquentes
- Qu'est-ce que Claude Mythos ?
- Claude Mythos est un modèle d'intelligence artificielle « frontier » dévoilé par Anthropic en avril 2026. Présenté comme le plus avancé de l'entreprise, il excelle en programmation et en raisonnement autonome, ce qui lui confère des capacités de cybersécurité hors norme. Anthropic ne l'a pas rendu public, le jugeant trop puissant.
- Pourquoi Anthropic refuse de rendre Mythos public ?
- Parce que ses capacités de détection et d'exploitation de failles informatiques pourraient servir à des cyberattaquants. Le modèle a trouvé seul des vulnérabilités critiques dans OpenBSD, FFmpeg, Firefox ou le noyau Linux. Anthropic craint qu'un accès libre n'arme des acteurs malveillants et préfère un déploiement contrôlé.
- Qu'est-ce que le Project Glasswing ?
- C'est l'initiative d'Anthropic pour déployer Mythos uniquement à des fins défensives. L'accès est réservé à environ 150 organisations chargées de protéger des infrastructures critiques (Amazon, Apple, Microsoft, Google, NVIDIA, CrowdStrike, Linux Foundation…), avec 100 millions de dollars de crédits d'usage engagés.
- Claude Mythos va-t-il sortir au grand public ?
- Rien n'est confirmé. Des rumeurs évoquent une sortie imminente et une grille tarifaire premium, mais Anthropic répète qu'elle n'envisage pas, pour l'instant, de rendre Mythos accessible sans garde-fous suffisants. L'accès reste limité aux partenaires du projet Glasswing.
- Quel rapport entre Mythos et le décret de Donald Trump ?
- Les capacités de Mythos ont accéléré une prise de conscience à Washington. Le 2 juin 2026, Donald Trump, jusque-là opposé à toute régulation de l'IA, a signé un décret reconnaissant de « nouveaux risques pour la sécurité nationale » et invitant les entreprises à soumettre leurs modèles à un examen 30 jours avant leur sortie.
- Mythos est-il vraiment dangereux ou est-ce du marketing ?
- Les deux lectures coexistent. Les exploits documentés (bug de 27 ans dans OpenBSD, 73 % de tâches de hacking de niveau expert selon l'AISI) sont réels et impressionnants. Mais une partie de la communauté cyber estime que l'annonce a surtout servi la communication d'Anthropic, qui a déposé son projet d'introduction en Bourse début juin.
- Combien coûte Claude Mythos ?
- Aucun tarif officiel n'a été communiqué, puisque le modèle n'est pas commercialisé au grand public. Des montants premium circulent dans les rumeurs (autour de 25 $ et 125 $ par million de tokens), mais ils ne sont pas confirmés par Anthropic à ce jour.


