NewsIA
En direct
Modèles de langage

Claude Opus 4.8 : Anthropic mise sur l'honnêteté

Anthropic sort Claude Opus 4.8 ce 28 mai : +5 pts SWE Bench Pro, Fast Mode 3x moins cher, Dynamic Workflows et 4x moins d'erreurs cachées.


PartagerXLinkedInEmail
Claude Opus 4.8 : Anthropic mise sur l'honnêteté
L'essentiel en 30 secondes
  • Sortie ce 28 mai 2026, disponible immédiatement partout : claude.ai, Claude Code, API et l'app Cowork. Identifiant API : claude-opus-4-8.
  • Prix de base inchangé par rapport à Opus 4.7 (5 $ / 25 $ par million de tokens), mais le Fast Mode est désormais 3 fois moins cher et 2,5 fois plus rapide.
  • +5 points sur SWE Bench Pro (64,3 % → 69,2 % en codage agentique), +1,4 pt sur OSWorld-Verified (usage ordinateur), +137 pts sur les tâches de bureau (1753 → 1890).
  • Quatre fois moins de bugs masqués. Selon Anthropic, Opus 4.8 laisse passer environ 4 fois moins d'erreurs de code sans les signaler que la version précédente. L'honnêteté devient un argument commercial.
  • Dynamic Workflows arrive dans Claude Code : un modèle Opus peut désormais piloter des centaines de sous-agents en parallèle et boucler des migrations de bases de code entières sans intervention humaine.

Anthropic vient de publier Claude Opus 4.8, la nouvelle version de son modèle de langage le plus avancé. L'annonce, faite ce jeudi 28 mai 2026 depuis San Francisco, marque la cadence la plus rapide jamais observée chez l'entreprise : seulement 41 jours après Opus 4.7. À titre de comparaison, les modèles Sonnet et Haiku n'ont pas reçu de mise à jour depuis 3 et 7 mois respectivement.

Cette accélération n'est pas un hasard. Opus 4.7 avait reçu un accueil mitigé chez les développeurs (verbosité des commentaires, appels d'outils maladroits) au moment où OpenAI venait de rafraîchir Codex et Google de sortir Gemini 3.5 Flash dans la même fenêtre. Anthropic devait répondre, et vite.

Au-delà des chiffres, Opus 4.8 introduit deux nouveautés stratégiques : une fonctionnalité « Dynamic Workflows » capable d'orchestrer des armées de sous-agents dans Claude Code, et un mode rapide trois fois moins cher qui change l'équation économique des usages massifs. Décryptage complet.

Claude Opus 4.8, qu'est-ce que c'est exactement ?

Claude Opus 4.8 est la version la plus capable de la famille de modèles d'Anthropic, l'éditeur américain de Claude, le concurrent direct de ChatGPT (OpenAI) et Gemini (Google). Dans la gamme Anthropic, Opus joue le rôle du modèle haut de gamme, là où Sonnet occupe le milieu (équilibre rapidité / qualité) et Haiku la base (modèle léger, économique).

Concrètement, Opus 4.8 succède à Opus 4.7 sorti le 15 avril 2026. C'est une mise à jour incrémentale, pas un changement d'architecture majeur. Anthropic décrit elle-même Opus 4.8 comme « une amélioration modeste mais tangible » par rapport à son prédécesseur. La direction de l'entreprise prépare en parallèle un saut générationnel beaucoup plus important avec un nouveau modèle baptisé Claude Mythos, déjà en préversion chez quelques organisations triées sur le volet (voir plus bas).

Où l'utiliser dès aujourd'hui

Le modèle est disponible immédiatement sur les surfaces suivantes :

claude.ai , l'application web et mobile grand public. Les abonnés Claude Pro (20 $/mois) et Max (100 $/mois) peuvent sélectionner Opus 4.8 dans le sélecteur de modèle.
Claude Code , l'agent en ligne de commande pour développeurs. Opus 4.8 devient le modèle par défaut sur les plans Max et Enterprise.
API Anthropic , pour intégration dans une application tierce. Identifiant : claude-opus-4-8.
Cowork , l'environnement de travail collaboratif lancé par Anthropic au printemps 2026.

Les chiffres clés : ce qui progresse vraiment

Anthropic publie une série de benchmarks comparatifs avec Opus 4.7. Voici les résultats consolidés :

Benchmark Ce que ça mesure Opus 4.7 Opus 4.8 Gain
SWE Bench Pro Résoudre des bugs logiciels réels 64,3 % 69,2 % +4,9 pts
OSWorld-Verified Usage agentique d'un ordinateur 82,3 % 83,4 % +1,1 pt
Online-Mind2Web Naviguer sur le web comme un humain n.c. 84 % nouveau record
Tâches de bureau Travail intellectuel multi-étapes 1753 1890 +137 pts
Raisonnement avec outils Logique multi-disciplines 54,7 % 57,9 % +3,2 pts
Finance agentique Analyse financière automatisée 51,5 % 53,9 % +2,4 pts

Comment lire ces chiffres ?

  • SWE Bench Pro est devenu le test de référence pour évaluer un modèle sur des problèmes de code authentiques tirés de projets open source. Un saut de presque cinq points en six semaines est considérable. À titre de repère, GPT-5.5 (OpenAI) score 83,4 % sur Terminal-Bench 2.1 (un test similaire) avec son propre harnais Codex CLI. Les deux modèles jouent donc dans la même cour.
  • OSWorld-Verified mesure la capacité à piloter un système d'exploitation : cliquer, taper, naviguer, remplir des formulaires. C'est le terrain de jeu des agents bureautiques. Opus 4.8 prend la tête sur Online-Mind2Web (la version web de ce benchmark), avec un score que ses concurrents n'égalent pas pour l'instant.
  • Le score de 1890 sur les tâches de bureau est exprimé sur une échelle propriétaire, mais Anthropic affirme que c'est le plus haut score jamais enregistré par un modèle commercial sur cette suite.

Témoignages des partenaires de lancement

L'annonce Anthropic est accompagnée de onze témoignages d'entreprises partenaires, et tous convergent sur deux qualités : la fiabilité sur les tâches longues, et le jugement plus affûté. Quelques highlights :

  • Cursor (l'éditeur de l'IDE éponyme) annonce que sur son benchmark interne CursorBench, Opus 4.8 dépasse les versions précédentes sur tous les niveaux d'effort. Plus important : les appels d'outils utilisent moins d'étapes pour atteindre le même résultat.
  • Cognition Labs (l'éditeur de l'agent Devin) déclare qu'Opus 4.8 « corrige les problèmes de verbosité des commentaires et d'appels d'outils observés sur Opus 4.7 ». C'est l'aveu en filigrane des défauts de la version précédente.
  • Databricks (avec son agent Genie pour les données d'entreprise) signale une réduction de 61 % du coût en tokens pour les analyses multimodales sur PDF et schémas, à qualité égale.
  • Hebbia, spécialisé dans les workflows juridiques et financiers, salue une précision de citation accrue sur les documents denses.

L'honnêteté, la nouvelle obsession d'Anthropic

C'est probablement l'angle de communication le plus inhabituel de cette annonce. Plutôt que d'insister uniquement sur la vitesse ou les benchmarks, Anthropic met en avant la fiabilité du modèle quand il rencontre de l'incertitude.

Citation de l'annonce officielle :

« Les premiers testeurs rapportent qu'Opus 4.8 est plus susceptible de signaler des incertitudes sur son travail, et moins susceptible de formuler des affirmations non étayées. C'est confirmé par nos évaluations, qui montrent qu'Opus 4.8 a environ quatre fois moins de chances que son prédécesseur de laisser passer des défauts dans le code qu'il a écrit sans les signaler. »

Concrètement, qu'est-ce que cela change pour un utilisateur ? Trois choses :

  • En codage assisté, le modèle remonte plus souvent les zones qu'il n'a pas pu valider, au lieu de produire un correctif qui « semble » fonctionner mais introduit une régression silencieuse.
  • En analyse de données ou de documents, il pointe les contradictions dans les sources qu'on lui fournit, là où Opus 4.7 avait tendance à harmoniser les écarts en silence.
  • En travail de recherche long, il met des balises explicites sur les hypothèses qu'il a dû faire faute de preuve.

Cette orientation rapproche Opus 4.8 du fonctionnement attendu d'un collaborateur humain consciencieux, qui dit « je ne sais pas » quand c'est le cas, plutôt que d'un assistant qui veut plaire à tout prix. C'est aussi une réponse à une critique récurrente des modèles génératifs : leur tendance à l'hallucination confiante.

L'équipe d'alignement d'Anthropic, qui audite chaque modèle avant publication, conclut que les traits d'alignement positifs d'Opus 4.8 atteignent de nouveaux records sur des mesures comme « le soutien à l'autonomie de l'utilisateur » et « l'action dans son meilleur intérêt ». Les taux de comportements problématiques (tromperie, coopération à un usage abusif) sont substantiellement plus faibles que sur Opus 4.7, à un niveau similaire à celui de Claude Mythos Preview, le modèle le plus aligné d'Anthropic à ce jour.

Dynamic Workflows : Claude Code pilote des armées de sous-agents

Si vous n'utilisez pas Claude Code au quotidien, cette section pourrait sembler technique. Mais c'est probablement la nouveauté la plus structurante de la journée, et elle mérite qu'on s'y arrête.

De quoi parle-t-on ?

Les modèles d'IA, même très puissants, restent limités par la longueur d'une session unique. Au-delà d'un certain volume de contexte, leur capacité à raisonner cohéremment se dégrade. Pour contourner ce mur, les développeurs d'agents IA utilisent depuis 18 mois une technique appelée « orchestration de sous-agents » : on découpe un gros problème en sous-tâches, on lance un sous-agent Claude par sous-tâche, et un agent superviseur synthétise les résultats.

Le problème : jusqu'à présent, cette orchestration devait être codée à la main par les équipes techniques avec des outils comme LangGraph, AutoGen ou les frameworks maison. Coûteux à mettre en place, fragile, difficile à debugger.

Dynamic Workflows intègre cette logique directement dans Claude Code. En une seule session :

  • Claude planifie l'arbre de sous-tâches.
  • Il lance jusqu'à plusieurs centaines de sous-agents en parallèle.
  • Chaque sous-agent travaille de manière autonome, parfois pendant plusieurs heures.
  • Claude vérifie les résultats avant de les remonter à l'utilisateur.

Le cas d'usage emblématique

Anthropic donne l'exemple suivant dans son post officiel : avec Dynamic Workflows et Opus 4.8, Claude Code peut mener une migration de base de code à l'échelle d'un dépôt complet, sur des centaines de milliers de lignes, du lancement de la tâche jusqu'à la fusion (merge) finale, en utilisant la suite de tests existante comme garde-fou.

Concrètement : transformer toutes les pages d'une application React 17 en React 19, ou migrer un backend Python 2 vers Python 3, sur un projet de 200 000 lignes, devient une commande unique. Le tout sous supervision humaine si on le souhaite, ou en mode totalement autonome avec validation finale.

Pour qui ? À quel prix ?

La fonctionnalité est en research preview (préversion de recherche), disponible uniquement sur les plans Claude Code Enterprise, Team et Max. Les utilisateurs Pro classiques n'y ont pas accès pour l'instant. C'est cohérent avec la philosophie d'Anthropic : tester d'abord avec des organisations capables d'absorber les éventuels accidents, puis élargir.

Anthropic a augmenté les rate limits (les quotas d'appels) de Claude Code pour accompagner la consommation de tokens explosive que ce mode entraîne. Comptez plusieurs millions de tokens pour une migration typique.

Fast Mode , 2,5 fois plus rapide, 3 fois moins cher

Le « Fast Mode » d'Opus 4.8 est probablement la nouveauté qui aura le plus d'impact sur les budgets des équipes IA. Petit rappel : le Fast Mode est une variante du modèle optimisée pour la vitesse, qui sacrifie un peu de qualité en échange d'un temps de réponse plus court.

Sur Opus 4.7, le Fast Mode coûtait environ 3 fois plus cher que le mode standard (à cause des optimisations matérielles nécessaires). Sur Opus 4.8, ce ratio s'effondre :

Mode Prix input (par M tokens) Prix output (par M tokens) Vitesse
Standard Opus 4.8 5 $ 25 $ référence
Fast Mode Opus 4.8 10 $ 50 $ 2,5× plus rapide
Pour mémoire : Fast Mode Opus 4.7 30 $ 75 $ 2× plus rapide

Le Fast Mode est désormais deux fois plus rapide qu'avant pour trois fois moins cher. Cela débloque deux usages qui étaient économiquement impossibles auparavant :

  • Les agents conversationnels en temps réel (chat client, support technique) où chaque seconde compte.
  • Les boucles d'auto-correction dans Claude Code, où un agent peut tenter plusieurs hypothèses rapidement avant de retenir la bonne.

Le contrôle d'effort débarque sur claude.ai

Petite révolution UX côté grand public : un curseur de contrôle d'effort apparaît à côté du sélecteur de modèle sur claude.ai et Cowork. Il propose plusieurs niveaux :

  • Standard (par défaut) : le bon équilibre qualité / latence pour la plupart des usages. Pour le codage, ce niveau dépense un nombre de tokens similaire à celui d'Opus 4.7, mais avec une meilleure qualité.
  • Extra (xhigh dans Claude Code) : pour les tâches difficiles ou les workflows asynchrones longs.
  • Max : le modèle réfléchit autant que nécessaire, sans contrainte. Recommandé pour les problèmes complexes où la précision prime sur le temps de réponse.

L'idée : laisser l'utilisateur arbitrer entre vitesse et qualité, plutôt que d'imposer un compromis figé. Cette fonctionnalité est disponible sur tous les plans, y compris gratuits avec quotas.

À noter : sur les niveaux supérieurs, le modèle consomme davantage de tokens, ce qui peut épuiser plus vite votre quota mensuel sur Claude Pro (20 $/mois). Si vous êtes un utilisateur intensif, prévoyez le plan Max ou un usage API.

Une nouveauté discrète mais majeure pour les développeurs

Si vous intégrez Claude dans une application via l'API, prenez deux minutes pour lire cette section. Anthropic a modifié un détail technique qui change beaucoup de choses pour les agents complexes.

Jusqu'à présent, l'instruction système de Claude (le prompt qui définit son rôle, ses contraintes, son ton) devait être passée avant le début de la conversation, et ne pouvait pas être modifiée en cours de route sans casser le cache de prompt (la mécanique qui rend les appels répétés moins chers).

Avec Opus 4.8, la Messages API accepte désormais des entrées système à l'intérieur du tableau de messages, à n'importe quel moment de la conversation. Concrètement :

  • Vous pouvez mettre à jour les permissions de l'agent au cours d'une session (autoriser l'accès à un nouveau fichier, par exemple).
  • Vous pouvez ajuster le budget de tokens restant ou les contraintes de format en cours de route.
  • Vous pouvez changer le contexte d'environnement (passer de mode développement à mode production) sans repartir de zéro.

Tout cela sans invalider le prompt cache, et sans devoir router l'instruction via un faux tour utilisateur (un hack courant jusqu'ici). C'est la cerise sur le gâteau pour qui construit des agents IA en Python ou TypeScript au-dessus de Claude.

Tarifs Claude Opus 4.8 : combien ça coûte ?

Récap clair des prix au 28 mai 2026 :

Claude Pro , 20 $/mois. Accès à Opus 4.8 sur claude.ai et l'app mobile, avec quotas généreux pour usage personnel ou professionnel léger. Inclut Sonnet et Haiku également. Facturation mensuelle ou annuelle (réduction ~17 % à l'année).
Claude Max , 100 $/mois. Quotas 5× supérieurs, accès prioritaire en heures de pointe, accès à Claude Code avec Dynamic Workflows. Cible : développeurs et power users.
API Anthropic , 5 $ / 25 $ par million de tokens (input / output). C'est le tarif standard. Pour les volumes très élevés, le tarif batch (économie de 50 %) et le prompt caching (économie jusqu'à 90 % sur les répétitions) restent disponibles.
Fast Mode API , 10 $ / 50 $ par million de tokens. Réservé aux usages où la vitesse prime. Trois fois moins cher qu'au lancement d'Opus 4.7.
Claude Code Enterprise , devis personnalisé. Pour les équipes de plus de 50 développeurs. Inclut Dynamic Workflows, SSO, audit, garanties contractuelles.

À titre de comparaison, GPT-5.5 d'OpenAI est facturé 5 $ / 30 $ par million de tokens, et Gemini 3.5 Flash de Google à environ 0,30 $ / 2,50 $ (Gemini joue volontairement la carte du low cost sur Flash). Opus reste donc le modèle le plus cher du trio sur l'output, mais l'écart se resserre depuis dix-huit mois.

Opus 4.8 face à GPT-5.5 et Gemini 3.5 Flash

Comment Opus 4.8 se positionne-t-il face à ses concurrents ? Voici notre lecture synthétique, à partir des benchmarks publiés et des retours partenaires.

Là où Opus 4.8 prend la tête

  • Codage agentique complexe et migrations de codebase. Dynamic Workflows + l'aptitude à des sessions très longues placent Opus 4.8 devant la concurrence sur les projets de plus de 100 000 lignes.
  • Travail juridique et financier. Anthropic met en avant des records sur Legal Agent Benchmark (« premier modèle à dépasser 10 % sur le standard all-pass ») et sur Finance Agent v2. CoCounsel Legal (Thomson Reuters) et Hebbia le confirment.
  • Agent navigateur (browser agent). 84 % sur Online-Mind2Web, contre des scores plus bas pour GPT-5.5 et Gemini.
  • Honnêteté et signalement d'incertitudes. C'est l'avantage qualitatif qui ressort le plus dans les retours partenaires.

Là où la concurrence reste devant

  • Coût par requête sur les usages simples. Gemini 3.5 Flash reste 5 à 10 fois moins cher sur les tâches courtes (rédaction, résumé, traduction). Pour un chatbot grand public à fort volume, le calcul économique penche encore vers Google.
  • Latence sur les tâches courtes. GPT-5.5 conserve un avantage marginal sur la première seconde de réponse.
  • Multimodalité native. Gemini reste plus performant sur l'analyse de très grandes vidéos ou de gros documents PDF illustrés.

En résumé

Si votre cas d'usage tourne autour du code, des agents autonomes, des analyses longues ou des workflows juridiques / financiers, Opus 4.8 est aujourd'hui le meilleur choix du marché. Pour des usages bureautiques quotidiens à fort volume, Gemini 3.5 Flash reste imbattable sur le rapport qualité / prix. GPT-5.5 reste le plus polyvalent pour qui cherche un équilibre toutes catégories. Notre comparatif détaillé des quatre grandes IA en 2026 creuse chaque dimension.

Claude Mythos en embuscade

Anthropic profite de cette annonce pour teaser son prochain palier. À la fin de son post officiel, l'entreprise écrit :

« Nous prévoyons de sortir une nouvelle classe de modèles dotée d'une intelligence supérieure à Opus. Dans le cadre du Project Glasswing, un petit nombre d'organisations utilisent actuellement Claude Mythos Preview pour des travaux de cybersécurité. Les modèles de ce niveau de capacité nécessitent des garde-fous cyber renforcés avant leur diffusion générale. Nous progressons rapidement, et nous prévoyons de pouvoir mettre des modèles Mythos à disposition de tous nos clients dans les semaines à venir. »

Lecture : Claude Mythos arrivera vraisemblablement au cours de l'été 2026, probablement avant la conférence Anthropic prévue à l'automne. Sa première vocation officielle est la cybersécurité offensive et défensive, terrain qui nécessite des barrières techniques particulières pour éviter les usages malveillants. Anthropic suit ainsi un schéma qu'OpenAI avait popularisé avec GPT-5 : publication d'abord en préversion fermée auprès d'organisations sélectionnées, puis ouverture progressive une fois les évaluations de sûreté terminées.

Pour qui suit l'écosystème des grandes IA américaines, c'est un signal clair : la prochaine vague va arriver vite, et Anthropic ne compte pas laisser GPT-5.5 ou Gemini 3.5 Pro (annoncé pour juin) prendre seuls la tête sur le segment ultra-haut de gamme.

Pour qui Opus 4.8 change vraiment la donne ?

Plutôt que de répondre « tout le monde » (ce qui n'aiderait personne), voici un découpage par profil.

Développeurs et équipes d'ingénierie. Le saut sur SWE Bench Pro, la correction des défauts de tool-calling et l'arrivée de Dynamic Workflows en font la mise à jour la plus impactante en 2026. Si vous êtes sur Cursor, Claude Code ou un IDE qui intègre l'API Anthropic, basculez dès aujourd'hui.
Cabinets juridiques et services financiers. Les benchmarks Legal Agent et Finance Agent v2 progressent significativement. La précision des citations sur documents denses, mise en avant par Hebbia et CoCounsel Legal, en fait un outil sérieux pour la veille réglementaire, l'audit de contrats et l'analyse de filings SEC.
Équipes data et analytics. Avec Genie de Databricks qui annonce 61 % d'économie sur l'analyse multimodale, Opus 4.8 devient pertinent pour les pipelines de reporting automatisé.
Créateurs de contenu et rédacteurs. Le saut sur les tâches de bureau (1753 → 1890) traduit une meilleure tenue du style et de la voix sur des sessions longues. Plusieurs partenaires le décrivent comme « le modèle vers lequel on revient pour le travail créatif sérieux ».
Particuliers et utilisateurs occasionnels. Si vous utilisez Claude une à deux fois par semaine pour des résumés, des traductions ou de l'aide à la rédaction, le changement sera marginal. Restez sur votre plan actuel, le modèle sera proposé automatiquement.

Comment activer Opus 4.8 dès aujourd'hui

Trois cas de figure.

Sur claude.ai

Le sélecteur de modèle, en haut à gauche de la zone de saisie, propose « Claude Opus 4.8 » dès le 28 mai 2026. Pas besoin de bascule manuelle pour les utilisateurs Pro et Max : c'est le nouveau modèle par défaut sur Opus. Si vous voyez encore « Opus 4.7 », rafraîchissez l'onglet. Le curseur de contrôle d'effort apparaît juste à droite du sélecteur.

Dans Claude Code

Si Claude Code est déjà installé sur votre machine, la mise à jour est automatique au prochain lancement. Pour vérifier la version, tapez claude --version dans votre terminal. La version minimale compatible est la 2.0.6. Si vous voulez tester Dynamic Workflows et que vous êtes sur Max ou Enterprise, la commande claude dynamic-workflow est désormais disponible (sinon, la commande renvoie un message d'indisponibilité).

Via l'API Anthropic

L'identifiant à utiliser est claude-opus-4-8. Voici un exemple minimaliste en Python :

from anthropic import Anthropic

client = Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explique-moi Dynamic Workflows en 3 lignes."}
    ]
)
print(response.content[0].text)

Le SDK gère automatiquement le prompt cache si vous structurez votre conversation avec des system entries. Aucun changement de code nécessaire si vous étiez déjà sur claude-opus-4-7 : il suffit de mettre à jour la chaîne du modèle.

Une cadence qui interroge le rythme du marché

Quarante-et-un jours entre Opus 4.7 et Opus 4.8. Six mois plus tôt, Anthropic livrait une version Opus par trimestre. À ce rythme, la famille Opus pourrait connaître trois à quatre versions par an en 2026, ce qui pose plusieurs questions structurelles.

Pour les équipes IA en entreprise, la cadence devient un défi : faut-il refaire ses évaluations à chaque sortie ? Anthropic répond en partie en publiant des System Cards détaillés à chaque release, qui documentent les changements de comportement attendus.

Pour les développeurs d'agents, la rapidité est une bonne nouvelle : les défauts identifiés sont corrigés vite (la verbosité d'Opus 4.7 disparaît avec 4.8). Mais elle impose aussi une discipline de versioning : épingler claude-opus-4-7 plutôt que d'utiliser l'alias claude-opus-latest en production, le temps de valider les régressions sur ses propres tests.

Pour le grand public, la cadence est largement transparente, mais elle traduit une compétition technologique d'une intensité inédite. À la fin du printemps 2026, OpenAI, Anthropic et Google publient en moyenne une mise à jour majeure par mois, ce qui n'avait jamais été le cas depuis l'arrivée de ChatGPT en novembre 2022.


À surveiller dans les prochaines semaines : la sortie de Claude Mythos (semaines à venir d'après Anthropic), l'arrivée de Gemini 3.5 Pro (juin annoncé par Google) et la prochaine itération de GPT-5.5 chez OpenAI (rythme trimestriel récent). NewsIA suit chaque sortie majeure dans sa rubrique Actualités IA.

Questions fréquentes

Quand sort Claude Opus 4.8 ?
Claude Opus 4.8 est sorti le jeudi 28 mai 2026, disponible immédiatement sur claude.ai, dans Claude Code, sur l'app Cowork et via l'API Anthropic (identifiant claude-opus-4-8).
Combien coûte Claude Opus 4.8 ?
Le prix de base est inchangé par rapport à Opus 4.7 : 5 $ par million de tokens en entrée, 25 $ en sortie via l'API. Côté grand public, Claude Pro à 20 $/mois et Claude Max à 100 $/mois donnent accès à Opus 4.8. Le Fast Mode coûte 10 $ / 50 $ par million de tokens, soit trois fois moins cher qu'auparavant.
Quelle est la différence entre Opus 4.7 et Opus 4.8 ?
Opus 4.8 améliore le codage agentique (+5 pts sur SWE Bench Pro), l'usage ordinateur (+1,1 pt sur OSWorld-Verified), les tâches de bureau (+137 pts) et le raisonnement avec outils (+3,2 pts). Il affiche surtout quatre fois moins de bugs non signalés dans le code qu'il écrit. Anthropic ajoute Dynamic Workflows dans Claude Code, un Fast Mode 3 fois moins cher et un contrôle d'effort sur claude.ai.
Qu'est-ce que les Dynamic Workflows de Claude Code ?
Les Dynamic Workflows sont une fonctionnalité de Claude Code disponible en research preview sur les plans Enterprise, Team et Max. Elles permettent à Claude Opus 4.8 de planifier puis d'exécuter des centaines de sous-agents en parallèle dans une seule session, par exemple pour mener une migration de base de code à l'échelle d'un dépôt complet (200 000+ lignes) de bout en bout, avec la suite de tests existante comme garde-fou.
Faut-il payer plus pour utiliser le Fast Mode d'Opus 4.8 ?
Oui, le Fast Mode coûte deux fois plus cher que le mode standard à la requête (10 $ / 50 $ contre 5 $ / 25 $ par million de tokens via l'API). Mais il est 2,5 fois plus rapide et désormais trois fois moins cher que le Fast Mode d'Opus 4.7. Pour des usages temps réel (chat client, support, boucles d'auto-correction), il est rentable. Pour des usages où la latence n'est pas critique, le mode standard reste plus économique.
Opus 4.8 est-il meilleur que GPT-5.5 d'OpenAI ?
Sur le codage agentique de grande échelle, les agents navigateurs (Online-Mind2Web 84 %), le travail juridique et l'analyse financière long-format, Opus 4.8 prend la tête. GPT-5.5 reste meilleur sur la latence courte et la polyvalence générale. Gemini 3.5 Flash de Google reste imbattable sur le coût des tâches simples à fort volume. Notre comparatif détaillé creuse chaque dimension.
Quand sortira Claude Mythos, le prochain modèle d'Anthropic ?
Anthropic annonce que Claude Mythos sera disponible pour l'ensemble de ses clients dans les semaines à venir, soit vraisemblablement au cours de l'été 2026. Le modèle est déjà utilisé en préversion fermée (Project Glasswing) par quelques organisations spécialisées en cybersécurité. Sa sortie générale dépend de la finalisation de garde-fous cyber renforcés.
Modèles cités

Source : www.anthropic.com

À lire aussi