NewsIA
En direct
Modèles de langage

DeepSeek V4 divise encore le prix par deux : la course au low-cost s'intensifie

DeepSeek annonce le 8 mai des baisses tarifaires massives sur V4. À 0,07 $/M tokens, le modèle est 200× moins cher que Claude Opus 4.7.


PartagerXLinkedInEmail
DeepSeek V4 divise encore le prix par deux : la course au low-cost s'intensifie
À retenir
  • [DeepSeek](/modeles/deepseek) V4 divise ses prix par 2 le 8 mai 2026.
  • Input à 0,07$/M tokens : 200× moins cher que [Claude Opus 4.7](/modeles/claude).
  • Performance proche de GPT-5 sur les benchmarks chinois et anglais.
  • Met pression sur [Mistral](/modeles/mistral) sur le segment milieu de gamme.

Le contexte : la course au low-cost IA

DeepSeek, startup chinoise, a marqué 2025 en publiant DeepSeek-R1 à un coût d'entraînement 50× inférieur à GPT-5 selon leurs propres benchmarks. Cette stratégie "qualité élevée + prix bas" a contraint OpenAI, Anthropic et Google à revoir leur grille tarifaire en 2025-2026.

Ce 8 mai 2026, DeepSeek V4 accélère encore le mouvement avec une nouvelle baisse de 50% sur l'input et 60% sur l'output.

L'annonce en détail

0,07$/M'input
0,21$/M'output
671BParamètres MoEMixture of Experts, une architecture où seule une partie des paramètres est activée par requête, ce qui réduit le coût d'inférence.
256kContexteLa fenêtre de contexte : le nombre maximum de tokens qu'un modèle peut traiter en une seule requête (ex : 200k, 1M).

Nouveaux tarifs DeepSeek V4 (mai 2026) :

  • Input : 0,07$/M tokens (vs 0,14$ avant)
  • Output : 0,21$/M tokens (vs 0,52$ avant)
  • Cache hit : 0,02$/M tokens

Comparaison avec la concurrence

Modèle $/M'input $/M'output Multiple vs DeepSeek
DeepSeek V4 0,07 0,21
Mistral Small 3 0,40 1,80 ~8×
GPT-5 mini 0,15 0,60 ~3×
Claude Haiku 5 0,80 4,00 ~16×
GPT-5 18 90 ~280×
Claude Opus 4.7 15 75 ~280×

Impact pour les startups françaises

DeepSeek V4 devient irrésistible pour les startups françaises qui ont besoin de gros volumes d'inférenceLe fait d'utiliser un modèle déjà entraîné pour produire une réponse à partir de nouvelles données. à bas coût. Cas d'usage typiques :

  • Chatbots SAV B2C (millions de conversations/mois)
  • Classification de documents en masse
  • Préfiltrage avant un modèle plus cher (Claude/GPT-5)
  • Génération de contenu marketing à scale

Limites et zones d'ombre

  • Souveraineté chinoise : usage déconseillé pour secteurs régulés FR
  • Cloud Act + Loi sécurité chinoise : données potentiellement accessibles à Pékin
  • Performance variable : moins bon que Claude/GPT-5 sur le raisonnement complexe FR
  • Pas d'hébergement région EU : seuls les self-hosters ouverts comme Hugging Face proposent une alternative

Notre lecture

DeepSeek transforme l'économie de l'IA générative. À 0,07$/M tokens, le coût marginal d'un appel APIApplication Programming Interface, le canal d'accès programmatique à un service ou à un modèle. devient quasi nul. Pour les usages où la qualité absolue n'est pas critique, c'est game-changing.

Pour aller plus loin, lis notre portrait DeepSeek et le comparatif open source vs propriétaire.

Réponse stratégique des autres acteurs

La baisse DeepSeek force chaque acteur à réagir :

  • OpenAI : annoncé GPT-5 mini à 0,15$/M'input (concurrence directe)
  • Anthropic : prix Haiku 4.5 baissé de 20% en réponse
  • Mistral : Small 3 légèrement baissé (0,40$ → 0,30$/M'input)
  • Google : Gemini Flash 3 à 0,10$/M'input (très compétitif)

Calcul ROI pour startups françaises

Profil : startup SaaSSoftware-as-a-Service, un logiciel facturé à l'usage et hébergé chez l'éditeur. avec chatbot, 1M tokens/jour input.

Modèle Coût mensuel Qualité notée /10 Coût/qualité
DeepSeek V4 2,10€ 8,0 0,26
Mistral Small 3 9€ 7,5 1,20
GPT-5 mini 4,50€ 8,5 0,53
Claude Haiku 5 24€ 9,0 2,67
Llama 5 70B (self) ~30€ host 8,0 3,75

DeepSeek V4 imbattable sur le ratio coût/qualité, mais souveraineté chinoise rédhibitoire pour certains secteurs.

Pour aller plus loin

Implications pour les utilisateurs français

L'écosystème IA française doit s'adapter aux annonces des géants américains. Trois axes d'action prioritaires :

Axe 1 : Veille stratégique

Les ETI et grandes entreprises françaises ont besoin d'une veille quotidienne pour anticiper. Notre newsletter NewsIA quotidienne, le magazine Flipboard NEWSIA et le compte X @NewsIA_FR_ facilitent cette veille en français.

Axe 2 : Souveraineté numérique

Les alternatives européennes existent et progressent. Mistral (3 Md€ levés en mai 2026), Aleph Alpha (Allemagne), Pollen Robotics (Bordeaux) offrent des options souveraines pour les secteurs régulés. La conformité AI Act devient incontournable.

Axe 3 : Adoption pragmatique

L'adoption doit être pragmatique : pilote sur cas d'usage défini, mesure ROI, scaling progressif. Pour les PME, Claude for Small Business ou Mistral Le Chat Pro offrent un bon point de départ.

Comparaison écosystèmes 2026

Région Acteur principal Valorisation Force
États-Unis OpenAI ~500 Md$ Multi-modal + écosystème
États-Unis Anthropic 184 Md$ Safety + qualité
États-Unis Google (Gemini) corporate MultimodalSe dit d'un modèle capable de traiter et de générer plusieurs types de données : texte, image, audio, vidéo. + intégration
Chine DeepSeek ~15 Md$ Open sourceUn logiciel dont le code source, et parfois les poids du modèle, sont publiés librement et réutilisables. low-cost
Chine Moonshot AI 20 Md$ Open weightsDes poids de modèle publiés librement, qui permettent de le redéployer sans dépendre de l'éditeur.
France Mistral AI 22 Md€ Souveraineté EU
Allemagne Aleph Alpha 500 M€ Modèles souverains

Ressources complémentaires NewsIA

Cartographies essentielles

Guides incontournables

NewsIA : l'information IA en français

NewsIA est le magazine français de l'intelligence artificielle. Notre rédaction couvre quotidiennement l'actualité IA, les modèles, les acteurs et les usages, en français et sans jargon. Pour soutenir notre travail et rester informé :

Le site est édité par Driss Redouane depuis Paris. Notre angle éditorial : sans hype, axé pros et souveraineté française.

Newsletter NewsIA et abonnement

NewsIA publie chaque matin une synthèse des actualités IA majeures dans une newsletter en français. Inscription gratuite via le formulaire en bas de chaque page. Notre cible : professionnels et passionnés IA francophones, du débutant au CTO, sans hype creuse ni jargon inutile. Édité depuis Paris, indépendant de tout éditeur de modèles.

À lire aussi : DeepSeek lève 7,4 Md$ et passe sous le contrôle de l'État chinois.

Questions fréquentes

DeepSeek V4 est-il compatible RGPD ?
Pas directement. L'hébergement par défaut est en Chine. Pour des usages européens sensibles, il faut soit déployer DeepSeek V4 en open-weights sur infrastructure européenne, soit privilégier des alternatives comme Mistral Small 3 ou Llama 5 405B chez un provider UE.
Comment DeepSeek peut-il proposer un prix aussi bas ?
Trois facteurs : architecture MoE ultra-efficace (9 experts actifs sur 256), backing financier d'un hedge fund qui subventionne pour gagner du marché, et quantization FP8 qui réduit drastiquement les coûts compute. C'est probablement non-rentable au coût marginal, mais stratégique.
Le modèle est-il censuré ?
Oui sur certains sujets politiquement sensibles en Chine (Tiananmen, Tibet, Hong Kong, Xi Jinping). Sur les sujets non-politiques (technique, business, science), il fonctionne normalement. Pour des usages éditoriaux ou journalistiques, ce point est critique à évaluer.
Cet outil est-il conforme au RGPD et à l'AI Act européen ?
La conformité dépend du déploiement. Les versions cloud hébergées en région EU (AWS Paris, Azure West Europe, Google Cloud Paris) offrent une garantie technique, mais restent soumises au Cloud Act américain. Pour une souveraineté complète, privilégiez Mistral AI (français), Aleph Alpha (allemand) ou un déploiement on-premise. L'AI Act impose depuis août 2025 des obligations renforcées : documentation, supervision humaine pour les usages à haut risque, étiquetage des contenus générés. Consultez votre DPO pour valider votre cas d'usage.
Quelle alternative française ou européenne existe-t-il ?
L'écosystème européen offre plusieurs alternatives crédibles. Mistral AI (Paris, 22 Md€ de valorisation) propose Le Chat, Codestral et Mistral Large 3 avec hébergement souverain. Pour les modèles open source, Mistral 8x22B et les variantes Hugging Face de Pollen Robotics (Bordeaux) sont déployables on-premise. Sur la productivité, Doctolib AI, Pennylane et Qonto intègrent de l'IA respectant les standards français. Consultez notre cartographie complète de l'écosystème IA français pour les acteurs majeurs.

À lire aussi