DeepSeek V4 divise encore le prix par deux : la course au low-cost s'intensifie
DeepSeek annonce le 8 mai des baisses tarifaires massives sur V4. À 0,07 $/M tokens, le modèle est 200× moins cher que Claude Opus 4.7.

- [DeepSeek](/modeles/deepseek) V4 divise ses prix par 2 le 8 mai 2026.
- Input à 0,07$/M tokens : 200× moins cher que [Claude Opus 4.7](/modeles/claude).
- Performance proche de GPT-5 sur les benchmarks chinois et anglais.
- Met pression sur [Mistral](/modeles/mistral) sur le segment milieu de gamme.
Le contexte : la course au low-cost IA
DeepSeek, startup chinoise, a marqué 2025 en publiant DeepSeek-R1 à un coût d'entraînement 50× inférieur à GPT-5 selon leurs propres benchmarks. Cette stratégie "qualité élevée + prix bas" a contraint OpenAI, Anthropic et Google à revoir leur grille tarifaire en 2025-2026.
Ce 8 mai 2026, DeepSeek V4 accélère encore le mouvement avec une nouvelle baisse de 50% sur l'input et 60% sur l'output.
L'annonce en détail
Nouveaux tarifs DeepSeek V4 (mai 2026) :
- Input : 0,07$/M tokens (vs 0,14$ avant)
- Output : 0,21$/M tokens (vs 0,52$ avant)
- Cache hit : 0,02$/M tokens
Comparaison avec la concurrence
| Modèle | $/M'input | $/M'output | Multiple vs DeepSeek |
|---|---|---|---|
| DeepSeek V4 | 0,07 | 0,21 | 1× |
| Mistral Small 3 | 0,40 | 1,80 | ~8× |
| GPT-5 mini | 0,15 | 0,60 | ~3× |
| Claude Haiku 5 | 0,80 | 4,00 | ~16× |
| GPT-5 | 18 | 90 | ~280× |
| Claude Opus 4.7 | 15 | 75 | ~280× |
Impact pour les startups françaises
DeepSeek V4 devient irrésistible pour les startups françaises qui ont besoin de gros volumes d'inférenceLe fait d'utiliser un modèle déjà entraîné pour produire une réponse à partir de nouvelles données. à bas coût. Cas d'usage typiques :
- Chatbots SAV B2C (millions de conversations/mois)
- Classification de documents en masse
- Préfiltrage avant un modèle plus cher (Claude/GPT-5)
- Génération de contenu marketing à scale
Limites et zones d'ombre
- Souveraineté chinoise : usage déconseillé pour secteurs régulés FR
- Cloud Act + Loi sécurité chinoise : données potentiellement accessibles à Pékin
- Performance variable : moins bon que Claude/GPT-5 sur le raisonnement complexe FR
- Pas d'hébergement région EU : seuls les self-hosters ouverts comme Hugging Face proposent une alternative
Notre lecture
DeepSeek transforme l'économie de l'IA générative. À 0,07$/M tokens, le coût marginal d'un appel APIApplication Programming Interface, le canal d'accès programmatique à un service ou à un modèle. devient quasi nul. Pour les usages où la qualité absolue n'est pas critique, c'est game-changing.
Pour aller plus loin, lis notre portrait DeepSeek et le comparatif open source vs propriétaire.
Réponse stratégique des autres acteurs
La baisse DeepSeek force chaque acteur à réagir :
- OpenAI : annoncé GPT-5 mini à 0,15$/M'input (concurrence directe)
- Anthropic : prix Haiku 4.5 baissé de 20% en réponse
- Mistral : Small 3 légèrement baissé (0,40$ → 0,30$/M'input)
- Google : Gemini Flash 3 à 0,10$/M'input (très compétitif)
Calcul ROI pour startups françaises
Profil : startup SaaSSoftware-as-a-Service, un logiciel facturé à l'usage et hébergé chez l'éditeur. avec chatbot, 1M tokens/jour input.
| Modèle | Coût mensuel | Qualité notée /10 | Coût/qualité |
|---|---|---|---|
| DeepSeek V4 | 2,10€ | 8,0 | 0,26 |
| Mistral Small 3 | 9€ | 7,5 | 1,20 |
| GPT-5 mini | 4,50€ | 8,5 | 0,53 |
| Claude Haiku 5 | 24€ | 9,0 | 2,67 |
| Llama 5 70B (self) | ~30€ host | 8,0 | 3,75 |
DeepSeek V4 imbattable sur le ratio coût/qualité, mais souveraineté chinoise rédhibitoire pour certains secteurs.
Pour aller plus loin
- Notre portrait DeepSeek
- Notre comparatif open source vs propriétaire
- Notre guide optimisation tokens
Implications pour les utilisateurs français
L'écosystème IA française doit s'adapter aux annonces des géants américains. Trois axes d'action prioritaires :
Axe 1 : Veille stratégique
Les ETI et grandes entreprises françaises ont besoin d'une veille quotidienne pour anticiper. Notre newsletter NewsIA quotidienne, le magazine Flipboard NEWSIA et le compte X @NewsIA_FR_ facilitent cette veille en français.
Axe 2 : Souveraineté numérique
Les alternatives européennes existent et progressent. Mistral (3 Md€ levés en mai 2026), Aleph Alpha (Allemagne), Pollen Robotics (Bordeaux) offrent des options souveraines pour les secteurs régulés. La conformité AI Act devient incontournable.
Axe 3 : Adoption pragmatique
L'adoption doit être pragmatique : pilote sur cas d'usage défini, mesure ROI, scaling progressif. Pour les PME, Claude for Small Business ou Mistral Le Chat Pro offrent un bon point de départ.
Comparaison écosystèmes 2026
| Région | Acteur principal | Valorisation | Force |
|---|---|---|---|
| États-Unis | OpenAI | ~500 Md$ | Multi-modal + écosystème |
| États-Unis | Anthropic | 184 Md$ | Safety + qualité |
| États-Unis | Google (Gemini) | corporate | MultimodalSe dit d'un modèle capable de traiter et de générer plusieurs types de données : texte, image, audio, vidéo. + intégration |
| Chine | DeepSeek | ~15 Md$ | Open sourceUn logiciel dont le code source, et parfois les poids du modèle, sont publiés librement et réutilisables. low-cost |
| Chine | Moonshot AI | 20 Md$ | Open weightsDes poids de modèle publiés librement, qui permettent de le redéployer sans dépendre de l'éditeur. |
| France | Mistral AI | 22 Md€ | Souveraineté EU |
| Allemagne | Aleph Alpha | 500 M€ | Modèles souverains |
Ressources complémentaires NewsIA
Cartographies essentielles
- Cartographie startups IA françaises , 48 fiches
- Cartographie formations IA en France , 36 cursus
- Cartographie laboratoires de recherche IA , 30 labs
- Cartographie datacenters IA en Europe , 30 datacenters
- Cartographie investisseurs IA en France , 30 VCs
- Hub écosystème IA complet
Guides incontournables
- Guide complet Claude débutant à pro
- Guide complet Veo 3 vidéo IA
- Guide AI Act règlement européen
- Comparatif ChatGPT vs Claude vs Gemini vs Mistral
- Top 10 Skills Claude pour automatiser
- Guide RAG Supabase pgvector
- Guide complet agents IA en 2026
NewsIA : l'information IA en français
NewsIA est le magazine français de l'intelligence artificielle. Notre rédaction couvre quotidiennement l'actualité IA, les modèles, les acteurs et les usages, en français et sans jargon. Pour soutenir notre travail et rester informé :
- Lire : tous nos articles d'actualité IA et nos guides IA
- Suivre : @NewsIA_FR_ sur X , veille temps réel
- Curer : Magazine NEWSIA sur Flipboard
- Référencer : Page Wikidata Q139764481
- Cartographies : écosystème IA français, startups, investisseurs, datacenters EU
- Modèles : tous les modèles IA majeurs
Le site est édité par Driss Redouane depuis Paris. Notre angle éditorial : sans hype, axé pros et souveraineté française.
Newsletter NewsIA et abonnement
NewsIA publie chaque matin une synthèse des actualités IA majeures dans une newsletter en français. Inscription gratuite via le formulaire en bas de chaque page. Notre cible : professionnels et passionnés IA francophones, du débutant au CTO, sans hype creuse ni jargon inutile. Édité depuis Paris, indépendant de tout éditeur de modèles.
À lire aussi : DeepSeek lève 7,4 Md$ et passe sous le contrôle de l'État chinois.
Questions fréquentes
- DeepSeek V4 est-il compatible RGPD ?
- Pas directement. L'hébergement par défaut est en Chine. Pour des usages européens sensibles, il faut soit déployer DeepSeek V4 en open-weights sur infrastructure européenne, soit privilégier des alternatives comme Mistral Small 3 ou Llama 5 405B chez un provider UE.
- Comment DeepSeek peut-il proposer un prix aussi bas ?
- Trois facteurs : architecture MoE ultra-efficace (9 experts actifs sur 256), backing financier d'un hedge fund qui subventionne pour gagner du marché, et quantization FP8 qui réduit drastiquement les coûts compute. C'est probablement non-rentable au coût marginal, mais stratégique.
- Le modèle est-il censuré ?
- Oui sur certains sujets politiquement sensibles en Chine (Tiananmen, Tibet, Hong Kong, Xi Jinping). Sur les sujets non-politiques (technique, business, science), il fonctionne normalement. Pour des usages éditoriaux ou journalistiques, ce point est critique à évaluer.
- Cet outil est-il conforme au RGPD et à l'AI Act européen ?
- La conformité dépend du déploiement. Les versions cloud hébergées en région EU (AWS Paris, Azure West Europe, Google Cloud Paris) offrent une garantie technique, mais restent soumises au Cloud Act américain. Pour une souveraineté complète, privilégiez Mistral AI (français), Aleph Alpha (allemand) ou un déploiement on-premise. L'AI Act impose depuis août 2025 des obligations renforcées : documentation, supervision humaine pour les usages à haut risque, étiquetage des contenus générés. Consultez votre DPO pour valider votre cas d'usage.
- Quelle alternative française ou européenne existe-t-il ?
- L'écosystème européen offre plusieurs alternatives crédibles. Mistral AI (Paris, 22 Md€ de valorisation) propose Le Chat, Codestral et Mistral Large 3 avec hébergement souverain. Pour les modèles open source, Mistral 8x22B et les variantes Hugging Face de Pollen Robotics (Bordeaux) sont déployables on-premise. Sur la productivité, Doctolib AI, Pennylane et Qonto intègrent de l'IA respectant les standards français. Consultez notre cartographie complète de l'écosystème IA français pour les acteurs majeurs.


