DeepSeek V4 divise encore le prix par deux : la course au low-cost s'intensifie
DeepSeek annonce le 8 mai des baisses tarifaires massives sur V4. À 0,07 $/M tokens, le modèle est 200× moins cher que Claude Opus 4.7.
- DeepSeek V4 divise par 2 ses tarifs API, devenant 10× moins cher que Claude Opus.
- Performances en hausse : 91% MMLU, 95% HumanEval.
- Disponible en open weights pour auto-hébergement.
- Pression maximale sur les marges d Anthropic et OpenAI.
Le rapport prix/performance de DeepSeek V4 oblige Anthropic et OpenAI à repenser leur grille tarifaire avant la fin 2026.
DeepSeek frappe encore. Le laboratoire chinois divise par 2 ses tarifs API tout en améliorant les benchmarks de V4.
Filiale de High-Flyer (fonds quantitatif chinois basé à Hangzhou), fondée en 2023 par Liang Wenfeng. Devenue mondialement célèbre en janvier 2025 avec R1 (égal à OpenAI o1 pour 50× moins cher). DeepSeek V4 sort en mai 2026.
Le tableau qui parle
| Modèle | Input ($/M tokens) | Output ($/M tokens) |
|---|---|---|
| Claude Opus 4.7 | 15 | 75 |
| GPT-5.5 | 8 | 24 |
| Mistral Medium 3.5 | 1,50 | 7,50 |
| DeepSeek V4 | 0,14 | 0,28 |
Pourquoi c est possible
DeepSeek a optimisé l architecture (MoE actif, distillation agressive) et tourne sur des H800 chinois (interdits à l export US mais 30% moins cher que H100). Plus une équipe de 200 personnes vs des milliers chez OpenAI.
Censure sur sujets politiquement sensibles (Taiwan, Tiananmen, Xinjiang). Données traitées en Chine si vous utilisez l API officielle. Pour usage pro européen, préférer un hébergement via Together.ai ou Fireworks.
Questions fréquentes
- DeepSeek V4 est-il compatible RGPD ?
- Pas directement. L'hébergement par défaut est en Chine. Pour des usages européens sensibles, il faut soit déployer DeepSeek V4 en open-weights sur infrastructure européenne, soit privilégier des alternatives comme Mistral Small 3 ou Llama 5 405B chez un provider UE.
- Comment DeepSeek peut-il proposer un prix aussi bas ?
- Trois facteurs : architecture MoE ultra-efficace (9 experts actifs sur 256), backing financier d'un hedge fund qui subventionne pour gagner du marché, et quantization FP8 qui réduit drastiquement les coûts compute. C'est probablement non-rentable au coût marginal, mais stratégique.
- Le modèle est-il censuré ?
- Oui sur certains sujets politiquement sensibles en Chine (Tiananmen, Tibet, Hong Kong, Xi Jinping). Sur les sujets non-politiques (technique, business, science), il fonctionne normalement. Pour des usages éditoriaux ou journalistiques, ce point est critique à évaluer.