NewsIA
En direct
Modèles de langage

DeepSeek : pourquoi le modèle chinois bouscule l'IA mondiale

Histoire, performances, coût d'entraînement, controverses, accès en France : tout sur DeepSeek, le modèle chinois qui change la donne.


PartagerXLinkedInEmail
DeepSeek : pourquoi le modèle chinois bouscule l'IA mondiale
À retenir
  • [DeepSeek](/modeles/deepseek) est un labo IA chinois basé à Hangzhou, filiale du fonds quantitatif High-Flyer.
  • Son modèle R1 (janvier 2025) a démontré qu'on pouvait égaler [OpenAI](https://openai.com/blog) o1 pour 50 fois moins cher.
  • DeepSeek V4 figure dans le top 3 mondial sur le code en 2026.
  • Censuré sur Taiwan, Tiananmen, Xinjiang. Préférer un hébergeur hors Chine pour les usages pros.

En janvier 2025, DeepSeek R1 a fait l'effet d'un séisme : un modèle de raisonnement open sourceUn logiciel dont le code source, et parfois les poids du modèle, sont publiés librement et réutilisables. quasi équivalent à OpenAI o1, entraîné pour 6 millions de dollars (contre des centaines de millions pour les concurrents). Un an plus tard, le laboratoire chinois confirme et accélère.

🐋
DeepSeek

Filiale de High-Flyer, fonds quantitatif chinois basé à Hangzhou. Fondée en 2023 par Liang Wenfeng, qui a fait fortune dans le trading algorithmique avant de réorienter ses ressources vers l'IA pure. Équipe d'environ 200 personnes, recrute majoritairement des jeunes diplômés chinois.

Le choc R1 et ses suites

DeepSeek R1, sorti en janvier 2025, a démontré qu'il était possible d'atteindre les performances de raisonnement d'OpenAI o1 avec un budget 50 fois inférieur, en utilisant une approche d apprentissage par renforcement directe sans étape de fine-tuningL'entraînement complémentaire d'un modèle pré-entraîné sur un petit jeu de données spécialisé, pour l'adapter à une tâche. supervisée intermédiaire.

Apprentissage par renforcement

Technique où le modèle apprend par essais-erreurs récompensés, comme un humain qui apprend à jouer aux échecs. Découverte clé de DeepSeek : on peut sauter l'étape coûteuse de "fine-tuning supervisé" et entraîner le modèle directement sur ses propres raisonnements.

V3 fin 2025, V4 début 2026 ont consolidé l'avance.

PerformanceLes benchmarks réels

Performances vs concurrents

95HumanEval
64SWE-benchUn benchmark qui évalue la capacité d'un modèle à résoudre de vrais problèmes GitHub en autonomie, comme un ingénieur.
91MMLU
6M$Coût V3
BenchmarkUn test standardisé qui mesure la performance des modèles sur une tâche (ex : SWE-bench pour le code, MMLU pour les savoirs généraux). DeepSeek V4 GPT-5.5 Claude Opus 4.7
MMLU 91 92 93
HumanEval 95 94 96
SWE-bench 64 67 71
GPQA 78 82 84

L'écart se mesure en quelques points. Sur le terrain (génération de code, analyse de documents techniques), DeepSeek est régulièrement préféré pour sa vitesse de réponse et son coût.

Coût d'entraînement

C'est le point le plus disruptif. DeepSeek revendique 6 à 10 millions de dollars pour entraîner V3, contre 100 à 200 millions pour GPT-4. Plusieurs experts ont contesté ces chiffres, mais la tendance est confirmée.

[Anthropic](https://www.anthropic.com/news), OpenAI et Google ne peuvent plus compter sur le coût de R&D comme moat. Ils doivent miser sur l'écosystème, la sécurité, l'intégration produit.

AvertissementLes controverses

Les controverses

  • Censure : DeepSeek refuse les sujets sensibles (Taiwan, Tiananmen, Xinjiang). Limitation sérieuse pour les usages occidentaux.
  • Données d'entraînement : suspicion que DeepSeek ait massivement distillé GPT-4 et Claude. OpenAI a engagé des poursuites en 2025.
  • Souveraineté : utiliser DeepSeek via son APIApplication Programming Interface, le canal d'accès programmatique à un service ou à un modèle. hébergée en Chine soulève des questions RGPDRèglement Général sur la Protection des Données, le cadre européen sur la vie privée numérique. majeures.
  • Utiliser DeepSeek en France

    3 options :

  • Web officiel chat.deepseek.com : gratuit mais données traitées en Chine, déconseillé pour pro
  • Via [Hugging Face](https://huggingface.co/blog) ou Together.ai : poidsLes paramètres numériques d'un réseau de neurones, ajustés pendant l'entraînement pour apprendre les motifs des données. open source, hébergement EU/US, RGPD safe
  • Auto-hébergement : possible avec un cluster GPUGraphics Processing Unit, une puce hautement parallèle devenue le standard pour entraîner les modèles d'IA., recommandé pour les usages sensibles
  • Pour les développeurs, DeepSeek via Together coûte 5-10 fois moins cher que Claude ou GPT pour des performances comparables sur le code.

    Verdict

    DeepSeek est un excellent modèle de second pool, à utiliser pour le code et les tâches techniques quand la confidentialité n'est pas critique.

    Pour la rédaction française, l'analyse stratégique sensible ou les usages grand public polyvalents, Claude, GPT-5.5 et Mistral restent préférables.

    Le débat de fondIA open source vs propriétaire : que choisir en 2026

    L'alternative européenneMistral AI, le champion français

    Sources

    DeepSeek : le phénomène chinois en 2026

    DeepSeek a transformé l'économie de l'IA générative. Son impact dépasse largement le simple "modèle chinois moins cher" :

    Innovation algorithmique

    DeepSeek-R1 (janvier 2025) puis V4 (mai 2026) ont prouvé qu'il était possible d'entraîner un modèle frontière avec ~50× moins de compute que GPT-5. Les techniques DeepSeek (MoEMixture of Experts, une architecture où seule une partie des paramètres est activée par requête, ce qui réduit le coût d'inférence. optimisé, distillationLe transfert des connaissances d'un gros modèle vers un plus petit, pour gagner en coût et en vitesse. efficace, training data curé) sont désormais étudiées par tous les labs.

    Adoption mondiale

    • 300+ millions d'utilisateurs mensuels actifs
    • #1 app gratuite App Store dans 80+ pays
    • API la moins chère du marché à 0,07$/M'input
    • Open source : tous les modèles téléchargeables

    Concurrence chinoise renforcée

    DeepSeek a inspiré d'autres chinois :

    • Moonshot AI : levée 2 Md$ en mai 2026, modèle Kimi K3 256B MoE
    • Qwen 3 (Alibaba) : 235B params, top 5 mondial
    • GLM-5 (Zhipu) : 130B params, partiellement open source
    • Yi-2 (01.AI) : 34B, focus chinois

    Limites pour les pros français

    Malgré les avantages tarifaires, DeepSeek présente des limites :

    • Souveraineté chinoise : exclu pour secteurs régulés FR (banque, défense)
    • Cloud Act + Loi sécurité chinoise : données potentiellement accessibles Pékin
    • Censure intégrée : refus sur Tiananmen, Tibet, Xi Jinping
    • Pas de hébergement région EU : self-hosting requis pour conformité

    La stratégie recommandée pour la France : utiliser DeepSeek pour les cas non-sensibles, Mistral pour la souveraineté.

    Pour aller plus loin, voir notre comparatif open source vs propriétaire et l'actu DeepSeek V4 prix divisé.

    DeepSeek : que retenir pour les pros français

    L'impact DeepSeek sur le marché français se cristallise en 2026. Trois scénarios d'adoption :

    Scénario 1 : Startup tech à fort volume

    DeepSeek V4 devient incontournable pour les chatbots, classification massive, pré-filtrage. Économie 80-90% par rapport à Claude ou GPT-5. Risque souveraineté : modéré pour usages non-sensibles.

    Scénario 2 : ETI régulée (banque, santé)

    Utilisation de DeepSeek exclue. Préférer Mistral Le Chat Enterprise pour la souveraineté ou Claude déployé en région Paris.

    Scénario 3 : Self-hosting DeepSeek open source

    Déploiement on-premise des modèles DeepSeek open weightsDes poids de modèle publiés librement, qui permettent de le redéployer sans dépendre de l'éditeur.. Souveraineté maximale, coût compute initial mais ROI rapide à scale.

    L'effet de cascade sur les prix

    DeepSeek a déclenché en 2025-2026 une guerre des prix qui profite à tous :

    • GPT-5 mini lancé à 0,15$/M'input (vs 18$ pour GPT-5)
    • Claude Haiku 5 baissé de 20% en réponse
    • Mistral Small 3 : 0,40$ → 0,30$/M'input
    • Gemini Flash 3 : 0,10$/M'input, très compétitif

    Cette dynamique va se poursuivre en 2026-2027 : les modèles "low-cost" haute qualité deviennent la norme. Les acteurs premium (Claude Opus 4.7, GPT-5.5) gardent leur place sur les cas critiques uniquement.

    Questions fréquentes

    Qu'est-ce que DeepSeek ?
    Un laboratoire IA chinois fondé en 2023 par High-Flyer, fonds quantitatif basé à Hangzhou. Devenu mondialement célèbre en janvier 2025 avec son modèle R1 capable de rivaliser avec OpenAI o1 pour 50 fois moins cher.
    DeepSeek est-il meilleur que ChatGPT ?
    Sur le code, DeepSeek V4 est au niveau de GPT-5.5. Sur le raisonnement général, l'écart se mesure en quelques points. Sur le français créatif et l'usage grand public polyvalent, GPT et Claude restent devant.
    Peut-on utiliser DeepSeek en France ?
    Oui mais pas via le site officiel (données traitées en Chine, risque RGPD). Préférez les hébergeurs européens et américains qui proposent les poids open source de DeepSeek (Together, Fireworks, Hugging Face).
    DeepSeek est-il vraiment 50 fois moins cher à entraîner ?
    DeepSeek revendique 6 à 10 millions de dollars pour V3 contre 100 à 200 millions pour GPT-4. Les chiffres exacts sont contestés mais la tendance est confirmée : la barrière à l'entrée des modèles frontaliers chute fortement.
    DeepSeek est-il censuré ?
    Oui sur les sujets politiquement sensibles en Chine (Taiwan, Tiananmen, Xinjiang). Limitation sérieuse pour des usages éditoriaux ou journalistiques occidentaux.

    À lire aussi