MENU

Les leçons européennes de l’IA DeepSeek

Les leçons européennes de l’IA DeepSeek

Actualités économiques |
Par Nick Flaherty, A Delapalisse



Selon un entrepreneur britannique, l’émergence de la société chinoise DeepSeek, spécialisée dans l’IA, est riche d’enseignements pour l’industrie européenne.

DeepSeek, basée à Hangzhou, dans le sud-est de la Chine, a développé deux cadres d’IA capables d’exécuter de grands modèles de langage (LLM) qui peuvent défier les performances de ceux d’OpenAI, de Perplexity et de Google avec une fraction des ressources informatiques. L’entreprise a utilisé l’apprentissage par renforcement non supervisé pour créer les cadres d’IA avec plus de raisonnement. Elle met également cette technologie en open source sous la licence MIT.

Les LLM, qui comptent jusqu’à 70 milliards de paramètres, fonctionnent avec des GPU Nvidia moins performants, les H100, car le gouvernement américain interdit l’envoi en Chine d’autres puces plus performantes. Selon des rapports récents, DeepSeek disposerait de 50 000 processeurs H100. Au prix unitaire de $25000 dans sa version de base, le coût seul de ces 50000 puces serait de $12,5 milliards ce qui met à mal le budget annoncé de développement de Deepseek de $6 millions qui ne permettrait de n’acheter que 240 processeurs H100.

L’article fondateur de la technologie DeepSeek est disponible ici.

« DeepSeek n’est pas la première à montrer qu’une équipe riche en talents peut rivaliser avec les entreprises de modèles d’IA les plus importantes et les plus capitalisées. En Europe, Mistral a pu, pendant une grande partie de l’année 2024, fournir des modèles open source qui rivalisaient avec les modèles ouverts Llama de Meta, tout en étant formés avec une fraction du budget », a déclaré Walter Goodwin, PDG et fondateur de la startup britannique d’IA Fractile, qui a récemment bénéficié d’un investissement de la part de Pat Gelsinger, ancien PDG d’Intel.

Fractile licenses RISC-V vector processor IP for AI accelerator

« L’Europe dispose d’une forte densité de talents et est moins limitée que la Chine en termes de disponibilité de calcul. DeepSeek devrait donc être un signal d’alarme qui prouve que l’Europe peut également se permettre de jouer les premiers rôles dans le domaine de l’IA. »

La nature open source des cadres DeepSeek a déjà eu un impact sur le prix des actions des concurrents américains qui font payer leurs services de chatbot d’IA. WiMi Hologram Cloud, en Chine, développe déjà des outils de programmation intelligents basés sur DeepSeek pour offrir aux programmeurs une expérience de codage plus intelligente et plus efficace. Cet outil sera capable de compléter automatiquement le code, d’analyser la qualité du code, de proposer des suggestions d’optimisation et bien plus encore, aidant ainsi les programmeurs à écrire du code plus efficacement et à améliorer la qualité du code.

ARM boost in $100bn Stargate data centre project

« Cependant, si DeepSeek a maintenu les coûts de formation de son modèle à un niveau incroyablement bas, il est important de souligner qu’il n’a pas eu d’impact révolutionnaire sur les coûts d’inférence », a déclaré M. Goodwin de Fractile, qui développe une puce d’inférence. « Ce que nous voyons ici est la preuve d’un renversement, où le coût de l’entraînement des modèles d’IA devient de plus en plus marginal par rapport au coût de l’inférence. C’est dans le domaine de l’inférence que nous verrons une concurrence accrue pour les opérateurs historiques comme Nvidia à long terme, car les coûts restent exceptionnellement élevés.

Une application de chat de DeepSeek a été téléchargée 2,6 millions de fois au cours des trois derniers jours, mais les inscriptions ont été interrompues après qu’une cyberattaque a été signalée.

www.deepseek.com ; www.fractile.ai

 

Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :    ECI sur Google News

Partager:

Articles liés
10s