MENU

DeepX prévoit une puce d’IA à 2 nm

DeepX prévoit une puce d’IA à 2 nm

Actualités économiques |
Par Nick Flaherty, Daniel Cardon

AI


La société coréenne DeepX conçoit une puce d’intelligence artificielle de pointe d’une consommation de 5 W qui sera fabriquée sur le processus 2nm de Samsung Foundries. Elle envisage également une version chiplet.

Le DX-M2 vise une performance de 40 TOPS et sera optimisé pour exécuter des modèles de transformateurs tels que GPT ainsi que des agents d’IA. Il pourra gérer des modèles comportant jusqu’à 20 milliards de paramètres, tels que DeepSeek, pour intégrer des fonctions de conversation en langage naturel dans des dispositifs embarqués tels que des distributeurs automatiques et des robots humanoïdes. Un processeur RISC-V personnalisé assure l’ordonnancement.

Il fait suite au DX-M1 de 25 TOPS construit sur un processus de 5 nm qui entrera en production de masse dans la première moitié de 2025. Il est optimisé pour le traitement vidéo avec un mélange de poids en virgule flottante et en nombres entiers à 8 bits (INT8) et est également utilisé pour les PC d’IA et les serveurs de pointe. « Nous utilisons une précision mixte afin de connaître la quantité de 8 bits, de 4 bits et de virgule flottante dont nous disposons dans le compilateur, ce qui nous permet de savoir ce que nous devons optimiser », a déclaré Tim Park, directeur du marketing stratégique chez DeepX.

DeepX a levé jusqu’à présent 531 millions de dollars de fonds, avec le soutien de Hyundai Robotics. « Nous en sommes maintenant à l’étape de la mise à l’échelle », a-t-il déclaré.

Conçu pour les applications de vision

« Le M1 est conçu pour les applications de vision et nous avons travaillé avec BMW, Mercedes, Volkswagen pour la vision dans le cadre de la conduite autonome – nous aurons l’AECQ100 grade 1 en octobre ou novembre. Nous avons beaucoup appris sur le marché de l’automobile, c’est pourquoi nous ne visons pas directement l’automobile à ce stade. En outre, nous nous dirigeons vers le marché des véhicules lourds où nous pouvons travailler avec Renesas, Texas Instruments et NXP pour ce marché où les autres puces sont trop chères. »

Une deuxième version de la puce, la V3, est un système sur puce qui ajoute quatre cœurs ARM Cortex-A53 au NPU de la M1 et un bloc de traitement du signal d’image. Elle est destinée aux caméras fixes et aux caméras IP de moyenne à haute gamme, gérant des modèles de vision avec des paramètres de 150 m à 200 m pour environ 20 dollars. L’échantillonnage aura lieu en août.

Il y aura également une version SoC du M2.

« Nous voulons proposer le NPU le moins gourmand en énergie, avec moins de 5 W, comme le M1, et nous sommes les premiers à utiliser la technologie 2nm, dont l’échantillonnage aura lieu en août 2026. Les gens commencent déjà à construire leurs modèles qui arriveront à maturité l’année prochaine, c’est donc une adéquation parfaite pour nous. Nous préparons également une version SoC ».

Les robots humanoïdes sont un autre domaine cible du M2.

« Les robots humanoïdes ont besoin de raisonner sur l’appareil et c’est un autre marché que nous visons », a-t-il déclaré. Le M2 prendra en charge le modèle de langage de vision de Nvidia, utilisé par les développeurs de robots tels que Figure.

« Figure AI a son propre modèle et elle utilisait Nvidia et cherche son propre silicium et M2 pourrait être ce qu’elle utilise.

À plus long terme, la société envisage de fournir la puce M2 en 2 nm, en particulier pour le marché de l’automobile. « Une fois que le marché des chiplets sera arrivé à maturité, nous voulons vendre la puce M2 aux équipementiers automobiles, c’est ce que j’attends. Nous devons être dans la boucle, car le marché ne sera pas ouvert à tous, mais nous devons en faire partie. »

www.deepx.ai

 

 

 

Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :    ECI sur Google News

Partager:

Articles liés
10s