MENU

La DRAM 3D promet des gains de performance de 10x en inférence IA

La DRAM 3D promet des gains de performance de 10x en inférence IA

Nouveaux produits |
Par eeNews Europe, A Delapalisse



d-Matrix, soutenu par Microsoft, basé à Santa Clara en Californie et Alchip à Taiwan ont annoncé un effort conjoint pour développer ce qu’ils appellent le premier accélérateur d’inférence de centre de données basé sur la DRAM 3D au monde. Cette technologie vise à éliminer les limites de performance, de coût et d’évolutivité qui pèsent sur l’infrastructure d’IA d’aujourd’hui. Les entreprises affirment que cette collaboration tire parti des forces des deux équipes : L’expérience d’Alchip en matière de conception d’ASIC et la plateforme de calcul numérique en mémoire de d-Matrix.

Ce développement indique un changement potentiel dans la façon dont les centres de données abordent l’inférence de l’IA à grande échelle, en particulier lorsque les charges de travail de l’IA générative et agentique continuent de croître. Les ingénieurs qui évaluent les accélérateurs d’inférence de la prochaine génération seront intéressés de voir comment les architectures 3D DRAM se comparent en pratique aux solutions avancées basées sur la mémoire HBM.

Nouvelle architecture pour l’inférence à grande vitesse

Au cœur de cette annonce se trouve le 3DIMC de d-Matrix, qui est une mise en œuvre de DRAM empilées en 3D, conçue pour éliminer les goulets d’étranglement traditionnels de la bande passante de la mémoire. Selon d-Matrix, la technologie a déjà été validée sur le silicium de test Pavehawk dans les laboratoires de la société. La société note que la technologie 3DIMC permettra une inférence jusqu’à 10 fois plus rapide que les solutions construites autour de HBM4, marquant ce qui pourrait être un changement architectural significatif dans la conception des accélérateurs.

La première apparition commerciale du 3DIMC se fera sur le futur accélérateur d’inférence Raptor de d-Matrix, positionné comme le successeur de la plateforme Corsair de l’entreprise. Raptor vise l’IA générative, l’IA agentique et d’autres charges de travail d’inférence à forte intensité de calcul qui nécessitent des solutions de silicium de plus en plus spécialisées.

Les deux sociétés affirment que l’approche technique commune associe l’intégration calcul-mémoire à des capacités ASIC avancées pour permettre des niveaux sans précédent de débit d’inférence et d’efficacité énergétique.

S’appuyer sur des plates-formes antérieures

d-Matrix considère cette collaboration comme une continuation de la philosophie d’intégration calcul-mémoire établie avec Corsair. L’extension de cette architecture à la DRAM 3D est décrite comme la prochaine étape logique pour soutenir les hyperscalers et les entreprises confrontées à des demandes d’inférence en croissance rapide.

« Cette collaboration combine nos technologies uniques d’intégration calcul-mémoire avec les capacités d’innovation d’Alchip en matière de conception d’ASIC pour fournir la première solution d’inférence DRAM 3D au monde », a annoncé d-Matrix. « Ensemble, nous réalisons une percée qui rend l’IA non seulement plus rapide, mais aussi plus économique et durable à grande échelle. 3DIMC représente la prochaine étape logique de notre feuille de route visant à fournir des architectures d’inférence efficaces qui suivent le rythme de la croissance exponentielle de l’IA générative et agentique. »

Pour les architectes de matériel, les concepteurs de puces et les ingénieurs systèmes, la promesse d’une meilleure rentabilité et d’un gain de performance significatif seront les principaux points d’intérêt. Alors que les solutions basées sur la technologie HBM4 repoussent les limites de puissance et de coût, la perspective de la DRAM 3D en tant qu’alternative évolutive pourrait remodeler les discussions sur les feuilles de route en matière d’inférence dans les centres de données.

www.d-matrix.ai

www.alchip.com

Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :    ECI sur Google News

Partager:

Articles liés
10s