
Sandisk propose la mémoire HBF pour remplacer la HBM
Sandisk Corp. poursuit une innovation dans le domaine de la mémoire flash 3D-NAND qui, selon l’entreprise, pourrait remplacer la mémoire HBM (mémoire à large bande passante) basée sur la DRAM pour les applications d’inférence de l’IA.
Lorsque Sandisk a été séparée de la société de stockage de données Western Digital en février 2025, l’entreprise a déclaré qu’elle avait l’intention de fournir des produits de mémoire flash tout en poursuivant le développement de technologies de mémoire émergentes et perturbatrices.
Lors de la journée des investisseurs de Sandisk qui s’est tenue le 11 février, peu avant la scission, Alper Ilkbahar, le nouveau vice-président principal de la technologie des mémoires, a décrit la mémoire flash à grande largeur de bande ainsi que ce qu’il a appelé la mémoire matricielle 3D.
Lors de la même présentation, Ilkbahar a déclaré qu’en optimisant la flash NAND pour la bande passante – plutôt que pour la surface de la puce et le coût – l’entreprise avait mis au point une architecture qu’elle appelle flash à large bande passante (HBF).
L’approche consiste à diviser le réseau de mémoire NAND en plusieurs mini-réseaux et à accéder à chacun de ces réseaux en parallèle. Ces multiples mini-réseaux peuvent être empilés dans la dimension verticale à l’aide de la technologie 3D-NAND de Kioxia BICS. Cette technologie a été utilisée pour produire des mémoires R&D à 16 couches dont la capacité est 8 à 16 fois supérieure à celle de la mémoire HBM à un prix similaire, a déclaré M. Ilkbahar.
« Nous développons cette technologie en collaboration avec les principaux acteurs de l’IA », a déclaré M. Ilkbahar devant un parterre d’analystes financiers. Le HBF a le potentiel de remplacer le HBM dans les GPU des centres de données et d’étendre leur utilisation aux smartphones compatibles avec l’IA et à d’autres équipements périphériques, a-t-il ajouté.
Actuellement, une AI-GPU typique comprend deux puces logiques de GPU et huit puces HBM. Une prochaine AI-GPU utilise ces huit HBM pour fournir 192 gigaoctets de DRAM. Ilkbahar a déclaré que l’utilisation de la mémoire HBF pourrait permettre à un composant de disposer de 4 To de mémoire non volatile.
Un LLM contemporain exigeant tel que GPT4 comporte 1,8 trillion de paramètres et utilise des poids de 16 bits, ce qui nécessite 3,6 To d’octets, a déclaré Ilkbahar. « Cela signifie que l’ensemble du modèle peut être placé sur un seul GPU avec mémoire HBF et permet d’éviter de nombreux déplacements de données », a-t-il observé. Cette efficacité sera importante pour les modèles multimodaux à venir qui combinent le texte avec l’audio et la vidéo.
Pour l’IA sur les smartphones, l’accent a été mis sur la réduction de la taille des LLM en raison des limites de mémoire, de performance et d’énergie, mais les résultats ont été décevants. Cela a retardé le développement de l’IA edge, a déclaré M. Ilkbahar. Mais un LLM plus avancé, ou basé sur des modèles de mélange d’experts, pourrait avoir 64 milliards de paramètres avec des poids de 8 bits nécessitant 64 gigaoctets de mémoire. « Une seule puce HBF pourrait contenir le modèle », a déclaré M. Ilkbahar.
Ilkbahar a admis que le HBF ne pouvait pas remplacer le HBM, mais il a déclaré que Sandisk avait décidé de mettre en place une interface standard ouverte basée sur la même interface électrique avec un minimum de changements de protocole. À cette fin, Sandisk est en train de former un comité consultatif technique composé de personnalités de l’industrie et de représentants d’entreprises partenaires.
Ilkbahar n’a pas révélé les noms des partenaires ni fourni de calendrier pour l’introduction du HBF. Il a toutefois présenté une feuille de route montrant un doublement de la capacité et de la largeur de bande de lecture, ainsi qu’une amélioration de l’efficacité énergétique de 36 % par rapport à la première génération de HBF.
Liens et articles connexes :
Articles de presse :
La mémoire flash 3D atteint une vitesse d’interface NAND de 4,8 Gbit/s
La startup Neo affirme que sa DRAM 3D offre une capacité 2D multipliée par 8
