MENU

SemiDynamics présente son NPU RISC-V tout-en-un

SemiDynamics présente son NPU RISC-V tout-en-un

Technologies |
Par Nick Flaherty, A Delapalisse



La société espagnole SemiDynamics a mis au point une unité de traitement neuronal (NPU) IP entièrement programmable qui combine le traitement par CPU, vecteur et tenseur afin de fournir jusqu’à 256 TOPS pour les modèles de langage de grande taille et les systèmes d’IA.

La NPU Cervell est basée sur l’architecture RISC-V à jeu d’instructions ouvert qui s’étend de 8 à 64 cœurs. Cela permet aux concepteurs d’adapter les performances aux exigences des applications, de 8 TOPS INT8 à 1 GHz pour les déploiements compacts edge à 256 TOPS INT4 pour l’inférence IA haut de gamme dans les puces de centres de données.

Elle fait suite au lancement de l’architecture tout-en-un en décembre dernier, détaillée dans ce livre blanc.

« Cervell est conçu pour une nouvelle ère de calcul de l’IA, où les solutions standard ne suffisent pas. En tant que NPU, il offre les performances évolutives nécessaires pour tout ce qui concerne l’inférence edge et les grands modèles de langage. Mais ce qui le distingue vraiment, c’est la façon dont il est construit : entièrement programmable, sans verrouillage grâce à l’ISA RISC-V ouverte, et profondément personnalisable jusqu’au niveau de l’instruction. Associé à notre sous-système de mémoire Gazillion Misses, Cervell élimine les goulets d’étranglement traditionnels des données et offre aux concepteurs de puces une base puissante pour construire des solutions d’IA différenciées et performantes », déclare Roger Espasa, PDG de Semidynamics.

Les NPU de Cervell sont spécialement conçues pour accélérer les opérations à forte intensité matricielle, ce qui permet d’augmenter le débit, de réduire la consommation d’énergie et d’obtenir une réponse en temps réel. En intégrant les capacités des NPU aux processeurs standard et au traitement vectoriel dans une architecture unifiée, les concepteurs peuvent éliminer la latence et maximiser les performances de diverses tâches d’IA, des systèmes de recommandation aux pipelines d’apprentissage en profondeur.

Les cœurs Cervell sont étroitement intégrés au sous-système de gestion de la mémoire Gazillion Misses. Cela permet d’effectuer jusqu’à 128 requêtes simultanées en mémoire, en éliminant les blocages de latence avec plus de 60 octets/cycle de flux de données continu. Il existe également un accès massivement parallèle à la mémoire hors puce, essentiel pour l’inférence de grands modèles et le traitement de données éparses.

Cela permet de maintenir une saturation totale du pipeline, même dans les applications gourmandes en bande passante telles que les systèmes de recommandation et l’apprentissage profond.

Le noyau est entièrement personnalisable avec la possibilité d’ajouter des instructions scalaires ou vectorielles, de configurer des mémoires scratchpad et des FIFO E/S personnalisées et de définir des interfaces mémoire et des schémas de synchronisation pour fournir un matériel d’IA différencié à l’épreuve du temps.

Cette personnalisation approfondie au niveau RTL, y compris l’insertion d’instructions définies par le client, permet aux entreprises d’intégrer la propriété intellectuelle unique directement dans la solution, protégeant ainsi leur investissement ASIC contre l’imitation et garantissant que la conception est entièrement optimisée en termes de puissance, de performance et de surface. Le modèle de développement comprend des chutes de FPGA précoces et une vérification parallèle afin de réduire le temps de développement et les risques.

Configuration

INT8 @ 1GHz

INT4 à 1 GHz

INT8 à 2 GHz

INT4 à 2 GHz

C8

8 TOPS

16 TOPS

16 TOPS

32 TOPS

C16

16 TOPS

32 TOPS

32 TOPS

64 TOPS

C32

32 TOPS

64 TOPS

64 TOPS

128 TOPS

C64

64 TOPS

128 TOPS

128 TOPS

256 TOPS

www.semidynamics.com

 

Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :    ECI sur Google News

Partager:

Articles liés
10s