Accélérateur pour les modèles d’IA légers et la technologie de processeur embarqué
Renesas Electronics a annoncé le développement d’une technologie de processeur embarqué qui permet des vitesses plus élevées et une consommation d’énergie plus faible dans les unités de microprocesseur (MPU) qui réalisent une IA de vision avancée.
Les technologies nouvellement développées sont les suivantes : (1) un accélérateur d’IA basé sur un processeur reconfigurable dynamiquement (DRP) qui traite efficacement les modèles d’IA légers et (2) une technologie d’architecture hétérogène qui permet un traitement en temps réel par des adresses IP de processeur fonctionnant en coopération, telles que le processeur. Renesas a produit un prototype d’IA-MPU embarqué avec ces technologies et a confirmé son fonctionnement à grande vitesse et à faible consommation d’énergie. Il a atteint un traitement jusqu’à 16 fois plus rapide (130 TOPS) qu’avant l’introduction de ces nouvelles technologies, et une efficacité énergétique de classe mondiale (jusqu’à 23,9 TOPS/W à une alimentation de 0,8 V).
- Un accélérateur d’IA qui traite efficacement les modèles d’IA légers
En tant que technologie typique pour améliorer l’efficacité du traitement de l’IA, l’élagage permet d’omettre les calculs qui n’affectent pas de manière significative la précision de la reconnaissance. Cependant, il est courant que des calculs qui n’affectent pas la précision de la reconnaissance existent de manière aléatoire dans les modèles d’IA. Cela provoque une différence entre le parallélisme du traitement matériel et le caractère aléatoire de l’élagage, ce qui rend le traitement inefficace.
Pour résoudre ce problème, Renesas a optimisé son accélérateur d’IA unique basé sur le PRA (DRP-AI) pour l’élagage. En analysant comment les caractéristiques du modèle d’élagage et une méthode d’élagage sont liées à la précision de reconnaissance dans les modèles d’IA de reconnaissance d’images typiques (modèles CNN), nous avons identifié la structure matérielle d’un accélérateur d’IA qui peut atteindre à la fois une précision de reconnaissance élevée et un taux d’élagage efficace, et nous l’avons appliquée à la conception DRP-AI. De plus, un logiciel a été développé pour réduire le poids des modèles d’IA optimisés pour ce DRP-AI. Ce logiciel convertit la configuration du modèle d’élagage aléatoire en un calcul parallèle très efficace, ce qui permet un traitement de l’IA plus rapide. En particulier, la technologie d’aide à l’élagage très flexible de Renesas (technologie d’élagage flexible N :M), qui peut modifier dynamiquement le nombre de cycles en réponse aux changements du taux d’élagage local dans les modèles d’IA, permet un contrôle fin du taux d’élagage en fonction de la consommation d’énergie, de la vitesse de fonctionnement et de la précision de reconnaissance requise par les utilisateurs. Cette technologie réduit le nombre de cycles de traitement des modèles d’IA à un seizième des modèles incompatibles et consomme moins d’un huitième de l’énergie. - Technologie d’architecture hétérogène qui permet un traitement en temps réel pour le contrôle du robot
Les applications robotiques nécessitent un traitement avancé de l’IA de vision pour la reconnaissance de l’environnement environnant. Pendant ce temps, le jugement et le contrôle des mouvements des robots nécessitent une programmation détaillée des conditions en réponse aux changements de l’environnement environnant, de sorte que le traitement logiciel basé sur le processeur est plus approprié que le traitement basé sur l’IA. Le défi réside dans le fait que les processeurs équipés de processeurs embarqués actuels ne sont pas entièrement capables de contrôler les robots en temps réel. C’est pourquoi Renesas a introduit un processeur reconfigurable dynamiquement (DRP), qui gère des traitements complexes, en plus de l’accélérateur CPU et AI (DRAP-AI). Cela a conduit au développement d’une technologie d’architecture hétérogène qui permet des vitesses plus élevées et une consommation d’énergie plus faible dans les MPU d’IA en distribuant et en parallélisant les processus de manière appropriée.
Un DRP exécute une application tout en modifiant dynamiquement la configuration de la connexion du circuit entre les unités arithmétiques à l’intérieur de la puce pour chaque horloge d’opération en fonction des détails de traitement. Étant donné que seuls les circuits arithmétiques nécessaires fonctionnent même pour les traitements complexes, une consommation d’énergie plus faible et des vitesses plus élevées sont possibles. Par exemple, le SLAM (Simultaneous Localization and Mapping), l’une des applications typiques des robots, est une configuration complexe qui nécessite plusieurs processus de programmation pour la reconnaissance de la position du robot en parallèle avec la reconnaissance de l’environnement par le traitement de l’IA de la vision. Renesas a démontré l’utilisation de ce SLAM par le biais d’une commutation instantanée de programme avec le DRP et d’un fonctionnement parallèle de l’accélérateur d’IA et du processeur, ce qui se traduit par des vitesses de fonctionnement environ 17 fois plus rapides et une efficacité énergétique de fonctionnement environ 12 fois supérieure à celle du processeur embarqué seul.
Vérification de l’opération
Renesas a créé un prototype de puce de test avec ces technologies et a confirmé qu’elle avait atteint l’efficacité énergétique la plus élevée de classe mondiale de 23,9 TOPS par watt à une tension d’alimentation normale de 0,8 V pour l’accélérateur d’IA et une efficacité énergétique de fonctionnement de 10 TOPS par watt pour les principaux modèles d’IA. Il a également prouvé que le traitement de l’IA est possible sans ventilateur ni dissipateur thermique.
L’utilisation de ces résultats permet de résoudre le problème de la production de chaleur due à l’augmentation de la consommation d’énergie, qui a été l’un des défis associés à la mise en œuvre de puces d’IA dans une variété d’appareils embarqués tels que les robots de service et les véhicules à guidage automatique. La réduction significative de la production de chaleur contribuera à la diffusion de l’automatisation dans diverses industries, telles que les marchés de la robotique et des technologies intelligentes. Ces technologies seront appliquées à la série RZ/V de Renesas, des MPU pour les applications d’IA de vision.
Suivre ECInews sur Google news