Alibaba dévoile une puce IA pour améliorer la puissance du Cloud Computing
La puce d’inférence IA à haute performance, une unité de traitement neuronal (NPU), nommée Hanguang 800, spécialisée dans l’accélération des tâches de machine learning, a été annoncée lors de la conférence annuelle Apsara Computing d’Alibaba Cloud. La Hanguang 800 est actuellement utilisée en interne pour les opérations commerciales d’Alibaba, notamment dans la recherche de produits et la traduction automatique pour ses sites e-commerce, les recommandations personnalisées, la publicité et les services clients intelligents. Ces domaines nécessitent une puissance de calcul considérable en matière d’intelligence artificielle afin d’optimiser l’expérience d’achat.
« Le lancement de Hanguang 800 est une étape importante dans notre quête de technologies de nouvelle génération. Elle améliore les capacités de calcul qui stimuleront nos activités actuelles et émergentes tout en augmentant l’efficacité énergétique », a déclaré Jeff Zhang, Directeur Technique du Groupe Alibaba et Président d’Alibaba Cloud Intelligence (photo). « Dans un avenir proche, nous prévoyons de donner à nos clients les moyens d’accéder à de l’informatique avancée, grâce à cette puce, à tout moment et en tout lieu, par l’intermédiaire de notre activité cloud. »
L’un des principaux objectifs d’Alibaba Cloud est d’offrir une infrastructure technologique de pointe qui profite aux entreprises de toutes tailles et bouche les lacunes existantes en matière d’accès à la technologie, pour finalement rendre le monde plus inclusif.
Portée par une architecture matérielle développée en interne, et des algorithmes hautement optimisés et adaptés à des applications métiers telles que le retail et la logistique, la puce Hanguang 800 a enregistré des performances remarquables dans les tests. La performance de calcul sur une seule puce a atteint 78 563 IPS au moment du pic, tandis que les scores des tests d’efficience Restnet-50 Inference étaient de 500 IPS/W. Les deux scores de performance sont largement supérieurs à la moyenne de l’industrie, mettant en lumière un équilibre remarquable entre des capacités de calcul élevées et une grande efficience.
Par exemple, environ un milliard d’images de produits sont téléchargées chaque jour sur Taobao, le site e-commerce d’Alibaba, pour les commerçants. Auparavant, il fallait une heure à la machine pour catégoriser un si grand volume d’images, puis adapter la recherche et les recommandations personnalisées pour des centaines de millions de consommateurs. Avec Hanguang 800, il ne faut plus que 5 minutes à la même machine pour accomplir la même tâche.
L’unité de recherche d’Alibaba, T-Head dont le nom chinois est « Pintouge » est à la pointe de l’innovation en matière de puces pour le cloud computing et le edge computing. T-Head est également responsable de la mise en place d’un écosystème informatique de pointe inclusif en collaborant avec des partenaires mondiaux de l’industrie de la carte à puce. Plus tôt cette année, T-Head a lancé la XuanTie 910, un processeur IoT haute performance basé sur RISC-V, un jeu d’instructions open source (ISA). XuanTie 910 a été conçu pour servir les applications IoT à haut rendement qui nécessitent des capacités de calcul élevées, telles que l’intelligence artificielle, la mise en réseau, les passerelles, les automobiles autonomes et les serveurs embarqués. Les développeurs du monde entier ont pu accéder avec succès à certains codes des processeurs hautes performances et utiliser cette technologie pour développer des prototypes pour leurs propres puces.