Jensen Huang, PDG de Nvidia, a présenté en détail sa dernière technologie de processeur graphique (GPU), de la puce au centre de données et jusqu’à la robotique, présentée comme une toute nouvelle industrie.
« Il se passe absolument quelque chose. L’industrie est en train de se transformer. L’informatique générale est à bout de souffle, nous avons besoin d’un nouveau type d’informatique pour passer à l’échelle supérieure », a déclaré Jensen Huang lors de son discours d’ouverture de la conférence technologique Nvidia GTC aujourd’hui en Californie. Il s’agit de la première CTG pour les cinq années qui ont suivi la pandémie.
« Il s’agit d’un nouveau secteur, car le logiciel n’existait pas auparavant, il s’agit d’une toute nouvelle catégorie et la façon dont vous produisez le logiciel ne ressemble à rien de ce que nous avons fait auparavant, en générant des jetons et en produisant des nombres à virgule flottante à une échelle jamais vue auparavant », a-t-il déclaré.
Il est basé sur le GPU Blackwell, qui succède à l’actuel GPU Hopper et porte le nom du mathématicien américain et pionnier de la théorie des jeux David Blackwell, décédé en 2010.
- Nvidia mise sur la puissance de 1 kW pour la prochaine génération de GPU
- Nvidia dévoile la plateforme de calcul accéléré Grace Hopper
M. Huang souligne cinq éléments clés, des puces aux jumeaux numériques qui seront à l’origine des fonderies d’IA et des nouveaux outils de distribution des modèles d’IA.
Le GPU Blackwell est composé de 208 milliards de transistors avec deux filières de taille normale, limitées par des réticules, dans un seul boîtier avec une mémoire cohérente. « Il n’y a pas de problèmes de localité de la mémoire ou de cache, il s’agit simplement d’une puce géante avec une mémoire cohérente », a déclaré M. Huang.
L’une des principales innovations réside dans le fait que la puce comprend un autotest intégré à 100 % de toutes les portes et de tous les bits de mémoire pour une analyse prédictive. « Nous avons donc mis en place un moteur de fiabilité RAS avec un auto-test intégré de chaque porte et de chaque bit de mémoire sur la puce et connecté à celle-ci, et c’est la première fois que nous faisons cela », a-t-il déclaré. Cette opération est réalisée via la chaîne de balayage avec un moteur dédié.
Deux de ces composants sont montés sur une carte dont l’unité centrale est un processeur Grace basé sur l’architecture ARM.
« Il s’agit de deux types de systèmes », a déclaré M. Huang. « La première est compatible avec Hopper avec la même puissance et les mêmes thermiques pour HGX.
Ceux-ci sont reliés à une nouvelle puce de commutation 4 nm à 72 ports, dotée de 50 milliards de transistors, qui comprend également un traitement permettant de relier les GPU entre eux dans les racks, de les synchroniser, de les mettre à jour et de rediffuser des produits partiels à travers le réseau.
Cela permet à 72 GPU Blackwell d’être connectés directement avec des interconnexions en cuivre dans un seul rack refroidi par liquide appelé GB200 NVL72. « Ce châssis a une capacité de 130 To/s, ce qui est supérieur à la bande passante totale de l’internet », a déclaré M. Huang.
« Notre objectif est de réduire continuellement le coût et l’énergie de l’informatique afin que nous puissions passer à l’échelle supérieure pour former la prochaine génération de modèles d’IA », a-t-il déclaré.
La première puce et les premiers systèmes comptent déjà 46 clients au moment du lancement. « Tous les hyperscalers des centres de données sont prêts, les fabricants ODM, tous les acteurs de l’IA souveraine, les opérateurs télécoms sont en train d’utiliser Blackwell.
En outre, Nvidia a également développé un microservice appelé NIMS avec des conteneurs logiciels qui permettent aux clients d’emporter leurs modèles entraînés avec eux pour les utiliser sur n’importe quel système utilisant la technologie Cuda de Nvidia.
Le dernier élément est la robotique, et Nvidia a développé une version de sa carte Jetson à bas prix qui utilise le GPU Blackwell. Jetson Thor est particulièrement destiné aux développeurs de robots humanoïdes et peut être utilisé avec l’outil de jumelage numérique Omniverse et Isaac Labs pour former les robots.
- Sonder les robots humanoïdes
- Puce d’IA pour la robotique humanoïde
- 1x lève 100 millions de dollars pour la production d’un robot humanoïde
C’est le cœur de la pile GR 00T (ou Groot) pour les robots humanoïdes.
« Nous avons simplifié l’accès à Omniverse avec quatre API pour les capacités de jumelage numérique et nous l’avons transformé en IA. Nous avons donc enseigné à Omniverse l’USD pour qu’il puisse rechercher des informations de manière sémantique, par exemple en recherchant des objets, des conditions ou des scénarios », a-t-il déclaré.