IBM booste le marché de l’IA avec son chip accélérateur d’IA Spyre
IBM a dévoilé son nouvel accélérateur Spyre, une puce d’IA personnalisée conçue pour stimuler les charges de travail d’IA générative et agentive dans les systèmes d’entreprise. L’accélérateur sera commercialisé le 28 octobre pour les systèmes IBM z17 et LinuxONE 5, et sera disponible pour les serveurs Power11 en décembre.
Pour les lecteurs d’ECInews – en particulier ceux qui suivent l’évolution du matériel d’IA d’entreprise, de l’intégration des systèmes et de la conception des semi-conducteurs – ce lancement est important. Spyre représente un pont tangible entre la fiabilité des ordinateurs centraux et l’accélération de l’IA de pointe, offrant un aperçu de la façon dont le traitement de l’IA se rapproche des charges de travail principales des entreprises.
Faire le lien entre l’IA et les charges de travail critiques
L’accélérateur Spyre a été développé pour permettre une inférence à faible latence et une réactivité en temps réel pour les agents d’intelligence artificielle fonctionnant parallèlement aux applications d’entreprise traditionnelles. Construite avec 32 cœurs d’accélérateur et 25,6 milliards de transistors utilisant un processus de 5 nm, chaque puce Spyre offre un débit élevé tout en maintenant une sécurité et une efficacité énergétique de niveau entreprise.
IBM indique que les clients pourront mettre en cluster jusqu’à 48 cartes Spyre dans un système IBM Z ou LinuxONE, ou 16 cartes dans un serveur Power11, offrant ainsi des performances d’IA évolutives sur site. Selon IBM, cette approche sur site permet aux clients de sécuriser leurs données sensibles tout en exécutant des charges de travail d’IA générative et agentique à grande échelle.
« L’une de nos principales priorités a été de faire progresser l’infrastructure pour répondre aux exigences des charges de travail d’IA nouvelles et émergentes », a déclaré Barry Baker, COO, IBM Infrastructure & GM, IBM Systems. « Avec l’accélérateur Spyre, nous étendons les capacités de nos systèmes pour prendre en charge l’IA multi-modèle – y compris l’IA générative et agentique. Cette innovation permet aux clients de faire évoluer leurs charges de travail critiques basées sur l’IA avec une sécurité, une résilience et une efficacité sans compromis, tout en libérant la valeur de leurs données d’entreprise. »
De la recherche à la commercialisation
Les origines de Spyre remontent au IBM Research AI Hardware Center, où il s’agissait à l’origine d’un prototype conçu pour explorer les calculs d’intelligence artificielle à faible consommation d’énergie. Au cours de plusieurs cycles de développement et de collaborations, notamment avec le Center for Emerging Artificial Intelligence Systems de l’université d’Albany, la puce a évolué pour devenir un système sur puce prêt à la production et adapté aux environnements d’entreprise.
« Nous avons lancé l’IBM Research AI Hardware Center en 2019 avec pour mission de répondre aux demandes de calcul croissantes de l’IA, avant même la montée en puissance des LLM et des modèles d’IA que nous avons récemment observée », a déclaré Mukesh Khare, GM d’IBM Semiconductors et vice-président d’Hybrid Cloud, IBM. « Aujourd’hui, dans un contexte de demande croissante de capacités d’IA avancées, nous sommes fiers de voir la première puce du Centre entrer en phase de commercialisation. »
L’IA d’entreprise, plus proche des données
Pour les utilisateurs d’ordinateurs centraux, Spyre complète le processeur Telum II d’IBM, permettant une inférence en temps quasi réel pour des applications telles que la détection des fraudes, l’automatisation de la vente au détail et l’analyse prédictive. Sur les systèmes IBM Power, Spyre s’intègre à un catalogue de services d’IA qui permet d’installer en un clic des flux de travail d’IA d’entreprise, en prenant en charge la conversion et l’intégration transparentes des données pour l’IA générative à grande échelle.
Avec le lancement de Spyre, IBM se positionne à l’intersection de l’accélération de l’IA et de l’infrastructure d’entreprise, signalant un changement où l’IA générative ne se trouve plus seulement dans le cloud – mais de plus en plus au cœur des systèmes sur site où vivent les données commerciales critiques.
Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :
ECI sur Google News
