ARM lance un coeur GPU avec tracing pour puces de smartphone
Le GPU Immortalis est destiné aux conceptions de systèmes sur puce pour les téléphones Android dédiés aux jeux et reflète le lancement récent d’un noyau avec ray tracing par Imagination Technologies.
Le bloc GPU est basé sur une nouvelle architecture appelée Valhall. Cela utilise un nouveau moteur superscalaire, un jeu d’instructions scalaires simplifié et un alignement amélioré de la structure de données avec les API modernes, en particulier Vulkan.
Le bloc est configurable de 10 à 16 cœurs de shader, chacun avec une unité de ray tracing. Il existe également une prise en charge supplémentaire de l’instruction Matrix Multiply qui fournit des améliorations d’apprentissage automatique (ML) pour inclure la photographie informatique et les améliorations d’image. Il prend en charge un cache L2 configurable de 512 Ko à 2 Mo et les interfaces AMBA4 ACE, ACE-LITE et AXI habituelles.
Toutes les architectures GPU Mali sont basées sur le principe du rendu basé sur des tuiles pour minimiser la bande passante de la mémoire DDR externe nécessaire pour l’accès au framebuffer. Toutes les primitives sont ombrées par les sommets et affectées aux tuiles de l’espace écran en fonction de la couverture en pixels, tandis que l’ombrage des fragments est rendu dans un tampon de tuiles intermédiaire stocké dans une mémoire locale étroitement couplée à chaque noyau de shader, et uniquement réécrite dans la mémoire principale à la fin du rendu pour cette zone d’écran. Tous les accès au tampon de trame pendant l’ombrage, tels que les tests de profondeur ou le mélange alpha, sont des accès économes en énergie effectués à cette mémoire locale au lieu de la DDR externe.
L’utilisation de la mémoire locale pour le stockage intermédiaire permet un blending économe en énergie, des pièces jointes transitoires sans bande passante et un anti-aliasing multi-échantillons 4x presque gratuit.
L’élimination des transactions (TE) est une fonction clé d’économie de bande passante qui permet d’importantes économies d’énergie sur un système sur puce (SoC). Lors de l’exécution de TE, le GPU compare le tampon d’image actuel avec l’image précédemment rendue et effectue une mise à jour partielle uniquement sur les parties particulières de celle-ci qui ont été modifiées, réduisant ainsi considérablement la quantité de données qui doivent être transmises par image à la mémoire externe. . La comparaison est effectuée sur une base par vignette, à l’aide d’une signature de contrôle de redondance cyclique (CRC) pour déterminer si la vignette a été modifiée. Les tuiles avec la même signature CRC sont identiques ; par conséquent, leur élimination n’a aucun impact sur la qualité d’image résultante. TE peut être utilisé par chaque application pour tous les formats de tampon de trame pris en charge par le GPU, quelles que soient les exigences de précision du tampon de trame.
Le noyau Immortalis G715 est conçu pour être combiné avec le noyau Mali-G715 de nouvelle génération qui comprend un ombrage à taux variable pour aider à réduire la consommation d’énergie et à améliorer les performances.
ARM a également lancé de nouveaux cœurs de processeur pour les SoC de téléphones mobiles aux côtés des Immortalis G715 et Mali-G715 dans une solution de calcul totale (TCS) avec des outils et une IP de sécurité. Le X3 à thread unique offre une amélioration des performances de 25 % par rapport au X2, tandis que le Cortex-A715 se concentre sur des performances efficaces, offrant un gain d’efficacité énergétique de 20 % et une augmentation des performances de 5 % par rapport au précédent Cortex-A710 pour atteindre les performances équivalentes au cœur X1.
ARM est revenu à ses configurations « big.LITTLE » avec un mélange de cœurs basse consommation et hautes performances, en lançant une version mise à jour de son cœur Cortex-A510 « LITTLE » avec une consommation d’énergie réduite.
« Les smartphones sont au centre de nos vies connectées. Du jeu à la productivité, en passant par les appels vidéo, les médias sociaux ou les environnements virtuels, c’est l’appareil qui nous fournit la connexion à tout le monde et à tout, en temps réel. Pour les développeurs, rendre ces expériences 3D immersives en temps réel encore plus attrayantes et engageantes nécessite plus de performances », a déclaré Paul Williamson, vice-président senior et directeur général, Client Line of Business chez ARM.
La combinaison des IP d’ARM offrira jusqu’à 28 % de performances supplémentaires et jusqu’à 16 % de réduction de puissance sur une gamme de charges de travail, telles que les jeux, où les avantages incluront un temps de jeu plus long, déclare Williamson. « Nous continuons à étendre les dimensions des performances au-delà des charges de travail à usage général vers des charges de travail nécessitant un traitement spécialisé, propulsant la technologie mobile, non seulement sur le GPU, mais également sur les processeurs et l’IP système », a-t-il déclaré.
MediaTek, le plus grand fournisseur de puces pour smartphones, est un client clé.
« Félicitations à Arm pour le lancement du nouveau GPU Immortalis, avec le Ray tracing en matériel. Combiné avec le nouveau processeur puissant Cortex-X3, nous attendons avec impatience le prochain niveau de jeu mobile et de productivité pour nos SOC mobiles phares et premium », a déclaré le Dr JC Hsu, vice-président et directeur général de l’unité commerciale des communications sans fil chez MediaTek.
www.arm.com
Related articles
- MediaTek samples first 4nm ARM v9 chip for 320Mpixel smartphones
- Imagination shows ray tracing tech
- Configurable image signal processor core for IoT
Other articles on eeNews Europe
- Foundries.io looks to $1bn IPO
- World’s first native plastic programmable processor
- European tech drives boost to US EV charging infrastructure
- Siemens acquires US AI analytics firm for $1.5bn
- GlobalWafers to build 300mm silicon wafer megafactory in Texas
- imec spinout Swave raises €7m for 3D display