Arm dévoile les processeurs Cortex-X925 et Cortex-A725, le GPU Immortalis-G925 et le logiciel Kleidi AI

Arm SoC with Cortex-X925 Cortex-A725 Cortex-A520 CPU with Immortalis-G925 GPU

Armez le SoC avec le processeur Cortex-X925 Cortex-A725 Cortex-A520 avec le GPU Immortalis-G925
Exemple de SoC avec l’IP 2024 d’Arm (TCS 2024)

Arm vient d’annoncer de nouveaux processeurs Armv9 et GPU Immortalis pour les SoC mobiles, ainsi que le logiciel Kleidi AI optimisé pour les processeurs Arm des architectures Armv7 à Armv9.

Les nouveaux cœurs de processeur Armv9.2 incluent le cœur Cortex-X925 « Blackhawk » avec des améliorations significatives des performances du processeur et de l’IA, le Cortex-A725 avec une efficacité de performance améliorée et une version actualisée du Cortex-A520 offrant des améliorations d’efficacité de 15 %. Trois nouveaux GPU ont également été introduits, à savoir le GPU phare Immortalis-G925 jusqu’à 14 cœurs qui offre jusqu’à 37 % d’amélioration des performances graphiques 3D par rapport à l’Immortalis-G720 à 12 cœurs de l’année dernière, le Mali-G725 avec 6 à 9 cœurs. pour les combinés mobiles haut de gamme, et le GPU Mali-G625 avec un à cinq cœurs pour les montres intelligentes et les appareils mobiles d’entrée de gamme.

Bras Cortex-X925

L’Arm Cortex-X925 offre des améliorations de performances maximales de 36 % en monothread dans Geekbench 6.2 par rapport à un smartphone Android Premium basé sur Cortex-X4, et des performances d’IA environ 41 % supérieures en utilisant le jeton de temps d’arrivée de tiny-LLama (Q4). . Le cœur Cortex-X925 a été implémenté sur une plate-forme FPGA avec la configuration suivante : Cortex-X925 à 3,8 GHz avec 2 Mo de cache L2, 16 Mo L3, 32 Mo SLC, DSU à 2 GHz et mémoire LPDDR5x-8533.

Tests de performances du Cortex-X925

Les performances de l’IA ont été mesurées comme étant améliorées de 46 % à l’aide du jeton de délai d’activation pour Phi3, et Arm indique également que les SoC X925 peuvent offrir des temps de lancement d’applications 33 % plus rapides en moyenne sur cinq des 10 principales applications (sous Android). et une navigation Web 60 % plus rapide, mesurée à l’aide du benchmark du navigateur Speedometer 2.1. Les diapositives partagées par Arm mentionnent la prise en charge des systèmes d’exploitation Android, Linux et Windows, elle sera donc utilisée non seulement dans les smartphones mais également dans les PC mobiles et IA.

Le cœur Arm Cortex-X925 est optimisé pour les processus de fabrication en 3 nm. Vous trouverez plus de détails techniques sur le nouveau noyau sur le site Web du développeur.

Arm Cortex-A725 et améliorations du cœur Cortex-A520.

Performances et efficacité du Cortex-A725

Le Cortex-A725 améliore encore les performances et l’efficacité par rapport aux cœurs Cortex-A720 et Cortex-A78. Le nouveau cœur offre une efficacité énergétique améliorée de 35 % par rapport au Cortex-A720, une efficacité énergétique supérieure de 25 % et une amélioration du trafic L3 de 20 %. L’efficacité des performances est définie comme le rapport entre l’amélioration de la Performance et l’amélioration de la Puissance pour ladite performance. Les performances maximales du Cortex-A725 ont apparemment été mesurées sur une puce de test de 3 nm avec 64 Ko de cache K1 et 8 Mo de cache L3, et comparées à une puce Cortex-A720 de 4 nm. Outre les différents nœuds de processus, Arm affirme que la plupart des améliorations en termes d’efficacité des performances sont dues à la microarchitecture du Cortex-A725.

Économies d'énergie du Cortex-A520

Le Cortex-A520 a été actualisé avec une mise en œuvre mise à jour et un processus 3 nm offrant jusqu’à 15 % d’amélioration de l’efficacité par rapport au Cortex-A520 dans TCS23.

GPU Immortalis-G925, Mali-G725 et Mali-G625

Benchmarks de performances du GPU Immortalis-G925

Comme le processeur Arm Cortex-X925, l’Immortalis-G925 offre des améliorations de performances significatives par rapport à la génération précédente Immortalis-G720 avec des performances 37 % supérieures dans les applications graphiques, une inférence IA 34 % plus rapide (tests en mode fp16) et un traçage de rayons 52 % plus rapide. . Arm déclare en outre que le GPU Immortalis-G925 offre en moyenne des améliorations de performances de 46 % sur mobile par rapport à l’Immortalis-G720. Quelques exemples incluent Genshin Impact avec une augmentation de 49 pour cent et Roblox qui est 46 pour cent plus rapide, et la société a également testé Call of Duty Mobile, Diablo Immortal, the Day After Tomorrow, Fortnite et PUBG Mobile avec des améliorations allant de 29 à 72 pour cent. On nous dit également que l’efficacité s’est améliorée de 30 % en moyenne dans les principaux jeux.

Performances de l'Immortalis-G925 AI ML
Améliorations des performances de l’Immoratlis-G925 AI avec classification d’images, segmentation d’images, détection d’objets, traitement du langage naturel, et plus encore…

Arm n’a pas développé les GPU Mali-G725 et Mali-G625. Il s’agit de variantes plus petites de l’Immortalis-G925 avec moins de cœurs et désormais des capacités de traçage de rayons optimisées pour les appareils de milieu de gamme et d’entrée de gamme.

Immortalis-G925, Mali-G725, Mali-G625

Logiciel Kleidi IA

Arm Kleidi est une suite de bibliothèques de logiciels et de communautés de développeurs conçues pour accélérer le développement de l’IA. Les bibliothèques Arm Kleidi prennent en charge les frameworks d’IA populaires et sont optimisées pour les processeurs Arm de l’architecture Armv7 à l’aide de l’extension SIMD (Advanced Single Instruction Multiple Data) pour les charges de travail d’apprentissage automatique (ML) jusqu’à la nouvelle architecture Armv9 avec des fonctionnalités plus avancées permettant des charges de travail d’IA génératives. sur le processeur Arm.

Bras KleidiAI

Kleidi comprend actuellement deux projets principaux : KleidiAI pour les réseaux de neurones et les moteurs d’inférence et KleidiCV pour la bibliothèque de vision par ordinateur OpenCV.

KleidiAI est une collection de noyaux d’IA hautement optimisés qui fonctionnent via MediaPipe (via XNNPACK), LLAMA.cpp, PyTorch (via ExecuTorch) et TensorFlow Lite (via XNNPACK). Arm affirme que KleidiAI peut accélérer de 190 % le délai d’obtention du premier jeton pour les LLM Llama 3 de Meta et Phi-3 de Microsoft utilisant llama.cpp sur le nouveau processeur Arm Cortex-X925 par rapport à l’implémentation de référence basée sur lama.cpp. KlaidiAI est également intégré au moteur d’inférence d’IA sur appareil Unity Sentis pour les développeurs de jeux.

KleidiCV est développé en partenariat avec OpenCV pour optimiser plus de 2 500 algorithmes de vision par ordinateur dans la célèbre bibliothèque open source. Les implémentations optimisées pour NEON/SVE2 offrent une amélioration des performances de 75 % en moyenne. Les versions Android sont également soumises au référentiel Maven Central de composants logiciels open source et de bibliothèques pour le développement Java.

Bras KleidiCV

Vous trouverez quelques détails supplémentaires sur Kleidi dans l’annonce.

Tous ces nouveaux blocs IP et logiciels constituent les sous-systèmes de calcul Arm pour client (Arm CSS for Client) qui seront intégrés dans les SoC pour les PC IA, les smartphones, les appareils grand public, etc. Nous devrons probablement attendre au moins 2025 avant que les premiers appareils équipés du Arm Cortex-X925 ou du Cortex-A725 n’arrivent sur le marché.

Retrouvez l’histoire de Raspberry Pi dans cette vidéo :

YouTube video

  • sourcing map Dissipateur Thermique à Encoche en Croix pour MOS GPU IC Puce Noir 25 x 25 x 10mm 5Pcs