Le cœur T-Head XuanTie C908 RISC-V cible les applications AIoT

Le cœur T-Head XuanTie C908 RISC-V cible les applications AIoT

Nous avons vu deux annonces de cœurs RISC-V haut de gamme cette semaine avec les processeurs SiFive P670 et Andes AX65, chacun avec une personne en panne à 4 voies, mais le semi-conducteur Xuantie C908 d’Alibaba est un peu différent avec un pipeline en 9 étapes à double émission et prise en charge de l’accélération de l’extension RISC-V Vector ciblant les applications AIoT de milieu de gamme.

Le cœur RISC-V 64 bits C908 adopte le RV64GCB[V] instruction et est conforme au profil RVA22 pour une meilleure compatibilité avec Android et d’autres systèmes d’exploitation « riches ». La société affirme que ses performances se situent entre les cœurs C906 et C910 introduits respectivement en 2020 et 2019.

Xuantie C908Points forts de XuanTie C908 :

  • RV32GCB[V] 32 bits et RV64GCB[V] Architectures RISC-V 64 bits avec manipulation de bits et extensions d’opérations vectorielles (en option)
  • Prise en charge du mode RV32 COMPAT qui permet aux processeurs RISC-V 64 bits d’exécuter du code binaire 32 bits et a été fusionné dans Linux 5.19.
  • Extensions XuanTie, y compris Instruction, Memory Attributes Extension (XMAE).
  • Compatibilité du profil RVA22
  • Grappe de 1 à 4 cœurs
  • Pipeline en ordre à double émission en 9 étapes
  • Modes privilégiés – Machine, Superviseur et Utilisateur.
  • Système d’adressage virtuel Sv39/Sv48
  • Système de cache à deux niveaux pour prendre en charge la cohérence du cache matériel et l’ECC en option.
  • Interface bus – Protocole AXI4/ACE avec deux interfaces optionnelles : un port Device Coherence (DCP) et un port Low Latency (LLP).
  • unité de protection améliorée de la mémoire physique (ePMP) avec jusqu’à 64 régions.
  • Débogage RISC-V et contrôleur d’interruption au niveau de la plate-forme (PLIC) configurable avec jusqu’à 1023 sources d’interruption

La société fournit également une comparaison des performances par rapport au processeur de commande unique T-Head C906, bien qu’aucune donnée ne soit fournie montrant comment il se compare au C910 haut de gamme.

C906 vs C908 Dhrystone

Le C908 offre une amélioration des performances de 24 à 64 % par rapport au C906 avec des références synthétiques telles que Linkpacks, Coremark, Whetstone et Dhrystone. Mais on ne nous dit rien sur le processus de fabrication et la fréquence des cœurs testés, de sorte que les résultats peuvent être dénués de sens, à moins que les deux cœurs n’utilisent le même nœud et la même fréquence.

Cela dit, le XuanTie C908 peut fonctionner à une fréquence allant jusqu’à 2 GHz et offre une consommation d’énergie dynamique aussi faible que 52,8 mW/GHz par cœur en utilisant le processus 12 nm de TSMC. L’efficacité énergétique de XuanTie C908 a été améliorée de plus de 20 % par rapport à celle de XuanTie C906 dans des scénarios typiques (non définis) sous les mêmes contraintes de fréquence et de processus.

Performances d'inférence IA C908

L’extension vectorielle RISC-V 1.0 aide vraiment avec les charges de travail d’IA car le C908 est 2 à 3,5 fois plus rapide que le C906, je suppose dans les mêmes conditions, pour la détection des mots d’activation, la classification des images, la détection des mots clés et la détection des anomalies dans MLPerf minuscule Test de performance d’inférence V0.7 utilisant le type de données INT4.

Le nouveau cœur C908 devrait éventuellement être répertorié sur le site Web de T-Head, mais pour le moment, la seule information publique que j’ai pu trouver était sur le blog RISC-V.