Lors de sa conférence des développeurs en juillet dernier, Rockchip a présenté ses nouveaux accélérateurs RK182X, comprenant le RK1820 doté de 2,5 Go de RAM pour les modèles à 3 milliards de paramètres et le RK1828 avec 5 Go de RAM pour les modèles à 7 milliards de paramètres. Selon cnx-software, de nouvelles informations concernant ces produits ont émergé quelques mois après leur annonce.
Développement avec le kit Firefly RK182X : 2,5 Go à 5 Go de RAM pour un calcul de 20 TOPS
Le « Kit de développement d’empilage de RAM 3D RK182X » repose sur la carte porteuse AIO-GS1N2, laquelle était à l’origine conçue pour les SoC Rockchip RK3576 ou RK3588, ainsi que pour des modules NVIDIA Jetson Orin Nano ou NX AI.
Ce kit comprend des modules SO-DIMM Rockchip RK1820 et RK1828, offrant respectivement 2,5 Go et 5 Go de DRAM sur puce, chacun avec une capacité de calcul de 20 TOPS (INT8). Ces modules sont notamment conçus pour des grands modèles de langage, avec la prise en charge de paramètres allant jusqu’à 3B pour le RK1820 et jusqu’à 7B pour le RK1828.
Pour le stockage, on trouve un emplacement pour carte MicroSD, ainsi que deux ports SATA 3.0 disponibles seulement avec le module principal Core-3588JD4. De plus, un SSD NVMe est pris en charge via des connecteurs M.2 Key-M 2280. En matière de connectivité, le kit offre un total de 9 ports Gigabit Ethernet RJ45, parmi lesquels une fonction PSE pour alimenter via ATX 48V.
Le kit de développement d’empilage de RAM 3D RK182X est proposé au prix de 889 $ pour le module RK1820 et 1 029 $ pour le module RK1828, tous deux équipés d’un SoM RK3588 avec 8 Go de RAM et 64 Go de mémoire flash.
Rockchip RK1820/RK1828 : 180 jetons/s face aux concurrents sur les benchmarks IA
Des benchmarks récents ont été publiés, montrant que les modèles RK1820 et RK1828 peuvent atteindre entre 59 et 180 jetons par seconde avec les modèles Qwen2.5, Qwen3, fastbvlm et internalVL3. Ces résultats placent les accélérateurs de Rockchip en concurrence directe avec d’autres technologies, mais ne les positionnent pas en tête pour les charges de travail basées sur la vision IA.
Lors de tests supplémentaires réalisés par Radxa, une comparaison entre un système Rockchip RK3588 et un système intégrant le module accélérateur RK1828 LLM/VLM a été effectuée. Le modèle RK1828 ne montre pas de progrès significatif par rapport aux performances du RK3588 pour les applications CNN, telles que celles utilisant YoloV5s et ResNet50. Bien que ces puces soient particulièrement adaptées pour des modèles de langage, elles ne semblent pas offrir d’avantages dans les charges de vision IA.
Tom Cubie, dans ses commentaires, a ajouté que Rockchip ne vend pas les puces directement mais propose plutôt le SO-DIMM RK182X aux clients professionnels, tout en travaillant sur un module M.2 RK182x à venir avec un connecteur d’alimentation 12V supplémentaire. Comme prévu, un dissipateur thermique sera requis pour les modules SO-DIMM et M.2.
La prochaine puce LLM/VLM, la Rockchip RK1860, est attendue pour le deuxième trimestre 2026, promettant d’apporter des avancées supplémentaires.
