Le codec audio open source Lyra V2 devient plus rapide, de meilleure qualité et compatible avec plus de plates-formes

Le codec audio open source Lyra V2 devient plus rapide, de meilleure qualité et compatible avec plus de plates-formes

Lyra V2 est une mise à jour du codec audio open-source Lyra introduit l’année dernière par Google, avec une nouvelle architecture qui offre des capacités de débit binaire évolutives, de meilleures performances, un son de meilleure qualité et fonctionne sur plus de plates-formes.

Sous le capot, Lyra V2 est basé sur un codec audio neuronal de bout en bout appelé SoundStream avec un «quantificateur vectoriel résiduel» (RVQ) situé avant et après le canal de transmission, et qui peut modifier le débit audio à tout moment en sélectionnant le nombre de quantificateurs à utiliser. Trois débits sont pris en charge : 3,2 kps, 6 kbps et 9,2 kbps. Lyra V2 exploite l’intelligence artificielle et un modèle TensorFlow Lite lui permet de fonctionner sur les téléphones Android, Linux, ainsi que sur Mac et Windows, bien que la prise en charge de ces deux derniers soit expérimentale. iOS et d’autres plates-formes intégrées ne sont pas pris en charge pour le moment, mais cela pourrait changer à l’avenir.

Lyra V2 contre OpusCela devient plus intéressant une fois que nous commençons à comparer Lyra V2 à d’autres codecs audio tels que Lyra (V1) et Opus avec le nouveau codec audio offrant une meilleure qualité (score MUSHRA) que ceux à un débit donné, et le tableau ci-dessus montre Lyra V2 @ 9,2 kbps offre à peu près la même qualité qu’Opus à 14 kbps.

La latence a également été améliorée de 100 ms à 20 ms, rendant le codec de deuxième génération comparable à Opus pour WebRTC, qui a un délai typique de 26,5 ms, 46,5 ms et 66,5 ms. Lyra V2 encode et décode également cinq fois plus rapidement que Lyra V1 pour permettre l’encodage/décodage audio en temps réel et une consommation d’énergie réduite. Par exemple, le nouveau codec audio prend 0,57 ms pour encoder et décoder une image audio de 20 ms sur un téléphone Pixel 6 Pro, soit environ 35 fois plus vite qu’en temps réel.

Lyra V2 contre AMR NB contre AMR WB Opus

Alors que LyraV1 se comparerait à l’AMR-NB, Lyra V2 offre une qualité améliorée par rapport aux services vocaux améliorés (EVS) et à l’Adaptive Multi-Rate Wideband (AMR-WB), et une qualité similaire à celle d’Opus tout en utilisant à peu près 50 % à 60 % du bande passante.

Le code source de l’implémentation de Lyra V1/V2 se trouve sur Github avec l’API C++ pratiquement identique depuis la première version, à l’exception de quelques modifications telles que la possibilité de modifier le débit pendant l’encodage. Les définitions et les poids des modèles sont également inclus sous forme de fichiers .tflite.

Plus de détails et des échantillons audio peuvent être trouvés sur Google Open Source Blog.