L’ESP32-AIVoice-Z01 est un kit vocal IA abordable alimenté par ESP32-S3, conçu pour créer des applications IA à commande vocale. Il dispose d’une connectivité Wi-Fi et Bluetooth via le SoC ESP32-S3, d’un double réseau de microphones numériques pour une reconnaissance vocale précise et d’un amplificateur intégré. Le système implémente également des algorithmes audio pour la réduction du bruit et l’annulation de l’écho.
La carte ESP32-AIVoice-Z01 prend en charge le cadre de réveil vocal WakeNet d’Espressif et s’intègre au cadre de service backend open source AiLinker pour permettre la connexion à divers grands services de modèle d’IA comme OpenAI, ZhiPu QingYan, TongYi QianWen et DouBao. Ces fonctionnalités rendent cet appareil adapté au développement de jouets, d’appareils IoT, d’appareils mobiles et d’applications pour maison intelligente alimentés par l’IA.

ESP32-AIVoice-Z01 Spécifications du kit vocal ESP32 AI
- Module sans fil – ESP32-S3-WROOM-1U
- SoC – Processeur Xtensa LX7 double cœur Espressif Systems ESP32-S3
- Mémoire – 8 Mo de PSRAM
- Stockage – 16 Mo de mémoire flash
- Sans fil – Connectivité WiFi 4 et Bluetooth 5.0 avec antenne externe
- Stockage – Emplacement pour carte MicroSD
- Audio
- Double réseau de microphones numériques (SNR 65 dB) avec interface PDM
- Amplificateur de puissance 4 ohms 2,5 W
- Interface I2S pour DAC ou amplificateur externe
- Prise en charge des algorithmes de réduction du bruit, VAD (Voice Activity Detection) et AEC (Acoustic Echo Cancellation)
- USB – USB-C pour l’alimentation et la programmation
- Autres interfaces
- Interface écran SPI
- Interface de caméra DVP (non prise en charge dans la version vocale)
- GPIO, UART, I2C, I2S, PWM
- Divers
- LED RVB
- interrupteur à bascule d’alimentation
- Connecteur haut-parleur
- Boutons de réinitialisation ESP et BOOT
- connecteur de batterie
- Interface SPI avec bornes 1,25 mm x 8PIN
- Gestion de l’alimentation
- Entrée 3,3 V à 5 V via USB-C, <10 mA en mode veille profonde
- Interface de batterie au lithium 3,7 V avec mesure de la tension de la batterie
- Courant de charge de la batterie 555 mA à 5 V
- Dimensions – 77 x 36 x 33 mm
- Plage de température – 10°C à 60°C
- Protection ESD – Air ±8kV, contact ±4kV

La carte est livrée avec une détection de mots de réveil pré-entraînée pour un fonctionnement mains libres, une reconnaissance vocale pour le traitement des commandes et une prise en charge de la synthèse vocale (TTS) basée sur l’IA pour générer des réponses naturelles. La carte peut être programmée avec le framework Arduino IDE ou ESP-IDF. Malheureusement, toute la documentation n’est actuellement disponible qu’en chinois, y compris un guide de démarrage rapide et un guide du matériel.

Nous avons déjà parlé du kit de développement AI ESP32-S3-BOX d’Espressif, idéal pour les applications vocales en ligne et hors ligne. Nous avons également couvert le kit de développement Banana Pi BPI-AI-Voice qui est un kit de développement de reconnaissance vocale basé sur MicroSemi ZL38063. M5Stack a également lancé son module LLM hors ligne alimenté par AX630C, doté de fonctionnalités de reconnaissance vocale et pouvant être utilisé pour des applications telles que les maisons intelligentes, les assistants vocaux et le contrôle industriel.

Le kit vocal ESP32-AIVoice-Z01 ESP32 AI coûte 23,02 $ sur la boutique YouYeeTtoo. La démo ci-dessous montre que la solution fonctionne avec les langues chinoise et anglaise.

Retrouvez l’histoire de Raspberry Pi dans cette vidéo :

