文档目录

在这篇文章中:

ESP32-S3 通过 I2S 接口采集 16kHz/16bit 单声道 PCM 音频，数据流约为 32KB/s（即16kHz×16bit≈256kbps）。使用μ-law 等压缩将数据量减半（约16KB/s）

ffmpeg -f avfoundation -list_devices true -i ""

唤醒词模型：WakeNet

sounddevice ：音频采集处理

openwakeword：唤醒检测（可自动训练唤醒词）

VAD语音活动检测：

硬件项目：语音助手