我几乎从零开始训练了我的第一个完全功能的网络:SuperVAD。这是一个基于transformers构建的语音活动检测器。它表现优异,超越了我尝试过的一切,并且完全开源,包括训练数据集。你可以立即查看:https://supervad.korshakov.com/