🤔我们能在没有平行语音数据的情况下实现直接语音到语音翻译 (S2ST) 吗?答案是肯定的!🚀介绍 ComSpeech,一种基于 S2TT 和 TTS 模型的复合 S2ST 模型,以及一种实现零样本 S2ST 的训练方法。https://github.com/ictnlp/ComSpeech1/n