Mini-Omni 支持“边思考边说话” 具备端到端的实时语音输入和输出能力模型- Omni可以同时处理语音输入和生成语音输出,实现了真正的端到端语音交互。- 不仅支持语音,还支持文本等多模态输入。能在不同的模态之间进行转换-Any Model Can Talk功能 :其他模型可以轻松集成Omni实现实时语音能力-Mini-Omni不仅在语音识别(ASR)和语音生成(TTS)任务中表现优异,在多模态任务(如TextQA、SpeechQA)上也具备强大的推理能力。