热门

最新

红包

立Flag

投票

同城

我的

发布
m0_46163918
程序员的店小二
2 年前
truem0_46163918

SpeechGPT2:一个端到端的语音对话语言模型

类似于 GPT-4o 能够感知和表达情感

该项目由复旦大学计算机学院开发

它能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。

超过10万小时的学术和野外收集的语音数据, 涵盖了丰富的语音场景和风格。

SpeechGPT2 是在有限资源下的技术探索,由于计算和数据资源的限制,它在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有一些不足。

目前仍在开发中,团队计划未来开源技术报告、代码和模型权重。

https://0nutation.github.io/SpeechGPT2.github.io/

AI资讯
CSDN App 扫码分享
分享
评论
点赞
打赏
  • 复制链接
  • 举报
下一条:
由于Groq上的新405B羊驼仅处于预览模式,哪些提供商允许在未收到邀请的情况下使用它?编辑:我想要API端点,而不是聊天应用程序。
立即登录