热门
最新
红包
立Flag
投票
同城
我的
发布
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报
下一条:
字节跳动 Seed-ASR:自动语音识别模型 可识别不同语言、方言、口音...Seed-ASR在超过2000万小时的语音数据和近90万小时的配对ASR数据上进行了训练。支持精准识别普通话和13种中国方言,以及各种口音的英语和其他7种语言。Seed-ASR 具有强大的上下文感知能力,能够识别在特定上下文下的语音内容。例如,模型可以利用历史对话或会议记录来更准确地识别当前语音中的人名、地名或其他上下文相关的关键词。项目地址:https://bytedancespeech.github.io/seedasr_tech_report/多领域语音•日常对话:Seed-ASR 能够识别日常对话中的语音,无论是简单的交流还是包含复杂上下文的信息。•会议记录:模型能够识别和转录会议中的语音内容,包括多说话人场景和带有背景噪音的环境。•视频和直播:Seed-ASR 在处理视频和直播中的语音时表现出色,能够适应不同的音频质量和背景环境。•语音搜索:适用于智能助手和语音搜索场景,模型能够准确识别和理解用户的语音指令。•特定领域专业术语:Seed-ASR 还能够识别包含专业术语的语音输入,如医疗、科技、汽车、音乐等领域的特定内容。