热门
最新
红包
立Flag
投票
同城
我的
发布
MuCodec
超低比特率音乐编解码器
讨论:https://huggingface.co/papers/2409.13216
音乐编解码器是音频编解码研究的重要方面,超低比特率压缩在音乐传输和生成中具有重要意义。由于音乐背景的复杂性和人声的丰富性,仅依靠建模语义或声学信息无法有效地重建包含人声和背景的音乐。为了解决这个问题,我们提出了MuCodec,专门针对超低比特率的音乐压缩和重建任务。MuCodec 使用 MuEncoder 提取声学和语义特征,通过 RVQ 离散化,并通过流匹配获取 Mel-VAE 特征。然后使用预训练的 MEL-VAE 解码器和 HiFi-GAN 重建音乐。MuCodec 可以在超低(0.35kbps)或高比特率(1.35kbps)下重建高保真音乐,在主观和客观指标上均取得了迄今为止最好的结果。
CSDN App 扫码分享
评论
11
- 复制链接
- 举报
下一条:
彩色散射固有图像分解在野外讨论:https://huggingface.co/papers/2409.13690固有图像分解旨在从单一照片中分离表面反射率和照明效果。由于问题的复杂性,大多数先前的研究假设单一颜色照明和朗伯世界,这限制了它们在照明感知图像编辑应用中的使用。在这项工作中,我们将输入图像分解为其漫反射反照率、彩色散射阴影和镜面残留成分。我们逐步去除单色照明和朗伯世界假设,从而得出结果。我们展示了通过将问题分解为更容易解决的子问题,可以在有限的真实数据集下实现野外彩色散射阴影估计。我们扩展的固有模型能够进行照片的照明感知分析,并可用于图像编辑应用,例如去除镜面反射和逐像素白平衡。