DiffSinger 合成高拟真度的歌声

 @halomaster 31 Aug 2022, 02:03 GMT【AI】 

[DiffSinger](https://huggingface.co/spaces/Silentlin/DiffSinger) 也是一个马尔科夫链参数模型,它根据乐谱一步步地将噪声转换为梅尔频谱。通过隐式地优化变分边界,DiffSinger可以稳定地训练并产生真实的输出。为了进一步提高语音质量和加快推理速度,论文作者引入了一个浅层扩散机制,以更好地利用通过之前简单损失学到的先验知识。 [堪比真人的歌声合成模型](https://mp.weixin.qq.com/s?__biz=Mzg4NjU0NTM1Ng==&mid=2247483955&idx=1&sn=ffdd80abace058d6916627f9705be3ab&chksm=cf994c90f8eec5860a729742d39fb0856c074c818d8433079128a6afeedd6da5e449fb998d0c&token=1840398179&lang=zh_CN#rd) DiffSinger的原理介绍:https://zhuanlan.zhihu.com/p/481148057 目前DiffSinger合成一首歌还需要不少手动的工作。 参考资料: [浅谈变分原理](https://zhuanlan.zhihu.com/p/139018146#:~:text=%E5%8F%98%E5%88%86%E5%A4%A7%E6%B3%95%20%E5%81%87%E8%AE%BE%E6%88%91%E4%BB%AC%E6%9C%89%E4%B8%A4%E4%B8%AA%E5%AE%9A%E7%82%B9%20%28a%2Cp%29%20%E5%92%8C%20%28b%2Cq%29%20%EF%BC%8C%E8%BF%9E%E6%8E%A5%E8%BF%99%E4%B8%A4%E7%82%B9%E7%9A%84%E4%BB%BB%E6%84%8F%E6%9B%B2%E7%BA%BF%E7%9A%84%E6%96%B9%E7%A8%8B%20y%20%3D,y%20%28a%29%3Dp%2C%20quad%20y%20%28b%29%3Dq%20quad%20%281%29%20%5C) [在变分问题中指定边界条件和约束](https://zhuanlan.zhihu.com/p/333459359)

[1] @halomaster • 13 Sep 2022, 06:17 GMT 
[【语音特征提取: 看懂梅尔语谱图(Mel-spectrogram)、梅尔倒频系数(MFCCs)的原理】](https://blog.csdn.net/weixin_50547200/article/details/117294164)

1 of 1 pages  1 replies