StyleTTS2通过建模风格为潜在随机变量,通过扩散模型生成最适合文本的风格,而无需参考语音,实现了高效的潜在扩散,并从扩散模型提供的多样化语音合成中受益。此外,它还利用大型预先训练的SLM,如WavLM,作...
浏览 83 次 标签: AI工具推荐:开源TTS(文本生成语音)模型集合