适合企业的TTS文本转语音接口：微软TTS最新模型，发布9种更真实的AI语音

全云在线allcloudonline 2024-07-15 16:31:03 阅读 70

微软对Azure Al语音服务的Personal Voice功能进行了升级，引入了新的零样本学习(zero-shot)的文本到语音(TTS)模型。与初始模型相比，这些新模型提高了合成语音的自然度，并更好地模仿了提示语音中的语音特征。

微软提供了超过400种神经语音，涵盖140多种语言和地区。这些文本到语音(TTS)语音可以快速为应用添加朗读功能，使其设计更加无障碍，或为聊天机器人赋予声音，提供更丰富的对话体验。

Microsoft Azure官网：

还要给大家说的是，目前微软Azure是免费的，但是，试用额度很快就会用完，而且后续企业付费用是没办法开国内合规发票的。

企业如何获取Azure AI语音服务

目前企业需要通过微软官方合作伙伴获取服务，可以合规、稳定地提供企业用户使用Azure AI 语音服务、ChatGPT等的可能，满足国内发票需求。

通过微软官方合作伙伴获取服务，可以合规、稳定地提供企业用户使用ChatGPT的可能，满足国内发票需求，同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

参考链接：

Azure AI 服务 OpenAI 4.0 开通申请

另外有需要可以关注【全云在线】gz号，进OpenAI技术开发交流裙

更新体验：

https://ai.azure.com/explore/speech

新推出的多语言语音包括了针对对话风格的优化，扩展了微软在9种语言及其变种中传达内容的能力：

en-US-AvaMultilingualNeuralen-US-AndrewMultilingualNeuralen-US-EmmaMultilingualNeuralen-US-BrianMultilingualNeuralDe-DE-FlorianMultilingualNeuralDe-DE-SeraphinaMultilingualNeuralFr-FR-RemyMultilingualNeuralFr-FR-VivienneMultilingualNeuralzh-CN-XiaoxiaoMultilingualNeural

特点

无论在创建基于语音的聊天机器人、语音助手还是对话代理，这些新语音都将确保交互更加逼真、栩栩如生和引人入胜。针对对话优化的语音在阅读对话和非正式文本时听起来更加自然和引人入胜。包括像笑声和填充停顿等感叹词，为虚拟对话增添了人性化的气息。

应用场景

1.语音助手：创建个性化的语音助手体验。用户现在可以使用自己的声音，而不是依赖通用的声音，实现真正独特的体验。2.游戏：为玩家提供沉浸式体验，允许他们完全以自己独特的声音扮演角色。语言配音：扩展全球影响力，用演讲者的母语为内容配音，为观众提供无缝目愉悦的体验，无论他们位于何处。3.媒体和娱乐：为故事、有声书、播客、视频等创建易于使用的个人语音，使内容比以往任何时候都更加贴近和沉浸。4.语音翻译：打破语言障碍，改善沟通。允许会话参与者以他们真实的声音被听到，用各种语言进行