1月22日消息 深度神经网络语音技术(Neural TTS)赋予了合成语音前所未有的自然真实感。近期,微软在 Azure 云认知服务上推出的美语合成女声 Jenny,再次让我们感受到微软语音合成的卓越能力。
目前,微软共计合成深度神经网络语音 129 个,覆盖世界 54 个语言。其中,美语合成语音 3 个,拥有多达 7 种不同风格。此前,微软已经发布了能量充沛的美语男声 Guy以及感情丰富的美语女声 Aria。近期发布的美语女声 Jenny 则是亲切温柔。从录音到模型训练,Jenny 的制作均十分精良,其声音自然度与真人非常接近。评测结果显示,其 MOS(Mean Opinion Score,平均主观意见分)得分高于同类产品 0.4 分以上,接近真人水平。
IT之家获悉,美语合成女声 Jenny 发音纯正,媲美母语使用者。除了适用于各个场景的默认风格(General)之外,Jenny 还拥有新闻朗读(Newscast)、客服(Customer Service)、语音助手(Assistant)以及闲聊(Chat)等风格。能够满足客户对于纯正美语不同音色与风格的多样要求,适用于如翻译、朗读、配音、教学等多种应用场景。
Jenny 聊天风格 demo:
Jenny 客服风格 demo:
Jenny 新闻风格 demo:
微软不仅关注神经网络语音的质量和自然度,也同样注重语言以及语音风格的多样性。预计微软将在 AI 语音合成领域为广大用户提供越来越多的优质合成声音选择。