这项科学技术是北京时间3月28日的早间新闻,谷歌研究人员正在寻找机器合成声音更自然的方法。 谷歌大脑和机器识别小组成员周二在博客上公布了如何使语音更具表现力。
周二早些时候,谷歌发布了从云拷贝到语音服务的测试版,提供了与谷歌助手一样的语音合成服务。 虽然该服务使用的是deepmind的wavenet技术,但该技术也可以用于生成非常自然的声音。
谷歌此次发表的从复制到语音服务的相关研究方法,可以通过需要语音控制和语音计算的设备、APP、数字化服务带来更自然的语音。
谷歌研究人员最近发表了两篇论文,提出了新的发音方法,并介绍了如何模仿语音语调和语调。 这两篇论文的技术都基于tacotron 2。 这是去年12月出现的人工智能系统,利用神经互联网进行训练,模仿人类的声音。
过去的tacotron大部分都能模拟人类的声音,但无法模仿语言中的声调和自然语调。 tacotron的共同发明者王玉轩这次参加了论文研究。 通过将人类的语音片段嵌入计算机的语音风格中,他们实现了对合成语音进行重音等效果。
另一篇论文的研究是在没有监控训练的情况下识别语音模式,模仿某种语音风格。
在同行业其他公司中,苹果siri去年获得了更具表现力的呼声。 去年4月,亚马逊alexa为语音APP开发者提供了ssml标签,为助手的语音添加了停顿、轻言、小小感叹词等更加丰富的表达方式。
标题:“谷歌新研究:让机器合成语音更加自然”
地址:http://www.man-on.com/xwdt/23742.html