现在的位置: 首页资讯>正文

谷歌新研究:使用无监督训练来识别语音模式

2018年03月29日 作者: 暂无评论 950+ 0

谷歌研究员正在探索让机器合成语音更加自然的方法。谷歌大脑和机器感知团队的成员周二在博客中公布了一些如何让语音更具表现力的范例。Google

周二早些时候,谷歌发布了“云端文本转语音”服务的测试版,提供了与谷歌助手同样的语音合成服务。该服务采用了DeepMind的WaveNet技术,而这个技术也可以被用于生成非常自然的声音。

谷歌此次发布的文本转语音服务和相关的研究方法可以给需要用到语音控制和语音计算的设备、应用和数字服务带来更自然的语音。

谷歌研究员近期发表了两篇论文,提出了新的发音方法,介绍了如何模仿语音中的重音或语调。这两篇论文的技术都基于Tacotron 2。这是个去年12月份亮相的人工智能系统,使用神经网络进行训练,模仿人类语音。

此前的Tacotron在大部分情况下都可以模拟真人声音,但却无法模仿说话中的重音和自然的语调。Tacotron的联合发明人Wang Yuxuan此次参与了其中一篇论文研究。通过将人类语音片段嵌入计算机语音风格,他们在合成语音中实现了重音等效果。

另一篇论文的研究则使用无监督训练来识别语音模式,并模仿某些语音风格。

竞争对手方面,苹果Siri去年获得了更具表现力的声音。去年4月,亚马逊Alexa面向语音应用开发者提供了SSML标签,在助手的语音中增加更丰富的表达,例如停顿、轻语,以及一些感叹语。

原文地址:https://www.eeboard.com/news/google-84/

搜索爱板网加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!

【微信扫描下图可直接关注】1-aibanwang127

发表评论

相关文章

AI未来发展路在何方?细数FPGA的独特优势

很多世界顶尖的“建筑师”可能是你从未听说过的人,他们设计并创造出了很多你可能从未见过的神奇结构,比如在芯片内部源于沙子的复杂体系。如果你使用手机、电脑,或者通过互联网收发信息,那...

【速览】2019慕尼黑上海电子展的创新与智慧

作为亚洲重要的电子行业展会,慕尼黑上海电子展(Electronica China)如期在上海新国际博览中心举办。本届展会迎合电子行业新趋势,在涵盖半导体、传感器技术、微纳米系统、电源、无源元件、...

RISC-V 为 AI 边缘计算晶片发展锦上添花

壹. RISC-V的简单介绍 RISC-V(念做 Risk-Five)是一种起源于UC Berkeley大学,具有High Quality(高质量)、No license fee(无授权费)、No Royalty(无权利金)等主要特点的RISC ISA(指...

[视频]当AI遇上骚扰电话,女推销员毫无察觉

今年 315 晚会曝光了智能骚扰电话机器人产业链,让我们意识到那些令人不堪其扰的销售来电背后,好多都是没感情的 AI。对此深恶痛绝的阿里人工智能实验室研究员聂再清决定“以其人之道还治其人...

控制AI之战:揭秘谷歌与DeepMind的爱恨情仇

AlphaGo堪称是经典的公关案例。自被谷歌收购以来,DeepMind曾多次制造奇迹,吸引了全球的关注。   划重点: 1、《经济学人》采访了25名消息人士,包括现任雇员、前任雇员以及投资者,揭...