央广网

科技频道 > 滚动新闻

央广网

谷歌开发AI“读唇”软件 准确率比人类高3倍

2016-11-25 11:23:00 来源:光明网

谷歌开发AI“读唇”软件 准确率比人类高3倍

TNW中文站 11月24日报道

  谷歌人工智能部门DeepMind正与牛津大学研究人员合作,希望开发出全球最先进的“读唇”软件,可能比人类的“读唇”能力还要出色。

  为实现这一目标,研究人员选取了数千个小时的BBC电视短片,上传到一个神经网络上,对其“读唇”软件进行训练,即根据主播嘴部运动来识别其播报内容。

  结果,这款“读唇”软件的唇读准确率高达46.8%。相比之下,基于同样的测试内容,人类唇读的准确率只有12.4%。

  这项研究基于牛津大学之前的一款人工智能“读唇”系统“LipNet”。LipNet能将视频中人物的嘴部运动与其台词进行匹配,准确率高达93.4%。当然,该准确率主要基于一些相对简单的句子。

  DeepMind这款“读唇”软件名为“看、听、分析与拼写”(Watch, Listen, Attend, and Spell),与LipNet不同的是,DeepMind的软件致力于更难的长句。

  为此,谷歌神经网络观看了来自BBC的约5000个小时的流行电视节目,包括《晚间新闻》和《提问时间》和《今日世界》等,共包含了11万个不同的句子,1.75万个不同的单词。相比之下,测试LipNet的句子只包含了51个不同的单词。

  谷歌对此表示:“这项研究的目的是识别人们谈话时的短语和句子,有声音或没有声音都能识别。与之前的相关研究不同,它们仅限于有限数量的单词或短语,而我们的研究针对无限制的自然语言长句。”

  DeepMind团队认为,他们新开发的这款软件除了能帮助听力损伤人群,还支持其他一系列应用,包括注释电影、利用唇部动作与Siri和Alexa等数字助理通信等。(腾讯科技/谭燃)

编辑:贾斯曼

关键词:谷歌;软件;读唇;lipnet;唇读

说两句

相关阅读

百度惜败亚马逊列MIT“全球最聪明公司”第二

在《麻省理工技术评论》(MIT Technology Review)发布的智能公司排行榜中,中国有百度和滴滴两家公司入选。该公司希望通过AI技术使汽车在行驶过程中实现更智能的路线选择,减少堵塞和节约能源。

2016-11-24 16:50:00

福布斯:苹果在华设两大研发中心的五大原因

在中国设立更多的研发中心意味接收本土品牌的员工,他们可能会因薪水跳槽到苹果。在北深建立两所研发中心,将有助于苹果接近中国顶尖科技公司和大学,掌握市场发展趋势。谷歌的进入无疑是对苹果的直接威胁,因此,苹果研发中心抢先一步登陆中国。

2016-11-22 17:10:00

给5G豪情泼一点冷水

给5G豪情泼一点冷水,“这次,华为主推的极化码最终成为控制信道上行和下行的编码方案,而数据信道的上行和下行短码方案则归属高通LDPC码”。其实,我们避免误导,只需要记住一个根本点:世界上没有一蹴而就的捷径,中国网络空间领域崛起任重道远。

2016-11-21 09:20:00

参与讨论

我想说

编辑推荐

视觉焦点

推荐视频

央广网官方微信

手机央广网

点击排行

违法和不良信息举报电话:010-56807188 新闻热线:4008000088 E-mail:4008000088@cnr.cn
网上传播视听节目许可证号 0102002 京ICP证150508号 京公网安备11040202120007
中央人民广播电台介绍 | 央广网介绍