您当前的位置是:澳门真人娱乐 > 澳门真人游戏 >
(浏览:次)

流利说:比听懂英文更难的,是听懂中国人说的

 

原标题:流利说:比听懂英文更难的,是听懂中国人说的英文

想一下雷军的「Are you OK」,想一下满口「We are 伐木累」的邓超,再想一下你初中时口音浓重的英语老师……

你就知道中国人英文发音的不确定性有多大,明明是一样的英文,但偏偏被说成了各种不同的调子。

12 月 16 日,在 PingWest 品玩举办的 HAY!17 语音识别 PK 赛上,流利说战胜科大讯飞取得了最后的胜利。赛后,我们采访了流利说联合创始人兼首席科学家林晖博士,聊了聊怎样让机器能听懂中国式英文,以及流利说对 AI 和教育的理解。

独门武器:最有价值的大数据

就像教机器识别一张照片是猫还是狗之前,需要给机器大量的图片,并标注出来图片对应的是猫还是狗一样,想教会机器识别语言,也需要先给机器听大量录音。

但并不是所有的大数据都是有价值的。林晖博士解释,只有真正符合使用场景的大数据,才有价值。

比如流利说在识别中国式英文时,就需要先去搜集大量的中国人说英文的语音数据,而且得是能够有对应文字的语音数据。

而流利说APP 本身,就是一个教中国人说英语的软件。5000 万用户们来自中国的各个城市,他们每天会花费二三十分钟在流利说的 APP 上学习英文。

通过这种方式,流利说就巧妙地收集到了大量带标注的语音数据,既涵盖了中国从东北到广东各个区域的口音特征,又覆盖了不同英语水平的人群,这也是全球最大的中国人说英语的数据库。

林晖博士介绍,金牛国际,为了验证流利说语音识别引擎的准确性,他们还专门设了包含几百小时语音数据的四个测试集。测试发现,在识别中国人说英语这件事上,流利说已经超过Google、科大讯飞等公司,做到了最准确,「是目前世界上最能听懂不同口音、不同水平中国式英语的灵敏耳朵。」

(来源:http://www.eajmp.com)