Advanced Search
  首页 > 行业动态
利用机器学习方法将大学讲座自动翻译成多种语言

  通信技术的进步对各行各业都产生了重大影响, 尤其是教育领域。世界各地的人们只需要上网就可以实时听取诺贝尔奖获得者的演讲, 或者在线学习最优秀大学的课程并获得相应的学分。但是, 如果用户无法理解演讲者的语言, 则无法从在线音视频中获得有用的信息。为了解决这个问题, 日本奈良科学技术研究所(NAIST)的科学家在日本信息处理协会自然语言处理兴趣小组(IPSJ SIG-NL)第240 次会议上提出一种新的基于机器学习的解决方案。

  机器翻译系统能帮助人们用以前从未听过或看过的语言进行简单的问询。系统可能会产生一些小错误, 但总体上能够实现连贯的沟通, 至少对于短暂的, 特别是只有一两句话的交流是完全能够胜任的。但是, 对于一个小时以上的内容, 例如学术讲座, 那么机器翻译系统显得就不那么健壮。

  研究人员从NAIST 获得了46.5 小时的讲座视频, 包括视频的转录文本和英文翻译, 并开发了一个深度学习系统来转录日语讲座演讲并将其翻译成英文。在观看视频时, 用户会看到与讲师讲话相匹配的日语和英语字幕。

  对于用户来说, 可能最理想的情况是同步实时翻译。但是, 实时翻译受处理时间的限制, 其准确性也因此受到一定的限制。因此, 研究人员采用非实时的方法, 利用更长时间以得到更好的效果翻译, 并将结果作为字母附在音频中。

  用于测试的演讲视频是机器人、语音处理和软件工程等主题的讲座。研究发现, 语音识别中的单词错误率与演讲者演讲过程是否流畅相关, 另一个影响错误率的因素则是演讲过程中停顿的时间。本研究用于测试的语料库仍然十分有限, 需要进一步扩充以改进测试效果。

  (编译自: https://www.sciencedaily.com/releases/2019/06/190614082935.htm)

(本刊讯)

发布时间: 2019-09-29   浏览: 1032
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn