特邀报告人:刘洋
清华大学计算机科学与技术系副教授,博士生导师,国家优秀青年基金获得者。研究方向是自然语言处理,在自然语言处理和人工智能领域重要国际刊物Computational Linguistics和国际会议ACL、IJCAI、AAAI、EMNLP和COLING上发表50余篇论文,获COLING/ACL 2006优秀亚洲自然语言处理论文奖。承担10余项国家自然科学基金、国家863计划、国家科技支撑计划和国际合作项目,2015年获国家自然科学基金优秀青年项目资助。获得2015年国家科技进步二等奖、2014年中国电子学会科学技术奖科技进步类一等奖、2009年北京市科学技术奖二等奖和2014年中国中文信息学会钱伟长中文信息处理科学技术奖汉王青年创新奖一等奖等多项科技奖励。担任中国中文信息学会青年工作委员会主任兼计算语言学专业委员会秘书长、国际计算语言学学会SIGHAN Information Officer、ACM TALLIP Associate Editor、ACL 2015组织委员会共同主席、ACL 2014讲习班共同主席、ACL 2017与EMNLP 2016程序委员会机器翻译领域共同主席。
发言题目:面向低资源语言的神经机器翻译
发言摘要:
“一带一路”涉及数十个国家、数十亿人口和上百种民族语言,利用技术手段突破语言障碍问题的重要性日益凸显。机器翻译能够利用计算机将一种语言自动翻译成为另外一种语言,正是能够解决这种语言障碍问题的最有力手段之一。近年来,端到端神经机器翻译获得了迅速地发展,相对于传统的机器翻译方法在翻译质量上获得显著提升,已经成为商用在线机器翻译系统的核心技术。作为一种数据驱动方法,神经机器翻译的性能高度依赖于平行语料库的规模、质量和领域覆盖面。然而,除了中文、英文等资源丰富语言,世界上绝大多数语言都缺乏大规模、高质量、广覆盖率的平行语料库。因此,如何充分现有数据来缓解资源匮乏问题成为神经机器翻译的一个重要研究方向。报告将首先介绍神经机器翻译的基本思想,进而对该方向上的最新研究进展进行评述,最后对面向低资源语言的神经机器翻译的未来方向进行展望。