本项目面向北京市2022年冬奥会筹办工作的重大需求,对机器翻译展开深入研究,建立面向冬奥会的机器翻译资源库,探索基于深度学习的机器翻译理论、模型和算法,研制支持中文和英文互译的冬奥会机器翻译系统,努力为《北京冬奥会语言服务行动计划》的跨语言术语服务平台和语言资源高精尖创新中心的“语言通”智能服务和提供关键技术支撑。项目拟对面向冬奥会的文本机器翻译资源库建设、面向冬奥会的神经机器翻译方法和面向冬奥会的书面语与口语机器翻译系统等三项内容开展研究。为了应对训练数据匮乏、知识融合困难和场景模态复杂等主要技术挑战,项目拟探索基于可比语料库的半监督学习、半监督学习中的数据选择、基于知识的神经机器翻译、场景模态复杂、语音-文本直接翻译和考虑地理位置信息的自适应口语翻译等方法。