2018年4月21日,语言资源高精尖创新中心(以下简称“中心”)“中俄经贸合作数据库及俄汉语智能化综合服务平台”(以下简称中俄“语商通”)项目进展报告会暨工作研讨会在北京语言大学综合楼909会议室召开。语言资源高精尖创新中心主任李宇明教授出席会议并致辞,中俄“语商通”项目负责人傅兴尚教授及部分核心成员参加研讨会。中心学术委员会委员、中国科学院自动化所研究员宗成庆,北京语言大学高级翻译学院韩林涛老师出席会议并与项目组做深入交流。中心副主任田列朋主持会议。
李宇明教授在致辞中指出,语言资源高精尖创新中心作为北京市唯一一个以语言命名的高精尖中心,是为攻克科学难题、汇聚顶尖人才资源而成立的科研中心。中心主要建设语言资源库、语言文化博物馆和“语言通”智能服务三大工程,即语言资源采集、语言资源展示以及语言资源智能研发利用,简称“库”、“馆”、“通”。
中俄“语商通”项目是 “库”和“通”相结合的重要示范,中心以此项目为基础,未来将从俄语扩展到其他语种,从经贸扩展到其他领域,重点研究解决领域语言数据和领域信息数据的汇聚和应用问题。
李主任指出,大数据时代背景下,我们应该提高对数据的认识,数据必须能够有用才能成为资源。近些年人们对“语言是一种资源”的意识较以前增强了,更多人认识到了语言资源的“用”处。这种“用”主要包含三方面:一是“可用”,二是“能用”,三是“便用”。目前,如何解决非汉语数据的可用和能用的问题是中国人面临的一个大问题。基于此中心近期提出“世界知识的中文表达”理念,希望通过最大努力,让世界知识都能进行中文表达,这既需要技术支撑,也需要国家政策支持,最终目的是希望促进汉语成为国人乃至世界语言的“路径依赖语”。至于“便用”,就是要把信息便捷地推送到有需要的用户手上。过去强调信息的原创,但在信息大爆炸时代,对信息的再加工再推送也是重要劳动。除了生产信息有价值之外,对信息的再加工再处理也成为重要产业。信息再加工就是把不可用的信息变为可用的信息,把不便用的信息变成便用的信息。
报告会上,中俄“语言通”项目负责人傅兴尚教授结合项目总体构架,介绍了项目的进展情况,并通过其整体构架、资源库建设、平台设计、实施原则、工程保障、前景应用等方面具体解析了“语言通 <> 领域通”模型涉及的诸多语言学和信息学问题,并指出了该模型在未来语言智能系统研发、领域知识库建设及二者互促互动中所具有的重要意义。项目组其他成员分别针对中俄“语商通”的框架结构与功能、中俄商贸仿真移动谈判室、中俄语句对齐有关理论与工具、句对库清洗软件等内容的进展进行了详细的介绍与演示。
会上,宗成庆研究员与韩林涛老师针对项目的框架和技术方面等有关问题与项目成员进行了深入的交流,提出很多富有建设性的指导意见。项目组成员围绕专家意见并根据项目进展情况在下午的专题研讨会上进行了针对性的研究和调整。
根据工作安排,4月26日上午,中俄“语言通”项目负责人傅兴尚教授做客“语言资源与智能”大讲坛(第十七讲),为广大师生作了题为《语言通<>领域通模式解析和实现》的学术讲座,语言资源高精尖创新中心常务副主任杨尔弘教授主持了讲座。
傅兴尚教授认为,语言数据是世界的本源,语言是用来表达世界、认知世界的工具,更是彼此交流的工具。语言通是模拟人的语言能力的智能语言系统,领域通指的是实现信息服务功能的平台,二者结合,充分体现了项目的目标成果。傅兴尚教授还详细介绍了中俄语言通和领域通的内部架构及建设思路,并表示该项目将在助力实施“一带一路”战略的实施和中俄经贸和相互投资的务实合作方面发挥重要作用。
报告会后,中心常务副主任杨尔弘教授和副主任刘晓海副研究员与傅兴尚教授就项目应进一步聚焦语言和信息资源建设、重点解决现实应用需求等方面深入交换了意见。
语言资源高精尖创新中心对下设项目进行定期检查是一项创新性的科研项目管理和服务制度,中心各项目根据有关办法和规范要求,每半年举办一次项目工作进展座谈会和多次学术交流会,以学术活动为主要形式保障项目顺利实施,取得了良好的效果。