12月7日-9日,语言资源高精尖创新中心与国家语言资源监测与研究平面媒体中心共同组织了“语言资源与智能大讲坛”系列讲座。中科院自动化所研究员宗成庆教授和美国布兰戴斯大学计算机系及语言学项目副教授薛念文博士受邀作为首期讲座嘉宾,两位专家围绕语言资源建设,与全校师生分享了相关研究成果。
宗成庆教授作了主题为《面向机器翻译的语料库建设》的讲座。讲座中,宗教授介绍了如何通过计算机网络自动或半自动地快速获取大规模、高质量的双语对照语料,如何面向基于语料库的机器翻译系统标注双语对照语料,并使翻译引擎借助人工标注的语料提高翻译质量。宗教授还讲解了一种双语平行资源获取框架和双语平行句对齐片段自动抽取方法,并对目前机器翻译中存在的问题做了简要分析,提出未来研究的初步设想。
薛念文副教授以《面向自然语言处理的通用语义表示》、《语篇标注中可扩展性和表示间的平衡》为题做了两场精彩的讲座。薛念文副教授介绍了命题树库(PropBank)和中文命题树库(CPB)语义标注项目,并分享了他在对宾州语篇树库中文语篇关系体系标注及过去两年组织计算自然语言学习大会(CoNLL)的浅层语篇分析共享任务的经验,展示了短信会话中的语篇和对话结构的标注成果。
两位专家讲座内容丰富,紧跟学科前沿进行创新,提出的研究设想和分享的经验让在座师生受益匪浅,受到大家的热烈欢迎和高度好评。
讲座后,语言资源高精尖创新中心、信科院部分师生同薛念文副教授进行了深层次座谈,双方就校际间的合作交流、课题研究及人才培养进行深入沟通,并对语篇标注的拓展领域进行探讨交流。
语言资源高精尖中心策划的“语言资源与智能大讲坛”将以系列讲座的形式陆续为广大师生推出更多精彩的活动,敬请广大师生期待。