讲座题目:语言资源的三个要素及其关系--以蒙古语为例
讲座时间:2017年12月11日(周一)下午2:00-4:00
讲座地点:北京语言大学综合楼707会议室
讲座简介:
“狭义的‘语言资源’是指语言信息处理用的各种语料库和语言数据库,以及各种语言词典等”(陈章太)。作者认为语言资源由语言数据、语言知识和语言技术三个部分组成,而且它们是一个互补、互动的循环体系,缺一不可。无论科学技术如何发达,自然语言处理总离不开这三种资源。
蒙古语语言资源非常丰富,从时间跨度上讲,历经了800余年的历史沉淀,从空间跨度上讲,横跨了整个欧亚大陆,且涉及到十余种文字,所以蒙古语语言资源建设有其独特的难点和挑战。报告以蒙古语语言资源建设为例介绍语言资源三个组成要素之间的关系。
主讲人:那顺乌日图
那顺乌日图,内蒙古赤峰市巴林右旗人。现任内蒙古大学教授、博士生导师、教育部重点研究基地“蒙古学研究中心”学术委员、内蒙古大学蒙古学学部委员、内蒙古大学民族语言资源产业化基地主任、内蒙古大学中国科学院计算技术研究所机器翻译联合实验室主任、“内蒙古大学学报”编委。从上世纪80年代开始从事民族语言信息处理工作,主持完成国家863项目“汉蒙机器翻译系统”(等2期)、国家自然科学基金项目“蒙古语语法信息词典框架设计”(等3期)、国家社科基金项目“面向信息处理的蒙古语语义研究”(等2期)和省部级项目、国际合作项目30余项;出版专著三部、发表论文60余篇、研发语言资源库和应用软件12项。曾获内蒙古自治区、北京市、教育部科技进步奖和蒙古国总统颁发的“友谊”勋章、蒙古国科学院颁发的“优秀科技成果”金质奖章,被蒙古国政府授予“蒙古国文化功勋”称号。