English | 中文

English | 中文

语言资源高精尖创新中心“汉语中介语语料库建设创新工程”项目进展报告会顺利召开
作者:
2018年07月05日

6月28日,语言资源高精尖创新中心(以下简称“中心”)“汉语中介语语料库建设创新工程”项目进展报告会在北京语言大学综合楼1006会议室召开。

项目进展报告会现场

项目进展报告会现场

本次会议邀请了北京大学袁毓林教授、杨德峰教授、常宝宝副教授,北京师范大学朱瑞平教授、宋继华教授,北京语言大学宋柔教授、施春宏教授、曹文教授、刘长征教授、王治敏教授等专家出席会议。项目负责人张宝林教授及项目组部分核心成员和与会专家进行了深入交流。

项目交流会部分与会人员合影

项目交流会部分与会人员合影

张宝林教授首先从项目任务完成情况、存在的问题和解决方案、对未来工作的设想等三个方面进行了介绍,指出目前项目已经完成了语料收集、书面语语料录入、口语、视频语料转写、汉语中介语语料库标注规范的研制和语料标注平台的开发等工作。语料库检索系统开发技术总监郝振斌先生从技术架构、功能实现、进度计划三个方面对全球汉语中介语语料库综合平台的开发做了介绍。项目组成员饶高琦博士对项目所支持的句法评测工作坊做了详细介绍,并提出句法评测工作坊旨在促进自动识别句法错误位置和类型的语言信息处理系统的发展。娄开阳副教授和王鸿滨副教授也对下一阶段项目实施提出了想法。张宝林教授指出该项目是一项极具挑战性的任务,集合了项目组所有成员的智慧,项目组将充分整合、共建、共享资源。

张宝林教授发言

张宝林教授发言

与会专家就项目设计理念、语料的收集标注和理论成果等方面提出了很多富有建设性的指导意见。宋柔教授肯定了语料库开放、市场化以及语料“浅层标注”的理念。袁毓林教授提出语料标注要充分考虑研究使用需求,并建议标注系统要和对外汉语教学系统做好对接。宋继华教授从“高精尖”的角度提出了项目要充分利用高新技术,探讨创新机制,要将建资源、创模式作为项目验收的重要依据。朱瑞平教授从语料库使用者的角度对语料建设提出建议,认为语料背景中的语别比国别更重要。杨德峰教授提出语料收集要包含个案追踪语料,语料标注要有专家干预。施春宏教授从多个角度对语料语体标注提出了看法,并建议要重视语体标注。曹文教授从“全球”概念出发,提出语料收集要具有针对性,要考虑所有国家全覆盖。刘长征教授在语料收集、语料标注和项目成果三个方面都指出了可以进一步细化的建设指标。王治敏教授对语料库中母语者语料的可比性提出意见,并建议标注要实现人机交互。常宝宝教授从统计学的角度提出语料样本要有代表性,并建议要充分借鉴国外同类语料库的建设经验。

最后,中心常务副主任杨尔弘教授在总结发言中对项目组的辛勤工作和与会专家的不吝赐教深表感谢,她指出项目下一阶段需按照专家们的意见继续完善顶层规划,充分发挥团队力量,根据中心项目建设“顶天立地”的理念,扎实推进。

杨尔弘教授发言

杨尔弘教授发言