“面向智能语音教学的汉语中介语语音多模态语料库研究”项目系列讲座（第4~6讲）-北京语言大学语言资源高精尖创新中心

“面向智能语音教学的汉语中介语语音多模态语料库研究”项目系列讲座（第4~6讲）

作者：
2018年11月20日

【时间】

2018年11月23日（周五）上午9:00-10:00（第4讲）

2018年11月23日（周五）上午10:00-11:00（第5讲）

2018年11月23日（周五）上午11:00-12:00（第6讲）

【地点】

北京语言大学主南304会议室

第4讲

【题目】

语音语料库的偏误标注

【主讲人简介】

曹文

研究员，博士生导师

北京语言大学汉语国际教育学部汉语学院院长

研究兴趣：语音学及应用语音学

研究成果：负责和参与的科研项目：普通话语调系统研究、汉外语调对比301句、日本学生汉语单音节语音语料库、面向外国学生的计算机辅助汉语正音系统研究、声学技术辅助汉语学习(ChAT)、中国语言志·普通话等。出版专著两部，编著及教材11部；发表学术论文数十篇。

【讲座介绍】

一个语料库建设得成功与否跟它的标注结果密切相关。中介语语音语料库的标注重点应该放在能为偏误检测、正音提示及语音修正提供必要而准确的信息。其中语料库建设核心的任务就是偏误标注。讲座将以中介语语音实例对如下问题进行说明：

1、什么是偏误？

2、偏误大类怎么分？

3、偏误种类如何确认？

4、偏误表征如何确认？

5、标注符号分配有何原则？

6、如何保证标注的质量？

曹文教授

第5讲

【题目】

基于语音关键信息的发音偏误检测

【主讲人简介】

解焱陆

副教授，硕士生导师

北京语言大学信息科学学院副教授

美国伊利诺伊大学（香槟）访问学者，中国计算机学会语音对话与听觉专业组专委，国家自然科学基金评审专家。

主要研究方向：语音技术与智能语音习得技术。在国内外核心期刊和会议发表论文60余篇，申请发明专利19项，已授权15项。2013年入选北京市青年英才计划。作为负责人承担了国家社科基金一般项目、国家语委重点项目、北京语言大学梧桐平台等多个科研项目。

【讲座介绍】

传统的发音偏误检测系统往往采用top-down的语音识别框架，而人类理解语音过程是Bottom-up形式的知识聚合。例如人类理解词汇的过程是通过在连续的语音信号中感知声学界标（Landmark），再对声学界标附近的语音参数分析，做出区别特征判断，然后再和词库中的词汇项的语音表达式进行比照，最终得到词汇项。本讲座以人类理解语音的过程为理论基础，通过感知实验，人工标注，IPA对照，数据驱动等方法研究了汉语普通话声学界标的可能位置，设计了基于声学界标的发音偏误检测框架，并在二语者的数据库上进行了实验验证。实验结果证明了基于语音关键信息的发音偏误检测方法的有效性。本研究结果也有助于发现语音理解的内在机理，并据此发现和纠正二语者的发音偏误。

解焱陆副教授

第6讲

【题目】

共振峰与声调互动研究

【主讲人简介】

曹冲

北京语言大学博士研究生在读

研究兴趣：计算机辅助汉语语音学习、语音习得、实验语音学

研究成果：负责和参与的科研项目：音段对汉语母语者和二语学习者声调感知和产出的影响、辅音送气与否对汉语母语者和二语学习者声调感知和产出的影响、面向二语的汉语口语水平智能评价关键技术研究、“洋腔洋调”汉语口语自动评价关键技术研究等。

【讲座介绍】

汉语声调一直是二语学习者习得过程中的难点，讲座从汉语母语者角度出发，深入揭示共振峰与声调在感知和产出上的互动，希望对二语学习者的声调习得有所借鉴。通过设计感知听辨实验发现声调感知的结果与元音共振峰的分布密切相关，通过统计不同元音在汉语四个声调下的共振峰频率，发现较低次序的共振峰（即第一共振峰）容易受到声调类型的影响，较高次序的共振峰（即第三共振峰）不容易受到声调类型的影响，共振峰的频率高低和声调的起点、末点音高有关。

曹冲