北京语言大学信息科学学院智能语音习得实验室与语言资源高精尖创新中心联合举办“智能语音习得技术”研讨会-北京语言大学语言资源高精尖创新中心

北京语言大学信息科学学院智能语音习得实验室与语言资源高精尖创新中心联合举办“智能语音习得技术”研讨会

作者：高而杰
2019年11月01日

2019年10月31日至11月1日，北京语言大学信息科学学院智能语音习得实验室、语言资源高精尖创新中心共同举办了为期两天的“智能语音习得技术”研讨会。此次研讨会邀请诸多致力于语音学研究的中外学者与会作精彩学术报告，吸引了诸多从事语音习得相关工作的研究者与会共同交流，分享学术经验。来自荷兰莱顿大学的Smakman教授介绍了他对划分语音教学中六大相关群体的划分：分别是语音学家、软件开发人员、教学材料的编纂者，教师、社会语言学家以及学习者。针对这六种不同群体，Smakman教授用深入浅出、妙趣横生的方式阐述这些团体所面临的各种语音、教学和文化挑战，并针对如何解决语言学习过程中的冲突问题提出了建议。

Smakman 教授发表报告

荷兰奈梅亨拉德伯德大学的Helmer Strik教授在报告中阐述了非典型语音的含义以及它对语音识别任务带来的诸多挑战。Strik教授称，在过去的几十年中，自引入深度神经网络（DNN）以来，自动语音识别（ASR）的质量逐渐提高。然而，尽管DNN的性能较好，但它们通常需要更多的训练数据，特别是针对资源较少的语言来说，非典型语音的使用能够让这些“小众语言”进入语音识别的种类当中。此外，Strik教授还介绍了他们实验室基于ASR的电子学习和电子健康项目的诸多研究。

Helmer Strik 教授作报告

张劲松教授在会议上介绍了北京语言大学智能语音习得技术实验室的工作，主要包括为促进汉语作为第二语言的语音教学任务而进行的资源建设和技术开发。智能语音习得实验室收集了大规模的汉语中介语语料库，涵盖近1000名汉语学习者30多种母语的汉语中介语音节、双字词及丰富的语音句子段落。实验室研究了特定汉语语音的感知，包括声调、辅音以及声调与音段之间的相互作用；通过各种感知训练，提高了部分学习者区分声调、混淆辅音、鼻音韵母等的感知能力；针对语音识别中的语音错误，研究了基于深层神经网络的语音识别技术。此外，实验室还开发了一个基于 CAPT的汉语学习移动平台“SAIT汉语”，并在汉语语音二语教学课堂上检验了其有效性。

张劲松教授作学术报告

王韫佳教授在研讨会上通过丰富示例，为大家介绍了汉语语音中有关韵脚及“十三辙”的内容，简明扼要地阐述其内涵和意义，以及开展的相关工作。陈莹教授则主要介绍了她研究工作中的两个实验，即美国母语学习者在二语普通话中的焦点语音实现情况和北京话母语者在二语英语中的焦点语音实现情况，并针对实验结果进行了深入分析。王蓓教授也在会上展示了两个实验内容。在第一个实验中，证明了单焦点状态下的 PFC 比双焦点状态下的 PFC 要强得多。在双焦点句中，当第一焦点后的边界强度大于词边界强度时，PFC的程度大大降低。在第二个实验中，对“2月8日6点”和“2月8日在北京”为结构的短语构成第一焦点的范围（例如，“8日”是焦点，句末也有焦点）也进行了详细讨论。

研讨会现场

曹文教授在报告中讨论了普通话中对上声的争论。近年研究表明，声调音质是上声重要特征之一，尤其是在感知方面，主要表现为中段非正常嗓音，如嘎裂音、喉塞音等。越南语的声调系统也存在类似现象。普通话语调与越南语语调不同，普通话语调受声调影响较大，其中上声声调的影响最为显著。曹文教授指出上声在语调结构的任何位置，即头、核、尾，都反映出与其他声调不同的面貌。

解焱陆副教授在本次报告中阐述了导致行为知觉错误的基本线索，并研究了代表错误本质的界标和区别特征的机制。他在报告还探讨了三种语音声学界标检测方法，即信号处理、人类感知和机器学习，提出了一种细粒度的语音属性建模方法。该方法结合汉语语音学和国际音标语音学，定义了汉语语音属性的类型，在此基础上，将声学界标和属性特征应用于语音错误检测系统。

1DFC1

研讨会现场听众

王玮博士在会上报告了二语习得研究中的发音偏误标注，并将心理学中的理论—Rational Complexity（RC）引入到了标注任务中来，提出了一个通过降低标注任务复杂度的方法来优化标注过程，并对相关的实验方法做了概括介绍。

此外，此次研讨会也在11月1日下午举办了同系列的主题讲座。

来自日本的Keikichi Hirose教授在讲座中简要回顾了韵律在言语交际中的作用，讨论了语音信息处理中如何处理韵律特征以及如何建立连接语音信息和韵律特征的韵律模型。随后，Keikichi Hirose教授补充了当前的语音合成/语音合成技术，例如基于HMM和基于DNN的带有韵律处理的基因/语音合成。另外，Keikichi Hirose教授也阐述了语音转换是在规模较小的语料库中实现各种话语风格的重要方案，并从韵律特征控制的角度出发对其进行了详细介绍。

Keikichi Hirose教授作学术报告

刘敏博士在讲座中探讨了跨方言音系的语音相似性对双方言听话者词汇识别的影响，并进一步介绍了实验结果。结果显示：音段和声调上跨方言的音系相似性不会影响双方言听话者的词汇通道，但是这种相似性会对双方言听话者的识别造成干扰。她进一步解释道，在听觉词汇识别中，声调在约束词汇激活（Word Activation）中起着重要的作用。

邹婷博士也在此次讲座上报告了通过眼动实验来研究不同汉语水平的荷兰学习者和汉语母语者在线词汇激活中，音段信息和声调信息所起的作用。她发现，汉语母语者在早期就能很好地利用声调信息和音段信息去约束词汇激活，然而荷兰学习者明显不能有效利用这些信息。但是，随着汉语水平的提高，荷兰学习者利用声调和音段信息的能力也在逐步提升。

与会专家学者合影

最后，“智能语音习得技术”研讨会伴随着热烈的掌声顺利落下帷幕。在为期两天的学术盛宴之旅中，各位中外学者和与会听众一道展开了深入交流与讨论，灵感汇集，思维碰撞。参会学生纷纷表示收获颇丰，并被专家学者孜孜不倦的学术精神感染。