该资源为中心在研项目《面向智能语音教学的汉语中介语语音多模态语料库研究》项目的成果。项目负责人为语言资源高精尖创新中心首席专家、北京语言大学张劲松教授。
该项目主要包括以下资源类成果:
(1)汉语中介语语音库
说明:收录的中介语语音库话者总数为894,来自43个国家和地区,话者数超过10人的有16个国家,超过20人的有11个国家,语音文件时长超过400小时。在已经完成的 I、 II 期数据库任务中,我们完成了675名不同母语背景的学习者数据语音学标注任务。语料库另外还收录了82名汉语母语者的录音数据,作为标准语音以供对比研究之用。
(2) 汉语作为第二语言习得的听知觉数据库
说明:针对汉语声调、声母(l/r, z、 c、 s/zh、 ch、 sh,b、 d、 g/p、 t、k )、前后鼻韵母、焦点重音等习得难点问题的听知觉数据,被试来自中国、日本、韩国、巴基斯坦、越南、老挝、孟加拉、泰国、俄罗斯、意大利等 15个国家,外国被试总人数超过 300 名,中国被试 390 人次。
(3) 语音发音生理数据库及视频数据库
说明:收录了包含4 名汉语母语者的语音和发音器官 EMA 数据库, 口肌训练视频库, 以及二维、三维动画的口腔发音视频库。本库的目的主要用于正音软件的视频反馈使用。
(4)多语种平行语料语音库
说明:以汉语常用301 句为蓝本,收集了少量话者17国语言的平行语音语料,包括英文、日语、法语、德语、俄语、蒙古语、西班牙语、葡萄牙语、韩语、阿拉伯语、乌尔都语、印地语、马来语、泰语、越南语、孟加拉语、菲律宾语等。可用作L1、L2的语音对比研究或作声学模型迁移学习使用。
(5)二语学习者语音发展语料库
说明:36 名 19 个母语背景的外国学生参加了为期 6 周的基于SAIT汉语APP的语音学习任务,共收录 21 小时 2.8 万条语音数据,人均 780 条。这些数据能够反映这些学习者在学习期间的发音能力发展状况,可以用来从经时角度研究汉语语音习得的问题。
更多项目成果详情,可点击:
http://yuyanziyuan.blcu.edu.cn/info/1066/2525.htm