该资源为中心在研项目《全球语言文化核心资源采集》的成果。项目负责人为语言资源高精尖创新中心副主任、北京语言大学刘晓海副研究员。
资源介绍:分阶段调查记录全世界的主要语言文化资源,选拔在华留学生作为本国本民族母语发音代表人,调查摄录具有各国各民族特色的语言文化材料,采录内容包括Swadesh 207核心词、123常用句、国家介绍、个人介绍、当地特色的传统“故事”和“歌谣”等。
数据量:已收集83个国家27000多条语料资源,生语料约13000多G,加工音视频语料约350G,文本、图片数据共1.39G。
文件格式:TXT文本,DOC文档,MP4、MTS音视频,JPG图片等。
资源样例可点击“一带一路国家语言文化核心资源展示系统”查看。