English | 中文

English | 中文

海外华语资源库
作者:
2019年05月31日

该资源库为中心在研项目《海外华语资源库建设》的成果。项目负责人为语言资源高精尖创新中心首席专家、暨南大学郭熙教授。包括三个子库建设:

1、华侨华人华语基础信息库

项目完成了华侨华人人口信息数据,华语研究文献资源,相关国家语言政策资料、华语文政策研究资料、华校和相关教育机构以及华侨华人社团信息的采集工作。例如,华侨华人人口信息数据库以洲际国别为单位,以共时层面的数据为主,历时层面为辅,采集整理了5大洲183个国家和地区的华侨华人人口等方面的数据信息。亚洲(49个国家和地区)非洲(29个国家及地区)欧洲(41个国家)美洲(49个国家和地区)大洋洲(15个国家及地区)华校和相关教育机构的信息数据库目前共采集了420所华校及116个华教组织的信息。420所华校的分布信息为:亚洲162所、欧洲158所、大洋洲23所、北美62所、南美8所、非洲7所。116个华教组织的分布信息为:亚洲44个、欧洲35个、大洋洲7个、北美18个、南美8个、非洲4个。华文政策研究资料方面目前已收集了晚清、民国、建国后的华文教育的政策文件,共约9.4万字。“海外早期华文报章文献分类语料库”从《叻报》《新国民日报》《振南日报》《中兴日报》《总汇新报》《槟城新报》等早期华文报章辑录重要文献13400余篇,按照“国语推广”“华文教育”“侨民新闻”“社论”“图文广告”“文艺作品”等进行了分类。对与当前华语研究直接相关的文献进行了部分转写(120万字),并进入了Emeditor检索程序,可按照关键词进行全文检索。

2、华语传承口述史资料库

海外华语传承口述史资源库是中华语言文化传承体系的重要组成部分,海外华语传承口述史研究是一项“留根铸魂”的学术工程。再现华教精英的光辉事迹、生命历程、实践体验和动人话语,提炼他们维护华语文事业的精神核心,可以接续中华语言文化海外再生的动力。项目从对海外华语资源的抢救性搜集出发,采集到一批规模庞大、价值珍贵的海外华语传承口述史料和实物资料,建成“覆盖广泛、人物典型、形态多样、真实生动”的海外华语口述史资源库。目前已经访谈了33个国家和地区268位调查对象,涵盖重要人物音像400小时,口述实录材料50万字,珍贵文献档案100余件。

调查提纲涉及华语传承40大类重要问题,调查样态包括口语、图像、影像、实物等多模态数据,第一次全面、系统、深入、真实地记录海外华语传承口述历史。访谈对象包括华社团体领袖、华文教育行业精英、一线华文教师、主流华文媒体管理者等代表。受访者年龄以70岁以上为主,其中多位年龄超过80岁,最长者已有92岁。目前,第一批访谈资料已经完成文本转写,校对工作也在开展中。项目有幸保留了很多弥足珍贵甚至鲜为人知、不曾公开的资料。在项目开展过程中,有三位高龄重要受访者陆续辞世,抢救工程是在和时间赛跑!

3、多模态华语语料库。包含9个子语料库,目前语料规模如下:

(1)海外主要华文媒体(网站、报纸)语料库,约7亿字;

(2)华裔学习者汉语口语语料库,约400万字;

(3)小学初中华文教材语料库,约100万字;

(4)华裔学习者口语语料库,约20万字;

(5)海外华语口语语言生活的录音录像,约20G;

(6)海外华语语言景观图片20000余张;

(7)完成东南亚华文媒体特殊用字数据库建设;

(8)海外华语文学作品语料库,已完成约500万字;

(9)华侨华人访谈录口语语料库,已完成约60万字(人工校对)。