世界语言基本信息库
作者:
2019年05月31日

资源介绍:收录世界7000多种语言主要属性字段数据,信息资源包括世界诸语的国际标准语言代码(ISO 639-3)、语言自称和他称、使用人数(Population)、地理位置(Location)、语言地位(Language Status)、语言系属(Classification)、方言划分(Dialects)、词汇相似性(Lexical similarity)、语言类型(Typology)、文字情况(Writing)等。探讨语言身份识别加入社会、民族、政治等变量以形成更为科学和符合事实的综合标准体系,在对语言的计算分析中可能采用决策树模式,以体现多种因素的决定及权重作用。

数据量:采集翻译、分析与标注了SIL International 2017发布的最新版Ethnologue: Languages of the World中7099种世界语言中英两种文字资料的数据库,目前文件大小5.32MB。

文件格式:EXCEL表格。

项目负责人:黄行。

资源样例可登录语言资源高精尖创新中心资源平台注册用户查看:http://47.94.155.105:9001/world_language_info.html