项目负责人:语言资源高精尖创新中心常务副主任、北京语言大学杨尔弘教授。
资源介绍:收集了来自各新闻网站、词典、文学作品等的汉-阿双语语料,语料内容涵盖经贸、科技、宗教、文学、政治等方面。
数据量:汉阿双语句对齐平行语料库含约14442034句对;汉阿双语词典含约338289个词对,90000多词条,其中,成语类4000条,计算机术语类16000条,科技类50000余条,专名类20000余条;阿-汉文学平行语料库含23部文学作品,汉-阿文学平行语料库含15部文学作品。
文件格式:TXT文本。
资源样例可登录语言资源高精尖创新中心资源平台注册用户查看:
http://202.112.195.40:8080/index.xhtml