English | 中文

English | 中文

傅兴尚-中俄经贸合作数据库及俄汉语智能化综合服务平台
作者:高而杰
2017年09月01日

当今以大数据、云计算、物联网、互联网+、移动互联网、人工智能、自然语言处理、VR/AR技术等为代表的新IT技术正从根本上改变人类的生存方式、生产方式和生活方式。这种改变集中体现在不受时空限制的人类各种活动的便捷和自由,现实和虚拟的即时交互和深度融合。这对人类活动的各个领域和行业产生冲击性和颠覆性变革。申报项目“中俄经贸合作数据库及俄汉语智能化综合服务平台”正是在这种背景下提出的。简单地说,就是充分利用俄汉语智能系统支撑建造中俄经贸合作数据库,再借助语言智能系统实现数据库应用功能和效率的最大化,为中俄(以及其他俄语对象国)经贸合作提供智库和自动化综合服务平台。项目具有战略性意义和可操作性价值。

项目定位在国家级中俄经贸数据库和语言智能综合服务平台。除了信息服务,还有语言服务。其中信息服务不仅体现为信息查询,还提供针对具体项目的咨询指导、可行性分析、调研规划、项目跟踪、法律服务和针对俄联邦财税系统的财税服务,代理服务。语言服务,主要是借助机器翻译加人工编辑进行文本翻译,合同起草和企业简介、项目简介和产品简介的对外发布。

平台潜在用户主要是中俄双方工商界,包括政府(制定政策、决策调研)、商务主管部门(监管、服务)、企业,尤其服务型企业,商会、金融机构、俄汉语语言工作者等。

综观与本课题相关的研究,几乎涉及上述所有IT新技术。概括地说,主要三个方面:1)俄汉语言知识库、语料库和语言智能系统。2)中俄两国经贸合作行业数据库。3)语言智能支撑下的行业数据库的知识挖掘和应用。

本课题目标是有效整合现有纸质载体、互联网(包括移动互联网)中俄经贸领域的资源数据,充分运用当今先进的IT技术,尤其是俄汉语自然语言处理的知识库资源和最新成果,逐步建设一个系统、统一、全面、智能、开放、共享的国家级中俄经贸合作数据库,并实现其产业化应用,助力实施“一带一路”战略和中俄经贸和相互投资的务实合作,以此为切入点,建设“中国X Y 数据库”群(X=国家或地区,如,香港,法国;Y=合作领域,如,文化、教育、科技、产业。 诸如,中法文化国际合作数据库,中韩产业数据库等),实现即时更新。

研究对象、内容和整体构架为:

1)语言数据库及俄汉语语言处理平台

包括语言知识库,指语言系统规则和知识构成的机器可读的静态数据库;俄汉双语语料库,指俄汉双语对应的动态数据库,如:俄汉双语文本语料库、句子对库等;基于以上数据库的语言处理系统,如,语音合成系统、语音识别系统、俄汉双向大词典、俄汉双向术语、科技词汇查询系统、俄汉双向翻译或辅助翻译系统、双语合同库系统、辅助阅读系统等。

2)数据库及功能处理平台

包括领域知识库,指与经贸合作相关的政策、法规等常态知识构成的数据库;经贸合作信息库,指即时动态经贸信息构成的数据库;经贸数据系统,主要包括经贸信息查询系统、专家系统、信息发布和语言转换系统、企业和项目自动匹配对接系统、跨境电商、跨境物流、在线展会系统等。

3)数据管理和开发应用平台

包括数据开发者数据库,数据源数据库,数据应用者数据库,项目管理团队数据库,数据安全中心等若干功能系统。

课题研究思路和方法上应遵循的几个原则。

1)自动化和智能化原则。2)行业协作原则。3)移动终端和PC机相结合的原则。4)整合资源、自动获取和交流交换相结合原则。5)国内和国外联动、互动原则。6)共享和共创相结合原则。