一、项目介绍
《基于知识图谱的北京冬奥项目智能问答系统》项目由语言资源高精尖创新中心特聘研究员、中国科学院软件研究所孙乐研究员主持开展。项目于2018年2月立项,2020年9月开展结项工作。本项目以面向2022年北京冬奥会的冬奥项目智能问答系统为核心研究目标,立足于以智能化的手段普及冬奥项目知识,集中解决“冬奥知识碎片化”、“知识展示单一化”、“服务手段智能化不足”三大核心挑战,从而为语言资源高精尖创新中心的“语言通”智能服务和《北京冬奥会语言服务行动计划》的人机智能交换平台提供关键技术支撑。
针对“冬奥知识碎片化”挑战,项目构建了首个对外发布的大规模冬奥项目知识图谱资源,可为各类冬奥智能应用提供有力的资源支撑。
针对“知识展示单一化”挑战,项目设计了立体化知识展示平台,为冬奥知识提供了不同粒度、不同视角的多种知识展示方式,使得用户可以更方便、快捷、全面地了解冬奥会知识。
针对“服务手段智能化不足”挑战,项目研发了冬奥项目智能问答原型系统,为普及冬奥知识、宣传冬奥文化提供了一种智能化手段。
二、资源成果
项目研发的资源类成果主要是大规模冬奥项目知识图谱资源。与冬奥会相关的知识分散在互联网的各个网站上,呈现出一种碎片化的局面。针对该挑战,项目组深入探索了各类数据挖掘与知识抽取、知识融合方法,从互联网上获取并融合国内外各类冬奥相关的知识资源,建设了一个包含179万知识点、完整覆盖5类冬奥核心实体(项目、赛会、运动员、比赛、参赛队)的北京冬奥项目知识图谱,不同类型的实体之间具有丰富的关联关系,为知识展示、智能知识问答等上层应用提供有力的资源支撑。
三、技术成果
项目研发的主要技术类成果包括:
(一)立体化冬奥项目知识展示平台
项目组针对冬奥知识展示单一化问题,设计了多种类型的知识展示服务,为普及冬奥知识、宣传冬奥文化提供全方位、立体化手段。当前平台可提供的知识展示手段包括:知识浏览、文本查询、结构化知识查询、全景交互式知识查询等,使得用户可以更方便、快捷、全面地了解冬奥会知识。
![](/__local/6/EE/40/7D15239A2DA970AB18EEA3C9BBD_3FB610BE_2C751.jpeg)
知识浏览
![](/__local/2/95/00/0069ADB583A5218D95036EBBBEA_50387F74_1E5E5.jpeg)
文本查询
![](/__local/8/50/5F/F7C4B4270710ECB250976514F4B_4713875A_20321.jpeg)
结构化知识
![](/__local/A/F0/7C/926F2423C88B5C4D6BDDD870840_31945BCB_11007.jpeg)
全景交互式知识查询
(二)智能化冬奥项目问答原型系统(“小奥”智能问答系统)
针对冬奥知识服务精准化、智能化不足问题,项目研发了智能化冬奥项目智能问答原型系统(“小奥”智能问答系统)。系统采用自主研发的国际前沿深度学习语义解析模型,构建了精准的问句分析引擎。系统以微信公众号、小程序、网站入口等多种方式提供服务,接受文本和语音两种方式的自然语言问句输入,在准确地识别用户的问句意图之后,实时便捷地返回文本、图片等多种模态的答案。系统当前可以提供与历届冬奥会赛会、冬奥比赛项目、冬奥运动员、冬奥比赛成绩等相关知识相关的问答服务。
![](/__local/0/C8/99/EB1B557098F6D5F751033A33A8F_8D80B36C_317C7.jpeg)
微信公众号和微信小程序
成果入口
冬奥知识图谱资源网站(基础版)
http://oly.icip.org.cn
“小奥”智能问答系统(微信公众号和小程序)
![](/__local/B/05/CE/2F202D62EE22C0374D94E62B133_186FCC7A_171F9.jpeg)
![](/__local/4/4A/EE/BE175D83B9A7B1B7352B7A729F3_E4B2D46C_15096.jpeg)
注:当前站点及智能问答系统均为基础版,主要提供与【冬奥项目】和【历届冬奥赛会】相关的知识服务,如需完整版本,请与课题组联系(olyqa_icip@163.com)。