新闻中心

基于自然资源产业链知识图谱的智能问答方法及系统pd

发布时间:2024-05-19 07:43:25 来源:安博电竞网址 作者:安博电竞网址大全 

  本发明涉及适用于预测目的的数据处理领域,本发明公开了基于自然资源产业链知识图谱的智能问答方法及系统,其中方法包括:获取自然资源产业数据;将半结构化数据转换为新的结构化数据;将所有的结构化数据存储到关系数据库中;对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;将领域本体作为自然资源产业链知识图谱的模式层;配置领域本体与关系数据库中结构化自然资源产业链数据之间的映射关系;基于映射关系将数据库中存储的结构化数据导出为三元组数据,将三元组数据作为自然资源产业链知识图谱的数据层;获取自然资源产

  (19)国家知识产权局 (12)发明专利 (10)授权公告号 CN 114637766 B (45)授权公告日 2022.08.26 (21)申请号 7.5 (56)对比文件 CN 113806513 A,2021.12.17 (22)申请日 2022.05.18 CN 111444351 A,2020.07.24 (65)同一申请的已公布的文献号 CN 112507691 A,2021.03.16 申请公布号 CN 114637766 A CN 109598384 A,2019.04.09 (43)申请公布日 2022.06.17 CN 114328949 A,2022.04.12 (73)专利权人 山东师范大学 CN 113918728 A,2022.01.11 地址 250014 山东省济南市历下区文化东 US 2018075335 A1,2018.03.15 路88号 JP 2004127003 A,2004.04.22 WO 2022051996 A1,2022.03.17 (72)发明人 闫伟王超越张亮王吉华 WO 2016156995 A1,2016.10.06 (74)专利代理机构 济南圣达知识产权代理有限 Bernard Kamsu-Foguem等.Graph-based 公司 37221 reasoning in collaborative knowledge 专利代理师 黄海丽 management for industrial maintenance. 《Computers in Industry》.2013,第998-1013 (51)Int.Cl. 页. (续) G06F 16/242 (2019.01) G06F 16/28 (2019.01) 审查员 程一峰 G06F 16/84 (2019.01) G06Q 50/06 (2012.01) 权利要求书3页 说明书9页 附图1页 (54)发明名称 基于自然资源产业链知识图谱的智能问答 方法及系统 (57)摘要 本发明涉及适用于预测目的的数据处理领 域,本发明公开了基于自然资源产业链知识图谱 的智能问答方法及系统,其中方法包括:获取自 然资源产业数据;将半结构化数据转换为新的结 构化数据;将所有的结构化数据存储到关系数据 库中;对所有的结构化数据进行分析,构建出自 然资源产业链的领域本体;将领域本体作为自然 资源产业链知识图谱的模式层;配置领域本体与 关系数据库中结构化自然资源产业链数据之间 的映射关系;基于映射关系将数据库中存储的结 B 6 构化数据导出为三元组数据,将三元组数据作为 6 7 7 自然资源产业链知识图谱的数据层;获取自然资 3 6 4 源产业的自然语言问题,基于自然资源产业链知 1 1 识图谱对自然语言进行答案搜索,输出与自然语 N C 言对应的答案。 [转续页] CN 114637766 B 2/2 页 [接上页] (56)对比文件 建与应用.《世界林业研究》.2020,(第04期),第 丁浩宸等.基于本体的油茶中文知识图谱构 50-55页. 2 CN 114637766 B 权利要求书 1/3 页 1.基于自然资源产业链知识图谱的智能问答方法,其特征是,所述方法包括: 获取自然资源产业数据;其中,所述自然资源产业数据,包括半结构化数据和结构化数 据;将半结构化数据转换为新的结构化数据;将新的结构化数据与原结构化数据存储到关 系数据库中; 对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;将领域本体作为 自然资源产业链知识图谱的模式层; 配置领域本体与关系数据库中结构化自然资源产业链数据之间的映射关系;基于映射 关系将数据库中存储的结构化数据导出为三元组数据,将三元组数据作为自然资源产业链 知识图谱的数据层;进而构建出自然资源产业链知识图谱; 获取自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进 行答案搜索,输出与自然语言对应的答案; 所述将半结构化数据转换为新的结构化数据;具体包括: 通过网络爬虫工具对网页内容中的非结构化数据进行噪声剔除; 将噪声剔除后得到的结构化数据导入到关系数据库MYSQL中,以实现将半结构化的数 据转换为结构化的数据; 对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;具体包括: 对结构化数据进行人工抽取、分析与总结,得到自然资源产业领域内的术语、基本概念 以及概念之间的关系,最终构建出自然资源产业链领域本体,该本体作为自然资源产业链 知识图谱中的模式层,模式层定义本体的概念以及关系; 对所有的结构化数据进行分析,构建出自然资源产业链的领域本体;具体包括: 通过自顶向下的方式构建自然资源产业链本体; 分析关系数据库中存储的自然资源产业链数据,确定本体构建所需要覆盖领域的常见 概念和术语; 分析关系数据库中存储的自然资源产业链数据;该产业分为资源谱系、资产谱系、资本 谱系、产业谱系、技术谱系; 创建自然资源产业链本体的类以及类的层次结构、关系、属性和本体公理; 创建自然资源产业链本体的类以及类的层次结构、关系、属性和本体公理;具体包括: 对于类的定义,自然资源领域本体中定义了资源谱系、技术谱系、资本谱系、资产谱系、 产业谱系,每个抽象类中又根据不同领域和不同的分类定义了各级子类; 对于关系的定义,产业链中还大量存在着上下游关系以及相互具有价值的信息交换, 因此父类与子类之间有“属于”、“前向带动”、“后向带动”关系; 配置领域本体与关系数据库中结构化自然资源产业链数据之间的映射关系;具体包 括: 使用映射工具OnTop来自定义两种数据之间的映射规则;利用映射工具OnTop,以访问 知识图谱的形式直接访问关系数据库,将存储在MySQL中的结构化数据转换成RDF数据,并 通过预先构建的映射文件映射到 定义的本体上,映射工具OnTop能够直接使用 SPARQL语句将知识图谱表达为由关系源执行的SQL查询,进而查询到映射在本体中的产业 链数据库中的信息,但数据保留在关系数据库中,而不是移动到另一个数据库中;通过映射 2 3 CN 114637766 B 权利要求书 2/3 页 工具OnTop将结构化数据映射到本体开发工具 所编辑的本体上; 所述基于映射关系将数据库中存储的结构化数据导出为三元组数据,将三元组数据作 为自然资源产业链知识图谱的数据层;具体包括: 使用OnTop内部的materialize命令将关系数据库中的结构化数据导出为RDF三元组格 式的数据; 获取自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进 行答案搜索,输出与自然语言对应的答案;具体包括: 获取自然资源产业方面的自然语言问题; 对所述自然语言问题,进行分词、词性标注和关键词提取处理; 将关键词与预定义的问题模板进行匹配,筛选出相似度最高的问题模板; 所述将关键词与预定义的问题模板进行匹配,筛选出相似度最高的问题模板;具体采 用相似度匹配算法进行相似度计算;所述相似度匹配算法为余弦相似度算法; 查找相似度最高的问题模板对应的查询语句,根据查询语句在自然资源产业链知识图 谱中进行查询,通过响应函数输出最终的查询结果; 所述方法还包括:基于结构化数据,进行自然资源产业数据的可视化和分析; 三元组数据被存储到Apache‑jena‑fuseki服务器作为问答系统的数据来源;同时该服 务器负责接收查询请求,并在接收请求后,对存储在该服务器的RDF三元组进行相应的 SPARQL查询;同时负责查询结果的反馈; 基于结构化数据,进行自然资源产业数据的可视化和分析;具体包括: 实现自然资源产业知识链知识图谱的可视化存储及检索查询; 将本产业链知识图谱采用图数据库方式进行存储,通过浏览器远程进行产业链知识的 更新与可视化; 产业链中的上游环节向下游环节输送产品或服务,下游环节向上游环节反馈信息即产 业链中存在着上下游关系以及相互具有价值的信息交换,利用知识图谱的推理功能对存储 在产业链知识图谱中的自然资源产业知识进行推理,从已知的自然资源产业知识与事实中 获取并学习得到新的、未被挖掘到的知识,从而梳理出明确的自然资源产业上、下游的产业 链关系、通过自然资源产业链关系明确自然资源产业各环节的竞争关系、明确自然资源产 业板块主导产业方向;最终优化自然资源产业布局,完善产业链条。 2.采用如权利要求1所述的基于自然资源产业链知识图谱的智能问答方法的基于自然 资源产业链知识图谱的智能问答系统,其特征是,包括: 获取模块,其被配置为,获取自然资源产业数据;其中,所述自然资源产业数据,包括半 结构化数据和结构化数据;将半结构化数据转换为新的结构化数据;将新的结构化数据与 原结构化数据存储到关系数据库中; 本体构建模块,其被配置为,对所有的结构化数据进行分析,构建出自然资源产业链的 领域本体;将领域本体作为自然资源产业链知识图谱的模式层; 映射关系配置模块,其被配置为,配置领域本体与关系数据库中结构化自然资源产业 链数据之间的映射关系;基于映射关系将数据库中存储的结构化数据导出为三元组数据, 将三元组数据作为自然资源产业链知识图谱的数据层;进而构建出自然资源产业链知识图 谱; 3 4 CN 114637766 B 权利要求书 3/3 页 答案输出模块,其被配置为,获取自然资源产业方面的自然语言问题,基于自然资源产 业链知识图谱对自然语言进行答案搜索,输出与自然语言对应的答案。 3.如权利要求2所述的基于自然资源产业链知识图谱的智能问答系统,其特征是,获取 自然资源产业方面的自然语言问题,基于自然资源产业链知识图谱对自然语言进行答案搜 索,输出与自然语言对应的答案;具体包括: 获取自然资源产业方面的自然语言问题; 对所述自然语言问题,进行分词、词性标注和关键词提取处理; 将关键词与预定义的问题模板进行匹配,筛选出相似度最高的问题模板; 查找相似度最高的问题模板对应的查询语句,根据查询语句在自然资源产业链知识图 谱中进行查询,通过响应函数输出最终的查询结果。 4 5 CN 114637766 B 说明书 1/9 页 基于自然资源产业链知识图谱的智能问答方法及系统 技术领域 [0001] 本发明涉及适用于预测目的的数据处理领域,特别是涉及基于自然资源产业链知 识图谱的智能问答方法及系统。 背景技术 [0002] 本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。 [0003] 近年来,随着自然资源相关企业规模的不断扩大,产业创新体系不断优化,以及对 自然资源综合管理的深入,以往基于部门或行业的单门类资源经济研究已不能满足自然资 源管理工作需要,迫切需要对自然资源经济及产业整体开展系统研究。 [0004] 现有技术中,为了对自然资源进行了解,一般是由用户对片面化的信息进行人工 整理和分析,得到自然资源的信息,现有技术的信息获取方法,获取效率低,会因为用户自 身的知识储备不足从而遗漏或查询不到自然资源隐含的信息,导致最终获取的信息准确率 比较低。 发明内容 [0005] 为了解决现有技术的不足,本发明提供了基于自然资源产业链知识图谱的智能问 答方法及系统;能够利用知识图谱的推理功能对存储在产业链知识图谱中的自然资源产业 知识进行推理,从已知的自然资源产业知识与事实中获取并学习得到新的、未被挖掘到的 知识。 [0006] 第一方。

上一篇:今年出现多笔过亿元融资一文看懂2 下一篇:【新】农业全产业链大全(文末加群
二维码