Please wait a minute...
Advanced Search
数据分析与知识发现  2022, Vol. 6 Issue (2/3): 212-221     https://doi.org/10.11925/infotech.2096-3467.2021.0948
  专辑 本期目录 | 过刊浏览 | 高级检索 |
基于企业知识图谱的企业关联关系挖掘*
侯党1,3,4,傅湘玲1,3,4(),高嵩峰2,彭雷2,王友军2,宋美琦1,3,4
1北京邮电大学计算机学院(国家示范性软件学院) 北京 100876
2华融融通(北京)科技有限公司 北京 100033
3北京邮电大学-华融科技智慧金融联合实验室 北京 100876
4北京邮电大学-可信分布式计算与服务教育部重点实验室 北京 100876
Mining Enterprise Associations with Knowledge Graph
Hou Dang1,3,4,Fu Xiangling1,3,4(),Gao Songfeng2,Peng Lei2,Wang Youjun2,Song Meiqi1,3,4
1School of Computer Science (National Pilot Software Engineering School), Beijing University of Posts and Telecommunications, Beijing 100876, China
2Huarong Rongtong(Beijing) Technology Co.,Ltd., Beijing 100033, China
3BUPT and Huarong Joint Lab of Smart Finance, Beijing 100876, China
4BUPT and Key Laboratory of Trustworthy Distributed Computing and Service, Beijing 100876, China
全文: PDF (1104 KB)   HTML ( 18
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 通过构建企业知识图谱,深入挖掘企业在生产经营过程中与其他企业之间产生的各类关联关系,为企业的风险预警、价值评估等方向提供新思路。【应用背景】 企业在生产经营过程中产生的关联关系种类繁多且数量庞大,导致有价值的关联关系信息隐蔽在其中。针对传统分析方法效率低下的问题,提出利用知识图谱构建企业关系网络,有效挖掘隐藏的企业关联关系。【方法】 利用结构化的企业数据表构建企业知识图谱,并在此基础上实现企业之间的关联路径、企业实际控制人、企业所属集团的关联关系挖掘算法。【结果】 构建的知识图谱包含140多万个包括公司和个人两种的实体,300多万条包括股权、担保、高管、投资等9种类型的关系。在图的路径和搜索算法基础上,实现了企业关联路径查询、实际控制人发现和所属集团发现的关联关系挖掘算法。【结论】 提出了构建企业知识图谱的方法,以及基于图搜索的路径规划算法挖掘隐藏的企业关联关系的方法,为企业关联关系挖掘提出新方向。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
侯党
傅湘玲
高嵩峰
彭雷
王友军
宋美琦
关键词 企业关系网络知识图谱关系挖掘    
Abstract

[Objective] This paper tries to explore relationships among enterprises in production and operation with the help of knowledge graph, aiming to provide new directions for risk management and valuation. [Context] In production and operation, there are enormous complex relationships containing valuable information. [Methods] We used the structured enterprise data tables to construct the enterprise knowledge graph, which helped us search the association between enterprises, and find the actual controller of enterprises and the affiliated groups. [Results] The constructed knowledge graph included more than 1.4 million entities, such as companies and individuals, and more than 3 million relationships on equity, guarantee, senior management, investment and so on. Based on the path and search algorithm of the graph, we found the association, actual controller and the affiliations. [Conclusions] The proposed algorithm could effectivley identify the hidden enterprise association relationship.

Key wordsEnterprise Relationship Network    Knowledge Graph    Association Mining
收稿日期: 2021-08-31      出版日期: 2022-04-14
ZTFLH:  TP391  
基金资助:*国家自然科学基金项目的研究成果之一(91546121)
通讯作者: 傅湘玲,ORCID: 0000-0002-1492-2829     E-mail: fuxiangling@bupt.edu.cn
引用本文:   
侯党, 傅湘玲, 高嵩峰, 彭雷, 王友军, 宋美琦. 基于企业知识图谱的企业关联关系挖掘*[J]. 数据分析与知识发现, 2022, 6(2/3): 212-221.
Hou Dang, Fu Xiangling, Gao Songfeng, Peng Lei, Wang Youjun, Song Meiqi. Mining Enterprise Associations with Knowledge Graph. Data Analysis and Knowledge Discovery, 2022, 6(2/3): 212-221.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2021.0948      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2022/V6/I2/3/212
Fig.1  企业关系网络
Fig.2  知识图谱的构建方案
实体类型 关键属性
公司(company) 组织机构代码、注册资本、企业类型
个人(person) 姓名、个人证件、联系方式
Table 1  实体类型及关键属性
关系两边的实体 关系类型 关键属性
公司-公司 股东关系 持股比例
公司-公司 投资关系 投资比例
公司-公司 担保关系 关系类型
公司-公司 分支关系 关系类型
个人-公司 股东关系 持股比例
个人-公司 投资关系 投资比例
个人-公司
个人-公司
个人-公司
担保关系
高管关系
联系人关系
关系类型
职位名称
关系类型
Table 2  关系类型及关键属性
Fig.3  知识图谱本体
Fig.4  知识图谱实例
Fig.5  关联路径查询的实例图
Fig.6  企业知识图谱中持股关系的实例图
Fig.7  关联路径查询结果示例
Fig.8  持股比例计算示意图
Fig.9  企业所属集团发现的示例图
Fig.10  企业所属集团发现的图谱结果
算法 Precision Recall
企业实际控制人 93.70% -
企业所属集团 90.41% 81.97%
Table 3  两种算法的结果评估
[1] 阮彤, 王梦婕, 王昊奋, 等. 垂直知识图谱的构建与应用研究[J]. 知识管理论坛, 2016, 1(3):226-234.
[1] ( Ruan Tong, Wang Mengjie, Wang Haofen, et al. Research on the Construction and Application of Vertical Knowledge Graphs[J]. Knowledge Management Forum, 2016, 1(3):226-234.)
[2] Richens R H. Preprogramming for Mechanical Translation[J]. Mechanical Translation, 1956, 3(1):20-25.
[3] Berners-Lee T, Hendler J, Lassila O. The Semantic Web[J]. Scientific American, 2001, 284(5):34-43.
[4] Bizer C, Lehmann J, Kobilarov G, et al. DBpedia - A Crystallization Point for the Web of Data[J]. Journal of Web Semantics, 2009, 7(3):154-165.
doi: 10.1016/j.websem.2009.07.002
[5] Biega J, Kuzey E, Suchanek F M. Inside YAGO2s: A Transparent Information Extraction Architecture[C]// Proceedings of the 22nd International Conference on World Wide Web - WWW’13 Companion. New York: ACM Press, 2013: 325-328.
[6] Bollacker K, Evans C, Paritosh P, et al. Freebase: A Collaboratively Created Graph Database for Structuring Human Knowledge[C]// Proceedings of the 2008 ACM SIGMOD International Conference on Management of Data. 2008: 1247-1250.
[7] 奥德玛, 杨云飞, 穗志方, 等. 中文医学知识图谱CMeKG构建初探[J]. 中文信息学报, 2019, 33(10):1-9.
[7] ( Ao Dema, Yang Yunfei, Sui Zhifang, et al. Preliminary Study on the Construction of Chinese Medical Knowledge Graph[J]. Journal of Chinese Information Processing, 2019, 33(10):1-9.)
[8] 张靖宜, 贺光辉, 代洲, 等. 融入BERT的企业年报命名实体识别方法[J]. 上海交通大学学报, 2021, 55(2):117-123.
[8] ( Zhang Jingyi, He Guanghui, Dai Zhou, et al. Named Entity Recognition of Enterprise Annual Report Integrated with BERT[J]. Journal of Shanghai JiaoTong University, 2021, 55(2):117-123.)
[9] 刘波. 面向企业图谱的实体链接技术的研究[D]. 南京: 东南大学, 2019.
[9] ( Liu Bo. Entity Linking Technology for Enterprise Knowledge Graph[D]. Nanjing: Southeast University, 2019.)
[10] Xia Y Q, Su W F, Lau R Y K, et al. Discovering Latent Commercial Networks from Online Financial News Articles[J]. Enterprise Information Systems, 2013, 7(3):303-331.
doi: 10.1080/17517575.2011.621093
[11] 孙晨, 付英男, 程文亮, 等. 面向企业知识图谱构建的中文实体关系抽取[J]. 华东师范大学学报(自然科学版), 2018(3):55-66.
[11] ( Sun Chen, Fu Yingnan, Cheng Wenliang, et al. Chinese Named Entity Relation Extraction for Enterprise Knowledge Graph Construction[J]. Journal of East China Normal University (Natural Science), 2018(3):55-66.)
[12] 吕华揆, 洪亮, 马费成. 金融股权知识图谱构建与应用[J]. 数据分析与知识发现, 2020, 4(5):27-37.
[12] ( Lv Huakui, Hong Liang, Ma Feicheng. Constructing Knowledge Graph for Financial Equities[J]. Data Analysis and Knowledge Discovery, 2020, 4(5):27-37.)
[13] Paolo A, Luigi B, Michela I, et al. Weaving Enterprise Knowledge Graphs: The Case of Company Ownership Graphs[C]// Proceedings of the 23rd International Conference on Extending Database Technology, Copenhagen, Denmark. 2020: 555-566.
[14] 徐增林, 盛泳潘, 贺丽荣, 等. 知识图谱技术综述[J]. 电子科技大学学报, 2016, 45(4):589-606.
[14] ( Xu Zenglin, Sheng Yongpan, He Lirong, et al. Review on Knowledge Graph Techniques[J]. Journal of University of Electronic Science and Technology of China, 2016, 45(4):589-606.)
[15] 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3):582-600.
[15] ( Liu Qiao, Li Yang, Duan Hong, et al. Knowledge Graph Construction Techniques[J]. Journal of Computer Research and Development, 2016, 53(3):582-600.)
[16] 王鑫, 邹磊, 王朝坤, 等. 知识图谱数据管理研究综述[J]. 软件学报, 2019, 30(7):2139-2174.
[16] ( Wang Xin, Zou Lei, Wang Chaokun, et al. Research on Knowledge Graph Data Management: A Survey[J]. Journal of Software, 2019, 30(7):2139-2174.)
[17] 鲁佳文, 严丽. 对象关系数据库到RDF(S)的映射方法[J]. 计算机科学, 2021, 48(10):145-151.
[17] ( Lu Jiawen, Yan Li. Mapping Method from Object-Relational Database to RDF(S)[J]. Computer Science, 2021, 48(10):145-151.)
[18] 王昊奋, 丁军, 胡芳槐, 等. 大规模企业级知识图谱实践综述[J]. 计算机工程, 2020, 46(7):1-13.
[18] ( Wang Haofen, Ding Jun, Hu Fanghuai, et al. Survey on Large Scale Enterprise-Level Knowledge Graph Practices[J]. Computer Engineering, 2020, 46(7):1-13.)
[19] 于慧琳, 陈炜, 王琪, 等. 使用子图推理实现知识图谱关系预测[J/OL]. 计算机科学与探索, 2021: 1-9.
[19] ( Yu Huilin, Chen Wei, Wang Qi, et al. Knowldege Graph Link Prediction Based on Subgraph Reasoning[J/OL]. Journal of Frontiers of Computer Science & Technology, 2021: 1-9.)
[20] Ruan T, Xue L J, Wang H F, et al. Building and Exploring an Enterprise Knowledge Graph for Investment Analysis[C]//Proceedings of the 15th International Semantic Web Conference. Cham: Springer International Publishing, 2016: 418-436.
[1] 张卫, 王昊, 陈玥彤, 范涛, 邓三鸿. 融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究*[J]. 数据分析与知识发现, 2022, 6(2/3): 167-183.
[2] 刘政昊, 钱宇星, 衣天龙, 吕华揆. 知识关联视角下金融证券知识图谱构建与相关股票发现*[J]. 数据分析与知识发现, 2022, 6(2/3): 184-201.
[3] 程子佳, 陈翀. 面向流行性疾病科普的用户问题理解与答案内容组织*[J]. 数据分析与知识发现, 2022, 6(2/3): 202-211.
[4] 周阳,李学俊,王冬磊,陈方,彭莉娟. 炸药配方设计知识图谱的构建与可视分析方法研究*[J]. 数据分析与知识发现, 2021, 5(9): 42-53.
[5] 沈科杰, 黄焕婷, 化柏林. 基于公开履历数据的人物知识图谱构建*[J]. 数据分析与知识发现, 2021, 5(7): 81-90.
[6] 阮小芸,廖健斌,李祥,杨阳,李岱峰. 基于人才知识图谱推理的强化学习可解释推荐研究*[J]. 数据分析与知识发现, 2021, 5(6): 36-50.
[7] 李贺,刘嘉宇,李世钰,吴迪,金帅岐. 基于疾病知识图谱的自动问答系统优化研究*[J]. 数据分析与知识发现, 2021, 5(5): 115-126.
[8] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[9] 朱冬亮, 文奕, 万子琛. 基于知识图谱的推荐系统研究综述*[J]. 数据分析与知识发现, 2021, 5(12): 1-13.
[10] 余传明, 张贞港, 孔令格. 面向链接预测的知识图谱表示模型对比研究*[J]. 数据分析与知识发现, 2021, 5(11): 29-44.
[11] 陈仕吉, 邱均平, 余波. 基于Overlay图谱的图情领域大数据主题分析*[J]. 数据分析与知识发现, 2021, 5(10): 51-59.
[12] 邵琦,牟冬梅,王萍,靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究*[J]. 数据分析与知识发现, 2020, 4(9): 68-80.
[13] 梁野,李小元,许航,胡伊然. CLOpin:一种面向舆情分析与预警领域的跨语言知识图谱架构*[J]. 数据分析与知识发现, 2020, 4(6): 1-14.
[14] 吕华揆,洪亮,马费成. 金融股权知识图谱构建与应用*[J]. 数据分析与知识发现, 2020, 4(5): 27-37.
[15] 孙鑫瑞,孟雨,王文乐. 基于知识图谱与目标检测的微博交通事件识别*[J]. 数据分析与知识发现, 2020, 4(12): 136-147.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn