Advanced Search

数据分析与知识发现, 2019, 3(8): 94-104 doi: 10.11925/infotech.2096-3467.2018.1137

研究论文

基于RBR和CBR的金融事件本体推理研究 *

强韶华,,1, 罗云鹿2, 李玉鹏1, 吴鹏3

1南京工业大学经济与管理学院 南京 211800

2西南财经大学经济信息工程学院 成都 611130

3南京理工大学经济管理学院 南京 210094

Ontology Reasoning for Financial Affairs with RBR and CBR

Qiang Shaohua,,1, Luo Yunlu2, Li Yupeng1, Wu Peng3

1School of Economics and Management, Nanjing Tech University, Nanjing 211800, China

2School of Economic Information Engineering, Southwestern University of Finance and Economics, Chengdu 611130, China

3School of Economics and Management, Nanjing University of Science &Technology, Nanjing 210094, China;

通讯作者: 强韶华, ORCID: 0000-0001-7797-3554, E-mail:shaohua3900@163.com

收稿日期: 2018-10-16   修回日期: 2019-02-3   网络出版日期: 2019-08-25

基金资助: *本文系国家自然科学基金项目“突发事件网民负面情感的模型检测研究”.  71774084
国家自然科学基金项目“基于时间感知模型的学术主题检索与演化挖掘研究”的研究成果之一.  71503124

Received: 2018-10-16   Revised: 2019-02-3   Online: 2019-08-25

摘要

【目的】综合企业财务、非财务和舆情等因素预测金融事件对企业股价的影响, 支持基于特定行业、特定金融事件主题之间的推理。【方法】基于本体的规则推理技术和案例推理技术, 构建金融事件本体, 设计基于本体的SWRL推理规则, 采用Dloors引擎进行规则推理(RBR)。然后利用本体表示案例结构, 建立基于本体的主题事件案例库, 设计案例推理(CBR)表示、检索、重用、修正与保存模型。【结果】基于具体企业实例对规则推理和案例推理的结果进行验证, 证明了本文所提推理模型的可靠性。【局限】本文重点在于金融本体及其推理模型的构建, 股价预测是一种推理结果, 故没有和其他股价预测方法进行定量比较。【结论】融合企业的舆情、财务和非财务指标, 基于金融事件主题的案例推理和基于关联规则的规则推理模型, 可以对大数据环境下企业股价进行预测。

关键词: 金融事件 ; 本体 ; 规则推理 ; 案例推理 ; 股价预测

Abstract

[Objective] This paper tries to predict the impacts of financial events/news on stock price with financial, non-financial and public opinion factors. [Methods] We designed a financial affairs ontology based on the Rule-Based Reasoning (RBR) and Case-Based Reasoning (CBR). Then, we created a SWRL rule-based reasoning model, which pursued the rule-based reasoning using the Dloors engine. Thirdly, we designed a topic case database to describe the structure of the financial cases. Finally, we used the model to describe, retrieve, reuse, correct and preserve the data. [Results] We conducted an empirical study to examine the reliability of rule-based reasoning and case-based reasoning with enterprise data. [Limitations] We did not compare our model with the existing methods. [Conclusions] The proposed method could predict the stock price in big data environment.

Keywords: Financial Affairs ; Ontology ; Rule-Based Reasoning ; Case-Based Reasoning ; Stock Price Forecast

PDF (1029KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

强韶华, 罗云鹿, 李玉鹏, 吴鹏. 基于RBR和CBR的金融事件本体推理研究 *. 数据分析与知识发现[J], 2019, 3(8): 94-104 doi:10.11925/infotech.2096-3467.2018.1137

Qiang Shaohua. Ontology Reasoning for Financial Affairs with RBR and CBR. Data Analysis and Knowledge Discovery[J], 2019, 3(8): 94-104 doi:10.11925/infotech.2096-3467.2018.1137

1 引 言

任何一个金融事件都可能引起巨大的经济波动, 所以如何及时发现潜在的金融事件, 预测经济走势等都是经济学家关心的重点。目前, 金融领域主要的研究对象是结构化的数据——财务报表数据。这样的研究结果对财务报表依赖性很强, 但由于金融领域的复杂特性, 仅仅对金融事件结构化数据进行分析, 而不考虑事件背后隐含的潜在舆情危机, 往往很难得到满意的分析结果。因此如何挖掘财务和非财务数据、结构化和非结构化数据、网民情感等各类数据间的关系和规则, 是金融领域在大数据时代面临的新挑战。

在现代知识表示方法中, 本体是一种表达和推理能力较强的新方法, 本体的理论及应用、基于案例的推理、基于规则的推理等研究都比较成熟。但在金融舆情方面, 基于金融本体的研究较少, 且金融本体的构建大多只考虑企业的财务指标和非财务指标, 未将舆情指标纳入金融本体之中。另外, 在对金融舆情的研究中, 大部分通过识别金融事件对股票波动分析提供支持, 缺少通过关联财务、非财务和舆情指标构建金融舆情本体, 设计本体推理模型, 支持基于特定行业、特定金融事件的企业股票波动预测。

本文基于本体构建和推理方法, 研究大数据环境下金融舆情中网民负面情感特征词表、特征词抽取、主题分类、属性构成、关联规则, 分析财务指标、非财务指标和舆情指标之间的关系, 金融事件主题分类关系等, 构建金融舆情网民负面情感状态本体, 设计基于金融事件主题的案例推理和基于关联规则的规则推理模型, 支持基于特定行业、特定金融事件主题的推理。

2 研究现状

2.1 金融本体技术发展与金融事件识别应用

外文文献对金融本体的研究主要集中在领域本体构造、本体在信息检索、数据质量管理、文本挖掘、风险管理中的应用等方面。例如Wang等基于本体的综合舆情信息的金融产品定价指标体系[1]。Cheng等基于本体的金融商务智能系统[2]。Shue等基于本体的金融产品定价专家系统[3]。Mellouli等基于本体和多Agent系统对金融热点新闻的预测[4]。Lupiani-Ruiz等基于本体的金融舆情语义搜索引擎[5]。Du等基于本体的金融数据质量管理[6]。近年来, 相关研究聚焦于金融事件的识别, 例如Chowdhuri等基于本体的金融文本挖掘和决策支持[7]。Ren等基于本体的金融新闻个性化推荐[8]。Organ等基于本体的金融事件风险控制系统[9]。中文文献也陆续出现了基于本体的金融事件识别研究, 例如韩立炜利用金融语义本体, 实现了金融信息的自动标注, 并利用词性标注和相关规则进行金融事件提取, 验证了通过本体进行金融事件跟踪的可行性[10]。刘立博利用基于本体标注聚类方式发现金融事件, 利用金融本体有效地发现对股票波动产生影响的金融事件[11]。李国林利用金融本体计算每个情感词中的语素情感值, 通过语素情感值的加权得到词汇情感值, 并通过句法模式分析、句法模式树构建等步骤完成Web金融文本信息的情感计算[12]。汪奕丁借鉴ACE语料库设计和构建了金融事件文本语料库, 利用相关规则和机器学习的方式对金融事件进行有效抽取, 对金融事件与股市时序数据的关联关系进行分析, 实现了结合文本特征和金融时序数据特征的金融事件类型识别以及金融热点事件发现[13]。但是上述研究主要利用本体进行金融信息的组织和语义检索, 缺乏基于本体的推理研究和应用。

2.2 本体推理

本体推理的重要作用主要体现在对知识进行一致性检测和包含检测, 其中主要的推理方法是案例推理(Case-Based Reasoning, CRB)和基于规则的推理(Rule-Based Reasoning, RBR)。

(1) 案例推理是将过去求解问题的经验定义为案例并使用案例来求解新的类似的问题[14]。对于事件案例推理系统来说, 即是将事件表示为案例, 通过对相似事件案例的检索, 为新事件的发生结果提供辅助决策。本体与案例推理相结合, 可以将案例所表达的知识与用本体表示的一般领域知识模型进行整合, 这样基于本体的案例推理过程可以充分利用领域知识获取更精确和全面的结果[15,16]。近年来, 将本体与案例推理相结合解决某领域问题的研究逐渐增多, 例如医疗产品分解组配[17]、生态术语关联[18]、复杂产品设计[19]、结合多Agent系统进行制造流程问题解决[20]、诊疗知识重用与推理[21]

(2) 基于规则的推理是一种专家系统, 其按照知识表示技术进行分类, 根据某一领域内专家的经验和知识, 将其归纳为规则, 规则推理能根据有限的事实获得确定的结论[22]。目前基于本体和RBR, 以及结合本体、RBR、CBR方法开展相关研究正成为热点。例如结合本体OWL语言、SWRL技术和RBR进行电子商务反欺诈[23]、复杂系统设计[24]、案件追踪[25]的规则推理, 结合SPARQL协议、RDF语言和RBR进行环境检测规则推理[26], 以及结合本体、RBR、CRB进行商品供应链设计[27]和主动跌落保护系统设计[28]

3 金融本体推理模型设计

从金融本体的设计、规则推理的设计和案例推理的设计三个方面完成对金融本体推理模型的设计。具体流程如图1所示。

图1

图1   金融事件本体推理模型构建框架


(1) 金融本体的设计思路参考骨架法开发策略和斯坦福大学的7步法。

(2) 规则推理包括SWRL的概念及其组成结构、构建本体库的SWRL规则设计。

(3) 案例推理部分首先设计了基于本体的企业金融舆情案例的案例表示方法、案例检索方法、企业金融舆情案例推理流程, 并根据研究案例, 从局部和整体两方面设计案例相似度计算方法, 以及设计案例的重用、修正、学习、维护过程。

3.1 金融本体设计

面向金融领域构建本体, 以在同花顺财经网、新浪微博、股吧三个网站上采集的各领域公司的财务、非财务和舆情信息作为数据源, 以公司年报内容为基础, 建立金融领域本体知识库。共采集74家企业45 621条财务和非财务数据, 经过数据清洗、数据组织和数据挖掘后得到权重值和相关度较高的13个财务指标和5个非财务指标, 并将其按所属类型划分总结金融领域本体财务和非财务指标的类结构。依据上述工作成果, 结合相关文献分析, 以及金融工程研究学者、金融企业的投资银行和银行风险管理领域专家协助, 设计完整的金融本体类。本研究构建的金融领域本体类详细结构如表1所示。

表1   金融领域本体类详细结构

评测指标备注
所处行业
舆情股市情绪网民情感
财务指标发展能力净利润增长率
现金流水平全部现金回收率
盈利能力净资产收益率、成本费用利润率、营业利润率、资产报酬率
经营能力固定资产周转率、应收账款周转率、总资产周转率、流动资产周转率
风险能力经营杠杆、综合杠杆、财务杠杆
非财务指标专利数量
信息披露
社会责任
子公司数
媒体和机构关注度
金融事件政府政策
自身危机
行业创新
股价事件发生前5天涨跌
事件发生前10天涨跌
事件发生后股价涨跌

新窗口打开| 下载CSV


本文研究目的是实现支持基于特定行业、特定金融事件主题之间的两种推理, 选取属于传播文化行业并于2016年11月陷于经营危机事件的乐视科技、属于食品饮料行业并于2018年1月陷入公关危机事件的贵州茅台集团和属于农林牧渔行业并于2018年2月陷入产品危机事件的獐子岛集团作为金融本体的实例融本体中, 为后续推理工作提供支持。

3.2 基于本体的SWRL规则推理设计

基于文献[23,24,25]的研究成果, 结合SWRL语言建立本体规则推理模型。规则推理过程中需要解决的问题主要包括两个方面:

(1) 根据企业的财务、非财务数据和事件发生后的舆情数据, 得到该企业股价评分。

(2) 根据该企业的股价评分, 给予该企业股价是否涨跌的判断结果。

建立规则库后, 将本体库的事实和规则转换为Drools的事实和规则, 运行后得到推理结论, 然后将得到的新知识反馈给本体知识库。使用SWRL作为描述规则的语法, 在设计规则时遵循以下原则: 明确条件与结果之间的关联; 满足Horn子句形式, 以便后续处理; 规则之间必须是无矛盾的。在满足上述原则前提下, 根据基于大数据分析的企业信用评价与预测研究成果[16,29-31], 总结归纳了10条规则, 如表2所示。

表2   规则列表

规则说明
规则1发展能力=0.074×净利润增长率
规则2现金流水平=0.074×全部现金回收率
规则3盈利能力=0.083×净资产收益率+0.074×成本费用利润率+0.083×营业利润率+0.078×资产报酬率
规则4经营能力=0.088×固定资产周转率+0.078×应收账款周转率+0.088×总资产周转率+0.088×流动资产周转率
规则5风险水平=0.069×经营杠杆+0.0698×综合杠杆+0.064×财务杠杆
规则6财务指标=发展能力+现金流水平+盈利能力+经营能力+风险水平
规则7非财务指标=0.17×专利数量+0.392×社会责任+0.545×媒体和分析机构关注度+0.352×信息披露+0.441×子公司数
规则8舆情=1×正面评论数+0×中性评论数+(-1)×负面评论数
规则9股价后续发展得分=0.65×财务指标+0.17×非财务指标+0.18×舆情
规则10股价得分≥90 →股价极有可能上涨, 61<股价得分<89→股价可能上涨, 31<股价得分<60→股价持平, 股价得分<30→股价下跌

新窗口打开| 下载CSV


3.3 基于本体的金融事件案例推理设计

基于本体表示案例结构, 将与股票市场主题事件相关的概念和概念间的关系等信息进行抽象化, 并提取主题事件案例特征选择、本体表示、主题事件类型本体结构定义, 采用OWL-DL语言描述本体, 采用Protégé4.2作为本体库构建工具, 构建案例库, 支持案例推理。

(1) 案例表示

案例是对某类事件的记录, 包含事件发生的知识背景以及结果和解决措施。案例包含三个方面的内容[32], 分别是问题描述、解决方案和结果。案例表示是否正确和恰当直接影响案例检索的效果和质量, 通过案例推理需要解决的问题对案例的表示进行设计。基于本体的案例表示能提高案例检索的查全率与查准率, 利用本体中清晰的类和类层次关系更好地组织案例, 更好地将案例推理和规则推理相结合[28]。根据企业经营涉及的4方面特征属性来表示案例, 建立的领域概念层次关系如图2所示。主要概念术语如下。

①描述企业基础信息的术语, 包括公司信息详细介绍(公司名称、董事长、所属地域);

②描述企业发生的金融事件的术语, 包括事件基本信息(事件名称、事件类型)和事件前市场描述(事件前5天股价涨跌、事件前10天股价涨跌、事件)和事件影响结果(事件发生后10天股价涨跌);

③描述事件企业舆情方面的术语, 包括企业在金融事件中的舆情状况;

④描述企业经营情况的术语, 包括财务状况(发展能力、经营能力、盈利能力、风险水平、现金流水平)和非财务状况(专利数量、子公司数、社会责任、分析机构和媒体关注度)。

图2

图2   金融领域概念层次结构


(2) 案例检索

案例检索是将对某一事件的定义与描述作为检索条件, 从建立的案例库中检索出最为相似的案例, 并将此案例的解决方案和结果作为参考信息提供给新案例。相似度计算是案例检索中最为重要的一部分, 通过计算各个案例之间的相似度, 可以使检索案例的案例描述与问题案例的案例描述相似度最大化, 从而提供最可靠信息。

①案例推理流程设计

通过案例推理能够达到案例存储的优化, 同时提高案例库的决策分析能力。案例推理的总流程如图3所示, 基于企业金融事件的案例推理的基本流程如下。

图3

图3   案例推理流程


1)根据用户提交的信息, 具体包括: 企业信息、事件类别、经营水平(财务指标和非财务指标)、舆情状况和金融事件发生前的市场描述等, 在案例事件库中检索。

2)若案例库中没有相似案例, 则将问题案例存入案例库, 若存在相似案例, 则根据相似度高低返回案例, 并提供所需要的相关信息。

3)用户通过分析相似案例的相关信息, 对问题案例进行预测。

②案例相似度计算方法设计

案例检索的效率和结果直接影响到CRB系统推理结果的科学性。由于案例推理需要通过相似度计算的结果确定问题案例和检索案例是否相似, 因此相似度计算是案例检索是否有效的关键。案例相似度计算过程可分解为两个步骤: 计算案例间的局部相似度和计算案例间的总体相似度。此外, 结合本研究构建的本体和基于本体的案例表示, 将局部相似度的计算分为三种类型: 数值型属性、符号型属性、对象型属性相似度计算。对于不同的属性相似度计算类型和总体相似度计算分别给出以下计算公式。

1)局部相似度计算

a.数值型属性相似度计算

本文中的“财务指标”和“非财务指标”等属性均属于该类型。数值型属性局部相似度可表示如公式(1)所示。其中XiYi分别表示案例X和案例Y的第i个属性值, maxi、mini表示该属性值域的范围。

$Sim({{X}_{i}},{{Y}_{i}})=1-\frac{\left| {{X}_{i}}-{{Y}_{i}} \right|}{{{\max }_{i}}-{{\min }_{i}}}$

b.符号型属性相似度计算

符号型属性值属于枚举值, 通过枚举该属性所有的可能取值来获取其值。本文的“事件前5天平均涨跌”、“事件前10天平均涨跌”等属性均属于该类型。其值分别是: 上涨、下跌和持平。符号型相似度计算可表示如公式(2)所示。其中XiYi分别表示案例X和案例Y的第i个属性值, 当XiYi属性值相同时则Sim(Xi, Yi)值为1, 反之则为0。

$Sim({{X}_{i}},{{Y}_{i}})=\left\{ \begin{align} & 1\ \ \ \ \ {{X}_{i}}={{Y}_{i}} \\ & 0\ \ \ \ {{X}_{i}}\ne {{Y}_{i}} \\ \end{align} \right.$

c.对象属性相似度计算

对象属性的相似度及本体概念类特征项的相似度具有较高的检索效率。对象属性相似度计算如公式(3)所示。其中Depth(Lcs(xi, yi))表示两个给定实例之间距离最近的共同父类的概念。cj为当前需要计算的概念, cn为所有概念, Depth(Cj)表示某个概念或实例在概念树中的深度。

$Sim({{X}_{i}},{{Y}_{i}})=1-\frac{\max (Depth(Lcs({{x}_{i}},{{y}_{i}})))}{\max (Depth({{c}_{j}}))}\ \ {{c}_{j}}\in {{c}_{n}}$

产品危机和人事危机的距离最近的共同父概念是自身危机, 距离为1, 因此公式(3)中的分子为1。产品危机和人事危机在本体层次结构中最大的层次数为5, 由此可得到产品危机和人事危机的相似度为4/5。同理, 公共政策和产品创新的距离最近的共同父概念是事件类型, 距离为2。公共政策和产品创新在本体层次结构中最大的层次数为5, 由此可得到公共政策和产品创新的相似度为3/5。产品危机和人事危机、公共政策和产品创新两组概念的相似度计算结果如表3所示。

表3   相似度计算结果

概念类相似度
Sim (产品危机, 人事危机)4/5
Sim (公共政策, 产品创新)3/5

新窗口打开| 下载CSV


2)总体相似度计算

得到案例间各个特征的局部相似度后, 将局部案例进行加权得到案例间的总体相似度, 案例间的总体相似度可以表示为公式(4)。其中Sim(i1, i2)表示两个案例间的总相似度, wj表示第j个属性的权重, Sim(Xj, Yj)表示第j个的相似度即案例间的局部相似度。

$Sim({{i}_{1}},{{i}_{2}})={\sum\limits_{1}^{n}{[{{w}_{j}}\times Sim({{X}_{j}},{{Y}_{j}})]}}/{\sum\limits_{1}^{n}{{{w}_{j}}}}\;$

(3) 案例重用、修正与保存设计

案例重用是将相似度最高的案例中的相关信息作为有价值的信息应用到新案例中, 并借此推理新案例的事件结果[33]。案例的保存是案例库中案例数量与质量的关键。由于构建案例库时预先存储案例是有限的,需要在案例推理过程中进行案例的保存与积累, 不断将新案例保存在临时案例库中, 并通过领域专家的分析和筛选, 将典型的案例保存到案例库中并更新案例库。在实际操作中, 将阈值设定为$\alpha$, $\alpha$$\in$[0,1], 定义的相似度如公式(5)-公式(8)所示。

$Sim({{c}_{i}},{{c}_{j}})=1$
$\alpha Sim({{c}_{i}},{{c}_{j}})1$
$0Sim({{c}_{i}},{{c}_{j}})\alpha$
$Sim({{c}_{i}},{{c}_{j}})=0$

完全匹配情况(公式(5))表示两案例间相似度高, 可以直接重用该案例的相关信息预测新案例的结果。可能相似度(公式(6))表示案例并不完全适配新案例, 需要以新案例的实际情况为依据, 修改相应案例。完全不匹配(公式(8))和最低程度相似(公式(7))表示案例库中的案例与新案例相似度均未超过阈值, 无案例与之匹配, 需要在案例库中保存该案例, 完善案例库。

在本文中, 若企业发生同类型金融事件, 当事件中企业股价波动情况相近时, 说明两个案例的相似度较高, 两案例相似。此时可以重用检索到的案例的事件信息和事件结果, 将其作为新案例的事件结果的参考信息, 从而对新案例做出预测。在案例修正部分, 针对企业经历金融事件后股价的涨跌预测, 采用结构修正法对案例进行修正。因为结果集是新案例与相似案例的排序, 可将领域专家的意见与收集的相关信息进行综合, 进而对新案例的股价涨跌进行预测, 并将修正后的案例存入案例库。

4 金融本体系统实现

4.1 金融领域本体

建立的金融本体的类如图4所示, 建立的企业实例如图5所示(以乐视企业为例)。建立的金融领域本体共有类38个、关系属性39个、企业实例3个, 形成的金融事件本体如图6所示。

图4

图4   金融领域本体的类


图5

图5   乐视企业本体实例


图6

图6   金融事件本体


4.2 基于本体的SWRL规则推理的实现

(1) 转化推理规则

基于SWRL中Atom的推理规则, 将规则从自然语言翻译为SWRL中的Atom, 建立股价涨跌规则中的Atom列表。例如“企业舆情是否为正”这个规则是通过公司各项非财务数据计算, 函数表达式如公式(9)所示, 转化为SWRL规则的表达式如式(10)—式(11)所示。

$\begin{matrix} & 非财务指标\mathrm{=0}\mathrm{.17}\times 专利数量\mathrm{+0}\mathrm{.392}\times 社会责任 \\ & \mathrm{+0}\mathrm{.545}\times 媒体和分析机构关注度 \\ & \mathrm{+0}\mathrm{.352}\times 信息披露\mathrm{+0}\mathrm{.441}\times 子公司数 \end{matrix}$
$\begin{matrix} & 企业\mathrm{(}a\mathrm{)}\wedge 专利数量\mathrm{(}?\beta \mathrm{)}\wedge 子公司数\mathrm{(}?\text{c}\mathrm{)}\wedge \\ & 社会责任\mathrm{(}?e\mathrm{)}\wedge 媒体和分析机构关注度\mathrm{(}?f\mathrm{)}\wedge \\ \end{matrix}$
$\begin{matrix} & 指标权重\mathrm{(?B)}\wedge指标权重\mathrm{(?C)}\wedge指标权重\mathrm{(?D)}\wedge \\ &指标权重\mathrm{(?E)}\wedge指标权重\mathrm{(?F)}\wedge指标权重mathrm{(?}\text{g}\mathrm{)}\wedge \\ \end{matrix}$

(2) 规则推理的实现

建立SWRL规则库的目的是更有效地对本体库进行推理和查询。本文使用的Dloors推理机在解释OWL和SWRL时, 通过解析器将OWL本体知识转换为Dloors事实, 将SWRL规则转换为Dloors规则。在进行规则推理时, 其输入变量为实例企业的财务、非财务和舆情数值。财务指标取自该企业发生金融事件同年企业年报, 如净利润增长率、固定资产回收率等数值均是根据年报相关内容通过其指标的计算公式得到。非财务指标通过同花顺财经网获得。舆情数值则是通过爬取新浪微博和股吧的用户对该企业发生金融事件后的评论计算得到。将企业的财务指标数值、非财务指标数值和舆情数值三部分数值录入本体的企业实例中, 在SWRTab插件中利用Dloors推理机进行规则推理, 推理完成后输出企业发生金融事件后该企业股价涨跌情况预测。

将企业的财务、非财务和舆情指标数值输入企业实例后, 在SWRTab插件中利用Dloors推理机进行规则推理, 推理机界面如图7所示, 可以看出企业实例“乐视”新增了一个“change”属性“股价持平”, 乐视发生金融事件5天后的企业股价变化如图8所示, 可以看出自2016年11月6日, 乐视贾跃亭宣布因企业发展过快, 导致企业资金不足, 供应链出现问题, 企业需停止扩张开始, 乐视的股价基本处于在19元上下浮动的持平状态。此情况与基于规则推理的结果相同, 证明基于规则的推理是有效的且具有可信性。

图7

图7   Dloors推理机


图8

图8   金融事件发生后股价变化


4.3 基于本体的金融事件案例推理的实现

使用乐视案例对2018年1月发生金融事件的贵州茅台进行股价涨跌预测。通过同花顺财经网、新浪微博和股吧等网站获取贵州茅台的相关数据, 计算得到乐视案例和贵州茅台案例间相似度。计算案例相似度后, 将相似度超过阈值的案例按相似度高低排序返回, 并且相似度最大的案例事件结果作为问题案例的事件推理结果。乐视和茅台相似度计算结果如表4所示, 可以看出, 乐视和茅台的金融舆情状况和金融事件状况都较为相似, 财务状况和非财务状况差异较大, 因为乐视遭遇的是经营危机, 其资金链出现问题, 产生资金短缺导致财务状况较差, 乐视是综合性较强的高科技企业, 专利数量与媒体关注度等都远远超过茅台集团, 所以其非财务状况远超于贵州茅台集团。对于乐视金融事件案例而言, 事件发生后市场短期内表现为下跌: 涨跌-1.22%、振幅8.21%。对于贵州茅台金融事件案例而言, 事件发生后市场短期内也表现为下跌: 涨跌-2.51%、振幅17.56%。乐视事件发生后的短期市场走势与贵州茅台集团事件发生后的短期市场走势具有一定相似性, 通过案例检索进行企业股价涨跌预测具备可行性。通过实验表明该推理方法设计思路基本合理, 实现方法可行有效。

表4   案例间相似度计算结果

属性名称乐视案例贵州茅台案例相似度属性权重加权相似度
所处行业传播文化食品饮料00.050
金融舆情-0.285-0.2630.9780.200.196
财务状况65.62150.340.5110.360.184
非财务状况153.4444.130.2210.090.020
金融事件经营危机、前5天股价下跌、前10天股价下跌、后5天股价下跌产品危机、前5天股价上涨、前10天股价下跌、后5天股价下跌0.6900.300.207
相似度总和0.607

新窗口打开| 下载CSV


5 结 语

本文结合企业经营情况评判标准及金融领域知识, 构建企业金融领域本体库, 对企业的财务数据、非财务数据、舆情状况与企业股价之间的变化关系进行研究, 建立企业在金融事件中的推理规则, 将上述规则转化为SWRL规则, 并完成了企业金融事件规则库的开发, 使用Dloors推理引擎实现企业金融事件中的规则推理, 实现金融领域本体知识库的功能。将本体技术引入到CRB中, 提出企业金融舆情案例表示方法。在案例检索过程中针对属性类型的不同设计不同的属性相似度计算方法。设计案例推理的工作流程并讨论了案例的重用、修正以及案例库的维护等。

本文在本体案例库的设计规模、基于知识的本体推理系统设计、金融领域本体术语设计、基于本体的CBR+RBR关联模型设计上仍然存在局限, 未来可以在这些方面开展深入的研究工作。

作者贡献声明

强韶华: 提出研究思路, 设计研究方案, 撰写并修改论文;

罗云鹿: 采集、清洗和分析数据, 进行实验;

李玉鹏: 采集、清洗数据;

吴鹏: 论文最终版本修订。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail:shaohua3900@163.com。

[1] 强韶华. 基于RBR和CBR的金融事件本体推理研究数据文件. rar. 金融本体模型与数据.

参考文献

Wang S, Zhe Z, Kang Y , et al.

An Ontology for Causal Relationships Between News and Financial Instruments

[J]. Expert Systems with Applications, 2008,35(3):569-580.

[本文引用: 1]

Cheng H, Lu Y C, Sheu C .

An Ontology-Based Business Intelligence Application in a Financial Knowledge Management System

[J]. Expert Systems with Applications, 2009,36(2):3614-3622.

[本文引用: 1]

Shue L Y, Chen C W, Shiue W .

The Development of an Ontology-Based Expert System for Corporate Financial Rating

[J]. Expert Systems with Applications, 2009,36(2):2130-2142.

[本文引用: 1]

Mellouli S, Bouslama F, Akande A .

An Ontology for Representing Financial Headline News

[J]. Web Semantics Science Services & Agents on the World Wide Web, 2010,8(2-3):203-208.

[本文引用: 1]

Lupiani-Ruiz E, García-Manotas I, Valencia-García R , et al.

Financial News Semantic Search Engine

[J]. Expert Systems with Applications, 2011,38(12):15565-15572.

[本文引用: 1]

Du J, Zhou L .

Improving Financial Data Quality Using Ontologies

[J]. Decision Support Systems, 2012,54(1):76-86.

[本文引用: 1]

Chowdhuri R, Yoon V Y, Redmond R T , et al.

Ontology Based Integration of XBRL Filings for Financial Decision Making

[J]. Decision Support Systems, 2014,68:64-76.

[本文引用: 1]

Ren R, Zhang L, Cui L , et al.

Personalized Financial News Recommendation Algorithm Based on Ontology

[J]. Procedia Computer Science, 2015,55:843-851.

[本文引用: 1]

Organ J, Stapleton L .

The Control of Human Factors in Catastrophic Financial Systems Risk Using Ontologies

[J]. International Federation of Automatic Control, 2017,50(1):6367-6372.

[本文引用: 1]

韩立炜 .

基于本体的金融事件跟踪

[D]. 哈尔滨: 哈尔滨工业大学, 2009.

[本文引用: 1]

( Han Liwei .

Ontology-Based Financial Events Tracking

[D]. Harbin: Harbin Institute of Technology, 2009.)

[本文引用: 1]

刘立博 .

基于异构信息的金融事件发现

[D]. 哈尔滨: 哈尔滨工业大学, 2010.

[本文引用: 1]

( Liu Libo .

Heterogeneous Information Based Financial Event Detection

[D]. Harbin: Harbin Institute of Technology, 2010.)

[本文引用: 1]

李国林 .

基于语义分析的Web金融文本信息情感计算

[D]. 南昌: 江西财经大学, 2012.

[本文引用: 1]

( Li Guolin .

Sentimental Computaiton of Web Financial Text Based on Sentimental Analysis

[D]. Nanchang: Jiangxi University of Finance & Economics, 2012.)

[本文引用: 1]

汪奕丁 .

结合文本与时序数据的金融事件发现研究

[D]. 哈尔滨: 哈尔滨工业大学, 2015.

[本文引用: 1]

( Wang Yiding .

Research on Financial Events Detection by Incorporating Text and Time-Series Data

[D]. Harbin: Harbin Institute of Technology, 2015.)

[本文引用: 1]

Kolodner J L .

An Introduction to Case-Based Reasoning

[J]. Artificial Intelligence Review, 1992,6(1):3-34.

[本文引用: 1]

谢红薇, 李建伟 .

基于本体的案例推理模型研究

[J]. 计算机应用研究, 2009,26(4):1422-1424.

[本文引用: 1]

( Xie Hongwei, Li Jianwei .

Research of Case-based Reasoning Model Based on Ontology

[J]. Application Research of Computers, 2009,26(4):1422-1424.)

[本文引用: 1]

何岩新, 倪丽萍, 曹琳 .

基于本体的股票主题事件案例推理系统研究

[J]. 计算机技术与发展, 2016,26(1):33-38.

[本文引用: 2]

( He Yanxin, Ni Liping, Cao Lin .

Research on Case Based Reasoning System of Stock Theme Events Based on Ontology

[J]. Computer Technology and Development, 2016,26(1):33-38.)

[本文引用: 2]

Chen S, Yi J, Jiang H , et al.

Ontology and CBR Based Automated Decision-Making Method for the Disassembly of Mechanical Products

[J]. Advanced Engineering Informatics, 2016,30(3):564-584.

[本文引用: 1]

Gerber A, Morar N, Meyer T , et al.

Ontology-Based Support for Taxonomic Functions

[J]. Ecological Informatics, 2017,41:11-23.

[本文引用: 1]

Abadi A, Ben-Azza H, Sekkat S .

Improving Integrated Product Design Using SWRL Rules Expression and Ontology-Based Reasoning

[J]. Procedia Computer Science, 2018,127:416-425.

[本文引用: 1]

Camarillo A, Ríos J, Althoff K-D .

Knowledge-Based Multi-Agent System for Manufacturing Problem Solving Process in Production Plants

[J]. Journal of Manufacturing Systems, 2018,47:115-127.

[本文引用: 1]

Roldán-García M D M, Uskudarli S, Marvasti N B , et al.

Towards an Ontology-Driven Clinical Experience Sharing Ecosystem: Demonstration with Liver Cases

[J]. Expert Systems with Applications, 2018,101:176-195.

[本文引用: 1]

陈明亮, 李怀祖 .

基于规则的专家系统中不确定性推理的研究

[J]. 计算机工程与应用, 2000,36(5):50-53.

[本文引用: 1]

( Chen Mingliang, Li Huaizu .

Study on the Non-Accurate Inference in Expert System Based on Rule

[J]. Computer Engineering and Applications, 2000,36(5):50-53.)

[本文引用: 1]

Roldán-García M D M, García-Nieto J, Aldana-Montes J F .

Enhancing Semantic Consistency in Anti-Fraud Rule-Based Expert Systems

[J]. Expert Systems with Applications, 2017,90:332-343.

[本文引用: 2]

Tang X, Xiao M, Hu B , et al.

Exchanging Knowledge for Test-Based Diagnosis Using OWL Ontologies and SWRL Rules

[J]. Procedia Computer Science, 2018,131:847-854.

[本文引用: 2]

EI Ghosh M, Naja H, Abdulrab H , et al.

Towards a Legal Rule-Based System Grounded on the Integration of Criminal Domain Ontology and Rules

[J]. Procedia Computer Science, 2017,112:632-642.

[本文引用: 2]

Zhong B, Gan C, Luo H , et al.

Ontology-Based Framework for Building Environmental Monitoring and Compliance Checking Under BIM Environment

[J]. Building & Environment, 2018,141:127-142.

[本文引用: 1]

Pal K .

Ontology-Based Web Service Architecture for Retail Supply Chain Management

[J]. Procedia Computer Science, 2018,130:985-990.

[本文引用: 1]

Goh Y M, Guo B H W .

FPSWizard: A Web-Based CBR-RBR System for Supporting the Design of Active Fall Protection Systems

[J]. Automation in Construction, 2018,85:40-50.

[本文引用: 2]

崔亮 .

投资者情绪的统计测评及其应用研究

[D]. 成都: 西南财经大学, 2013.

[本文引用: 1]

( Cui Liang .

A Study on Statistical Evaluation of Investor Sentiment and Its Application

[D]. Chengdu: Southwest University of Finance and Economics, 2013.)

[本文引用: 1]

张欣 .

投资者情绪与上市公司投资行为研究

[D]. 乌鲁木齐: 新疆财经大学, 2013.

( Zhang Xin .

The Research on Investor Sentiment and Investment Behavior of Listed Companies

[D]. Urumqi: Xinjiang University of Finance and Economics, 2013.)

沈云霞 .

基于股吧舆情的投资者情绪与股票收益研究

[D]. 天津: 天津工业大学, 2016.

[本文引用: 1]

( Shen Yunxia .

Research on the Investor Sentiment and Stock Returns Based on the Opinion of the Stock Forum

[D]. Tianjin: Tianjin Polytechinic University, 2016.)

[本文引用: 1]

Qin Y, Lu W, Qi Q , et al.

Towards an Ontology-Supported Case-Based Reasoning Approach for Computer-Aided Tolerance Specification

[J]. Knowledge-Based Systems, 2018,141:129-147.

[本文引用: 1]

焦海霞 .

基于本体的地铁施工安全风险知识库构建与应用

[D]. 南京: 东南大学, 2015.

[本文引用: 1]

( Jiao Haixia .

Modeling and Application of Ontology Based Konwledge Base Forrisks of Subway Construction

[D]. Nanjing: Southeast University, 2015.)

[本文引用: 1]

/

版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn