基于二部图的P2P网络借贷投资组合决策方法 *

doi:10.11925/infotech.2096-3467.2019.0357

基于二部图的P2P网络借贷投资组合决策方法 ^*

丁勇¹^,², 程璐^,^,¹, 蒋翠清¹^,²

1 合肥工业大学管理学院合肥 230009

2 过程优化与智能决策教育部重点实验室合肥 230009

Choosing Portfolios Based on Bipartite Graph of P2P Lending Networks

Ding Yong¹^,², Cheng Lu^,^,¹, Jiang Cuiqing¹^,²

1 School of Management, Hefei University of Technology, Hefei 230009, China

2 Key Laboratory of Process Optimization and Intelligent Decision-making of Ministry of Education, Hefei 230009, China

通讯作者: 程璐, ORCID: 0000-0001-7602-0452, E-mail:chengluhs@163.com

收稿日期: 2019-04-3 修回日期: 2019-09-13 网络出版日期: 2019-12-25

基金资助:

*本文系教育部人文社会科学规划基金项目“社会化媒体对企业绩效的影响机制研究”. 项目编号: 15YJA630010
国家自然科学基金重点项目“大数据环境下的微观信用评价理论与方法研究”. 项目编号: 71731005

Received: 2019-04-3 Revised: 2019-09-13 Online: 2019-12-25

摘要

【目的】基于网贷数据, 通过推荐算法和投资组合理论, 帮助投资者选择投资产品、确定投资金额, 从而提高投资者的满意度和收益率。【方法】基于人人贷交易数据, 通过构建P2P场景下的二部图关系网络图, 利用基于二部图的推荐算法和马科维茨投资组合理论为投资者确定投资产品和投资比例。【结果】实验结果表明, 在不同的k值(5、15、25、35、45、50)下, 简单权值改进的二部图推荐算法PNBI的准确率(0.055、0.044、0.039、0.035、0.036、0.032)均高于基于用户的协同过滤算法UCF(0.022、0.019、0.032、0.032、0.033、0.034)和基于物品的协同过滤算法ICF(0.007、0.013、0.014、0.014、0.014、0.014)。PNBI召回率同样高于其他两种算法。【局限】实验数据集有待进一步扩充。【结论】将推荐算法和组合理论相结合, 可以显著提高投资者的满意度以及投资者最终的实际回报率。

关键词： P2P网络借贷 ; 二部图 ; 推荐算法 ; 投资组合 ; 决策方法

Abstract

[Objective] This paper proposes a method based on recommendation algorithm, portfolio theory and the actual data of China’s online lending market, aiming to help investors make better decisions. [Methods] We collected data from Renren’s Loan Transaction and constructed a bipartite graph network graph for the P2P scenario. Then, we used the recommendation algorithm and Markowitz portfolio theory to choose the investment products. [Results] Under different K values, the accuracy of the improved bipartite graph recommendation algorithm with simple weight were 0.055, 0.044, 0.039, 0.035, 0.036 and 0.032. These results were higher than those of the user-based collaborative filtering algorithms UCF (0.022, 0.019, 0.032, 0.032, 0.033, 0.034) and item-based collaborative filtering algorithms ICF (0.007, 0.013, 0.014, 0.014, 0.014, 0.014). The recall rate was also higher than those of the other two algorithms. [Limitations] The sample dataset needs to be expanded. [Conclusions] Combining recommendation algorithm with group theory could find portfolios with better return of investments.

Keywords： P2P Network Lending ; Bipartite Graph ; Recommendation Algorithm ; Investment Portfolio ; Decision Method

PDF (551KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

丁勇, 程璐, 蒋翠清. 基于二部图的P2P网络借贷投资组合决策方法 ^*. 数据分析与知识发现[J], 2019, 3(12): 76-83 doi:10.11925/infotech.2096-3467.2019.0357

Ding Yong. Choosing Portfolios Based on Bipartite Graph of P2P Lending Networks. Data Analysis and Knowledge Discovery[J], 2019, 3(12): 76-83 doi:10.11925/infotech.2096-3467.2019.0357

1 引言

P2P借贷是基于互联网的在线金融模式, 该模式将拥有闲散资金的投资者和想要筹到资金的借款者联系在一起, 为投资者提供一种投资途径^[1]。互联网的迅速发展与普及使得P2P借贷得到飞速发展, 借贷平台越来越多, 参与借贷的人数也迅速增长。一方面促进了互联网金融更好地服务实体经济发展, 既节约时间成本, 也降低了市场准入的门槛, 优化了金融资源的市场配置效率; 另一方面, 借贷中交易双方掌握和观测到的信息量有差异, 投资者在交易过程中处于绝对的信息劣势, 而投资者作为借贷市场的参与主体之一, 如何在信息不对称的情况下获得满意的收益率面临着巨大的挑战^[2,3]。

基于此, 如何利用海量的交易数据, 运用数据挖掘技术探索隐藏的信息, 帮助投资者做出更好的决策尤为重要。本文以人人贷数据为基础, 构建关于投资者和借款者的二部图网络, 并利用推荐算法和投资组合理论帮助投资者进行决策以提高投资者的满意度和收益率。

本文将需要筹集资金的一方统称为借款者, 即借方; 投资资金的一方统称为投资者, 即贷方。借款者申请一笔贷款和投资者投资一笔借款统称为一笔借款。假设借款者A在P2P平台上申请一笔贷款L, 投资者B对贷款L进行投资, 那么借款者A为借方, 投资者B为贷方, 由于贷款L对于借贷双方有不同的表达方式, 在本文中统称为一笔借款, 一笔借款可以由多个投资者进行投资, 而一个借款者可以申请多笔借款。

2 研究现状

在P2P借贷中, 借款者的个人信息和借款标的信息被看成是评估贷款是否会违约的重要信息。现有研究关于信用风险有两方面的研究。

(1) 关于信用指标的研究

根据Stein^[4]的研究结果, 将信用风险度量指标分为硬信息和软信息两类, 硬信息指能够被客观证实的信息, 如借款者资产、负债、工作、年龄、房产等; 而软信息是指不容易被客观证实的信息, 如借款目的等描述性语言。在硬信息方面, 操玮等^[5]利用随机森林的方法选择特征, 认为年龄、婚姻状况、逾期次数、还款期限等指标影响借款人的违约程度; 石澄贤等^[6]结合实际业务需求从表征信息、行为信息及状态信息三个方面选择个人信用评价指标变量, 通过计算变量的相关指标和逻辑回归筛选出22个指标作为P2P网络平台信用评价体系指标。在软信息方面, 蒋翠清等^[7]利用主题模型抽取文本软信息中的相关变量, 引入随机森林方法构建融入软信息的违约预测模型, 结果证明在P2P借款的违约预测模型中融入有价值的软信息可以提高预测准确率。王会娟等^[8]通过人人贷数据发现借款人信用等级越低, 越倾向于添加借款描述, 以降低借贷双方的信息不对称问题; 在控制其他变量的情况下, 借款描述展示的人格数量越多, 越能吸引投标人, 满标用时越短, 借款者越容易获得借款且借款违约率越低。

(2) 关于信用风险模型的研究

Guo等^[9]在均值-方差投资组合模型的基础上提出基于实例的P2P网贷信用风险评估模型, 结果表明该模型能有效地量化借款者的信用风险, 并且帮助投资者进行投资决策。张卫国等^[10]构建基于非均衡模糊近似支持向量机的P2P网络借贷人信用风险评估模型, 并且提出借款人信用评分及评级方法, 结果表明所构建的模型具有较高的分类准确度, 能有效减少样本非均衡对分类结果的影响。肖会敏等^[11]根据指标体系构建相应的BP神经网络模型, 并利用一步正切法进行优化实验, 证明该模型在P2P网贷平台的风险控制方面起到一定的作用。Byanjankar等^[12]使用神经网络方法预测P2P借贷中的风险, 并且认为基于信用分数的神经网络在筛选违约标时效果较好。李斌等^[13]使用属性归纳和聚类方法对业务过程中的风险因素进行分析, 并且采用马尔可夫模型构建可传导的风险评估模型。操玮等^[5]集成算法构建风险预警模型, 提高信用风险预测效率。

综上所述, 目前的相关研究主要是基于借款者的信息判断借款者的信用状况。但是, 在P2P借贷中, 还存在一种角色即投资者, 只有投资者获得满意的收益才能使更多的投资者参与其中。因此, 为投资者提供符合自身需求的借款同样是需要解决的问题。P2P平台作为特殊的借贷手段, 与传统银行相比, 借贷门槛低、中介费低, 大量缺乏资金的需求者都希望通过此平台筹到资金, 导致借款者质量参差不齐^[14,15]; 同时, 对于投资者, 由于P2P借贷的易操作和高收益吸引了大量的投资者。但是由于很多投资者缺乏对P2P网贷平台以及专业金融知识的了解, 导致未能获得预期效益^[16]。

本文根据P2P平台存在的缺陷以及投资者的需求, 提出基于二部图的P2P投资组合决策方法(P2P- Network-Based Inference, PNBI)。由于在P2P网贷市场中, 借款者和投资者之间存在较大的信息鸿沟, 投资者很难获得全面消息, 而二部图网络将借款者之间、投资者之间以及借款者和投资者相互联系, 形成一张巨大的关系网络图^[17], 通过相互关系使投资者获得更多的信息, 更好地满足投资者的需求^[18], 利用投资组合决策理论, 进一步帮助投资者定量地确定投资比例, 以减小投资风险。

3 P2P网络借贷下借款者和投资者的概念模型

3.1 P2P网络借贷二部图模型

P2P网络借贷中存在众多的借款者和投资者, 一个投资者可以投资多笔借款, 而一笔借款可以由多个投资者投资, 因此形成多对多的二部图网络^[19], 如图1所示。构建基于投资者、借款者、借贷关系的网络图$G=(U,V,E)$, 其中U表示投资者集合, u_i表示第i个投资者; V表示借款者集合, v_j表示第j个借款者; E表示借贷关系集合, e_ij表示第i个投资者给第j个借款者的投资额。例如图1 中e₁₁表示投资者u₁给借款者v₁投资了150元。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 借款者和投资者的关系网络

3.2 基于P2P二部图模型的借款者概念模型

回报率和风险是衡量借款者质量的两个最基本的指标^[20], 即高回报率低风险的借款者会吸引投资者进行投资。因此用二元组$(p_{j}^{E},p_{j}^{risk})$表示借款者特征。其中, $p_{j}^{E}$表示回报率, 借款者在申请阶段会明确说明该笔借款的利率, 则将此利率当作投资该借款者的回报率。$p_{j}^{risk}$表示风险, 而风险不能从已有数据中直接得出, 将借款者的违约概率看成风险, 即违约概率越大说明投资风险越大。本文采用逻辑回归模型预测违约概率。

首先, 进行特征筛选, 本文选择借款利率、借款期限、借款金额、信用等级、年龄、学历、工作年限、收入、房产、房贷等指标衡量借款者的违约概率。对于每一个借款者${{v}_{j}}\in V$, 其所对应的特征为${{v}_{j}}= (1;{{v}_{j,1}};{{v}_{j,2}};\cdot \cdot \cdot ;{{v}_{j,n}})$, 从而, 借款者的风险可以被表示成公式(1)^[21,22]。

(1)$p_{j}^{risk}=p({{v}_{j}})=\frac{exp({{\beta }^{\mathrm{T}}}\cdot {{v}_{j}})}{1+\exp ({{\beta }^{\mathrm{T}}}\cdot {{v}_{j}})}$

其中, $\beta =({{\beta }_{0}},{{\beta }_{1}},{{\beta }_{2}},\cdot \cdot \cdot ,{{\beta }_{n}})$为特征系数。

3.3 基于P2P二部图模型的投资者概念模型

与借款者类似, 同样需要用两个指标衡量投资者的投资意愿^[20], 用二元组$({{E}_{i}},{{R}_{i}})$表示投资者的特征, ${{E}_{i}}$表示投资收益率。本研究中的投资收益率指投资者投资的收益率的加权平均值, 因此在计算投资者投资收益率时, 需要先计算投资者对每笔借款的投资比例, 则得到公式(2)。

(2)${{E}_{i}}=\sum\limits_{j=1}^{n}{{{w}_{ij}}}p_{j}^{E}$

${{R}_{i}}$表示投资风险, 投资者的投资风险与回报率类似, 也是利用所有投资借款的风险加权平均值, 计算如公式(3)所示。

(3)${{R}_{i}}=\sum\limits_{j=1}^{n}{{{w}_{ij}}}p_{j}^{risk}$

其中, $p_{j}^{E}$为第j个借款者回报率, $p_{j}^{risk}$表示第j个借款者的风险, ${{w}_{ij}}=\frac{{{e}_{ij}}}{\sum\nolimits_{j=1}^{n}{{{e}_{ij}}}}$表示投资者u_i给第j个借款者的投资比例。

4 P2P网络借贷下的二部图推荐算法

4.1 二部图基本算法

二部图推荐算法是基于图的模型形成的推荐算法, 是个性化推荐领域中越来越被关注的一个研究热点, 由于其推荐复杂度低、准确性高、推荐内容多样化而被大量关注。基本思想是不用考虑用户属性和产品内容, 将用户和产品分别看作抽象的节点, 把用户和产品的连接关系抽象成边^[23]。用户和产品的节点之间的购买关系构造一个网络结构图, 根据这个结构图进行推荐。其中, 应用较多的是利用资源分配的二部图推荐算法(Network-Based Inference, NBI)^[24], 并利用电影数据集验证了方法的效果。

假设一个系统中存在m个用户和n个产品, 设$U=\{{{u}_{1}},{{u}_{2}},{{u}_{3}},\cdot \cdot \cdot ,{{u}_{m}}\}$表示用户, $V=\{{{v}_{1}},{{v}_{2}},{{v}_{3}},\cdot \cdot \cdot ,{{v}_{n}}\}$表示产品, 则整个系统中, 用户和产品可以构成一个m行n列的关系矩阵${{e}_{\alpha i}}$, 其中$\alpha =\{1,2,3,\cdot \cdot \cdot ,m\}$, $i=\{1,2,3,\cdot \cdot \cdot ,n\}$。关系矩阵${{e}_{\alpha i}}$的取值如公式(4)所示。

(4)${{e}_{\alpha i}}=\left\{ \begin{align}& 1\text{ }{{u}_{\alpha }}{{v}_{i}} \\ & 0\text{ }{{u}_{\alpha }}{{v}_{i}} \\ \end{align} \right.$

当${{e}_{\alpha i}}$=1, 用户${{u}_{\alpha }}$和产品${{v}_{i}}$之间连成一条线, 同时产品${{v}_{i}}$被赋予一个单位的资源量; 若未被选择, 则初始资源量为零。受物理学中复杂物质扩散理论的启发, Zhou等^[24]提出利用资源分配思想的相似度计算方法。整个资源分配的过程为: 将用户购买过的产品资源初始化为1, 其余为0; 将产品上的资源平均分配给所有在网络结构中与之连接的用户, 将用户的资源平均分配给与之相连的产品, 整个分配过程如图2所示。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 资源分配过程

初始资源从产品层经过物品与用户的选择关系平均分配到用户层。经过第一阶段的资源变动, 用户${{u}_{\alpha }}$获得的资源量如公式(5)所示。

(5)$f({{u}_{\alpha }})=\sum\limits_{i=1}^{n}{\frac{{{e}_{\alpha i}}}{k({{v}_{i}})}}$

其中, $k({{v}_{i}})$为产品${{v}_{i}}$的度, 即物品${{v}_{i}}$被选择的次数。第二阶段资源由用户层的每个用户节点经过选择关系流向物品层, 则物品节点${{v}_{j}}$的资源量如公式(6)所示。

(6)$f({{v}_{j}})=\sum\limits_{\alpha =1}^{m}{\frac{{{e}_{\alpha j}}f({{u}_{\alpha }})}{k({{u}_{\alpha }})}}=\sum\limits_{i=1}^{n}{\sum\limits_{\alpha =1}^{m}{\frac{{{e}_{\alpha j}}}{k({{u}_{\alpha }})}}}\frac{{{e}_{\alpha i}}}{k({{v}_{i}})}=\sum\limits_{i=1}^{m}{{{w}_{ij}}}$

其中, $k({{u}_{\alpha }})$为用户节点${{u}_{\alpha }}$的度, 即用户购买的物品数。${{w}_{ij}}$表示物品${{v}_{i}}$对${{v}_{j}}$推荐的资源贡献量。针对具体的目标客户, 将物品按照新资源量由大到小排序, 取排序中前N个物品作为推荐系统中推荐给目标用户的推荐结果。

4.2 简单权值改进的二部图算法

结合基本的二部图模型, 在P2P场景下构建权值改进的二部图投资网络图。

假设用户$U=\{{{u}_{1}},{{u}_{2}},{{u}_{3}},\cdot \cdot \cdot ,{{u}_{m}}\}$, 即投资者; $P=\{{{p}_{1}},{{p}_{2}},{{p}_{3}},\cdot \cdot \cdot ,{{p}_{n}}\}$表示产品, 即借款者, 在4.1节理论基础上, 对${{e}_{ij}}$做出调整, 即${{e}_{ij}}$表示投资者i给借款者j的投资额, 不再仅表示为0和1, 如公式(7)所示。

(7)${{e}_{ij}}=\left\{ \begin{align} & amount\text{ }ij \\ & 0\text{ }else \\ \end{align} \right.$

其中, amount表示投资者给每笔借款投资的投资额。

此时, 计算投资者资源分配矩阵W。借款i从借款j处获得的推荐资源, 如公式(8)所示。

(8)${{w}_{ij}}=\sum\limits_{u=1}^{m}{\frac{{{e}_{ui}}\cdot {{e}_{uj}}}{k(j)k(u)}}$

其中, $k(j)$和$k(u)$不再是连接的次数, 即投资次数和被投资人数, 而是对应边连接的权值之和。计算指定投资者对没有标注过借款的资源分配。投资者u对借款i的最终投资分配如公式(9)所示。

(9)$f({{\mu }_{i}})=\sum\limits_{j=1}^{n}{{{w}_{ij}}{{f}_{u}}}=\sum\limits_{j=1}^{n}{{{w}_{ij}}{{e}_{uj}}}$

计算投资者u对没有投资过的借款的最终资源分配, 将$f({{\mu }_{i}})$降序, 选取前K个产品排列成一个借款列表。

5 投资组合决策

美国经济学家Markowitz^[25]发表的Portfolio Selection标志着现代资产组合的理论的诞生。该文利用风险资产的收益与风险之间的关系来讨论不确定性经济系统中最优投资组合的选择问题^[26,27]。根据投资组合理论, 投资者更愿意进行分散投资来降低风险。不同于传统银行, P2P的个人投资不仅要区分信用好的借款者和信用不好的借款者, 还需要知道在预期的利润下, 将投资额怎样分配给不同的借款才能使得风险最小^[26,27]。因此, P2P投资问题就是一个典型的组合决策问题。特别地, 在P2P借款中可以合理地忽略每笔借款之间的相关性, 从而简化问题。

假设有n笔不同的借款可以投资, 通过借款者二元组模型可知, 第j笔借款的收益率为$p_{j}^{E}$, 风险为$p_{j}^{risk}$。构造投资组合P, 记作$w={{({{w}_{1}},{{w}_{2}},{{w}_{3}},\cdot \cdot \cdot ,{{w}_{n}})}^{\mathrm{T}}}$, 其中${{w}_{j}}$表示第j笔借款在投资组合中所占的比例, 以期望收益E衡量投资组合的收益, 以单个风险的平方和R衡量投资组合的风险大小, 因此根据均值-方差理论^[23]投资组合模型可以表示如公式(10)-公式(12) 所示。

(10)$\min R[P]=\sum\limits_{j=1}^{n}{w_{j}^{2}}p_{j}^{ris{{k}^{2}}}$

(11)$s.t.\ E[P]=\sum\limits_{j=1}^{n}{{{w}_{j}}p_{j}^{E}}$

(12)$\sum\limits_{j=1}^{n}{{{w}_{j}}=1}$

本文将推荐算法的结果作为投资组合的候选名单, 根据公式(1)计算候选名单中每笔借款的利率和风险, 根据投资组合模型, 在不同的投资数量K下, 通过求解二次规划问题, 在预期利润下, 求得风险最小的组合。

6 实验及评价

6.1 实验数据

实验数据选取人人贷平台上已完成的2 105位投资者对2 604个借款者进行投资的数据, 共有53 237条投资信息。将数据分为80%的训练集和20%的测试集。将借款者和投资者分别编号, 利用基于二部图的推荐算法得出每位投资者的推荐清单。选取K=10展示部分结果。

表1根据推荐算法为5位投资者分别推荐了10笔借款, v_i表示借款者。在不同K情况下, 则推荐清单的数量也不相同, 但方法相同。

表1 K=10时推荐清单

投资者	v₁	v₂	v₃	v₄	v₅	v₆	v₇	v₈	v₉	v₁₀
1	15 309	11 737	17 135	16 944	15 181	14 584	11 633	19 976	12 988	14 349
2	11 988	12 097	18 336	9 429	9 387	11 780	7 095	12 056	12 988	11 575
3	13 640	13 073	13 084	14 352	14 062	12 988	19 102	19 976	13 681	13 946
4	15 919	11 737	15 112	18 901	11 633	15 579	19 976	16 944	20 084	11 735
5	15 919	17 973	17 065	15 563	19 172	16 944	16 149	18 296	19 976	19 085

新窗口打开| 下载CSV

如表2所示, 在考虑利润和风险的情况下, 利用决策模型得出推荐清单里每一笔借款的投资比重, 以实现利益的最大化。w_i表示投资比重, R_i和E_i分别表示在一定的投资比重下获得的期望风险和期望回报率。

表2 K=10时投资比重

投资者	w₁	w₂	w₃	w₄	w₅	w₆	w₇	w₈	w₉	w₁₀	R_i	E_i
1	1.38%	11.19%	1.46%	1.29%	0.03%	5.01%	64.45%	2.13%	12.01%	1.05%	0.54%	15.00%
2	4.18%	6.67%	28.27%	1.04%	6.43%	0.16%	0.07%	32.16%	11.46%	9.56%	0.52%	12.27%
3	3.09%	6.37%	4.12%	0.02%	72.47%	10.13%	0.72%	1.80%	1.02%	0.27%	0.49%	9.88%
4	0.68%	12.63%	0.00%	2.23%	72.80%	0.06%	2.41%	1.46%	2.44%	5.28%	0.57%	14.62%
5	0.67%	1.76%	1.51%	5.47%	10.41%	1.42%	73.77%	0.01%	2.35%	2.63%	0.56%	12.31%

新窗口打开| 下载CSV

6.2 评价指标

本文实验分别从推荐角度和经济角度衡量模型的效果。

(1) 推荐角度

利用推荐系统中的两个常用指标进行模型的评价, 分别为准确率^[28]和召回率^[28]。

准确率(Precision, P)为推荐结果中目标投资者已投资借款占比。P的结果越大表示算法的准确率越高, 如公式(14)所示。

(14)$Precision=\frac{\sum\nolimits_{u\in U}{|R(u)\bigcap T(u)|}}{|R(u)|}$

召回率(Recall, R)为推荐结果中已投资借款的个数与目标投资者投资借款总数的比值。R的结果越大表示算法的召回率越高, 如公式(15)所示。

(15)$Recall=\frac{\sum\nolimits_{u\in U}{|R(u)\bigcap T(u)|}}{|T(u)|}$

其中, R(u)表示在根据训练数据得到的投资者推荐列表, T(u)表示根据测试数据得到的投资者推荐列表。

(2) 经济角度

投资回报率是最重要的指标。因此, 采用借款的实际回报率(RR)作为一个量度, 另一个量度为夏普比率^[29](SR), 一个同时对收益与风险加以综合考虑的指标。两个量度的计算方法如公式(16)-公式(17)所示。

(16)$RR(i)=\sum\limits_{j=1}^{k}{{{w}_{j}}{{R}_{j}}}$

(17)$SR(i)=\frac{RR(i)-{{R}_{f}}}{{{\sigma }_{i}}}$

其中, ${{R}_{j}}$表示借款${{v}_{j}}$的实际回报率, ${{w}_{j}}$表示对借款${{v}_{j}}$的投资比重, ${{R}_{f}}$表示无风险利率, 本文选取 5年国债利率为4%, ${{\sigma }_{i}}$表示投资组合的标准差^[30]。

6.3 实验结果及讨论

(1) 将本文算法(PNBI)和基于用户的协同过滤算法(UCF)^[31]、基于物品的协同过滤算法(ICF)^[31]在不同指标下进行对比。为了消除推荐数量单一对结果的偶然性, 因此选择不同的推荐数量K计算准确率和召回率, 使结果更有说服力。实验结果如表3和表4所示。随着投资数量K的增加, PNBI的准确率下降, ICF和UCF的准确率稍有增加或保持不变, 而召回率都随之上升, 但在不同的K值下, PNBI的准确率和召回率都要高于另外两种模型; 三种模型相比, 本文提出的模型的各项指标更优, 这表明本文提出的模型所确定的投资推荐列表更符合投资者的需求, 从而有助于提高投资的有效性以及投资者的满意度。

表3 不同K值下准确率比较

K 算法	5	15	25	35	45	50
PNBI	0.055	0.044	0.039	0.035	0.036	0.032
UCF	0.022	0.019	0.032	0.032	0.033	0.034
ICF	0.007	0.013	0.014	0.014	0.014	0.014

新窗口打开| 下载CSV

表4 不同K值下召回率比较

K 算法	5	15	25	35	45	50
PNBI	0.032	0.077	0.113	0.143	0.167	0.170
UCF	0.053	0.072	0.079	0.079	0.081	0.083
ICF	0.016	0.032	0.034	0.034	0.034	0.034

新窗口打开| 下载CSV

(2) 在经济角度方面, 表5展示了三种模型得到的实际投资回报率和没有推荐情况下投资者自行投资的实际回报率, 可以发现, 在不同的推荐数量K, 三种模型的推荐结果投资收益率高于投资者自己决策投资的实际回报率, 而三种模型之间, PNBI模型的推荐结果为投资者带来的收益率最高, 这表明PNBI模型的经济效果更好。

表5 不同K值下实际回报率比较

K 算法	5	10	20	30	40	50
PNBI	0.139	0.136	0.134	0.133	0.132	0.132
UCF	0.138	0.133	0.128	0.129	0.131	0.129
ICF	0.137	0.134	0.132	0.13	0.128	0.125
无推荐	0.114	0.114	0.114	0.114	0.114	0.114

新窗口打开| 下载CSV

表6展示了三种模型的夏普比率, 可以发现, 在不同K值的情况下, PNBI的夏普比率在绝大部分情况下高于其他两种模型, 表明PNBI模型增加一个单位的风险可以获得的收益更高, 组合的效果更好。

表6 不同K值下夏普比率比较

K	5	10	20	30	40	50
PNBI	9.929	8.726	6.253	5.576	4.738	4.092
UCF	9.125	8.247	7.125	5.236	4.978	3.968
ICF	7.719	4.125	3.283	3.015	2.863	1.238

新窗口打开| 下载CSV

7 结语

本文在P2P借贷平台上进行投资推荐方法研究, 解决了在投资决策过程中的两个重要问题: 投资哪笔借款和每笔借款投资多少钱。具体来说, 通过投资者和借款者之间的关系构建关系网络图以及两者的概念模型; 之后通过简单改进的二部图推荐算法解决了应该投资什么借款的问题, 为每一位投资者形成具体的投资推荐清单。根据投资组合理论, 通过考虑风险和收益, 为投资者构建决策模型, 以此解决对每笔借款投资金额的问题。实验结果证明在不同的评价指标下本文提出的整个投资组合决策模型是合理有效的。

本文由于数据获取的有限性, 未能根据投资者的风险偏好进行针对性的投资组合推荐; 本文针对的用户为进行过投资的老客户, 未实现对新用户的推荐。因此, 后续研究中笔者将对这些问题进行深入探索。

作者贡献声明

丁勇: 提出研究思路, 设计研究方案;

程璐, 蒋翠清: 分析数据;

程璐: 进行实验, 起草论文;

丁勇, 程璐, 蒋翠清: 论文最终版修订。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail:chengluhs@163.com。

[1] 丁勇, 程璐, 蒋翠清. Renren-application.xlsx. 人人贷散标申请数据.

[2] 丁勇, 程璐, 蒋翠清. Renren-investment. xlsx. 人人贷散标投资数据.

[3] 程璐. PNBI.py. 实验脚本程序.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

彭倩, 秦进 .

P2P网络借贷中历史投资经验对投资人决策的影响

[J]. 金融论坛, 2018(5):24-39.

检索词推荐：