Please wait a minute...
Advanced Search
数据分析与知识发现  2021, Vol. 5 Issue (11): 114-123     https://doi.org/10.11925/infotech.2096-3467.2021.0548
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
融合多源数据和场景相似度计算的数字资源推荐研究*
吴彦文1,2,蔡秋亭2(),刘智3,邓云泽2
1华中师范大学国家数字化学习工程技术研究中心 武汉 430079
2华中师范大学物理科学与技术学院 武汉 430079
3华中师范大学教育大数据应用技术国家工程实验室 武汉 430079
Digital Resource Recommendation Based on Multi-Source Data and Scene Similarity Calculation
Wu Yanwen1,2,Cai Qiuting2(),Liu Zhi3,Deng Yunze2
1National Engineering Research Center for E-Learning, Central China Normal University, Wuhan 430079, China
2College of Physical Science and Technology, Central China Normal University, Wuhan 430079, China
3National Engineering Laboratory for Educational Big Data, Central China Normal University, Wuhan 430079, China
全文: PDF (1566 KB)   HTML ( 15
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 探索融合多源数据和场景相似度计算的方法,为用户精准匹配相应的数字资源。【方法】 本文提出一种融合多源数据和场景相似度计算的数字资源推荐方法(CF-SSC),通过构建融合多源数据的场景模型得到场景数据的抽象表示,基于细化的相似度指标计算场景相似度,最后根据相似度等级预测得到场景列表及相应资源,以此优化推荐结果。【结果】 相比于CF-Pearson、CF-Cosine、IOS和User-MRDC,本文所提CF-SSC算法在指标MAE(0.688)上表现最优,在指标RMSE(0.936)上仅略次于User-MRDC,达到MAE和RMSE最优值时所需邻居的数量(20)最少。【局限】 仅在少量有限的数据集上进行重复测试。【结论】 所提相似度算法提高了推荐系统的预测精度,有效提升资源推荐的效率和准确性。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
吴彦文
蔡秋亭
刘智
邓云泽
关键词 数字资源个性化推荐场景分析多源数据相似度计算    
Abstract

[Objective] This paper proposes a new method based on multi-source data fusion and scene similarity calculation to accurately recommend digital resources for users. [Methods] First, we constructed a scene model integrating multi-source data, and obtained their abstract representation. Then, we calculated the scene similarity based on the detailed similarity index. Finally, we predicted the scene list and corresponding resources according to their similarity level predictions, and optimized the recommendation results. [Results] Compared with CF Pearson, CF cosine, IOS and user-MRDC, the proposed CF-SSC algorithm performed best on the index MAE (0.688), and was slightly inferior to user-MRDC on the index RMSE (0.936). It required the least number of neighbors (20) to reach the optimal value of MAE and RMSE. [Limitations] Our new algorithm was only tested with small data sets. [Conclusions] The proposed similarity algorithm improves the prediction accuracy and the effectiveness of resource recommendation system.

Key wordsDigital Resources    Personalized Recommendation    Scene Analysis    Multi-Source Data    Similarity Calculation
收稿日期: 2021-06-01      出版日期: 2021-12-23
ZTFLH:  TP391  
基金资助:*国家自然科学基金重点项目(61937001);教育部国家级新工科研究与实践项目2020年新工科专业改革类项目(E-RGZN20201032);湖北省2020年教学研究项目(2020139)
通讯作者: 蔡秋亭,ORCID:0000-0002-8359-0776     E-mail: 1206948864@qq.com
引用本文:   
吴彦文, 蔡秋亭, 刘智, 邓云泽. 融合多源数据和场景相似度计算的数字资源推荐研究*[J]. 数据分析与知识发现, 2021, 5(11): 114-123.
Wu Yanwen, Cai Qiuting, Liu Zhi, Deng Yunze. Digital Resource Recommendation Based on Multi-Source Data and Scene Similarity Calculation. Data Analysis and Knowledge Discovery, 2021, 5(11): 114-123.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2021.0548      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2021/V5/I11/114
Fig.1  推荐整体框架
Fig.2  某阅读场景模型的构建
Fig.3  阅读场景本体概念及关系示意图
Fig.4  场景相似度计算示意图
Fig.5  场景评级矩阵
Fig.6  不同邻居数的各算法的MAE结果比较
Fig.7  不同邻居数的各算法的RMSE结果比较
方法 CF-Pearson CF-
Cosine
IOS User-MRDC CF-SSC
邻居数量/MAE
邻居数量/RMSE
30/0.703 60/0.704 50/0.699 40/0.697 20/0.688
30/0.951 30/0.947 50/0.945 50/0.931 20/0.936
Table 1  达到最优值时的MAE值、RMSE值和邻居数量
[1] 杨君, 吴菊华, 艾丹祥. 一种基于情景相似度的多维信息推荐新方法研究[J]. 情报学报, 2013, 32(3):262-269.
[1] (Yang Jun, Wu Juhua, Ai Danxiang. A New Method for Multi-Dimensional Information Recommendation Based on the Similarity of Context[J]. Journal of the China Society for Scientific and Technical Information, 2013, 32(3):262-269.)
[2] 张明红, 佘廉, 耿波. 基于情景的结构化突发事件相似度研究[J]. 中国管理科学, 2017, 25(1):151-159.
[2] (Zhang Minghong, She Lian, Geng Bo. Research on the Similarity of the Structured Emergency Events Based on Scenario[J]. Chinese Journal of Management Science, 2017, 25(1):151-159.)
[3] 曾子明, 陈贝贝. 移动环境下基于情境感知的个性化阅读推荐研究[J]. 情报理论与实践, 2015, 38(12):31-36.
[3] (Zeng Ziming, Chen Beibei. Research on Personalized Reading Recommendation Based on Context-aware in Mobile Environment[J]. Information Studies: Theory & Application, 2015, 38(12):31-36.)
[4] 谭剪梅. 顾及多类型用户需求的地震灾害场景知识图谱构建及应用[D]. 成都: 西南交通大学, 2019.
[4] (Tan Jianmei. The Construction and Application of Earthquake Disaster Scene Knowledge Graph Concerned on the Demands of Multy-type Users[D]. Chengdu: Southwest Jiaotong University, 2019.)
[5] 刘华真, 王巍, 谷壬倩, 等. 基于用户浏览行为的个性化推荐研究综述[J]. 计算机应用研究, 2021, 38(8):2268-2277.
[5] (Liu Huazhen, Wang Wei, Gu Renqian, et al. Survey of Personalized Recommendation Study Based on User Browsing Behavior[J]. Application Research of Computers, 2021, 38(8):2268-2277.)
[6] 刘嘉, 都兴中, 陈振宇, 等. 移动推荐研究综述[J]. 情报科学, 2012, 30(10):1584-1590.
[6] (Liu Jia, Du Xingzhong, Chen Zhenyu, et al. A Survey of Research on Mobile Recommendation[J]. Information Science, 2012, 30(10):1584-1590.)
[7] 周明建, 赵建波, 李腾. 基于情境相似的知识个性化推荐系统研究[J]. 计算机工程与科学, 2016, 38(3):569-576.
[7] (Zhou Mingjian, Zhao Jianbo, Li Teng. Personalized Knowledge Recommendation System Based on Context Similarity[J]. Computer Engineering & Science, 2016, 38(3):569-576.)
[8] 杨峰, 张月琴, 姚乐野. 基于情景相似度的突发事件情报感知实现方法[J]. 情报学报, 2019, 38(5):525-533.
[8] (Yang Feng, Zhang Yueqin, Yao Leye. The Method for Intelligence Awareness in an Emergency Based on Scenario Similarity[J]. Journal of the China Society for Scientific and Technical Information, 2019, 38(5):525-533.)
[9] 徐绪堪, 李一铭. 基于情景相似度的突发事件多粒度响应模型研究[J]. 情报科学, 2021, 39(2):18-23, 43.
[9] (Xu Xukan, Li Yiming. Research on Multi-Granularity Response Model of Emergency Based on Scene Similarity[J]. Information Science, 2021, 39(2):18-23,43.)
[10] 涂伟, 曹劲舟, 高琦丽, 等. 融合多源时空大数据感知城市动态[J]. 武汉大学学报(信息科学版), 2020, 45(12):1875-1883.
[10] (Tu Wei, Cao Jinzhou, Gao Qili, et al. Sensing Urban Dynamics by Fusing Multi-Sourced Spatiotemporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12):1875-1883.)
[11] 黄晓斌, 张明鑫. 融合多源数据的企业竞争对手画像构建[J]. 现代情报, 2020, 40(11):13-21, 33.
[11] (Huang Xiaobin, Zhang Mingxin. Construction of Enterprise Competitor Portrait Based on Multi-Source Data[J]. Journal of Modern Information, 2020, 40(11):13-21, 33.)
[12] 郑荣, 杨竞雄, 张薇, 等. 多源数据驱动的产业竞争情报智慧服务研究[J]. 情报学报, 2020, 39(12):1295-1304.
[12] (Zheng Rong, Yang Jingxiong, Zhang Wei, et al. Research on Intelligent Services for Industrial Competitive Intelligence Driven by Multi-Source Data[J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(12):1295-1304.)
[13] 张永和, 肖广德, 胡永斌, 等. 智慧学习环境中的学习情景识别——让学习环境有效服务学习者[J]. 开放教育研究, 2012, 18(1):85-89.
[13] (Zhang Yonghe, Xiao Guangde, Hu Yongbin, et al. An Approach to Recognize Learning Scenario in Smart Environment[J]. Open Education Research, 2012, 18(1):85-89.)
[14] Paula A R M, Mauricio G, Valentina T, et al. Educational Resources Recommendation System for a Heterogeneous Student Group[J]. Advances in Distributed Computing and Artificial Intelligence Journal, 2016, 5(3):21-30.
[15] Ahn Y, Kim Y. Semantic Cloud Resource Recommendation Using Cluster Analysis in Hybrid Cloud Computing Environment[J]. KIPS Transactions on Computer and Communication Systems, 2015, 4(9):283-288.
doi: 10.3745/KTCCS.2015.4.9.283
[16] Corinna J L, Freimut B. Analyzing Industry Stakeholders Using Open-source Competitive Intelligence - A Case Study in the Automotive Supply Industry[J]. Journal of Enterprise Information Management, 2020, 33(3):579-599.
doi: 10.1108/JEIM-08-2019-0234
[1] 韩辉, 刘秀文. 海事适任评估中主观题自动评分技术研究*[J]. 数据分析与知识发现, 2021, 5(8): 113-121.
[2] 丁浩, 艾文华, 胡广伟, 李树青, 索炜. 融合用户兴趣波动时序的个性化推荐模型*[J]. 数据分析与知识发现, 2021, 5(11): 45-58.
[3] 李广建,王锴,张庆芝. 基于多源数据的美国出口管制分析框架及其实证研究*[J]. 数据分析与知识发现, 2020, 4(9): 26-40.
[4] 魏伟,郭崇慧,邢小宇. 基于语义关联规则的试题知识点标注及试题推荐*[J]. 数据分析与知识发现, 2020, 4(2/3): 182-191.
[5] 关鹏,王曰芬,傅柱. 基于LDA的主题语义演化分析方法研究 * ——以锂离子电池领域为例[J]. 数据分析与知识发现, 2019, 3(7): 61-72.
[6] 张怡文,张臣坤,杨安桔,计成睿,岳丽华. 基于条件型游走的四部图推荐方法*[J]. 数据分析与知识发现, 2019, 3(4): 117-125.
[7] 叶佳鑫,熊回香. 基于标签的跨领域资源个性化推荐研究*[J]. 数据分析与知识发现, 2019, 3(2): 21-32.
[8] 聂卉. 结合词向量和词图算法的用户兴趣建模研究 *[J]. 数据分析与知识发现, 2019, 3(12): 30-40.
[9] 丁浩,李树青. 基于用户多类型兴趣波动趋势预测分析的个性化推荐方法 *[J]. 数据分析与知识发现, 2019, 3(11): 43-51.
[10] 孙海霞, 王蕾, 吴英杰, 华薇娜, 李军莲. 科技文献数据库中机构名称匹配策略研究*[J]. 数据分析与知识发现, 2018, 2(8): 88-97.
[11] 李杰, 杨芳, 徐晨曦. 考虑时间动态性和序列模式的个性化推荐算法*[J]. 数据分析与知识发现, 2018, 2(7): 72-80.
[12] 侯银秀, 李伟卿, 王伟军, 张婷婷. 基于用户偏好与商品属性情感匹配的图书个性化推荐研究*[J]. 数据分析与知识发现, 2017, 1(8): 9-17.
[13] 陈梅梅, 薛康杰. 基于标签簇多构面信任关系的个性化推荐算法研究*[J]. 数据分析与知识发现, 2017, 1(5): 94-101.
[14] 陈梅梅, 薛康杰. 基于改进张量分解模型的个性化推荐算法研究*[J]. 数据分析与知识发现, 2017, 1(3): 38-45.
[15] 闫晶, 毕强, 李洁, 王福. 图书馆数字资源聚合质量预测模型构建*——基于改进遗传算法和BP神经网络[J]. 数据分析与知识发现, 2017, 1(12): 49-62.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn