Data Analysis and Knowledge Discovery  2020, Vol. 4 Issue (2/3): 214-222    DOI: 10.11925/infotech.2096-3467.2019.0649
Group Recommendation Based on Attribute Mining of Book Reviews
Xiong Huixiang1(),Li Xiaomin1,Li Yueyan2
1School of Information Management, Central China Normal University, Wuhan 430079, China
2School of Information Management, Nanjing University, Nanjing 210023, China
[Objective] This paper conducts group recommendation using the relationship among users, tags and books.[Methods] First, we used the K-means algorithm to cluster users and books. Then, we calculated cosine similarity of the two groups. Third, we compared various books based on their reviews. Finally, we sorted and clustered books to personalize the recommendation results.[Results] We examined the proposed model with data from “Douban Net” and our model recommended better resources for user groups.[Limitations] The sample data size needs to be expanded.[Conclusions] The proposed model improves the personalized recommendation of books.

Key wordsSocial Tagging      Group Recommendation      Clustering      Book Comments     
Received: 11 June 2019      Published: 26 April 2020
ZTFLH:  G230  
Xiong Huixiang,Li Xiaomin,Li Yueyan. Group Recommendation Based on Attribute Mining of Book Reviews. Data Analysis and Knowledge Discovery, 2020, 4(2/3): 214-222.

Group Recommendation Framework
编号 用户 图书名称 标签
1 柳无码 《发现艺术家系列:谁是毕加索?》


2 YING 《梁启超全集》


20 Jacky 《大秦帝国》


Users、Books and Tag Datasets
编号 图书名称 标签
1 《发现艺术家系列:谁是毕加索?》 艺术;童书;…;读书
2 《这不是一本科学书》 益智;趣味;…;浪花朵朵
3 《镜子》 历史;世界史;…;乌拉圭
4 《常识》 科普;百科;…;DK
5 《少年维特的烦恼》 歌德;少年维特的烦恼;…;名著
6 《谁的骨头?》 科普;童书;…;读书
7 《恐龙大冒险》 童书;绘本;…;浪花朵朵
8 《会飞的帽子》 绘本;童书;…;后浪
9 《孩子和猫》 绘本;浪花朵朵;…;儿童
10 《日月的容曜》 小说;古言;…;言情
373 《Python核心编程(第二版)》 Python;编程;…;开发
Books and Tag Datasets
编号 图书名称 评论内容
1 《发现艺术家系列:谁是毕加索?》 本书中,作者布丽塔·本克精选了毕加索的儿童画以及其他富有童趣的艺术作品,…了解到毕加索的艺术理念。
2 《这不是一本科学书》 非常非常好玩,有一些实验最近正打算亲自做。这个系列还有一本数学也非常好。回头我做一个视频发豆瓣。

3 《镜子》 一本过于强调女性、少数族裔、同性恋政治正确而矫枉过正的书。

373 《Python核心编程(第二版)》 系统的梳理了我那半调子的python,…总之作为第一本系统了解python基础的书很赞:)

内容有点乱。 感觉翻译的也不好
Book Reviews of Douban
用户群组 用户
1 柳无码;luancheng;Rek大叔;杜扬Seatory;ag獭
2 YING;暗影摄手;举个栗子手酸
3 日落西山;阅夜吴声;白色液体;Leo____L
4 匿名用户;Johnlukia;yuedong;Jacky
5 tiiiiiiiiin;李小暖;snowrainbow;僻野村夫
Results of User Clustering
用户群组 1 2 3 4 5
1 1 0.17 0.08 0.12 0.64
2 0.17 1 0.12 0.09 0.21
3 0.08 0.12 1 0.22 0.13
4 0.12 0.09 0.22 1 0.13
5 0.64 0.21 0.13 0.13 1
Similarity of User Groups
用户群组 用户
1 柳无码;luancheng;Rek大叔;杜扬Seatory;ag獭;tiiiiiiiiin;李小暖;snowrainbow;僻野村夫
2 YING; 暗影摄手; 举个栗子手酸
3 日落西山; 阅夜吴声;白色液体;Leo____L
4 匿名用户; Johnlukia;yuedong;Jacky
Merged User Groups
资源群组 图书名称
1 少年维特的烦恼;何以笙箫默;罪与罚;…;天蓝色的彼岸
2 大数据时代;Python数据分析基础;…;Data Science from Scratch
3 镜子;金叶 : 来自金枝的故事;…;刑法的私塾
4 证券公司图鉴;金融的解释;…;小岛经济学
5 祈祷落幕时;推理竞技场;…;解忧杂货店
22 专注;从自我苛求中解放出来;…;把时间当作朋友
Results of Book Clustering
图书群组 1 2 3 4 5 22
1 1 0 0.21 0 0.22 0
2 0 1 0 0 0 0
3 0.21 0 1 0.04 0.14 0.06
4 0 0 0.04 1 0 0.14
5 0.22 0 0.14 0.14 1 0
22 0 0 0.06 0.06 0 1
Similarity of Book Groups
图书群组 图书名称
1 少年维特的烦恼;何以笙箫默;罪与罚;…;自媒体写作,从基本功到实战方法
2 大数据时代;Python数据分析基础;…;Python核心编程(第二版)
3 镜子;金叶 : 来自金枝的故事;…;刑法的私塾
4 证券公司图鉴;金融的解释;…;小岛经济学
16 Huxley's Church and Maxwell's Demon;时间简史;…;费曼手札
Merged Book Groups

1 2 3 4
1 0.78 0.30 0.23 0.15
2 0 0.01 0.11 0.51
3 0.43 0.45 0.27 0.18
4 0.01 0.02 0.31 0.16
5 0.41 0.23 0.08 0.05
6 0.14 0.03 0.08 0.05
7 0.29 0.20 0.16 0.12
8 0.04 0.05 0.51 0.27
9 0.22 0.05 0.08 0.06
10 0.15 0.13 0.07 0.05
11 0.33 0.31 0.23 0.10
12 0.25 0.36 0.07 0.08
13 0.02 0.05 0.39 0.34
14 0.26 0.21 0.12 0.03
15 0.08 0.11 0.07 0.03
16 0.02 0.03 0.07 0.07
Similarity of User Groups and Book Groups

内容 作者 封面 版本 插图 印刷 适用人群 类型 文笔 出版社
1 0.14 0.16 0.11 0.12 0.02 0.04 0.11 0.09 0.15 0.05
2 0.30 0.25 0.02 0.02 0.02 0.02 0.30 0.04 0.03 0.02
3 0.19 0.19 0.08 0.06 0.08 0.07 0.15 0.04 0.11 0.03
4 0.26 0.24 0.03 0.05 0.01 0.04 0.24 0.00 0.09 0.03
5 0.22 0.25 0.05 0.08 0.01 0.05 0.07 0.05 0.15 0.07
6 0.17 0.34 0.08 0.00 0.12 0.08 0.21 0.00 0.00 0.00
7 0.17 0.29 0.04 0.08 0.04 0.00 0.08 0.08 0.17 0.04
8 0.28 0.24 0.04 0.03 0.01 0.03 0.15 0.05 0.10 0.06
9 0.25 0.20 0.06 0.06 0.20 0.08 0.02 0.04 0.08 0.02
10 0.17 0.28 0.15 0.05 0.00 0.00 0.02 0.00 0.30 0.00
11 0.14 0.15 0.15 0.09 0.02 0.05 0.09 0.12 0.14 0.05
12 0.19 0.21 0.11 0.04 0.02 0.01 0.07 0.14 0.20 0.00
13 0.30 0.26 0.04 0.05 0.01 0.00 0.19 0.06 0.07 0.02
14 0.18 0.18 0.13 0.05 0.05 0.11 0.11 0.08 0.03 0.08
15 0.25 0.17 0.08 0.17 0.08 0.00 0.08 0.08 0.08 0.00
16 0.16 0.23 0.10 0.06 0.06 0.10 0.10 0.00 0.13 0.06
Attribute Comparison of Book Groups
图书编号 内容 作者 封面 版本 插图 印刷 适用人群 类型 文笔 出版社 评分
1 5.05 6.63 0 0 0 0 8.57 6.00 2.00 0 6.01
2 8.57 0 0 0 0 0 10.00 0 0 0 5.55
3 7.69 0 0 0 0 0 7.50 0 0 0 4.54
4 8.18 10.00 3.33 6.67 0 10 8.82 0 0 10.00 7.96
5 5.88 6.67 0 0 0 0 8.89 0 0 0 6.24
44 8.07 6.92 0 0 7.50 10.00 10.00 0 0 0 7.42
Book Scores of Group2
图书聚类 图书名称
1 Python编程;Python Cookbook;…;Python高手之路
2 大数据时代;Python数据分析基础;…;Data Science from Scratch
3 鸟哥的Linux私房菜;Go语言入门经典…;简约至上
4 大型网站技术架构;Python Web开发实战;…;Flask Web开发:基于Python的Web应用开发实战
5 A Byte of Python;流畅的Python;.…Python核心编程(第二版)
Book Clustering of Group2
群组 评分 图书名称
1 8.50 代码大全(第2版)
7.96 Python编程
7.62 Head First 设计模式(中文版)
7.02 黑客与画家
6.96 Python网络编程(第3版)
2 7.67 最简单的图形与最复杂的信息
7.20 深入浅出统计学
7.10 集体智慧编程
6.01 大数据时代
5.97 Data Science from Scratch
3 7.42 简约至上
6.88 MySQL必知必会
6.81 鸟哥的Linux私房菜
5.52 Python Linux系统管理与自动化运维
1.51 Go语言入门经典
4 7.32 大型网站技术架构
7.06 Flask Web开发:基于Python的Web应用开发实战
6.36 Java面向对象编程 (第2版)
5.32 Python Web开发实战
2.50 JSP & Servlet学习笔记
5 6.98 流畅的Python
6.55 C程序设计语言
6.32 Head First Python(中文版)
6.24 A Byte of Python
5.81 Python核心编程(第二版)
Book Recommendations of top5
