Data Analysis and Knowledge Discovery  2024, Vol. 8 Issue (6): 30-43    DOI: 10.11925/infotech.2096-3467.2023.0398
A Review Summary Generation Model with Emotion-Topic Dual-Channel Information
Li Honglian1,Chen Haotian1,Zhang Le2(),Lv Xueqiang2,Tian Chi2
1School of Information & Communication Engineering, Beijing Information Science & Technology University, Beijing 100101, China
2Beijing Key Laboratory of Internet Culture and Digital Dissemination Research, Beijing Information Science & Technology University, Beijing 100101, China
[Objective] This paper aims to solve the problem that traditional automatic summarization technology cannot deeply integrate emotion and topic information synthetically, and cannot solve the lexical deficiency, a review summary generation model integrating emotion and topic information is proposed. [Methods] TextRank is used to dynamically extract the comment topic sentence, and PyABSA model is used to extract the aspect word-emotion word sequence in the topic sentence to concatenate the topic sentence to obtain the final topic information. The emotion sentence is obtained by constructing the emotion word set and Bi-LSTM emotion word extraction model integrating the topic, and the comment text and emotion sentence are concatenated to form dual-channel information with the topic sentence. The attention mechanism is used to obtain topic attention and emotion attention, respectively, and the superposition of them is deeply fused to obtain fusion attention. The single-channel attention of the pointer generation network is replaced, and the final comment summary is generated by the pointer network. [Results] Compared with the comparative experiment Topic+PNG, the proposed pointer generation network with dual-channel information improves the ROUGE-1, ROUGE-2 and ROUGE-L values by 2.87%, 6.14% and 2.64%, respectively. The ablation experiment showed that ROUGE-1, ROUGE-2 and ROUGE-L value of integrating dual-channel information were 4.49%, 3.66% and 4.16% higher than single-channel information. [Limitations] Because fine-grained attribute words may appear in comments, the integration of fine-grained attributes is not considered. [Conclusions] The model can effectively integrate the topic information and emotion information of the comments, improve the quality of the two-channel information fusion, and outperform the comparison model in the summary generation results. The generated summary can contain more emotion and topic information.

Key wordsReview Summary      Dual-Channel      Attention Mechanism      Pointer-Generator Network     
Received: 02 May 2023      Published: 08 January 2024
ZTFLH:  G35  
Fund:National Natural Science Foundation of China(62171043);Key Project of the National Language Commission of China(ZDI145-10);Scientific Research Project of the Beijing Municipal Education Commission(KM202311232001)
Corresponding Authors: Zhang Le,ORCID:0000-0002-9620-511X,。   

Li Honglian, Chen Haotian, Zhang Le, Lv Xueqiang, Tian Chi. A Review Summary Generation Model with Emotion-Topic Dual-Channel Information. Data Analysis and Knowledge Discovery, 2024, 8(6): 30-43.

Framework of Review Summary Generation Model with Emotion-Topic Information
主题句内容 方面词-情感词序列
价格 优惠 是 正品 很好用 包装 也 很 高端 大气 上档次 值得 购买 五星 好评 跟 专卖店 一样 价格-优惠 包装-高端
希望 店家 多多 优惠 其他 就是 感谢 店家 打折 送 券 活动 产品 总体 不错 快递 也 发货 很快 产品-不错 快递-很快
Samples of Aspect Words-Emotion Words Sequence
Framework of Bi-LSTM Emotion Word Recognition Model with Topic
评论内容 主题句 情感句
是 余华 老师 的 获奖作品 ,极力 推荐 。 是 一个 时代 的 缩影 ,人物
鲜活 ,形 象 生动 ,一口气 读完 ,真是 难得 的 佳作 。
是 一个 时代 的 缩影 人物 鲜活形象 生动
通俗文学 的 经典之作 ,情节 曲折离奇 ,引人入胜 ,人物 爱憎分明 ,
令人感动 ,主题 扬善 罚恶 ,催人泪下 。
情节 曲折离奇 人物 爱憎分明 主题 扬善 惩恶
催人 泪下
文景 的 书 ,纸质 和 印刷 没得说 。 胡赛 尼 的 书 总是 有 一种 吸引 你
一口气 读完 的 魅力 ,但是 这 本书 读 到 最后 又 舍不得 把 它 读完 。
个人 认为 这本 比 追 风筝 的 人 更 优秀 ,无论是 立意 内容 还是 语言 。
纸质 和 印刷 没得说
胡赛 尼 的 书 总是 有 一种 吸引 你
一口气 读完 的 魅力
但是 这本书 读 到
最后 又 舍不得 把
它 读完
Samples of Emotional Sentences and Topic Sentences
Dual Channel Pointer Network with Emotion-Topic Information
书名 评论 摘要
《红楼梦》 值 了 ,很棒 的 一套 珍藏品 ,平时 没事 拿来 看看 ,感觉 好极了 。 价格 实在 是 实惠 ,可比 书店 便宜 不少 。 印刷 质量 很 好 ,纸张 质量 也 不错 ,推荐 购买 。 很棒 的 一套
送货 速度 快 ,专用 瓦楞 纸盒包装 ,性价比 很 高 的 图书 。 硬皮 装订 带 简易 书签 ,有 彩色 插图 ,还 附送 一张 人物 关系 图 便于 阅读 过程 中 随时 查询 ,非常 实用 。 性价比 很 高 的
中国 的 国粹 。 红楼梦 这部 小说 所 要 表达 的 东西 很多 ,细细 品来 ,会 有 很多 人生 感悟 。 中国 的 国粹
Samples of Book Review Data
参数名 参数值
编码器原文本最大长度 150
编码器主题句最大长度 50
编码器情感句最大长度 30
训练集批处理大小 32
验证集批处理大小 32
学习率 0.001
隐藏层维度 256
Dropout 0.2
激活函数 ReLU
优化函数 Adam
Experimental Parameter Setting
算法或模型 ROUGE-1/% ROUGE-2/% ROUGE-L/%
Lead-1 23.16 17.89 21.22
TextRank 18.20 10.27 18.01
改进TextRank 19.64 11.25 19.32
BERTSUM 30.54 21.86 29.59
PGN 37.24 30.07 36.97
WordNet+Dual-Att+PGN 37.93 30.61 37.44
Transformer+PGN 38.31 19.77 38.01
LSTM+GCN 38.82 31.46 38.29
主题+PGN 39.07 27.66 38.63
本文 41.94 33.80 41.27
Comparison of Model Performance
原文 PGN 主题+PGN 本文
不知 从 何时 起 我 就 喜欢 上 了 艺术 ,艺术 的 故事 也 是 历史 的 故事 ,我们 一定 要 好好学习 艺术 。 艺术 是 很 有趣 的 学问 ,我 就 喜欢 艺术 一发 不可收拾 ,这 本书 关注 很久 了 ,接下来 好好 读读 。 我们一定要好好学习艺术,艺术很有趣。 喜欢上了艺术,艺术是个有趣的学问。 喜欢 艺术 一发 不可收拾,艺术 的 故事 是 历史 的 故事,也 是 有 趣 的 学 问。
收到 图书 后 马上 拆包 ,万万 没想到 ,满满的 惊喜 。 图书 是 彩印 的 ,完全 没有 油漆 味道 ,打印质量 非常 精致 ,图书 编辑 也 很 用心 ,部分 的 生僻字 会 用 拼音 标注 ,降低 青少年 的 阅读 难度 。 文字 优美 有 大量 优美 语句 ,词语 生动 ,适合 小学生 阅读 。 图书是彩印,没有油漆味,文字优美。 图书是彩印的,降低青少年的阅读难度,文字优美。 没想到,满满的惊喜,图书是彩印 的,没有油漆味道,打印 精致,适合小学生阅读难度。
非常适合 低年级 孩子 用来 了解 史记 的 一 本书 。 印刷 清晰 ,图片 精美 ,好 词会用 彩色 标示 出来 。 意外 的 是 后面 还会 有 词语 收藏夹 来 解释 这些 词语 ,文章 后面 还有 历史 总结 ,历史 总结 里面 包含 了 哲学 、 国学 、 启蒙 。 一套 入 了 不会 后悔 的 历史 、文学 、 哲学 、 国学 、 启蒙 书 。 里面 还 附赠 了 本 阅读 手账 ,孩子 非常 喜欢 。 印刷 清晰,图片 精美,好词 会 彩色 标示 的 一 本书。 适合孩子了解史记,印刷清晰图片 精美好词会用彩色 标示的一本书,入 了 不会 后悔。 适合 孩子 了解 史记,意外 的 是 后面还会 有 词语 收藏夹,印刷 清晰,图片 精美,好 词会用彩色 标示 的 一 本书。
读 《读者》 时 了解 到 ,《尤里西斯》 是 萧乾 、 文洁若 夫妻 二人 在 80 多 岁 的 时候 拖着 虚弱 的 身躯 ,整整 翻译 了 五年 ,可以 说 耗费 了 他们 许多 的 心血 ,觉得 非常 值得 拥有 ,所以 就 毫不 犹豫 下单 买 了 ,看到 这 本 书 有 八 大 特色 ,相信 不会 让 自己 失望 。 萧乾 拖着 身躯 翻译了 五年 ,可以 说耗费 了 许多 心血,值得 拥有 。 萧乾 拖着 身躯 翻译
了 五年 ,可以 说
耗费 了 许多 心血 ,有 八 大 特色 。
萧乾 拖着 虚弱 的 身躯 整整 翻译 了 五年 ,可以 说 耗费 了许多 心血 ,毫不 犹豫 下单 买 了 ,有 八 大 特色 。
Examples of Summary Results
评论内容 情感词典 Bi-LSTM情感词抽取模型
终于买到了余华的新书,先赞一下京东的物流,次日达真的是太快了,没有破损,包装很到位。然后书的质量很好精装书,内页纸张顺滑,手感也好,颜色偏黄对眼睛很友好。 终于买到了余华的新书,先赞一下京东的物流,次日达真的是太了,没有破损,包装很到位。然后书的质量很好精装书,内页纸张顺滑,手感也,颜色偏对眼睛很友好 终于买到了余华的新书,先赞一下京东的物流,次日达真的是太了,没有破损,包装很到位。然后书的质量很好精装书,内页纸张顺滑,手感也,颜色偏对眼睛很友好
封面精美 印刷清晰 纸张顺滑 。作为经典读物经常会看到网上的读者说看过这本书才知道什么是绝望的人生。在那个年代 很多人大概都是这么过来的。我反而觉得与其说这本书让人绝望不如说他是给人希望的 福贵在经历的家人一个个远去之后 不还是一样坚强的活着吗 还能时不时打趣的向作者讲述他的人生。作者写作流畅 故事引人入胜 触动人心。 封面精美 印刷清晰 纸张顺滑 。作为经典读物经常会看到网上的读者说看过这本书才知道什么是绝望的人生。在那个年代 很多人大概都是这么过来的。我反而觉得与其说这本书让人绝望不如说他是给人希望的 福贵在经历的家人一个个远去之后 不还是一样坚强的活着吗 还能时不时打趣的向作者讲述他的人生。作者写作流畅 故事引人入胜 触动人心。 封面精美 印刷清晰 纸张顺滑 。作为经典读物经常会看到网上的读者说看过这本书才知道什么是绝望的人生。在那个年代 很多人大概都是这么过来的。我反而觉得与其说这本书让人绝望不如说他是给人希望的 福贵在经历的家人一个个远去之后 不还是一样坚强的活着吗 还能时不时打趣的向作者讲述他的人生。作者写作流畅 故事引人入胜 触动人心。
Samples of Book Review Emotional Words Extraction
本文 41.94 33.80 41.27
PGN 37.24 30.07 36.97
w/o A-S Sequence 41.26 33.52 40.73
w/o sentiment+Dual-Attention 37.92 30.38 37.68
w/o center+Dual-Attention 37.85 30.61 37.58
w/o Dual-Attention 37.45 30.14 37.11
w/o sentiment 38.76 31.20 38.24
w/o center 38.52 31.05 38.12
Results of Ablation Experiments
