数据分析与知识发现  2021, Vol. 5 Issue (2): 43-49
  专题 本期目录 | 过刊浏览 | 高级检索 |
基于情感分析的微博热点话题用户群体划分模型 *
安徽理工大学计算机科学与工程学院 淮南 232001
Grouping Microblog Users of Trending Topics Based on Sentiment Analysis
Zhang Mengyao,Zhu Guangli(),Zhang Shunxiang,Zhang Biao
Computer Science and Engineering, Anhui University of Science & technology, Huainan 232001, China
【目的】 提出一种划分模型解决微博热点话题下用户群体分类问题。【方法】 从情感分析的角度入手,采用情感词典的方法计算用户文本情感值,并将文本情感值与用户文本向量表达相结合构建用户观点情感特征,利用K-means方法划分用户群体。【结果】 本文提出的话题下用户群体划分模型将用户分为三类,评价指标CA的值为78.2%。【局限】 该模型在划分用户群体时需要首先确定类别数。【结论】 根据研究结果可知本文构建模型和选取特征的有效性;同时,使用该模型划分的用户群体精度较高,能很好地将有相同情感观点的用户聚为一类。

关键词 微博情感分析词典聚类用户群体划分    

[Objective] The paper proposes a model to group users of Weibo trending topics. [Methods] First, we computed the sentiment of user’s texts with sentiment dictionary. Then, we combined sentiment and text vector expression to determine the characteristics of user opinion. Finally, we grouped similar users with the K-means method. [Results] The proposed model divided users into three categories, and the value of evaluation index (CA) reached 78.2%. [Limitations] Our model needs to define the number of categories before dividing user groups. [Conclusions] The proposed model could effectively group users with the same sentimental views.

Key wordsMicroblog    Sentiment Analysis    Dictionary    Clustering    User Group Classification
收稿日期: 2020-10-28      出版日期: 2020-12-15
ZTFLH:  TP393  
通讯作者: 朱广丽 ORCID:0000-0003-4364-866X     E-mail:
张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
Zhang Mengyao, Zhu Guangli, Zhang Shunxiang, Zhang Biao. Grouping Microblog Users of Trending Topics Based on Sentiment Analysis. Data Analysis and Knowledge Discovery, 2021, 5(2): 43-49.
Fig.1  划分模型研究框架
词语 词频 词语 词频
李某 461 希望 102
贾某 328 举报 96
出轨 299 喜欢 94
离婚 288 网页 93
251 心疼 88
孩子 246 明星 84
恭喜 189 终于 81
某馨 188 评论 69
视频 167 家庭 68
哈哈哈 123 可怜 65
女人 117 好好 65
106 可惜 59
Table 1  部分特征词及词频
用户 观点情感特征
Since-孟孟孟子 0 0 0 0 0 0 0 0 0 0 0 4.77 0 0 0 5.98 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
类阿类- 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
殷进媳妇儿 0 0 0 0 0 0 0 0 0 0 0 0 5.98 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3.94 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
柑g子 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
勋鹿家的小仙女 0 0 0 0 0 0 0 0 0 0 0 4.77 0 0 0 5.98 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
阿桐baby 0 0 0 0 0 0 0 0 0 0 0 9.54 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
水瓶座佳佳大本营 0 0 0 0 0 0 0 0 0 0 0 3.18 0 0 0 3.98 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Table 2  部分观点情感特征
编号 用户序号 用户 评论
1 3 一个平凡人的吃瓜专用微博 既然不爱,分开吧,搞得鸡飞狗跳,看着都累。希望某馨健康成长。
6 8 起名太难不会改 各自安好吧,婚姻如饮水冷暖自知,作为局外人,没法说真的谁对谁错,好好对某馨,我喜欢你的女儿
13 15 就叫阿馨呀 好好对待孩子,别让孩子扯入大人的恩怨纠纷
137 139 傻fufu猪猪 你是真的绿茶,心痛亮哥和某馨
315 317 做不了你的洛璃但想见你 心疼亮哥和某馨
405 407 蓝忘机0818 主要还是心疼某馨和贾某
431 433 foxfoxy琳 心疼孩子
439 441 梦509 心疼某馨
609 611 如何为了自己奋斗一次 尊重对方,给孩子一个健康成长的环境。大人的错误不该让孩子来买单。
738 740 shan-yolo 某馨真可怜
1 121 1 123 长宁2004 就没有想过孩子吗
Table 3  部分第二类用户及其评论
编号 用户序号 用户 评论
18 20 Since-孟孟孟子 恭喜亮哥
39 41 勋鹿家的小仙女 恭喜亮哥
43 45 阿桐baby 恭喜
49 51 水瓶座佳佳大本营 恭喜亮哥脱离苦海
108 110 Rsskcs 恭喜亮哥
134 136 Sai平安喜乐 恭喜亮哥脱离苦海
162 164 再无感100 恭喜亮哥脱离苦海
170 172 小赞哥呀 恭喜贾某脱离苦海 喜得重生
172 174 H魔法师阿狸H 恭喜亮亮脱离苦海
191 193 禹棹奂女朋友 终于发声明了 恭喜亮哥
205 207 乱花渐欲迷人眼520 恭喜亮哥喜得单身
Table 4  部分第三类用户及其评论
