基于SVM和CRF的三孩政策舆情省份差异分析*
Analyzing Public Opinion on Three-Child-Policy with Sentiment Classification and Keyword Extraction
通讯作者: 钟寒,E-mail:zhonghan@ppsuc.edu.cn。
收稿日期: 2022-01-23 修回日期: 2022-04-2
基金资助: |
|
Corresponding authors: Zhong Han,E-mail:zhonghan@ppsuc.edu.cn。
Received: 2022-01-23 Revised: 2022-04-2
Fund supported: |
|
【目的】 对三孩政策相关舆情在不同省份的区别进行分析研究。【应用背景】 三孩政策舆情的分析往往将全网的三孩舆情视为一个整体,忽视了不同省份群体对三孩政策的诉求、关注点的不同;对三孩政策舆情的文本研究存在方法简单、数据来源单一的问题。【方法】 首先从统计学角度基于时间序列分析三孩舆情热度,然后基于支持向量机方法对三孩舆情进行情感分析,发现负面舆情,进而基于CRF方法进行关键词提取并形成词云。对不同省份的三孩舆情文本展开研究,得到不同省份的三孩负面舆情词云。对比不同省份负面舆情关键词与不同省份的政治、经济统计数据,分析其中的联系。【结果】 三孩政策舆情热度高于同期政策类舆情。舆情以中性情感为主,占60.56%;积极情感为辅,占35.15%;存在少量负面舆情,占4.29%。不同省份的舆情关注点不同,这些差别与各省的政治经济生态差异是有关联性的。【结论】 三孩政策的舆情工作应当考虑不同省份的实际情况,针对人民关切的问题做出回应,及时跟进相关的配套措施。
关键词:
[Objective] This paper studies the public opinion on the three-child-policy in different Chinese provinces. [Context] Existing research on this issue addresses public opinion from the Web as a whole, and ignores the demands or concerns from individual province. These studies’ research methods are rather simple with single data source. [Methods] Firstly, we analyzed the public opinion on three-child-policy with time series method from the statistical perspective. Then, we examined their sentiments with the SVM model, and extracted keywords from the negative opinion with the CRF model. Third, we created word clouds for these keywords. Finally, we conducted research on these public opinion in different provinces and generated word clouds for them. We also examined the ties between political or economic statistics and the negative key words from different provinces. [Results] The three-child-policy was more popular than other policies during the same period. The public opinion was dominated by neutral sentiments (60.56%), followed by the positive (35.15%) and the negative ones (4.29%). Public concerns in different provinces were different and correlated to the political, economic and ecological factors. [Conclusions] Different provinces should adopt customized public opinion guidance to support the three-child-policy, which will address people’s concerns more effectively.
Keywords:
本文引用格式
孟凡思, 钟寒, 施水才, 谢泽坤.
Meng Fansi, Zhong Han, Shi Shuicai, Xie Zekun.
1 引言
1.1 研究背景
人口是社会经济发展的基石,人口问题是我国社会经济发展面临的重大问题。国家统计局发布的数据显示,我国人口生育率自1965年达到6.38%的峰值后就一路走低,1991年降至2.14%,之后始终低于2.10%的更替水平。2015年,国家实施全面二孩政策后有过短暂的回升,之后又迅速回落。根据第七次全国人口普查结果,与2010年(第六次全国人口普查)的数据相比,全国人口增加7 206万人,增长5.38%,年平均增长率为0.53%,比2000年-2010年的年平均增长率0.57%下降0.04个百分点。数据表明,我国人口10年来继续保持低速增长态势[1]。我国对于“少子老龄化”这一目前人口发展中特别突出的人口现象,相继推出“单独二孩”和“全面二孩”生育政策。随着政策的发布落地,我国人口的出生状况虽有一定的改善,但依然存在生育水平持续走低的风险。在第七次全国人口普查后,更是提出全面三孩生育政策,希望通过增加幼年人口,改善我国不合理的人口结构,积极应对人口老龄化的发展趋势[2]。2021年5月31日中共中央政治局召开会议,会上提出进一步优化生育政策,审议《关于优化生育政策促进人口长期均衡发展的决定》后,主要官媒相继于2021年6月1号发布了三孩政策的博文,发布后引起了群众极大的反响[3]。
基于三孩政策博文的网民评论既包含群众的调侃,也有着群众内心真实的意思表示。提炼网民评论数据背后蕴含的信息,能够为三孩政策的贯彻落实提供最为真实有效的数据支持,针对大众的意见进行调整修正能够帮助政策更加贴近实际,实现既落实国家意志、又满足公民需求的作用。同时,关于三孩政策的网络舆情中负面的内容也不容忽视。经过对舆情的分析监测发现,其中有不少内容打着“民主”、“平等”等旗号制造性别对立,创造焦虑氛围,也有信息分析对比政策的发布更新速度,暗示政策制定不合理,影射领导问题。对于这些煽动性的可能诱发社会不稳定的信息,需要进行及时的溯源查证和正向诱导来营造干净纯洁的互联网氛围。
1.2 研究意义
通过对政策相关舆情的研究,有助于畅通意见表达的渠道、了解民意,以便指导下一步的宣传工作。同时,通过对舆情文本进行分析,可以找出民众关切的重点问题,帮助政府科学决策,使问题得到妥善解决。
另外,网络舆情具有两面性。从正面效果来看,广大网民可以通过网络平台广泛参与社会性公共事件的讨论,实时表达自己的态度、看法、意见或者观点,一方面提高了公众参与社会性公共事务和社会管理的积极性,另一方面为政府、企业和其他社会组织深入了解民情民意,形成有价值的参考意见提供了智力支持。从负面效果来看,由于网络的匿名性,其在促进真实信息传播的同时也无法避免不良信息的侵入,进而使得群众被不良情绪所感染或者被不良信息所诱导,引发大规模、多中心的舆情危机态势,给社会稳定和国家治理带来风险。
2 相关工作
由于舆情在社会治理方面的重要作用,对于舆论的掌握和利用越来越受到社会各界的重视,相关的研究也处于蓬勃发展的阶段。对于舆情的研究主要分为分析和预测两个方向。一方面,针对已经发生的舆情,研究其发生、传播、演化的规律和影响因素,寻找舆情传播网络中影响力大、扩散力度强的关键节点,对比分析不同的主体行为、网络环境、平台机制对舆情传播的影响,或跟踪舆情主题在舆情发展过程中的动态演化。叶金珠等基于经典扩散模型建立基于个体水平的网络群体行为扩散模型,对网络群体行为的扩散模式进行研究,解释了网络突发事件的蔓延机制[8];黄微等结合微博运行机制和知识图谱的理论与方法,构建微博主题识别知识图谱以及微博主题演变知识图谱,进而发现其演变路径,揭示其动态变化过程[9]。另一方面,基于过往的舆情事件数据建立模型,针对未来可能的舆情或已有舆情可能的传播趋势进行分析预测,判断其热度拐点、话题演变趋势等,为下一步的宣传、引导工作提供支持,由于网络舆情具有不规则、小样本、动态性和不确定性等特点,网络舆情的预测工作一直是舆情分析的热点和难点。赵艺等采用Elman神经网络模型对突发疫情环境下的网络舆情传播趋势进行预测分析,为突发疫情环境下的社会稳控工作提供数据支持[10]。林玲等针对网络舆情的小样本特性,提出一种改进灰狼优化支持向量回归的网络舆情预测模型,有效提高了网络舆情预测的准确性与稳定性[11]。
随着三孩政策出台,各种相关的研究也紧随其后。首先是从社会学的角度出发,对三孩政策的思想做出解读、分析和建议。风笑天认为提升三孩生育率要从提升二孩生育率开始,指出要更加关注和重视提高育龄人口的二孩生育意愿和生育行为,努力建立与鼓励生育相适应的新型生育文化[2]。之后,风笑天又从政策、思想和方法的角度解析国家生育政策调整的目标[15];还指出了二孩生育意愿预测工作中既没有纳入已生育二孩的人口,也没有对“没想好”的人口比例进行必要调整的问题[16]。其后又有学者从专业角度出发,针对政策施行过程中的配套措施提出建议,如杨燕绥等从医学角度出发,通过成功案例构建医护融合服务体系的综合治理机制[17]。相关 数据分析方面的研究论文出现相对较晚。如陈卫基于第七次全国人口普查数据对中国的人口情况和演化趋势进行定量分析,论证三孩政策的合理性和必要性[18]。也有学者对三孩政策的舆情进行分析。如李丹等基于自然语言处理中情感分析方法,对官微博文评论数据进行分析,研究网民对三孩政策的情感态度和关注点,并分析其成因[19]。
3 传统方法的舆情分析
3.1 实验设计
本文结合自三孩政策发布以来的社交媒体数据信息进行相关分析。首先对文本进行预处理,包括分词、去停用词等。将预处理后的文本进行情感分类,找出三孩政策相关负面舆情,之后按舆情来源的省份不同对其进行分类,并完成关键词提取,形成不同省份三孩政策相关负面舆情的词云。
三孩政策的热点引爆是以新浪微博平台上的一篇博文为起点的,由于新闻的时效性,相关信息在微博上一经发布便引起了转发评论的热潮。从三孩政策在不同平台的热度。可以看出,相关的信息以微博为主要发生地。基于此,本文选择新浪微博平台作为研究对象。
对微博平台自三孩政策首条博文发布以来一个月的全量微博数据信息进行数据采集,包括关于三孩政策的原发博文文本信息、转发博文的观点内容、每个原发博文的点赞关注情况和每条博文下的评论内容信息,共计92万余条。从热度、情感和主题三个方面分析三孩政策在新浪微博的相关舆情。
3.2 基于时间序列的热度分析
为更直观地体现三孩政策的舆情热度,本文通过网络爬取微博数据并作统计分析,自三孩政策提出至2021年7月1日,原发博文文本信息、转发博文的观点内容、每个原发博文的点赞关注情况和每条博文下的评论内容信息共计92万余条,其中评论信息26万余条。同时,为表现三孩政策在群众中的反响,选取“离婚冷静期”和“延迟退休”这两个民生政策话题与“三孩政策”进行对比分析,三个话题热度高峰过后的7天的热度如图1所示。
图1
在三个政策话题均经过舆情的高潮期后,三孩政策在一周的时间内的热度高于延迟退休和离婚冷静期话题。可以明显地看出三孩政策的舆情热度远高于一般的政策类舆情。
针对三孩政策舆情第一周的热度显然高于之后几周的情况,分析博文的发布信息和发布时间,对微博数据信息按周进行时间序列分类,结果如图2所示。大部分信息集中发布于周一到周三,结合文本信息说明,繁重的工作会增加人们讨论三孩政策的热情及讨论中负面言论的比率。进一步针对博文的内容进行分析,分别对敏感博文信息和评论信息进行研究,发现存在大量的相似文本表述,多为生活压力、女性权利等方面的信息,且三孩政策发布的同时女性权利话题热度存在陡然上升、陡然下降的情况,如图3所示。女性权利的热度变化与三孩政策有关联性。其中表述间存在高度相似性,从发布时间上看,存在陡然上升、陡然下降的情况。结合文本来看多是对官方信息的带观点转发。基于此认为一定程度上存在部分水军账号以及通过自动化脚本进行博文撰写、发布来营造舆论氛围的机器人账号。
图2
图3
3.3 舆情文本的情感分类
关注舆情的目的是为施政服务,对于政策类舆情首先应关注舆论的情感倾向,以观察民众对政策的接受度和认可度。因此本研究通过敏感词识别和情感维度分析,对三孩政策中敏感消极的博文进行提取和分析。
为找到最适合三孩舆情文本的情感分析方法,本文抽取10 000条语料进行人工标注,在其中随机抽取70%作为训练集,其余作为测试集,分别使用朴素贝叶斯(NB)、长短期记忆网络(LSTM)、支持向量机(SVM)和XGBoost等4种方法进行情感分类工作,结果如表1所示。
表1 算法性能对比
Table 1
算法 | 标签 | 精确率 | 召回率 | F1值 | 支持度 | 准确率 |
---|---|---|---|---|---|---|
NB | 0(负面) | 0.74 | 0.83 | 0.78 | 155 | 0.858 |
1(正面) | 0.92 | 0.87 | 0.89 | 145 | ||
LSTM | 0(负面) | 0.79 | 0.61 | 0.69 | 155 | 0.830 |
1(正面) | 0.84 | 0.93 | 0.88 | 345 | ||
SVM | 0(负面) | 0.82 | 0.69 | 0.75 | 155 | 0.856 |
1(正面) | 0.87 | 0.93 | 0.90 | 345 | ||
XGBoost | 0(负面) | 0.74 | 0.81 | 0.77 | 155 | 0.852 |
1(正面) | 0.91 | 0.87 | 0.89 | 345 |
综合来看,SVM方法在本数据集上表现最好,因此选用SVM方法对三孩政策舆情文本进行情感分析。SVM是一种情感分类模型,以设定好的特征为基础和核心,分析文本的情感倾向,常用于解决模式识别与函数逼近问题[20]。特征表示部分取文本的正面情感词数量、负面情感词数量、程度副词分值、感叹号数量、问号数量、否定词数量等6个特征。结果显示,文本中负面情绪主导的舆论占4.29%,正面情绪主导的舆论占35.15%,情感分类为中性的舆论占60.56%。
3.4 关键词抽取
为进一步探究民众产生负面情绪的原因,本文对三孩舆情进行关键词抽取,借以了解民众对三孩政策的关注点。
从整体上来看,目前学界主流的关键词抽取研究更偏向基于有监督的方法,研究中所选用的模型也从分类模型转向序列标注模型[21]。因此,本文选择使用经典的序列标注模型条件随机场(Conditional Random Field, CRF)来进行三孩政策的舆情关键词抽取。
针对三孩政策舆情做情感分析,抽取负面舆情,进行关键词抽取,得到词云如图4所示。
图4
结合文本内容得出结论,民众对三孩政策的担忧主要集中在:
(1)在国家大力推行三孩政策的前提下,女性权益是否能得到保障,女性的就业自由是否会受到影响。
(2)在经济日益发展、生活压力日渐增大的现代社会,养育多个孩子带来的高额养育负担如何解决。
(3)配套的政策,如孩子的教育、医疗等配套的公共服务。
(4)更多的生育是否会给女性的身体健康带来损害。
表2 负面舆情主题对比
Table 2
所发布政策 | 高频词 |
---|---|
全面二孩政策 | 看孩子劳累、二孩幸福、二孩教育、二孩家庭接纳、老人带孩子 |
三孩政策 | 性别平等、配套措施、生育权、婚嫁陋习、女性压力、生育负担 |
对比发现,在全面二孩和三孩政策发布后,舆论重点既有差异,又有相同之处。全面二孩政策时期人们的担忧主要集中在孩子的抚育问题上,而三孩政策时期,年轻人开始将视线转移到自己身上,更多地担心自身是否有抚育第三个孩子的能力,对抚养第三个孩子要承担的责任和成本感到担忧,并在舆论中以调侃或激烈的言论表现出来。
一方面说明人们在经历了全面二孩政策落地之后,对生育更多孩子面临的问题有了更全面和深刻的认识。表现在舆情当中为,人们的政策理解能力有了明显提高,对政策有了更深入的思考,对三孩政策的讨论热度更高,议题更加多元和尖锐。另一方面也说明许多生育过程中和生育后所必然出现的家庭和社会矛盾在全面二孩期间即已经出现,需要在三孩政策提出后得到配套的解决方案。但无论全面二孩政策还是三孩政策,人民最关切的始终是与自身生活息息相关的话题,对于人口老龄化、人口结构、人口红利等话题并不关注,甚至表现出一定的排斥。
4 基于不同省份的舆情差异的分析
4.1 不同省份的三孩舆情热度分析
研究发现,不同地区的群众对三孩政策的关注程度有明显不同。为研究三孩政策舆情在不同省份的差异,根据文章发布地域统计三孩政策舆情在不同省份的热度,除以本省人口数并作归一化作为“热度指数”,取热度前10的省份,结果如图5所示。可以看出,不同省份对三孩政策的讨论热情明显不同,省份热度与经济发展水平相关。
图5
图5
三孩政策舆情省份热度
Fig.5
Popularity of the Three-Child Policy in Different Provinces
4.2 不同省份负面舆情关键词差异分析
为进一步探究不同省份的舆情差异,对来自不同省份的舆情文本分别进行负面舆情提取、关键词抽取,给出不同省份的三孩政策舆情关键词表,如表3所示。
表3 不同省份舆情关键词
Table 3
省份 | 北京 | 广东 | 浙江 | 山东 | 四川 |
---|---|---|---|---|---|
TOP1 | 年轻人 | 朱列玉 | 微信公众号 | 山东 | 奖励 |
TOP2 | 北京 | 小孩 | 篡改 | 淄博 | 复读 |
TOP3 | 管培生 | 幼儿教育 | 新闻 | 三胎 | 家长 |
TOP4 | 生孩子 | 女职工 | 截图 | 考生 | 四川 |
TOP5 | 怀孕 | 子女 | 三个子女 | 山东高考 | 成都 |
TOP6 | 劳动者 | 照顾 | 县城 | 调查 | 学生 |
TOP7 | 投资 | 延长产假 | 房价 | 多地 | 辅助生殖 |
TOP8 | hr | 负担 | 丽水市 | 有望 | 医学 |
TOP9 | 躺平 | 照看 | 丽水 | 调研 | 小孩 |
TOP10 | 资本家 | 全国人大代表 | 公安局 | 会议 | 生三孩 |
省份 | 河南 | 江西 | 湖北 | 陕西 | 重庆 |
TOP1 | 高三 | 研判 | 受访者 | 托育 | 养老 |
TOP2 | 房间 | 会议 | 公共服务 | 西安 | 复读 |
TOP3 | 笔记 | 江西 | 儿童 | 青年 | 福祉 |
TOP4 | 女士 | 贷款 | 放开 | 调查 | 豪华 |
TOP5 | 拍下 | 部署 | 优惠 | 人口老龄化 | 人口老龄化 |
TOP6 | 来源 | 调研 | 出行 | 应对 | 三胎 |
TOP7 | 学习 | 多地 | 时代 | 调研 | 重庆 |
TOP8 | 学生 | 高于 | 景区 | 母婴 | 座椅 |
TOP9 | 妈妈 | 全市 | 调查 | suv | 老龄化 |
TOP10 | 理想 | 银行 | 应对 | 会议 | 应对 |
人口问题从来不是孤立的,作为关系国计民生的基本问题,与经济、社会、教育、政治都有着密不可分的联系。从表3中可以清楚看到,相比总体关键词,不同省份关键词的舆情指向更加明确具体,更能反映网民的需求和关切。例如,北京的网民更关心年轻人的工作问题,体现在负面舆情词云中包含“劳动者”“hr”“躺平”等词;而山东网民的负面舆情词云则主要围绕“高考”这一中心展开。显然,不同省份的网民对于三孩政策的关注点有较大区别,相应地,相关的舆情研究、政府舆论引导、监督工作也应有不同的侧重点。
从总体的关键词抽取任务中,网民对三孩政策的负面情绪来源包括就业、升学、女性权利等多个方面,而从不同省份的关键词抽取结果看,这些负面情绪来源的比重是不同的。
4.3 针对不同省份负面舆情关键词的关联分析
以河南高频词“高三”“学习”“学生”为例,判断河南网友生育三孩的顾虑中,高考压力占比较大。查阅各省考试院公布的2020年高考人数,结果显示,河南存在较重的高考压力和负担,结合“高三”“学习”“学生”等与高考关联较强的高分负面舆情词可以认为,河南这种较重的高考压力已经对三孩政策的施行和民众对三孩政策的接受产生了较为严重的影响。
重庆的负面舆情高频词中同时出现了“养老”“人口老龄化”“老龄化”等词,说明重庆市的网民对三孩政策的不满与当地的人口老龄化现象有关。查阅各省65岁以上人口占比,发现重庆市确实存在人口老龄化严重的现象。结合相应的三孩政策负面舆情高频词,本文认为重庆市的网友对三孩政策的抵触情绪与当地较为严重的人口老龄化现象之间存在因果关系。
综上所述,对各省的负面舆情分别计算得到词云,找出各省高频词中有别于其他省份的内容,结合各省政治、经济、文化进行分析,有助于更深入地分析舆情中负面情绪的来源和产生机理,为政府的科学决策提供参考。
5 结论
根据上述的实验结果,结合社会学相关理论和互联网特征得到结论如下:
(1)三孩政策在发布后较同类政策信息收获了更高的关注度,其中大部分网民在意生育的相关政策和配套的支持措施,网络舆情整体关注三孩政策配套的福利待遇和政策具体内容。可见网民对于三孩政策的关注重视和后续的期待。同时,不同省份的网民对三孩政策的关注度和讨论热情也存在明显差异,热情较高的省份往往是经济发达地区如北京、浙江,或人口大省如山东、河南。
(2)在三孩政策的网络讨论中,存在部分网络水军发布同质度较高的负面言论,虽然其规模不大,影响有限,但绝不容忽视大意。对于疑似的网络水军,可以设计对应的措施限制其文章发布数量,如增加发文前的验证码输入、对相似文本拒绝发布等;同时,对于全时段活跃账号进行内容的监测和限制,使得基于人工的网络水军不能使用同一个账号进行大量的引流操作,实现对网络机器人和人工水军的制约,确保此话题下的内容中没有繁杂的噪音。
(3)部分用户由于其文化背景和生活经历的原因,思想情感和价值观念同国内的主流文化存在较大的意识形态上的差距,求同存异的同时也应当对其中的煽动性言论进行及时的监测和制约。如针对话题中的敏感词汇进行语料库的构建,对于命中语料的信息进行人工的审核监督,使得相关的情感不会出现极化情况,浏览访问者既能够接受来自不同地域的文化信息,又能够正确认识自身所处环境,实现思想交流的同时维护内心的立场坚定。
(4)从政策宣传角度来看,“为改善人口结构、促进社会经济发展而鼓励生娃”会引起民众较大的反感。而政策改进类,如“教育改革(双减)”、“防沉迷系统的改进推广”等政策宣传的舆情反响则普遍向好。针对网民提出的福利问题,可以结合二孩政策的相关配套支持措施及其效果进行后续的深入研究,国家卫健委2019年全国人口与家庭动态监测调查显示,有生育二孩及以上打算的妇女,仅不足半数实现了再生育,即要想落实好三孩政策,优先要对二孩政策的结果进行分析和深入的贯彻落实,提高二孩生育率才是实现三孩政策的基础和保障。将宣传工作的重心放在三孩相关配套政策的细节上,如政策内容、推行方法、推行结果等,能有效改善民众对三孩政策的信心。
(5)不同省份的网民对三孩政策的关注点不同,所期望的后续配套措施也各有侧重,应予以适当关注。
6 研究不足与展望
(1)信息平台较为单一,未选择全平台数据进行分析。理论上应当结合多个主流媒体平台的数据进行分析,实现全量的数据收集才可能提炼出最精确的信息。
(2)数据均为自然语言文本,未进行语音、图像信息和视频信息的处理,存在数据损失情况,后续可以结合文字识别技术对此类信息进行处理,从而能够基于多模态数据进行分析,使结果更具有说服力。
(3)数据选取的时间跨度较小,仅选取政策相关信息发布后一个月的数据,当时相关的具体信息未进行发布,此时得到的信息不具有代表性,仅为网民对于政策字面意义的理解。后续可以针对每一项具体措施及其实施效果进行追踪研究。
(4)不同省市自治区的舆情情况存在较大的差异,其在一定程度上能够反映政策在不同地区的实施情况。未来可以考虑参考不同区域的词频特征对其词频的成因进行基于人口学变量和区域社会文化上的分析,从而针对不同的区域制定更加适合区域三孩政策落实的相关计划,实现基于互联网舆情信息上的因地制宜,更具有针对性地增加区域内公民的政治参与感、社会建设的使命感和荣誉感,从而能够在后期更好地参与网络讨论,实现网络舆情环境建设的正向积极循环。
综合来看,本文针对三孩政策的先导信息进行了短期的舆情追踪和分析,得到了三孩政策的舆情特征规律,初步实现了基于互联网舆情数据归纳总结信息、基于信息萃取提炼知识的过程。知识应当反作用于现实创造价值发挥作用。由于官方发布的三孩政策的相关信息量较少,本文并没有获取到相关政策的大众意见数据,未来可以基于此继续进行针对某项制度的专项分析。
作者贡献声明
孟凡思:提出研究思路和方案,进行实验和论文写作;
钟寒:确定研究方案,参与论文实验,论文最终版本修订;
施水才:完善研究方案,对论文提出修改意见;
谢泽坤:提出研究方案,参与论文实验。
利益冲突声明
所有作者声明不存在利益冲突关系。
支撑数据
支撑数据由作者自存储,E-mail: 805261341@qq.com。
[1] 孟凡思, 钟寒, 施水才, 谢泽坤. sentiment_data.zip. 情感分析工作所需的标注数据.
[2] 孟凡思, 钟寒, 施水才, 谢泽坤. sentiment_model.zip. 情感分析模型.
[3] 孟凡思, 钟寒, 施水才, 谢泽坤. correlation_data.zip. 三孩舆情相关对比数据.
[4] 孟凡思, 钟寒, 施水才, 谢泽坤. text_data.xlsx. 三孩舆情文本数据.
参考文献
2010年第六次全国人口普查主要数据公报(第一号)
[R].
Major Figures of the 2010 National Population Census(No. 1)
[R].
三孩生育政策与新型生育文化建设
[J].
The Three-Child Policy and the Construction of the New Fertility Culture
[J].
关于优化生育政策促进人口长期均衡发展的决定
[R].
Decision on Optimizing Birth Policy to Promote Long-Term Balanced Development of Population
[R].
Introduction to Network Public Opinion Research
[M].
涉警舆情结构及其演化机理分析
[J].
The Structure and Evolution Mechanism of Police-Related Public Opinion
[J].
舆情概念认识中的两个基本问题
[J].
Two Basic Problems in Public Opinion Concept Understanding
[J].
网络舆情研究进展及其主题关联关系路径分析
[J].
DOI:10.13266/j.issn.0252-3116.2021.07.014
[本文引用: 1]
<b>[Purpose/significance]</b> This paper aims to sort out the research progress of network public opinion, which helps to clarify the internal relationship and theme evolution path among the knowledge base, transmission law, early warning mechanism and governance strategy of network public opinion research. <b>[Method/process]</b> Firstly, this paper analyzed the theoretical knowledge basis of network public opinion. Then, according to the law of content progression, the research of network public opinion was divided into four themes: influencing factors, transmission path, early warning mechanism and guiding governance strategy. Content analysis and social network analysis were used to analyze the topic correlation and explore the evolution path of network public opinion. <b>[Result/conclusion]</b> The results show that life cycle theory, cognitive set theory, silence spiral, group polarization theory, butterfly effect theory and governance theory are often used as the theoretical knowledge basis of network public opinion research. In addition, the network media environment, social structure pressure, netizens’ psychology, trigger events, effective mobilization and social control force are regarded as the important factors influencing the evolution of network public opinion. Moreover, the six themes of online public opinion, public opinion events, social media, stakeholders, big data and information dissemination are closely related to other research contents, and they play an important bridging role in the evolution path of themes.
Analysis on the Association and Evolution Path of Internet Public Opinion
[J].
DOI:10.13266/j.issn.0252-3116.2021.07.014
[本文引用: 1]
<b>[Purpose/significance]</b> This paper aims to sort out the research progress of network public opinion, which helps to clarify the internal relationship and theme evolution path among the knowledge base, transmission law, early warning mechanism and governance strategy of network public opinion research. <b>[Method/process]</b> Firstly, this paper analyzed the theoretical knowledge basis of network public opinion. Then, according to the law of content progression, the research of network public opinion was divided into four themes: influencing factors, transmission path, early warning mechanism and guiding governance strategy. Content analysis and social network analysis were used to analyze the topic correlation and explore the evolution path of network public opinion. <b>[Result/conclusion]</b> The results show that life cycle theory, cognitive set theory, silence spiral, group polarization theory, butterfly effect theory and governance theory are often used as the theoretical knowledge basis of network public opinion research. In addition, the network media environment, social structure pressure, netizens’ psychology, trigger events, effective mobilization and social control force are regarded as the important factors influencing the evolution of network public opinion. Moreover, the six themes of online public opinion, public opinion events, social media, stakeholders, big data and information dissemination are closely related to other research contents, and they play an important bridging role in the evolution path of themes.
网络突发事件蔓延机理研究
[J].
The Mechanism of Internet Emergency Spread
[J].
基于知识图谱的微博主题演变路径研究
[J].
Research on the Evolution Path of Microblog Topic Based on Knowledge Graph
[J].
突发疫情环境下网络舆情传播趋势预测及社会保障应急机制研究
[J].
The Trend Forecast of Internet Public Opinion Dissemination and Social Security Emergency Mechanism in the Emergent Epidemic
[J].
基于改进灰狼优化支持向量回归的网络舆情预测
[J].
DOI:10.12011/SETP2020-1500
[本文引用: 1]
网络舆情发展趋势预测对政府相关部门的舆情监测与管控有非常重要的参考意义.针对网络舆情的小样本特性,同时考虑适用模型的时效性和准确度,本文提出一种基于佳点集方法初始化、非线性参数控制以及对引领狼赋权的改进灰狼优化支持向量回归(IGWO-SVR)的网络舆情预测模型,以"新冠肺炎"、"中国梦"等百度指数作为舆情数据样本进行了实证研究.对比实验结果显示,改进后的灰狼优化算法有较强的全局搜索能力、较快的收敛速度以及较好的稳定性.IGWO-SVR网络舆情预测模型有较为突出的准确性与稳定性,能够为政府舆情管控部门提供较好的决策参考.
Prediction of Network Public Opinion Based on Improved Grey Wolf Optimized Support Vector Machine Regression
[J].
DOI:10.12011/SETP2020-1500
[本文引用: 1]
网络舆情发展趋势预测对政府相关部门的舆情监测与管控有非常重要的参考意义.针对网络舆情的小样本特性,同时考虑适用模型的时效性和准确度,本文提出一种基于佳点集方法初始化、非线性参数控制以及对引领狼赋权的改进灰狼优化支持向量回归(IGWO-SVR)的网络舆情预测模型,以"新冠肺炎"、"中国梦"等百度指数作为舆情数据样本进行了实证研究.对比实验结果显示,改进后的灰狼优化算法有较强的全局搜索能力、较快的收敛速度以及较好的稳定性.IGWO-SVR网络舆情预测模型有较为突出的准确性与稳定性,能够为政府舆情管控部门提供较好的决策参考.
面向不同用户群体的社交媒体台风舆情演化分析及对比研究
[J].
DOI:10.12082/dqxxkx.2021.210065
[本文引用: 1]
社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风“利奇马”为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:① 在省级范围内,微博数据能有效反映台风动态和灾害时空分布;② 台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;③ 官方微博文本比民众微博文本具有更明确的主题社团结构;④ 台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。
Analysis and Comparative Study of the Evolution of Public Opinion on Social Media During Typhoon for Different User Groups
[J].
DOI:10.12082/dqxxkx.2021.210065
[本文引用: 1]
社交媒体数据可以为台风灾害追踪、灾时救援和灾情评估提供及时有效的信息。现有研究常采用主题建模和情感分析等技术对台风期间社交媒体平台(如新浪微博等)舆论话题和情感变化进行研究。在省域范围内以小时为时间粒度的多维度有效性论证尚有欠缺,且在舆情分析时未能区分用户群体差异。本文以台风“利奇马”为例,在浙江省域范围内,以新浪微博数据为研究对象,首先从词频分析、台风关注度时空变化以及特定灾害事件响应3个角度探讨了微博数据对台风灾情响应的有效性;其次采用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型技术挖掘微博文本主题信息,并根据Louvain算法对主题社团进行划分;然后开发了一种基于自定义情感词典的情感分析方法用于情感指数计算,与SnowNLP相比情感倾向性预测精度得到了提高;最后分析了台风期间官方和民众在新浪微博平台上的话题关注以及情感演变差异。结果表明:① 在省级范围内,微博数据能有效反映台风动态和灾害时空分布;② 台风事件微博文本的主题变化反映了灾情不同阶段舆论关注点的动态变化;③ 官方微博文本比民众微博文本具有更明确的主题社团结构;④ 台风事件相关微博文本中的消极情绪在台风登陆后显著增加,其中民众微博文本对台风灾害的情绪响应更及时,官方微博文本中的情感表达始终相对积极。
案件要素句子关联图卷积的案件舆情摘要方法
[J].
Case-Related Public Opinion Summarization Method Based on Graph Convolution of Sentence Association Graph with Case Elements
[J].
基于层次分析的长短记忆网络(AHP-LSTM)的食品安全网络舆情预警模型
[J].
An Early-Warning Model Based on an Analytic Hierarchy Process-Long Short-Term Memory Network(AHP-LSTM) for Food Safety Network Public Opinion
[J].
“二孩”还是“三孩”, “允许”还是“提倡”?——国家生育政策调整的目标解读与认识转变
[J].
“Two Children” or “Three Children, “Allowing” or “Advocating”: Interpretation of the Policy Objectives of the National Family Planning Policy and Awareness Shift
[J].
三孩生育意愿预测须防范二孩研究偏差
[J].
The Prediction of Three-Child Fertility Intention Must Avoid the Deviation of Second-Child Research
[J].
三孩政策目标与护养融合体系建设
[J].
The Goal of Three-Child Policy and Medical Care and Nursing Integration System Construction
[J].
中国的低生育率与三孩政策——基于第七次全国人口普查数据的分析
[J].
China’s Low Fertility and the Three-Child Policy: Analysis Based on the Data of the Seventh National Census
[J].
三孩政策出台的舆情效应及启示——基于NLP的网络大数据分析
[J].
The Public Opinion Effect and Enlightenment of the Three-Child Policy Network Big Data Analysis Based on NLP
[J].
Measuring the VC-Dimension of a Learning Machine
[J].DOI:10.1162/neco.1994.6.5.851 URL [本文引用: 1]
关键词提取研究综述
[J].
Review of Keyword Extraction Studies
[J].
生育政策调整背景下的“女性与生育”微博舆情研究
[J].
Public Sentiment Analysis of “Women and Birth” on Weibo Against the Backdrop of Policy Change
[J].
2021年第七次全国人口普查主要数据公报(第一号)
[R].
Major Figures of the 2021 National Population Census(No. 1)
[R].
/
〈 |
|
〉 |
