Please wait a minute...
Advanced Search
数据分析与知识发现  2021, Vol. 5 Issue (10): 15-27     https://doi.org/10.11925/infotech.2096-3467.2021.0142
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
政民互动中社会诉求主题挖掘和省际差异研究*——基于省级政府领导电子信箱语料的分析
胡广伟(),滕婕,刘露
南京大学信息管理学院 南京 210023
南京大学政务数据资源研究所 南京 210023
Mining Topics of Social Appeals and Interprovincial Differences in Government-People Interaction——Case Study of E-mail Corpus of Provincial Leaders
Hu Guangwei(),Teng Jie,Liu Lu
Government Data Resources Institution, Nanjing University, Nanjing 210023, China
全文: PDF (2379 KB)   HTML ( 20
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 挖掘领导信箱文本蕴含的主题,更好地感知、回应公众诉求,为政府服务和社会治理的和谐有序发展提供支撑。【方法】 对27个省和4个直辖市的政府领导电子信箱文本数据进行爬取,得到106 810条有效数据,应用LDA建模方法提取文本主题,构建公众诉求热点分类表;针对诉求的地区性差异,对不同省市进行对比分析,挖掘社会治理问题中的省际化差异特征。【结果】 社会诉求主题主要集中于民生服务、社会发展、教育服务、卫生健康、法律服务和资源生态等领域;公众诉求类目具有明显的省际差异,如山西对劳动就业、江西对出行、河南对教育主体、上海对住房、广西对企业等更为关注。【局限】 未考虑多渠道公众诉求数据的综合运用,未对相应算法和分析方法进行深入的智能优化。【结论】 聚焦社会诉求具体内容以挖掘诉求热点,为构建社会关切的全景视图及支撑政府治理决策提供参考。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胡广伟
滕婕
刘露
关键词 领导信箱政民互动社会诉求主题挖掘省际差异    
Abstract

[Objective] This research proposes a method to explore the topics of provincial leaders’ public emails, aiming to effectively respond to residents’ demands and provide support for social governance and services. [Methods] First, we retrieved the text message from public emails in 27 provinces and 4 municipalities directly under the Central Government. A total of 106,810 valid items were collected. Then, we applied the LDA modeling method to extract the topics of these emails and learned the public appeals. Finally, we conducted a comparative analysis of these appeals in different provinces and cities to understand the differences in social governance. [Results] The public paid more attention to the livelihood services, social development, education services, health issues, legal services and resource ecology. The public appeals showed significant inter-provincial difference. For example, Shanxi people paid more attention to employment; Jiangxi people attached great importance to travel; Henan people focused on education; Shanghai people cared housing issues; and Guangxi people paid more attention to enterprises. We also built a panoramic view of social concerns and support local governments’ decision making. [Limitations] This study did not comprehensively examined public appeal from multi-channels. More research is needed to optimize the algorithms and analysis methods. [Conclusions] This study could help local government better understand people’s demands or concerns, and improve decision making.

Key wordsLeader’s Mailbox    Government-to-People Interaction    Social Appeals    Theme Mining    Inter-provincial Differences
收稿日期: 2021-02-09      出版日期: 2021-11-23
ZTFLH:  D63  
基金资助:*国家社会科学基金重大项目(20&ZD154);国家双创示范基地项目(BDIS2019HW002);国家自然科学基金面上项目(71573117)
通讯作者: 胡广伟,ORCID:0000-0003-1303-363X     E-mail: hugw@nju.edu.cn
引用本文:   
胡广伟, 滕婕, 刘露. 政民互动中社会诉求主题挖掘和省际差异研究*——基于省级政府领导电子信箱语料的分析[J]. 数据分析与知识发现, 2021, 5(10): 15-27.
Hu Guangwei, Teng Jie, Liu Lu. Mining Topics of Social Appeals and Interprovincial Differences in Government-People Interaction——Case Study of E-mail Corpus of Provincial Leaders. Data Analysis and Knowledge Discovery, 2021, 5(10): 15-27.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2021.0142      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2021/V5/I10/15
Fig.1  数据集构建与分析流程
Fig.2  词汇频数分布
Fig.3  信息熵
Fig.4  数据集结果
Fig.5  政民互动中的主体词云分布
Fig.6  LDA的概率模型
Fig.7  主题聚类结果可视化呈现
省市 所属主题类别 文档支持数 主题词
北京 Topic13 8 604 户口 工作 孩子 住房 居住证 居住 公积金 生育 社保 身份证
Topic16 7 455 小区 拆迁 公司 停车 道路 物业 业主 出行 公交 乘客
Topic1 1 851 违法 执法 违章 非法 合法 违规 处罚 无照 法律 私搭乱建
Topic0 1 733 城管 安全 隐患 派出所 隐患 火灾 安保 消防通道 消防 保安
Topic8 1 391 经济 保险 报销 市场 养老保险 贷款 限价 发票 社会保险 价格
Topic7 1 271 学校 幼儿园 小学 考试 毕业 学生 教育 上学 教师 大学
Topic19 1 078 环境 垃圾 噪音 绿地 绿化 土地 污染 废品 市容 污水
Topic3 463 医院 卫生 医保 医疗 健康 看病 门诊 奥运会 住院 奥运
Topic10 312 产权 技术 产权证 一卡通 高新 技术 科技 计算机 科学 网页 研究院
Topic15 304 村民 农业 户口 农村 农民 非农业 村委会 村里 新村 农村户口 农户
Topic18 296 12345 交管局 政风 房管局 交管部门 市建委 发改委 计划生育 民政局 农转非
上海 Topic11 3 361 小区 公司 业主 物业 企业 有限公司 开发商 居委会 拆迁业 委会
Topic8 3 108 工作 房屋 孩子 动迁 居住 房子 老人 户口 社保 住房
Topic2 1 419 违法 执法 法律 合法 违规 权利 违章 依法 非法 维权
Topic5 1 207 学校 幼儿园 教育 小学 老师 学生 教育局 学习 上学 教师
Topic1 1 135 安全 城管 派出所 安全 隐患 110 保安 隐患 警察 消防 公安
Topic6 1 131 市场 消费者 经济 银行 价格 交易 贷款 投资 消费 金融
Topic14 1 124 环境 土地 垃圾 绿化 噪音 变电站 污染 绿地 松江 市容
Topic4 770 医院 医生 健康 治疗 患者 医疗 医保 手术 病人 卫生
Topic13 681 政策 信访 12345 房管局 工商局 党员 规土局 官员 纪委 腐败
Topic10 513 村民 农村 村里 新村 农民 村委 村委会 村干部 农民工 种植
Topic12 346 文化 历史 文明 旅游 媒体 新闻 诚信 读书 春节 节假日
甘肃 Topic3 497 工作 工资 供暖 孩子 房屋 房子 家庭 住房 低保 职工
Topic1 476 公司 小区 住户 道路 企业 开发商 业主 物业 出行 有限公司
Topic19 289 村民 农民 农村 农民工 村委会 种植 村里 村上 农业 乡村
Topic8 223 学校 学生 教师 教育 考试 上学 小学 毕业 幼儿园 学习
Topic15 161 安全 安全隐患 派出所 公安局 隐患 公安 警察 交警 民警 公安机关
Topic10 134 违法 合法 法律 依法 非法 违规 维权 合法权益 权益 法院
Topic6 132 贷款 经济 报销 市场 价格 投资 银行 财政 消费者 保险
Topic12 119 土地 环境 征地 污染 供水 用水 环保 污水 垃圾 下雨
Topic4 103 医院 治疗 医保 患者 奥运 手术 健康 住院 医疗 医生
Topic5 29 政策 公务员 信访 房管局 12345 民政局 水务局 信访办 教育厅 信访局
Topic13 21 技术 科技 科学 产权 产权证 技术推广 引进人才 创新 计算机 卫星
Table 1  领导信箱文本聚类主题以及主题词项
社会诉求
主题
公众诉求类目 公众诉求热词 社会诉求
主题
公众诉求
类目
公众诉求热词
公共安全 城管 城管局 城管办 民生服务 户籍 身份证 户籍 落户 户口本 入户 外地人
公安 安全 派出所 安全隐患 立案 隐患 婚育 生育 结婚 出生 独生子女
军队 部队 军人 士兵 退伍军人 复员 服役 士官 军转安置 退伍 战友 军转
消防 火灾 消防通道 消防车 消防安全 劳动就业 工作 工资 公积金 员工 上班 人才 职工
治安 保安 安保 冲突 打架 殴打 安检 人口 户口 人口
法律服务 法律 合法 权利 维权 依法 条例 权益 人事监察 人事 人力资源 职务
立法 立法权力 法制建设 社会保障 社保 退休 养老 养老金 医疗保险
司法 法院 举报人 诉讼 人民法院 社会福利 补助 福利 津贴
违法 违规 非法 诈骗 违章 违法行为 衣食 烧烤 供暖 漏水 自来水 食品
执法 处罚 罚款 责令 查封 执法人员 住房 房屋 居住 房子 动迁 居住证 房产
港澳台外 对台 台湾人 台胞 儿童 孩子 小孩 儿童
港澳事务 香港 港澳 澳门 粤港澳 妇女 女士 女性 孕妇
侨务 华侨 美籍华人 归侨 三农服务 农村 农村 村里 村委会 新村 村委
外交 国外 移民 日本 全球 国际化 外国 德国 农民 村民 农民 农民工 农户 农业户口
卫生健康 防疫 疫苗 接种 吃药 蚊虫 农业 种植 耕地 农场 非农业
疾病 患者 病人 残疾人 残疾 血友病 大病
病情 伤残 骨折
社会发展 安全生产 工程质量 盐业 质检 工程队 偷工减料 电缆
食品卫生 卫生状况
体育 健身 运动 奥运会 奥运 球迷 城建 拆迁 开发商 城市 建筑 违建 违章建筑
卫生 抽烟 卫生院 食品安全 有毒 出行 道路 停车 地铁 公交
医疗 医院 医生 医保 治疗 扶贫 扶贫 脱贫 疾苦 贫困生
教育服务 教学管理 考试 毕业 上学 培训招生 放学 企业 公司 有限公司房地产 行业
教育事项 学习 入学 学历 就读 硕士应届 学位 就近入学 中考中级职称 社区管理
社团管理
小区 业主 物业
物业费 协会 公益
教育体制 高考 文科 义务教育 大专中专 本科学历 高等教育 专科 市场监管
应急管理
许可证 营业执照 监管部门 监管
应急 地震 抗震 救援
教育主体 学校 幼儿园 学生 小学教师 老师 教育局 文化休闲 旅游 游客 旅行社 旅客 出国
经济贸易 保险 养老保险 社会保险 参保 文化 文化 历史 读书 春节
财政 国资 固定资产 财政收入财政厅 文明 文明 诚信
宏观经济 经济 市场 价格 房价 文物 文物保护 遗址
货币 人民币 现金 货币 新闻出版 新闻 媒体
金融 理财 资产 基金 财产 集资 影视 摄影 录像 电视台 拍摄 有线电视 数字电视 节目
贸易 消费者 投资 交易 投资人
投资者 消费 商品 拍卖 过户 承租人
综合政务 政策 计划生育 社会主义 计生 改革开放
新政优惠政策
审计 报销 发票 财务 政风 纪委 腐败 懒政 滥用职权 政风 依法行政
税收 纳税人 纳税 税务 税务局个人所得税 契税 政务 信访 市政府 12345 信访办
银行 贷款 账户 借款人 政效 政绩 楷模 催办 行政效率
证券 上市 股权 交易所 黄金 入股 资源生态 环境 垃圾 噪音 绿化 污染 绿地 环保 市容
科技创新 创新 科研 引进人才 能源 变电站 新能源 燃气用电
科学技术 技术 科技 科学 网络科技 气象 天气 下雨 下雨天 大雨 台风 暴雨
知识产权 产权 产权证 专利 资源 土地 河道 征地
民族宗教 民族 抗战 汉族 少数民族 中华民族
宗教 教堂 宗教 宗教信仰
Table 2  公众诉求热点分类
Fig.8  省级社会诉求主题差异化分布
公众诉求类目 类目指标频次 最高类目指数省份 文档支持指数
劳动就业 24 山西 0.403
教育主体 20 河南 0.264
企业 17 广西 0.318
出行 16 江西 0.400
环境 12 福建 0.277
住房 9 上海 0.237
法律 7 上海 0.224
城建 3 江西 0.400
社区管理 3 福建 0.299
公安 2 浙江 0.527
婚育 2 河南 0.212
教学管理 2 新疆 0.133
宏观经济 1 江西 0.200
疾病 1 江苏 0.070
金融 1 浙江 0.171
违法 1 浙江 2.540
农业 1 海南 0.280
社会保障 1 河北 0.125
Table 3  各省市公众诉求类目排名前5的文档支持指数
[1] 鲍静, 贾开. 习近平新时代信息化建设重要思想研究与阐释[J]. 中国行政管理, 2018(4): 33-38.
[1] (Bao Jing, Jia Kai. Research and Explanation of Xi Jinping Important Thought on Informationization for a New Era[J]. Chinese Public Administration, 2018(4): 33-38.)
[2] 赵金旭, 王宁, 孟天广. 链接市民与城市:超大城市治理中的热线问政与政府回应——基于北京市12345政务热线大数据分析[J]. 电子政务, 2021(2): 2-14.
[2] (Zhao Jinxu, Wang Ning, Meng Tianguang. Links to Citizens and Cities: Hot-line Policy and Government Response in the Governance of Large Cities——Big Data Analysis Based on Beijing 12345 Government Hotline[J]. E-Government, 2021(2): 2-14.)
[3] 彭晓, 梁艳, 许立言, 等. 基于“12345”市民服务热线的城市公共管理问题挖掘与治理优化途径[J]. 北京大学学报(自然科学版), 2020, 56(4): 721-731.
[3] (Peng Xiao, Liang Yan, Xu Liyan, et al. An Approach for Discovering Urban Public Management Problem and Optimizing Urban Governance Based on “12345” Citizen Service Hotline[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(4): 721-731.)
[4] 赵兴华. 网络空间中公民策略性话语表达与政府回应逻辑——基于大数据分析与倾向值匹配相结合的方法[J]. 电子政务, 2020(10): 62-73.
[4] (Zhao Xinghua. Citizen’s Strategic Discourse Expression and Government Response Logic in Cyberspace——A Method Based on Big Data Analysis and Tendency Matching[J]. E-Government, 2010(10): 62-73.)
[5] 王思迪, 胡广伟, 杨巳煜, 等. 基于文本分类的政府网站信箱自动转递方法研究[J]. 数据分析与知识发现, 2020, 4(6): 51-59.
[5] (Wang Sidi, Hu Guangwei, Yang Siyu, et al. Automatic Transferring Government Website E-Mails Based on Text Classification[J]. Data Analysis and Knowledge Discovery, 2020, 4(6): 51-59.)
[6] 王绪情. 合肥市政府门户网站中市长信箱的建设研究[D]. 合肥: 安徽大学, 2019.
[6] (Wang Xuqing. Research on the “Mayor Mailbox” Construction of Hefei Government Website[D]. Hefei: Anhui University, 2019.)
[7] 周志忍, 李倩. 解读市长信箱悖论:功能边界与非理性期望[J]. 行政论坛, 2011, 18(5): 1-5.
[7] (Zhou Zhiren, Li Qian. Interpretation of Mayor’s Mailbox Paradox: Functional Boundary and Irrational Expectations[J]. Administrative Tribune, 2011, 18(5): 1-5.)
[8] 段哲哲, 刘江. 网络问政的政府回应逻辑: 公开承诺压力与选择性回应——基于66个政府网站领导信箱的实验设计[J]. 浙江工商大学学报, 2019(4): 79-89.
[8] (Duan Zhezhe, Liu Jiang. Government Responsive Logic in Network Politics: Public Commitment Pressure and Selective Response——Experimental Design Based on 66 Government Website Leadership Mailboxes[J]. Journal of Zhejiang Gongshang University, 2019(4): 79-89.)
[9] 孙宗锋, 赵兴华. 网络情境下地方政府政民互动研究——基于青岛市市长信箱的大数据分析[J]. 电子政务, 2019(5): 12-26.
[9] (Sun Zongfeng, Zhao Xinghua. Research on the Interaction Between Local Government and People in Network Context——Based on Big Data Analysis of Mayor’s Box in Qingdao City[J]. E-Government, 2019(5): 12-26.)
[10] 张会平, 张兰, 陈晨, 等. 城市网络问政平台政府回应的城区差异研究——基于成都市市长信箱的基尼系数测度[J]. 公共管理评论, 2020, 2(1): 46-67.
[10] (Zhang Huiping, Zhang Lan, Chen Chen, et al. District Response Differences to an Urban E-Government Platform: Based on a Gini Coefficient Measurement of Online Letters to the Mailbox of the Mayor of Chengdu[J]. China Public Administration Review, 2020, 2(1): 46-67.)
[11] 孟天广, 郭凤林. 大数据政治学: 新信息时代的政治现象及其探析路径[J]. 国外理论动态, 2015(1): 46-56.
[11] (Meng Tianguang, Guo Fenglin. Big Data Politics: Political Phenomenon in the New Information Age and its Exploration Path[J]. Foreign Theoretical Trends, 2015(1): 46-56.)
[12] 王鸿儒. 政民互动下的公共服务满意度研究——公民行政负担感知的个体差异及影响[J]. 社会科学家, 2020(5): 156-160.
[12] (Wang Hongru. Research on Public Service Satisfaction Under the Interaction of Government and People——Individual Differences and Influence of Citizen’s Administrative Burden Perception[J]. Social Scientist, 2020(5): 156-160.)
[13] Hargittai E, Walejko G. The Participation Divide: Content Creation and Sharing in the Digital Age[J]. Information, Community & Society, 2008, 11(2): 239-256.
[14] Horsburgh S, Goldfinch S, Gauld R. Is Public Trust in Government Associated with Trust in E-Government?[J]. Social Science Computer Review, 2011, 29(2): 232-241.
doi: 10.1177/0894439310368130
[15] Kuhlmeier D B, Lipscomb C A. The Effect of Local and federal Government Website Use on Trust in Government: An Exploratory Analysis[J]. International Journal of Electronic Business, 2014, 11(4): 297.
doi: 10.1504/IJEB.2014.065823
[16] 祁光华. 基于政府回应的公务员能力模型[J]. 中国行政管理, 2008(5): 115-118.
[16] (Qi Guanghua. Competence Model of Civil Servants Based on Government Response[J]. Chinese Public Administration, 2008(5): 115-118.)
[17] 李放, 韩志明. 政府回应中的紧张性及其解析: 以网络公共事件为视角的分析[J]. 东北师大学报(哲学社会科学版), 2014(1): 1-8.
[17] (Li Fang, Han Zhiming. The Intensity and its Analysis of the Government’s Response——In the Perspective of the Internet Public Incidents[J]. Journal of Northeast Normal University (Philosophy and Social Sciences), 2014(1): 1-8.)
[18] 吕晓阳, 王会. 构建问政云平台促进政民互动与信息处理集约化——基于对奥一网及惠州网络问政平台的研究[J]. 电子政务, 2014(12): 37-43.
[18] (Lv Xiaoyang, Wang Hui. Building a Cloud Platform to Promote Interaction Between Government and People and Intensive Information Processing——Based on the Research on the Administration Platform of Aoyi Network and Huizhou Network[J]. E-Government, 2014(12): 37-43.)
[19] 李慧龙, 于君博. 数字政府治理的回应性陷阱——基于东三省“地方领导留言板”的考察[J]. 电子政务, 2019(3): 72-87.
[19] (Li Huilong, Yu Junbo. Response Trap of Digital Government Governance——Investigation on “Local Leadership Message Board” in the Three Eastern Provinces[J]. E-Government, 2019(3): 72-87.)
[20] Meng W C, Liu L C, Dai T. A Modified Approach to Keyword Extraction Based on Word-Similarity [C]// Proceedings of 2009 IEEE International Conference on Intelligent Computing and Intelligent Systems. 2009: 388-392.
[21] 蒋甜, 刘小平, 刘会洲. 基于关键词关联度指标(KRI)进行LDA噪声主题过滤的方法研究[J]. 图书情报工作, 2020, 64(3): 92-99.
[21] (Jiang Tian, Liu Xiaoping, Liu Huizhou. Topic Filtering of LDA Model Recognition Results Based on the Keywords Relevance Index (KRI)[J]. Library and Information Service, 2020, 64(3): 92-99.)
[22] 曾子明, 王婧. 基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例[J]. 情报学报, 2019, 38(1): 89-96.
[22] (Zeng Ziming, Wang Jing. Research on Microblog Rumor Identification Based on LDA and Random Forest[J]. Journal of the China Society for Scientific and Technical Information, 2019, 38(1): 89-96.)
[23] 王雅楠, 孙慧, 何昭丽. 教育投入与经济增长关系计量模型分析——以新疆教育投入为例[J]. 干旱区地理, 2016, 39(6): 1373-1379.
[23] (Wang Yanan, Sun Hui, He Zhaoli. Relation Between the Education Investment and Economic Growth Using Econometric Model: A Case of Education in Xinjiang[J]. Arid Land Geography, 2016, 39(6): 1373-1379.)
[24] 梁立明, 谢彩霞. 词频分析法用于我国纳米科技研究动向分析[J]. 科学学研究, 2003, 21(2): 138-142.
[24] (Liang Liming, Xie Caixia. Investigation of China’s Nanotechnology Study Based on Frequency Analysis of Key Words[J]. Studies in Science of Science, 2003, 21(2): 138-142.)
[25] 谢彩霞, 梁立明, 王文辉. 我国纳米科技论文关键词共现分析[J]. 情报杂志, 2005, 24(3): 69-73.
[25] (Xie Caixia, Liang Liming, Wang Wenhui. Analysis of Key Words of China’s Nanotechnology Papers[J]. Journal of Information, 2005, 24(3): 69-73.)
[1] 王思迪,胡广伟,杨巳煜,施云. 基于文本分类的政府网站信箱自动转递方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 51-59.
[2] 黄漫宇,云琪,彭虎锋,窦雪萌. 基于主题挖掘的超额募资农产品众筹项目文本特征研究 *——以众筹网为例[J]. 数据分析与知识发现, 2019, 3(9): 124-134.
[3] 杨磊,王子润,侯贵生. 基于Q-LDA主题模型的网络健康社区主题挖掘研究 *[J]. 数据分析与知识发现, 2019, 3(11): 52-59.
[4] 王树义, 廖桦涛, 吴查科. 基于情感分类的竞争企业新闻文本主题挖掘*[J]. 数据分析与知识发现, 2018, 2(3): 70-78.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn