Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (10): 2-11    DOI: 10.11925/infotech.2096-3467.2019.0028
  专题 本期目录 | 过刊浏览 | 高级检索 |
基于“过程-问题”视角的情报学方法技术研究 *——以社会情报学舆情领域为例
朱惠1,2(),王昊1,2,章成志3
1南京大学信息管理学院 南京 210023
2江苏省数据工程与知识服务重点实验室 南京 210023
3南京理工大学经济管理学院 南京 210094
Research Methods and Technologies for Information Science from Process-Problem Perspective: Case Study of Public Opinion
Hui Zhu1,2(),Hao Wang1,2,Chengzhi Zhang3
1School of Information Management, Nanjing University, Nanjing 210023, China
2Jiangsu Key Laboratory of Data Engineering and Knowledge Service, Nanjing 210023, China
3School of Economics & Management, Nanjing University of Science and Technology, Nanjing 210094, China
全文: PDF(641 KB)   HTML ( 28
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】基于大规模情报学文献了解中国情报学方法技术并探讨如何从“过程-问题”这一新视角组织这些方法技术。【方法】构建“过程-问题”视角下的情报学方法技术术语获取和组织模型: 解析情报过程及其包含的情报问题; 标注文献所属的情报问题; 分别采用基于词典和基于模板的抽取方法获得方法技术术语并将结果融合; 最终按过程、问题组织这些方法技术。【结果】运用上述方法获得按过程、问题组织的情报学方法技术术语, 验证了模型的可行性和有效性, 术语抽取的F1值达到90.91%。【局限】仅从CNKI采集实验数据, 对结果的全面性有影响; 情报学方法技术术语抽取模板还有待完善。【结论】词典和模板相结合的抽取方法可以较好地获取情报学方法技术术语; 从“过程-问题”视角组织情报学方法技术对于情报问题的解决具有指导作用。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
朱惠
王昊
章成志
关键词 情报过程情报问题方法技术社会情报学舆情    
Abstract

[Objective] This paper explores large-scale information science literature, aiming to better examine research methods and technologies in this field and organize them from the“process-problem” perspective. [Methods] Firstly, we analyzed the information lifecycles and related research questions. Secondly, we grouped and labeled literature by research questions. Thirdly, we extracted terms of research methods and technologies based on dictionary and templates. Finally, we organized the terms from the “process-problem” perspective. [Results] The F1 value of the proposed method reached 90.91%. [Limitations] We collected experimental data only from the CNKI database and the templates for extracting terms need improvements. [Conclusions] We could extract terms of research methods and technologies with the proposed model simultaneously and effectively.

Key wordsInformation Process    Information Problem    Method and Technology    Social Information Science    Public Opinione
收稿日期: 2019-01-07     
中图分类号:  TP391 G35  
基金资助:*本文系国家社会科学基金重大项目“情报学学科建设与情报工作未来发展路径研究”(17ZDA291);江苏省社会科学基金项目“领域术语语义关系自动获取研究”的研究成果之一(15TQB009)
通讯作者: 朱惠     E-mail: zhuhui@nju.edu.cn
引用本文:   
朱惠,王昊,章成志. 基于“过程-问题”视角的情报学方法技术研究 *——以社会情报学舆情领域为例[J]. 数据分析与知识发现, 2019, 3(10): 2-11.
Hui Zhu,Hao Wang,Chengzhi Zhang. Research Methods and Technologies for Information Science from Process-Problem Perspective: Case Study of Public Opinion. Data Analysis and Knowledge Discovery, DOI:10.11925/infotech.2096-3467.2019.0028.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2019.0028
图1  “过程-问题”视角下情报学方法技术术语获取和组织模型
图2  情报过程及情报问题解析
舆情过程
(舆情问题)
舆情子问题 特征词
舆情采集 舆情采集 采集、获取、检索、搜集、提取
舆情加工 舆情加工 加工、预处理、清洗、融合
舆情分析 舆情识别 舆情识别
传播与演化 传播、扩散、演变、演化
主题与热点 主题、观点、话题、热点、热度
负面舆情 负面舆情
意见领袖 意见领袖
情感分析 情感、情绪
指标体系 指标、指数
可视化 可视化、图谱
舆情服务 监测与预警 监测、监控、预警、危机处理、应对
舆情管理 舆情管理 管理、治理、引导、疏导、控制
表1  舆情过程及舆情问题
舆情问题 关联的
文本数
占比(%) 与之共现的
问题数
与其他问题
的共现频数
舆情采集 16 0.94 5 10
舆情加工 2 0.12 0 0



舆情识别 2 0.12 1 2
传播与演化 515 30.37 8 270
主题与热点 245 14.45 9 132
负面舆情 10 0.59 4 11
意见领袖 41 2.42 6 40
情感分析 64 3.77 8 58
指标体系 79 4.66 5 50
可视化 22 1.30 5 16
舆情服务 550 32.43 9 260
舆情管理 649 38.27 9 259
表2  文本与舆情问题的关联情况
方法技术术语 频数 方法技术术语 频数
聚类 131 层次分析法(AHP) 55
社会网络分析(SNA) 125 情感分析 53
博弈 120 支持向量机(SVM) 48
分类 107 时间序列分析 38
统计分析 87 内容分析法 36
神经网络 72 LDA 30
传染病模型 70 马尔科夫模型 30
agent 63 回归分析 26
复杂网络分析 63 爬虫 24
灰色模型 58 数据挖掘 23
表3  基于方法技术词典的抽取结果片段
特征类型 特征描述 举例
尾词
特征
术语常以下列词作为尾词: 方法、法、技术、工具、软件、平台、模型、算法、方式、指数、指标 仿真方法/分层抽样法/Wiki技术/爬虫工具/Gephi软件/GM模型/Pagerank算法/编程方式/百度指数
上下文
特征
术语的紧邻上文经常出现下列词: 采取、使用、结合、引入、引进、用、基于、通过、利用、运用、采用、应用、选用、借助、借鉴、依据、根据, 这些词有时后面会跟“了/的” 运用Netlogo仿真软件进行模拟仿真/并引入模糊层次综合评价方法对预警等级进行评估/利用stata固定效应模型
有时术语会出现在下列表达中: 将…引入(到)/融入(到)/拓展(到)、将…应用于/应用到、将…运用于/运用到、在…(的)基础上、由…可得/可知/得出, 以…为基础 将案例分析法融入到网络舆情热点话题传播模式的研究中/在焦点情感模型(SSCM)的基础上引入新闻报道的时间信息
采取/使用/结合/引入/引进/用/基于/通过/利用/运用/采用/应用/选用/借助/借鉴/依据/根据/将/在/由/以, 这些词后紧接的英文命名实体往往也是方法技术术语 并借助ROST Emotion Analysis Tool完成文本情感分析/在利用SVM对各阶段舆情进行情感性分析的基础上
英文术语有时也会存在如下表达: “采取/使用/结合/引入/引进/用/基于/通过/利用/运用/采用/应用/选用/借助/借鉴/依据/根据/将/在/由/以” + “…方法/技术/工具/软件/平台/模型/算法/方式”+ 英文命名实体 采用复杂网络分析工具Gephi/利用引文网络分析工具CiteSpaceⅣ绘制科学知识图谱/基于传染病模型SEIRS
表4  方法技术术语特征分析
模板 模板表达 举例
TEMP1 LC1…CkD1…DmW:1个L类词紧接k个普通词紧接m个D类词紧接1个尾词
(其中1≤k≤6, 0≤m≤1)
借助/文本/挖掘/工具
运用/社会/网络/分析/方法
将/聚类/方法/引入
在/层次/分析/法/基础上
由/仿真/方法/可知
以/层次/分析/法/为基础
TEMP2 LE1…Ek:1个L类词紧接
k个E类词
(其中1≤k≤6)
借助/ROST/Emotion/Analysis/ Tool
利用/SVM
TEMP3 LC1…CiWE1…Ej:1个L类词紧接i个普通词紧接1个尾词紧接j个E类词
(其中0≤i≤6,1≤j≤6)
采用/复杂/网络/分析/工具/Gephi
利用/软件/SPSS
表5  方法技术术语抽取模板
抽取方法 正确术语数 错误术语数 总的术语数 人工抽取的术语数 准确率 召回率 F1
模板抽取 107 8 115 184 93.04% 58.15% 71.57%
词典抽取 148 - 148 184 100.00% 80.43% 89.15%
模板抽取
融合词典抽取
160 8 168 184 95.24% 86.96% 90.91%
表6  模板方法融合词典方法的抽取效果检验
舆情问题 方法技术术语
舆情采集(6) 最大熵模型、多项Logistic回归模型、无线数据包捕获技术、爬虫工具、网络日志、搜索引擎
舆情加工(3) 中文分词、句法分析、倒排索引



舆情识别(4) Matlab、数据挖掘、聚类、支持向量机
传播与演化(137) 多主体建模、BA无标度网络、社会网络分析方法、复杂网络分析方法、最小二乘法、统计方法、博弈论、传染病模型、Gephi软件、NetLogo仿真平台、卷积神经网络、动力学模型、结构方程模型、SVM……
主题与热点(108) BTM模型、Citespace软件、Hits算法、PageRank算法、KNN、LDA、群智能算法、热点追踪算法、小世界网络、数据包络分析方法……
负面舆情(7) 案例分析法、多元回归模型、马尔科夫模型、内容分析法、事件研究法、网络舆情热度趋势预测模型、演化博弈模型
意见领袖(12) NetLogo仿真平台、仿真方法、Smart PLS、层次分析法、多项Logistic模型、多主体建模、灰色关联度分析法、统计方法、文本聚类……
情感分析(53) A-V-P心理学模型、OCC模型、PLSA模型、ROST Emotion Analysis Tool、句法依存分析方法、焦点情感模型、消费者满意度模型……
指标体系(43) 层次分析法、德尔菲法、多级模糊综合评判方法、分层抽样法、混合赋权法、问卷调查、相关性分析、主成分分析、百度指数、舆情指数……
可视化(7) 引文网络分析工具、共词网络分析法、复杂网络分析工具、文献计量学分析方法、可视化建模、Citespace软件、Gephi软件
舆情服务(156) 话题聚类预测模型、灰色关联度方法、链路预测方法、蜜罐网络主动防御模型、模糊层次综合评价方法、BP神经网络、Logistic模型、人工蜂群算法、热点追踪算法、模糊时间序列预测模型、Matlab ……
舆情管理(85) 云治理、知识模型、关系数据库、Bass模型、Gephi软件、ISM方法、stata固定效应模型、平均场方法、现象归纳法、MVC……
表7  “过程-问题”视角下的舆情方法技术术语
[1] 马费成, 望俊成 . 导言: 图书情报领域研究方法的外来文化[J]. 图书情报知识, 2010(1):12-14.
( Ma Feicheng, Wang Juncheng . Introduction: Foreign Culture in the Field of Library and Information Science[J]. Documentation, Information & Knowledge, 2010(1):12-14.)
[2] 化柏林 . 网络海量信息环境下的情报方法体系研究[J]. 情报理论与实践, 2012,35(11):1-5.
( Hua Bolin . Research on the Intelligence Method System in the Networked Mass Information Environment[J]. Information Studies: Theory & Application, 2012,35(11):1-5.)
[3] 王崇德 . 情报学研究方法概论[J]. 情报科学, 1985,6(6):1-7.
( Wang Chongde . Introduction to Information Science Research Methods[J]. Information Science, 1985,6(6):1-7.)
[4] 邹志仁 . 论情报研究方法体系[J]. 江苏图书馆学报, 1990(2):18-23.
( Zou Zhiren . Discussion on the Information Research Method System[J]. Journal of Jiangsu Library, 1990(2):18-23.)
[5] 曾建勋 . 论情报研究方法论体系[J]. 情报业务研究, 1989,6(2):117-119.
( Zeng Jianxun . Discussion on the Methodology of Intelligence Research[J]. Information Professional Research, 1989,6(2):117-119.)
[6] 包昌火 . 情报研究方法论[M]. 北京: 科学技术出版社, 1990.
( Bao Changhuo. Intelligence Research Methodology[M]. Beijing: China Science and Technology Press, 1990.)
[7] 卢泰宏 . 信息分析[M]. 广州: 中山大学出版社, 1998.
( Lu Taihong. Information Analysis[M]. Guangzhou: Sun Yat-Sen University Press, 1998.)
[8] 郗沭平 . 浅论图书馆学、情报学研究方法论体系[J]. 津图学刊, 1997(2):19-23.
( Xi Shuping . Discussion on the Methodology of Library and Information Research[J]. Tianjin Library Journal, 1997(2):19-23.)
[9] 王秀梅 . 试论情报分析研究方法的体系建设[J]. 情报理论与实践, 1998,21(5):259-260.
( Wang Xiumei . Discussion on the System Construction of Analysis and Research Methods in Information Science[J]. Information Studies: Theory & Application, 1998,21(5):259-260.)
[10] 许儒红 . 信息社会条件下情报研究方法体系构建初探[J]. 情报理论与实践, 2012,35(3):119-122.
( Xu Ruhong . Preliminary Exploration of How to Construct the Methodological System of Intelligence Research in Information Society[J]. Information Studies: Theory & Application, 2012,35(3):119-122.)
[11] 王芳, 王向女 . 我国情报学研究方法的计量分析:以1999~2008年《情报学报》为例[J]. 情报学报, 2010,29(4):652-662.
( Wang Fang, Wang Xiangnv . A Bibliometric Study on Research Methods of Information Science in China: Taking JOCSSTI(1999~2008) as Example[J]. Journal of the China Society for Scientific and Technical Information, 2010,29(4):652-662.)
[12] 杨寿青 . 军事情报分析方法体系初探[J]. 情报杂志, 1997,16(2):52-53.
( Yang Shouqing . A Preliminary Study on the Method of Military Intelligence Analysis[J]. Journal of Information, 1997,16(2):52-53.)
[13] 程立斌, 林春应 . 军事情报研究方法体系探析[J]. 情报杂志, 2007,26(2):87-89.
( Cheng Libin, Lin Chunying . Analysis on the Methodology System of Military Intelligence Research[J]. Journal of Information, 2007,26(2):87-89.)
[14] 周军, 韩建新 . 试论军事情报研究方法[J]. 图书情报工作, 2005,49(5):64-66.
( Zhou Jun, Han Jianxin . Methods Used on Military Intelligence Research[J]. Library and Information Service, 2005,49(5):64-66.)
[15] 樊松林 . 竞争情报研究方法体系的架构与选用[J]. 情报科学, 2000,18(10):871-876.
( Fan Songlin . Construct and Choice of the Research Method Architecture of Competitive Information[J]. Information Science, 2000,18(10):871-876.)
[16] 王玉 . 试论竞争情报研究方法的二维结构[J]. 现代情报, 2004( 7): 12, 15.
( Wang Yu . Discussion on the Two-dimensional Structure of Competitive Intelligence Research Methods[J]. Modern Information, 2004( 7): 12, 15.)
[17] 刘冰 . 面向对象的竞争情报分析方法体系建构研究[J]. 图书情报工作, 2010,54(12):100-103.
( Liu Bing . Research on Competitive Intelligence Analysis Methods System Construction Based on Object-Oriented[J]. Library and Information Service, 2010,54(12):100-103.)
[18] Bose R . Competitive Intelligence Process and Tools for Intelligence Analysis[J]. Industrial Management & Data Systems, 2008,108(4):510-528.
[19] 靳娟娟 . 边防情报学的形成与发展研究[J]. 情报杂志, 2001,20(11):38-40.
( Jin Juanjuan . Research on the Formation and Development of Frontier Information Science[J]. Journal of Information, 2001,20(11):38-40.)
[20] 刘桂锋 . 国内专利情报分析方法体系构建研究[J]. 情报杂志, 2014,33(3):16-21.
( Liu Guifeng . A Methodological System of Patent Information Analysis in China[J]. Journal of Intelligence, 2014,33(3):16-21.)
[21] 谢晓专, 周西平 . 基于层次结构的公安情报分析方法研究进展[J]. 图书情报工作, 2012,56(20):103-109.
( Xie Xiaozhuan, Zhou Xiping . Research Progress of Public Security Intelligence Analysis Methods upon the Hierarchical Structure[J]. Library and Information Service, 2010,56(20):103-109.)
[22] 杨锐 . 关于情报学方法体系建设的思考[J]. 情报探索, 2008(5):126-128.
( Yang Rui . Thoughts on the Construction of Information Science Method System[J]. Information Research, 2008(5):126-128.)
[23] 化柏林, 李广建 . 面向情报流程的情报方法体系构建[J]. 情报学报, 2016,35(2):177-188.
( Hua Bolin, Li Guangjian . Constructing Methodology of Intelligence Analysis Based on Intelligence Process[J]. Journal of the China Society for Scientific and Technical Information, 2016,35(2):177-188.)
[24] 方付建 . 网络舆情研究中量化方法应用态势分析[J]. 情报杂志, 2014,33(10):47-51.
( Fang Fujian . Quantitative Methods Application in Online Public Opinion Researches: A Review[J]. Journal of Intelligence, 2014,33(10):47-51.)
[25] 左蒙, 李昌祖 . 网络舆情研究综述: 从理论研究到实践应用[J]. 情报杂志, 2017,36(10):75-82, 144.
( Zuo Meng, Li Changzu . A Review of Network Public Opinion: From Theoretical Research to Practical Application[J]. Journal of Intelligence, 2017,36(10):75-82, 144.)
[26] 刘亚男 . 我国网络舆情研究现状述评[J]. 情报杂志, 2017,36(5):99-104.
( Liu Ya’nan . Review on Chinese Network Public Opinion Research in Recent Years[J]. Journal of Intelligence, 2017,36(5):99-104.)
[27] 李文杰, 化存才, 何伟全 , 等. 网络舆情事件的灰色预测模型及案例分析[J]. 情报科学, 2013,31(12):51-56.
( Li Wenjie, Hua Cuncai, He Weiquan , et al. Grey Prediction Model of Network Public Opinion Events and Analysis of Examples[J]. Information Science, 2013,31(12):51-56.)
[28] 邹伟, 刘永学, 李满春 , 等. 网络新闻中黄岩岛争端事件舆情研究——以新浪网“中菲黄岩岛争端”专题为例[J]. 现代图书情报技术, 2014(2):72-78.
( Zou Wei, Liu Yongxue, Li Manchun , et al. Research on Public Opinion of the Disputes on Huangyan Island in the Network News: A Case Study of “Special Reports About the Disputes Between China and Philippines on Huangyan Island” on Sina[J]. New Technology of Library and Information Service, 2014(2):72-78.)
[29] 廖海涵, 王曰芬 . 社交媒体舆情信息传播效果影响因素研究——以新浪微博“8.12天津爆炸”事件为例[J]. 现代图书情报技术, 2016(12):89-97.
( Liao Haihan, Wang Yuefen . Public Opinion Dissemination over Social Media: Case Study of Sina Weibo and “8.12 Tianjing Explosion”[J]. New Technology of Library and Information Service, 2016(12):89-97.)
[1] 安璐,梁艳平. 突发公共卫生事件微博话题与用户行为选择研究*[J]. 数据分析与知识发现, 2019, 3(4): 33-41.
[2] 王林,王可,吴江. 社交媒体中突发公共卫生事件舆情传播与演变*——以2018年疫苗事件为例[J]. 数据分析与知识发现, 2019, 3(4): 42-52.
[3] 吴江,赵颖慧,高嘉慧. 医疗舆情事件的微博意见领袖识别与分析研究*[J]. 数据分析与知识发现, 2019, 3(4): 53-62.
[4] 梅妍霜,朱恒民,魏静. 媒体协同对网络舆情扩散的作用机制研究*[J]. 数据分析与知识发现, 2019, 3(2): 65-71.
[5] 贾隆嘉,张邦佐. 高校网络舆情安全中主题分类方法研究*——以新浪微博数据为例[J]. 数据分析与知识发现, 2018, 2(7): 55-62.
[6] 王秀芳,盛姝,路燕. 一种基于话题聚类及情感强度的微博舆情分析模型*[J]. 数据分析与知识发现, 2018, 2(6): 37-47.
[7] 王璟琦,李锐,吴华意. 基于空间自相关的网络舆情话题演化时空规律分析*[J]. 数据分析与知识发现, 2018, 2(2): 64-73.
[8] 李真,丁晟春,王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[9] 王晰巍,张柳,李师萌,王楠阿雪. 新媒体环境下社会公益网络舆情传播研究* ——以新浪微博“画出生命线”话题为例[J]. 数据分析与知识发现, 2017, 1(6): 93-101.
[10] 田世海,吕德丽. 改进潜在语义分析和支持向量机算法用于突发安全事件舆情预警*[J]. 数据分析与知识发现, 2017, 1(2): 11-18.
[11] 韩普,王鹏. 基于无标度网络模型和传染病模型的舆论演化仿真研究*[J]. 数据分析与知识发现, 2017, 1(10): 53-63.
[12] 丁晟春,龚思兰,李红梅. 基于突发主题词和凝聚式层次聚类的微博突发事件检测研究*[J]. 现代图书情报技术, 2016, 32(7-8): 12-20.
[13] 岑咏华,王曰芬. 大数据环境下社会舆情分析与决策支持的研究视角和关键问题*[J]. 现代图书情报技术, 2016, 32(7-8): 3-11.
[14] 吴鹏,金贝贝,强韶华. 基于BDI-Agent模型的突发事件网络舆情应急响应建模研究*[J]. 现代图书情报技术, 2016, 32(7-8): 32-41.
[15] 杨小平,马奇凤,余力,莫雨婷,吴佳楠,张悦. 评论簇在网络舆论中的情感倾向代表性研究*[J]. 现代图书情报技术, 2016, 32(7-8): 51-59.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn