Please wait a minute...
Data Analysis and Knowledge Discovery  2019, Vol. 3 Issue (10): 2-11    DOI: 10.11925/infotech.2096-3467.2019.0028
Current Issue | Archive | Adv Search |
Research Methods and Technologies for Information Science from Process-Problem Perspective: Case Study of Public Opinion
Hui Zhu1,2(),Hao Wang1,2,Chengzhi Zhang3
1School of Information Management, Nanjing University, Nanjing 210023, China
2Jiangsu Key Laboratory of Data Engineering and Knowledge Service, Nanjing 210023, China
3School of Economics & Management, Nanjing University of Science and Technology, Nanjing 210094, China
Download: PDF (641 KB)   HTML ( 29
Export: BibTeX | EndNote (RIS)      
Abstract  

[Objective] This paper explores large-scale information science literature, aiming to better examine research methods and technologies in this field and organize them from the“process-problem” perspective. [Methods] Firstly, we analyzed the information lifecycles and related research questions. Secondly, we grouped and labeled literature by research questions. Thirdly, we extracted terms of research methods and technologies based on dictionary and templates. Finally, we organized the terms from the “process-problem” perspective. [Results] The F1 value of the proposed method reached 90.91%. [Limitations] We collected experimental data only from the CNKI database and the templates for extracting terms need improvements. [Conclusions] We could extract terms of research methods and technologies with the proposed model simultaneously and effectively.

Key wordsInformation Process      Information Problem      Method and Technology      Social Information Science      Public Opinione     
Received: 07 January 2019      Published: 25 November 2019
ZTFLH:  TP391 G35  
Corresponding Authors: Hui Zhu     E-mail: zhuhui@nju.edu.cn

Cite this article:

Hui Zhu,Hao Wang,Chengzhi Zhang. Research Methods and Technologies for Information Science from Process-Problem Perspective: Case Study of Public Opinion. Data Analysis and Knowledge Discovery, 2019, 3(10): 2-11.

URL:

https://manu44.magtech.com.cn/Jwk_infotech_wk3/EN/10.11925/infotech.2096-3467.2019.0028     OR     https://manu44.magtech.com.cn/Jwk_infotech_wk3/EN/Y2019/V3/I10/2

舆情过程
(舆情问题)
舆情子问题 特征词
舆情采集 舆情采集 采集、获取、检索、搜集、提取
舆情加工 舆情加工 加工、预处理、清洗、融合
舆情分析 舆情识别 舆情识别
传播与演化 传播、扩散、演变、演化
主题与热点 主题、观点、话题、热点、热度
负面舆情 负面舆情
意见领袖 意见领袖
情感分析 情感、情绪
指标体系 指标、指数
可视化 可视化、图谱
舆情服务 监测与预警 监测、监控、预警、危机处理、应对
舆情管理 舆情管理 管理、治理、引导、疏导、控制
舆情问题 关联的
文本数
占比(%) 与之共现的
问题数
与其他问题
的共现频数
舆情采集 16 0.94 5 10
舆情加工 2 0.12 0 0



舆情识别 2 0.12 1 2
传播与演化 515 30.37 8 270
主题与热点 245 14.45 9 132
负面舆情 10 0.59 4 11
意见领袖 41 2.42 6 40
情感分析 64 3.77 8 58
指标体系 79 4.66 5 50
可视化 22 1.30 5 16
舆情服务 550 32.43 9 260
舆情管理 649 38.27 9 259
方法技术术语 频数 方法技术术语 频数
聚类 131 层次分析法(AHP) 55
社会网络分析(SNA) 125 情感分析 53
博弈 120 支持向量机(SVM) 48
分类 107 时间序列分析 38
统计分析 87 内容分析法 36
神经网络 72 LDA 30
传染病模型 70 马尔科夫模型 30
agent 63 回归分析 26
复杂网络分析 63 爬虫 24
灰色模型 58 数据挖掘 23
特征类型 特征描述 举例
尾词
特征
术语常以下列词作为尾词: 方法、法、技术、工具、软件、平台、模型、算法、方式、指数、指标 仿真方法/分层抽样法/Wiki技术/爬虫工具/Gephi软件/GM模型/Pagerank算法/编程方式/百度指数
上下文
特征
术语的紧邻上文经常出现下列词: 采取、使用、结合、引入、引进、用、基于、通过、利用、运用、采用、应用、选用、借助、借鉴、依据、根据, 这些词有时后面会跟“了/的” 运用Netlogo仿真软件进行模拟仿真/并引入模糊层次综合评价方法对预警等级进行评估/利用stata固定效应模型
有时术语会出现在下列表达中: 将…引入(到)/融入(到)/拓展(到)、将…应用于/应用到、将…运用于/运用到、在…(的)基础上、由…可得/可知/得出, 以…为基础 将案例分析法融入到网络舆情热点话题传播模式的研究中/在焦点情感模型(SSCM)的基础上引入新闻报道的时间信息
采取/使用/结合/引入/引进/用/基于/通过/利用/运用/采用/应用/选用/借助/借鉴/依据/根据/将/在/由/以, 这些词后紧接的英文命名实体往往也是方法技术术语 并借助ROST Emotion Analysis Tool完成文本情感分析/在利用SVM对各阶段舆情进行情感性分析的基础上
英文术语有时也会存在如下表达: “采取/使用/结合/引入/引进/用/基于/通过/利用/运用/采用/应用/选用/借助/借鉴/依据/根据/将/在/由/以” + “…方法/技术/工具/软件/平台/模型/算法/方式”+ 英文命名实体 采用复杂网络分析工具Gephi/利用引文网络分析工具CiteSpaceⅣ绘制科学知识图谱/基于传染病模型SEIRS
模板 模板表达 举例
TEMP1 LC1…CkD1…DmW:1个L类词紧接k个普通词紧接m个D类词紧接1个尾词
(其中1≤k≤6, 0≤m≤1)
借助/文本/挖掘/工具
运用/社会/网络/分析/方法
将/聚类/方法/引入
在/层次/分析/法/基础上
由/仿真/方法/可知
以/层次/分析/法/为基础
TEMP2 LE1…Ek:1个L类词紧接
k个E类词
(其中1≤k≤6)
借助/ROST/Emotion/Analysis/ Tool
利用/SVM
TEMP3 LC1…CiWE1…Ej:1个L类词紧接i个普通词紧接1个尾词紧接j个E类词
(其中0≤i≤6,1≤j≤6)
采用/复杂/网络/分析/工具/Gephi
利用/软件/SPSS
抽取方法 正确术语数 错误术语数 总的术语数 人工抽取的术语数 准确率 召回率 F1
模板抽取 107 8 115 184 93.04% 58.15% 71.57%
词典抽取 148 - 148 184 100.00% 80.43% 89.15%
模板抽取
融合词典抽取
160 8 168 184 95.24% 86.96% 90.91%
舆情问题 方法技术术语
舆情采集(6) 最大熵模型、多项Logistic回归模型、无线数据包捕获技术、爬虫工具、网络日志、搜索引擎
舆情加工(3) 中文分词、句法分析、倒排索引



舆情识别(4) Matlab、数据挖掘、聚类、支持向量机
传播与演化(137) 多主体建模、BA无标度网络、社会网络分析方法、复杂网络分析方法、最小二乘法、统计方法、博弈论、传染病模型、Gephi软件、NetLogo仿真平台、卷积神经网络、动力学模型、结构方程模型、SVM……
主题与热点(108) BTM模型、Citespace软件、Hits算法、PageRank算法、KNN、LDA、群智能算法、热点追踪算法、小世界网络、数据包络分析方法……
负面舆情(7) 案例分析法、多元回归模型、马尔科夫模型、内容分析法、事件研究法、网络舆情热度趋势预测模型、演化博弈模型
意见领袖(12) NetLogo仿真平台、仿真方法、Smart PLS、层次分析法、多项Logistic模型、多主体建模、灰色关联度分析法、统计方法、文本聚类……
情感分析(53) A-V-P心理学模型、OCC模型、PLSA模型、ROST Emotion Analysis Tool、句法依存分析方法、焦点情感模型、消费者满意度模型……
指标体系(43) 层次分析法、德尔菲法、多级模糊综合评判方法、分层抽样法、混合赋权法、问卷调查、相关性分析、主成分分析、百度指数、舆情指数……
可视化(7) 引文网络分析工具、共词网络分析法、复杂网络分析工具、文献计量学分析方法、可视化建模、Citespace软件、Gephi软件
舆情服务(156) 话题聚类预测模型、灰色关联度方法、链路预测方法、蜜罐网络主动防御模型、模糊层次综合评价方法、BP神经网络、Logistic模型、人工蜂群算法、热点追踪算法、模糊时间序列预测模型、Matlab ……
舆情管理(85) 云治理、知识模型、关系数据库、Bass模型、Gephi软件、ISM方法、stata固定效应模型、平均场方法、现象归纳法、MVC……
[1] 马费成, 望俊成 . 导言: 图书情报领域研究方法的外来文化[J]. 图书情报知识, 2010(1):12-14.
[1] ( Ma Feicheng, Wang Juncheng . Introduction: Foreign Culture in the Field of Library and Information Science[J]. Documentation, Information & Knowledge, 2010(1):12-14.)
[2] 化柏林 . 网络海量信息环境下的情报方法体系研究[J]. 情报理论与实践, 2012,35(11):1-5.
[2] ( Hua Bolin . Research on the Intelligence Method System in the Networked Mass Information Environment[J]. Information Studies: Theory & Application, 2012,35(11):1-5.)
[3] 王崇德 . 情报学研究方法概论[J]. 情报科学, 1985,6(6):1-7.
[3] ( Wang Chongde . Introduction to Information Science Research Methods[J]. Information Science, 1985,6(6):1-7.)
[4] 邹志仁 . 论情报研究方法体系[J]. 江苏图书馆学报, 1990(2):18-23.
[4] ( Zou Zhiren . Discussion on the Information Research Method System[J]. Journal of Jiangsu Library, 1990(2):18-23.)
[5] 曾建勋 . 论情报研究方法论体系[J]. 情报业务研究, 1989,6(2):117-119.
[5] ( Zeng Jianxun . Discussion on the Methodology of Intelligence Research[J]. Information Professional Research, 1989,6(2):117-119.)
[6] 包昌火 . 情报研究方法论[M]. 北京: 科学技术出版社, 1990.
[6] ( Bao Changhuo. Intelligence Research Methodology[M]. Beijing: China Science and Technology Press, 1990.)
[7] 卢泰宏 . 信息分析[M]. 广州: 中山大学出版社, 1998.
[7] ( Lu Taihong. Information Analysis[M]. Guangzhou: Sun Yat-Sen University Press, 1998.)
[8] 郗沭平 . 浅论图书馆学、情报学研究方法论体系[J]. 津图学刊, 1997(2):19-23.
[8] ( Xi Shuping . Discussion on the Methodology of Library and Information Research[J]. Tianjin Library Journal, 1997(2):19-23.)
[9] 王秀梅 . 试论情报分析研究方法的体系建设[J]. 情报理论与实践, 1998,21(5):259-260.
[9] ( Wang Xiumei . Discussion on the System Construction of Analysis and Research Methods in Information Science[J]. Information Studies: Theory & Application, 1998,21(5):259-260.)
[10] 许儒红 . 信息社会条件下情报研究方法体系构建初探[J]. 情报理论与实践, 2012,35(3):119-122.
[10] ( Xu Ruhong . Preliminary Exploration of How to Construct the Methodological System of Intelligence Research in Information Society[J]. Information Studies: Theory & Application, 2012,35(3):119-122.)
[11] 王芳, 王向女 . 我国情报学研究方法的计量分析:以1999~2008年《情报学报》为例[J]. 情报学报, 2010,29(4):652-662.
[11] ( Wang Fang, Wang Xiangnv . A Bibliometric Study on Research Methods of Information Science in China: Taking JOCSSTI(1999~2008) as Example[J]. Journal of the China Society for Scientific and Technical Information, 2010,29(4):652-662.)
[12] 杨寿青 . 军事情报分析方法体系初探[J]. 情报杂志, 1997,16(2):52-53.
[12] ( Yang Shouqing . A Preliminary Study on the Method of Military Intelligence Analysis[J]. Journal of Information, 1997,16(2):52-53.)
[13] 程立斌, 林春应 . 军事情报研究方法体系探析[J]. 情报杂志, 2007,26(2):87-89.
[13] ( Cheng Libin, Lin Chunying . Analysis on the Methodology System of Military Intelligence Research[J]. Journal of Information, 2007,26(2):87-89.)
[14] 周军, 韩建新 . 试论军事情报研究方法[J]. 图书情报工作, 2005,49(5):64-66.
[14] ( Zhou Jun, Han Jianxin . Methods Used on Military Intelligence Research[J]. Library and Information Service, 2005,49(5):64-66.)
[15] 樊松林 . 竞争情报研究方法体系的架构与选用[J]. 情报科学, 2000,18(10):871-876.
[15] ( Fan Songlin . Construct and Choice of the Research Method Architecture of Competitive Information[J]. Information Science, 2000,18(10):871-876.)
[16] 王玉 . 试论竞争情报研究方法的二维结构[J]. 现代情报, 2004( 7): 12, 15.
[16] ( Wang Yu . Discussion on the Two-dimensional Structure of Competitive Intelligence Research Methods[J]. Modern Information, 2004( 7): 12, 15.)
[17] 刘冰 . 面向对象的竞争情报分析方法体系建构研究[J]. 图书情报工作, 2010,54(12):100-103.
[17] ( Liu Bing . Research on Competitive Intelligence Analysis Methods System Construction Based on Object-Oriented[J]. Library and Information Service, 2010,54(12):100-103.)
[18] Bose R . Competitive Intelligence Process and Tools for Intelligence Analysis[J]. Industrial Management & Data Systems, 2008,108(4):510-528.
[19] 靳娟娟 . 边防情报学的形成与发展研究[J]. 情报杂志, 2001,20(11):38-40.
[19] ( Jin Juanjuan . Research on the Formation and Development of Frontier Information Science[J]. Journal of Information, 2001,20(11):38-40.)
[20] 刘桂锋 . 国内专利情报分析方法体系构建研究[J]. 情报杂志, 2014,33(3):16-21.
[20] ( Liu Guifeng . A Methodological System of Patent Information Analysis in China[J]. Journal of Intelligence, 2014,33(3):16-21.)
[21] 谢晓专, 周西平 . 基于层次结构的公安情报分析方法研究进展[J]. 图书情报工作, 2012,56(20):103-109.
[21] ( Xie Xiaozhuan, Zhou Xiping . Research Progress of Public Security Intelligence Analysis Methods upon the Hierarchical Structure[J]. Library and Information Service, 2010,56(20):103-109.)
[22] 杨锐 . 关于情报学方法体系建设的思考[J]. 情报探索, 2008(5):126-128.
[22] ( Yang Rui . Thoughts on the Construction of Information Science Method System[J]. Information Research, 2008(5):126-128.)
[23] 化柏林, 李广建 . 面向情报流程的情报方法体系构建[J]. 情报学报, 2016,35(2):177-188.
[23] ( Hua Bolin, Li Guangjian . Constructing Methodology of Intelligence Analysis Based on Intelligence Process[J]. Journal of the China Society for Scientific and Technical Information, 2016,35(2):177-188.)
[24] 方付建 . 网络舆情研究中量化方法应用态势分析[J]. 情报杂志, 2014,33(10):47-51.
[24] ( Fang Fujian . Quantitative Methods Application in Online Public Opinion Researches: A Review[J]. Journal of Intelligence, 2014,33(10):47-51.)
[25] 左蒙, 李昌祖 . 网络舆情研究综述: 从理论研究到实践应用[J]. 情报杂志, 2017,36(10):75-82, 144.
[25] ( Zuo Meng, Li Changzu . A Review of Network Public Opinion: From Theoretical Research to Practical Application[J]. Journal of Intelligence, 2017,36(10):75-82, 144.)
[26] 刘亚男 . 我国网络舆情研究现状述评[J]. 情报杂志, 2017,36(5):99-104.
[26] ( Liu Ya’nan . Review on Chinese Network Public Opinion Research in Recent Years[J]. Journal of Intelligence, 2017,36(5):99-104.)
[27] 李文杰, 化存才, 何伟全 , 等. 网络舆情事件的灰色预测模型及案例分析[J]. 情报科学, 2013,31(12):51-56.
[27] ( Li Wenjie, Hua Cuncai, He Weiquan , et al. Grey Prediction Model of Network Public Opinion Events and Analysis of Examples[J]. Information Science, 2013,31(12):51-56.)
[28] 邹伟, 刘永学, 李满春 , 等. 网络新闻中黄岩岛争端事件舆情研究——以新浪网“中菲黄岩岛争端”专题为例[J]. 现代图书情报技术, 2014(2):72-78.
[28] ( Zou Wei, Liu Yongxue, Li Manchun , et al. Research on Public Opinion of the Disputes on Huangyan Island in the Network News: A Case Study of “Special Reports About the Disputes Between China and Philippines on Huangyan Island” on Sina[J]. New Technology of Library and Information Service, 2014(2):72-78.)
[29] 廖海涵, 王曰芬 . 社交媒体舆情信息传播效果影响因素研究——以新浪微博“8.12天津爆炸”事件为例[J]. 现代图书情报技术, 2016(12):89-97.
[29] ( Liao Haihan, Wang Yuefen . Public Opinion Dissemination over Social Media: Case Study of Sina Weibo and “8.12 Tianjing Explosion”[J]. New Technology of Library and Information Service, 2016(12):89-97.)
[1] Ke Qing, Ding Songyun, Qin Qin. Health Information Readability Affects Users’ Cognitive Load and Information Processing: An Eye-Tracking Study[J]. 数据分析与知识发现, 2021, 5(2): 70-82.
[2] Liang Jiwen,Jiang Chuan,Wang Dongbo. Chinese-English Sentence Alignment of Ancient Literature Based on Multi-feature Fusion[J]. 数据分析与知识发现, 2020, 4(9): 123-132.
[3] Yue Yuan,Dongbo Wang,Shuiqing Huang,Bin Li. The Comparative Study of Different Tagging Sets on Entity Extraction of Classical Books[J]. 数据分析与知识发现, 2019, 3(3): 57-65.
[4] Yufeng Duan,Sisi Huang. Information Extraction from Chinese Plant Species Diversity Description Text[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[5] Xiong Jing, Gao Feng, Wu Qinxia. Research on Semantic Mining for Large-scale Oracle Bone Inscriptions Foundation Data[J]. 现代图书情报技术, 2015, 31(2): 7-14.
[6] Deng Shasha, Zhang Pengzhu, Li Xinmiao. A Method for Network Opinion Modeling Based on Governmental Public Decision Domain[J]. 现代图书情报技术, 2012, (9): 69-74.
[7] Jiang Hua, Su Xiaoguang. Chinese High-frequency Words Extraction Algorithm Without Thesaurus[J]. 现代图书情报技术, 2012, 28(6): 50-53.
[8] Zhang Chengzhi,Huilin Wang. Survey on Multilingual Documents Clustering[J]. 现代图书情报技术, 2009, 25(6): 31-36.
[9] Tan Chunmei,Yan Shiwei,Liu Zimu. Design and Realization of Knowledge Element Automatic Extraction of Network Special Subject Knowledge Organization[J]. 现代图书情报技术, 2008, 24(3): 62-67.
[10] Yao Xingshan. The Improvement in a Chinese Word Segmentation Based on Hash Algorism[J]. 现代图书情报技术, 2008, 24(3): 78-81.
[11] Zhang Chengzhi,Su Xinning . Recognition Mutually Exclusive Words for Information Retrieval[J]. 现代图书情报技术, 2007, 2(2): 44-48.
[12] Huang Kun. An Overview on Affective Information Processing[J]. 现代图书情报技术, 2007, 2(11): 67-71.
[13] Zhang Chengzhi,Su Xinning . Lexical Knowledge Discovery for Information Retrieval[J]. 现代图书情报技术, 2007, 2(1): 10-14.
[14] Zhai Xikui . Application of Chinese Information Processing in the Digital Library[J]. 现代图书情报技术, 2006, 1(8): 8-11.
[15] Wu Shaogen . Study of Scheme Automaton for Chinese Word Automatic Segmentation[J]. 现代图书情报技术, 2006, 1(5): 47-49.
  Copyright © 2016 Data Analysis and Knowledge Discovery   Tel/Fax:(010)82626611-6626,82624938   E-mail:jishu@mail.las.ac.cn