Please wait a minute...
Data Analysis and Knowledge Discovery  2021, Vol. 5 Issue (10): 81-93    DOI: 10.11925/infotech.2096-3467.2021.0148
Current Issue | Archive | Adv Search |
Constructing Degree Lexicon for STI Policy Texts
Zheng Xinman,Dong Yu()
National Science Library, Chinese Academy of Sciences, Beijing 100190, China
Department of Library, Information and Archives Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190, China
Download: PDF (1457 KB)   HTML ( 2
Export: BibTeX | EndNote (RIS)      
Abstract  

[Objective] This paper constructs a sentiment lexicon for STI policy texts, aiming to identify and quantify the embedded attitudes of policy makers. It tries to address the issues of existing studies, which ignore the semantic intensity of words. [Methods] First, we summarized the characteristics of policy texts and proposed a method to construct degree lexicon. This lexicon chose seed words from expert knowledge, expanded domain degree words with the PMI algorithm, and screened these words with Tongyi Cilin. Finally, we combined the TextRank algorithm with the new lexicon and conducted an experimental validation. [Results] The constructed degree lexicon yielded better results in policy text analysis than the traditional single text mining algorithm. [Limitations] The weights of our lexicon needs to be refined. [Conclusions] The degree words in STI policy texts are abundant, standardized and stable. The new lexicon can effectively utilize degree words, and learn more semantic features of policy texts.

Key wordsPolicy Texts      Feature Extraction      Domain Lexicon Construction      Opinion Mining     
Received: 18 February 2021      Published: 30 June 2021
ZTFLH:  G350  
Fund:Project of Literature and Information Capacity Building, Chinese Academy of Sciences(Y9290002)
Corresponding Authors: Dong Yu,ORCID:0000-0001-9006-5462     E-mail: dongy@mail.las.ac.cn

Cite this article:

Zheng Xinman, Dong Yu. Constructing Degree Lexicon for STI Policy Texts. Data Analysis and Knowledge Discovery, 2021, 5(10): 81-93.

URL:

http://manu44.magtech.com.cn/Jwk_infotech_wk3/EN/10.11925/infotech.2096-3467.2021.0148     OR     http://manu44.magtech.com.cn/Jwk_infotech_wk3/EN/Y2021/V5/I10/81

类型 特征概述
政策文本 高度凝练的书面用语;表达规范,用词稳定简洁;情感表达相对含蓄
评论文本 多为网络语言;内容简短;情感色彩强烈
微博文本 网络语言;字数有限制,有大量表情符号的应用,用词更新较快;情感色彩强烈
Expression Features of Three Types of Texts
词语来源 词语示例
HowNet“中文程度级别词语” 倍加 不过 更加 未免 相对 出头
HowNet“中文正面情感词语” 欢快 入迷 贪恋 答谢 妒恨 恭维
HowNet“中文负面情感词语” 哀愁 包容 不满 敌视 犹豫 责备
HowNet“中文主张词语” 发现 相信 觉得 以为 感觉 听说
“十三五”国家科技创新规划 加强 深化 促进 突破 完善 着力
Comparison of Emotional Words in HowNet with Degree Words in the Policy Text
Process of Building Degree Lexicon Based on Chinese Policy Texts
规划名称 发布时间 规划时间 语料来源
《1956—1967年科学技术发展远景规划》 1956 1956—1967 科技部
《1963—1972年科学技术发展规划》 1963 1963—1972 科技部
《1978—1985年全国科学技术发展规划纲要》 1978 1978—1985 科技部
《全国科技发展“九五”计划和到2010年远景目标纲要》 1996 1996—2010 科技部
《国民经济和社会发展第十个五年计划科技教育发展专项规划》 2001 2001—2005 科技部
《国家“十一五”科学技术发展规划》 2006 2006—2010 科技部
《国家中长期科学和技术发展纲领》 2006 2006—2020 国务院
《国家“十二五”科学和技术发展规划》 2011 2011—2015 科技部
《“十三五”国家科技创新规划》 2016 2016—2020 科技部
《国家创新驱动发展战略纲要》 2016 2016—2050 国务院
Corpus Details
标注 词性 标注 词性
a 形容词 v 动词
ad 副形词,直接作状语的形容词 vd 副动词,直接作状语的动词
an 名形词,具有名词功能的形容词 vn 名动词,指具有名词功能的动词
ag 形语素,形容词性语素 vl 动词性惯用语
al 形容词性惯用语 vf 趋向动词
d 副词 vx 形式动词
dg 副语素,副词性语素
Lexicality of Candidate Degree Words
Example of Tagging Degree Words Based on Expert Interpretation
种子词列表
主要 明确 重大 重点 迈进 加强 长远 推进
加速 健全 改善 突破 建立 建全 保障 引领
发展 及时 新兴 特别 加快 改变 赢得 推动
重视 大力 引进 引导 鼓励 力度 急需 紧缺
促进 探索 强化 深化 支持 完善 持续 加强
提升 充分 积极 优化 建立 健全 壮大 培育
形成 瞄准 聚焦 增强 奠定 重要 拓展 统筹
打造 集成 着力 发挥 坚持 主动 力争 提高
De-duplicated Seed Words
词语 关联度 词性 词语 关联度 词性
攻克 98.697 1 v 开拓 96.126 2 v
稳定 97.799 7 a 跨越 93.877 3 v
攻关 97.194 3 v 迅速 86.277 3 ad
Examples of Candidate Degree Words with High Relevance with Seed Words
词语1 词语2 词语相似度 相似度范围
发展 进步 1 0.9~1.0
加强 增强 1 0.9~1.0
推动 促进 1 0.9~1.0
加快 加速 1 0.9~1.0
进一步 更加 1 0.9~1.0
完善 健全 1 0.9~1.0
Degree Words with High Semantic Similarity
词语1 词语2 词语相似度 相似度范围
重点 着力 0.96 0.9~1.0
迈进 发展 0.96 0.9~1.0
迈进 提高 0.96 0.9~1.0
加强 深化 0.96 0.9~1.0
加强 增强 1 0.9~1.0
加强 提高 1 0.9~1.0
Seed Words with High Semantic Similarity
词语列表
主要 重大 重点 迈进 加强 推进 加速 健全 保障
发展 特别 加快 推动 大力 促进 强化 深化 支持
Seed Words with Semantic Similarity Higher than 0.8
Distribution of Degree Words in the Degree Lexicon in STI Policy Samples
Statistics on the Distribution of Degree Words
Policy Text Analysis Process Combined with Degree Lexicon
Degree Value of Each Paragraph in Beijing’s 13th Five-Year STI Plan
文本
章节
原文
段落
专家解读的主要内容 程度值
前20的段落
段落
数量
占程度值前20
段落数的比例
1~9 建设全国科技创新中心面临的新形势和新使命 1,2,3,9 4 20%
10~19 明确“十三五”时期全国科技创新中心建设的总体思路和功能定位 11,16 2 10%
20~35 强化原始创新对于全国科技创新中心建设的作用(主要任务) 30 1 5%
36~71 强化科技创新与经济社会发展的深度结合(主要任务) 60,62,67,69 4 20%
72~95 支撑京津冀协同发展等国家战略(主要任务) 73,75,77,83,85,92 6 30%
96~121 以全面创新改革为主线(主要任务) 100,113,117 3 15%
Comparison of the Top 20 Paragraphs in Terms of Degree Value and Experts’ Opinions
段落号 程度值 各段落Top10关键词
词语1 词语2 词语3 词语4 词语5 词语6 词语7 词语8 词语9 词语10
30 55 学科 研究 基础 交叉 信息学 科学 评估 网络 数据 跨学科
69 51 农业 装备 智能 技术 设施 科技 农机 共性 劳动生产率 成果
11 40 科技 经济社会 有机 衔接 全国 制度 科技体制 开放 领域 贯穿
2 38 科技 常态 经济 驱动 要素 供给 全国 中心 动力 依靠
67 36 种业 体系 生物 工程 自主 成果 创新能力 载体 蔬菜 林果
75 33 重点 中心 产业 能力 科技 合理 河北省 科技成果 技术 天津市
83 33 京津冀 先行 园区 总结 国家 中关村 示范区 自主 重点 承接
9 32 科技 经济 全国 中心 方面 能力 有待 资源 决定性 要素
77 32 京津冀 信息 国际 产业 地区 共享 资源 成果 科技 项目
3 31 协同 中心 京津冀 战略 科技 驱动 全国 交易 核心区 全球
60 29 设计 企业 产业 中心 培育 文化 相关 推动 发展 深度
85 29 生态 先行 利用 能源 矿产资源 绿色 共建 承德地区 示范 京津冀
1 28 科技 技术 全球 世界 战略 坚持 经济 网络 全国 中心
62 27 设计 技术 中心 文化 科技 产业 环节 城市 主线 共性
117 26 任务 规划 重点 目标 研究 实施方案 科技 部门 相关 制定
100 24 登记 企业 服务 部门 抵扣 合伙人 试点 纳税 所得额 住所
16 23 研究 经费 专利申请 协定 途径 基础 比重 合作 专利 增长率
73 23 重点 高端 城六区 绿色 服务业 条件 中心 产业 科技成果 旅游
92 22 资本 人才 投资 风险 国际 高端 科技成果 相关 企业 政策
113 22 创业 技术 服务平台 研究 服务 实验室 工程 认证 检验 融资
Keywords of the 20 Key Paragraphs
关键词结果
创新 科技 发展 技术 产业 建设 研究 推动 服务 企业
推进 中心 重点 开展 国际 建立 完善 人才 北京 机制
创业 加快 京津冀 国家 加强 领域 合作 实施 政策 文化
支持 应用 工程 平台 设计 高端 协同 基础 区域 转化
资源 全国 鼓励 促进 提升 科技
成果
探索 社会 全球 改革
Top 50 Keywords of the Full Text
[1] 李钢. 公共政策内容分析方法:理论与应用[M]. 重庆: 重庆大学出版社, 2007.
[1] (Li Gang. Methods of Public Policy Content Analysis: Theory and Applications[M]. Chongqing: Chongqing University Press, 2007.)
[2] 郑新曼, 董瑜. 政策文本量化研究的综述与展望[J]. 现代情报, 2021, 41(2): 168-177.
[2] (Zheng Xinman, Dong Yu. Review on Quantitative Analysis of Political Texts[J]. Journal of Modern Information, 2021, 41(2): 168-177.)
[3] 魏韡, 向阳, 陈千. 中文文本情感分析综述[J]. 计算机应用, 2011, 31(12): 3321-3323.
[3] (Wei Wei, Xiang Yang, Chen Qian. Survey on Chinese Text Sentiment Analysis[J]. Journal of Computer Applications, 2011, 31(12): 3321-3323.)
[4] 赵妍妍, 秦兵, 石秋慧, 等. 大规模情感词典的构建及其在情感分类中的应用[J]. 中文信息学报, 2017, 31(2): 187-193.
[4] (Zhao Yanyan, Qin Bing, Shi Qiuhui, et al. Large-Scale Sentiment Lexicon Collection and Its Application in Sentiment Classification[J]. Journal of Chinese Information Processing, 2017, 31(2): 187-193.)
[5] 符淮青. 现代汉语词汇[M]. 第2版. 北京: 北京大学出版社, 2004.
[5] (Fu Huaiqing. Modern Chinese Word[M]. The 2nd Edition. Beijing: Peking University Press, 2004.)
[6] 朴镇秀. 现代汉语形容词的量研究[D]. 上海:复旦大学, 2009.
[6] (Piao Zhenxiu . Study of Quantity in Modern Chinese Adjectives[D]. Shanghai: Fudan University, 2009.)
[7] 吕文杰. 现代汉语程度范畴表达方式研究[D]. 长春:吉林大学, 2013.
[7] (Lü Wenjie. A Study on Expressions of Degree Category in Modern Chinese[D]. Changchun: Jilin University, 2013.)
[8] 张国宪. 形容词的记量[J]. 世界汉语教学, 1996, 10(4): 35-44.
[8] (Zhang Guoxian. Quantitative Measurement of Chinese Adjectives[J]. Chinese Teaching in the World, 1996, 10(4): 35-44.)
[9] 朱德熙. 现代汉语语法研究[M]. 北京: 商务印书馆出版社, 1985.
[9] (Zhu Dexi. Study on Modern Chinese Grammar[M]. Beijing: The Commercial Press, 1985.)
[10] 蔺璜, 郭姝慧. 程度副词的特点范围与分类[J]. 山西大学学报(哲学社会科学版), 2003, 26(2): 71-74.
[10] (Lin Huang, Guo Shuhui. On the Characteristics, Range and Classification of Adverbs of Degree[J]. Journal of Shanxi University(Philosophy and Social Sciences), 2003, 26(2): 71-74.)
[11] 刘平. 现代汉语程度副词及程度副词结构研究[D]. 武汉:武汉大学, 2011.
[11] (Liu Ping. A Study on Adverbs of Degree and Their Structures in Modern Chinese[D]. Wuhan: Wuhan University, 2011.)
[12] 李宇明. 程度与否定[J]. 世界汉语教学, 1999, 13(1): 29-36.
[12] (Li Yuming. Adverbs of Degree and Negation Particles[J]. Chinese Teaching in the World, 1999, 13(1): 29-36.)
[13] 赵国军. 现代汉语变量表达研究[D]. 上海:华东师范大学, 2008.
[13] (Zhao Guojun. On Expression of Interchange Between Quantity Subcategories in Modern Chinese[D]. Shanghai: East China Normal University, 2008.)
[14] 罗琼鹏. 等级性、量级结构与汉语性质形容词分类[J]. 汉语学习, 2018 (1): 27-38.
[14] (Luo Qiongpeng. Gradability, Scale Structure and Classification of Simple Adjectives in Chinese[J]. Chinese Language Learning, 2018 (1): 27-38.)
[15] 鲁英. 政治语篇中的人际元话语研究: 以2012年《国务院政府工作报告》为个案[J]. 外语学刊, 2012 (5): 52-55.
[15] (Lu Ying. On Interactional Metadiscourse in Political Texts: A Case Study of Report on the Work of Government (2012)[J]. Foreign Language Research, 2012(5): 52-55.)
[16] 陈涛涛. 党政机关公文写作处理:规则方法与范本[M]. 北京: 中国法制出版社, 2014.
[16] (Chen Taotao. The Writing and Processing of Official Documents for Party and Government Organs: Rules, Methods and Models[M]. Beijing: China Legal Publishing House, 2014.)
[17] 徐音华. 从改革开放以来的《国务院政府工作报告》看我国公文词汇的衍变[D]. 成都: 四川师范大学, 2012.
[17] (Xu Yinhua. From the Reform and Opening up of the “State Government Work Report” to See Our Documents Vocabulary Evolution[D]. Chengdu: Sichuan Normal University, 2012.)
[18] 李朦. 现代命令体公文语言研究[D]. 成都:四川师范大学, 2013.
[18] (Li Meng. A Study on the Language of Contemporary Injunctive Documents[D]. Chengdu: Sichuan Normal University, 2013.)
[19] 王国璋. 汉语褒贬义词语用法词典[M]. 北京: 华语教学出版社, 2001.
[19] (Wang Guozhang. A Dictionary of Chinese Praise and Blame Words[M]. Beijing: Sinolingua, 2001.)
[20] HowNet. OpenHowNet’s Home Page[EB/OL].[2021-06-18]. https://openhownet.thunlp.org/about_hownet.
[21] 李枫林, 范雅娴. 领域情感词典构建方法研究[J]. 图书馆理论与实践, 2019 (12): 60-65, 112.
[21] (Li Fenglin, Fan Yaxian. Research on Construction Method of Domain Sentiment Lexicon[J]. Library Theory and Practice, 2019 (12): 60-65, 112.)
[22] 敦欣卉, 张云秋, 杨铠西. 基于微博的细粒度情感分析[J]. 数据分析与知识发现, 2017, 1(7): 61-72.
[22] (Dun Xinhui, Zhang Yunqiu, Yang Kaixi. Fine-grained Sentiment Analysis Based on Weibo[J]. Data Analysis and Knowledge Discovery, 2017, 1(7): 61-72.)
[23] Wu F Z, Huang Y F, Song Y Q, et al. Towards Building a High-quality Microblog-specific Chinese Sentiment Lexicon[J]. Decision Support Systems, 2016, 87: 39-49.
doi: 10.1016/j.dss.2016.04.007
[24] 沈艳, 陈赟, 黄卓. 文本大数据分析在经济学和金融学中的应用:一个文献综述[J]. 经济学(季刊), 2019, 18(4): 1153-1186.
[24] (Shen Yan, Chen Yun, Huang Zhuo. A Literature Review of Textual Analysis in Economic and Financial Research[J]. China Economic Quarterly, 2019, 18(4): 1153-1186.)
[25] 胡家珩, 岑咏华, 吴承尧. 基于深度学习的领域情感词典自动构建: 以金融领域为例[J]. 数据分析与知识发现, 2018, 2(10): 95-102.
[25] (Hu Jiaheng, Cen Yonghua, Wu Chengyao. Constructing Sentiment Dictionary with Deep Learning: Case Study of Financial Data[J]. Data Analysis and Knowledge Discovery, 2018, 2(10): 95-102.)
[26] 汪昌云, 武佳薇. 媒体语气、投资者情绪与IPO定价[J]. 金融研究, 2015 (9): 174-189.
[26] (Wang Changyun, Wu Jiawei. Media Tone, Investor Sentiment and IPO Pricing[J]. Journal of Financial Research, 2015 (9): 174-189.)
[27] 蒋翠清, 郭轶博, 刘尧. 基于中文社交媒体文本的领域情感词典构建方法研究[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[27] (Jiang Cuiqing, Guo Yibo, Liu Yao. Constructing a Domain Sentiment Lexicon Based on Chinese Social Media Text[J]. Data Analysis and Knowledge Discovery, 2019, 3(2): 98-107.)
[28] 徐琳宏, 丁堃, 陈娜, 等. 中文文献引文情感语料库构建[J]. 情报学报, 2020, 39(1): 25-37.
[28] (Xu Linhong, Ding Kun, Chen Na, et al. Corpus Construction for Citation Sentiment in Chinese Literature[J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(1): 25-37.)
[29] Li J, Chen Y, Shen Y, et al. Measuring China’s Stock Market Sentiment[J/OL]. SSRN Electronic Journal, 2019. DOI: 10.2139/ssrn.3377684.
doi: 10.2139/ssrn.3377684
[30] 蒋健. 文本分类中特征提取和特征加权方法研究[D]. 重庆:重庆大学, 2010.
[30] (Jiang Jian. Study on Feature Selection and Feature Weighting of Text Classification[D]. Chongqing: Chongqing University, 2010.)
[31] Hoberg G, Phillips G. Text-Based Network Industries and Endogenous Product Differentiation[J]. Journal of Political Economy, 2016, 124(5): 1423-1465.
doi: 10.1086/688176
[32] 李婷婷, 姬东鸿. 基于SVM和CRF多特征组合的微博情感分析[J]. 计算机应用研究, 2015, 32(4): 978-981.
[32] (Li Tingting, Ji Donghong. Sentiment Analysis of Micro-blog Based on SVM and CRF Using Various Combinations of Features[J]. Application Research of Computers, 2015, 32(4): 978-981.)
[33] 曾子明, 杨倩雯. 基于LDA和AdaBoost多特征组合的微博情感分析[J]. 数据分析与知识发现, 2018, 2(8): 51-59.
[33] (Zeng Ziming, Yang Qianwen. Sentiment Analysis for Micro-blogs with LDA and AdaBoost[J]. Data Analysis and Knowledge Discovery, 2018, 2(8): 51-59.)
[34] 王科, 夏睿. 情感词典自动构建方法综述[J]. 自动化学报, 2016, 42(4): 495-511.
[34] (Wang Ke, Xia Rui. A Survey on Automatical Construction Methods of Sentiment Lexicons[J]. Acta Automatica Sinica, 2016, 42(4): 495-511.)
[35] 钮菊生. 论现代公共政策的功能与特点[J]. 江海学刊, 2001(5): 71-75.
[35] (Niu Jusheng. On the Function and Features of Modern Public Policy[J]. Jianghai Academic Journal (Bimonthly), 2001(5): 71-75.)
[36] 张宝建, 李鹏利, 陈劲, 等. 国家科技创新政策的主题分析与演化过程: 基于文本挖掘的视角[J]. 科学学与科学技术管理, 2019, 40(11): 15-31.
[36] (Zhang Baojian, Li Pengli, Chen Jin, et al. Thematic Analysis and Evolution Process of National Science and Technology Innovation Policy: Based on the Perspective of Text Mining[J]. Science of Science and Management of S. & T., 2019, 40(11): 15-31.)
[37] 尹均生. 中国写作学大辞典[M]. 北京: 中国检察出版社, 1998.
[37] (Yin Junsheng. Dictionary of Chinese Writing[M]. Beijing: China Procuratorial Press, 1998.)
[38] 杨正联. 公共政策文本解读的方法论[J]. 理论探讨, 2007(4): 143-147.
[38] (Yang Zhenglian. Methodologies for the Interpretation of Public Policy Texts[J]. Theoretical Investigation, 2007(4): 143-147.)
[39] Carvalho A, Pinto-Coelho Z, Seixas E. Listening to the Public -Enacting Power: Citizen Access, Standing and Influence in Public Participation Discourses[J]. Journal of Environmental Policy & Planning, 2019, 21(5): 563-576.
[40] Turney P D, Littman M L. Measuring Praise and Criticism: Inference of Semantic Orientation from Association[J]. ACM Transactions on Information Systems, 2003, 21(4): 315-346.
doi: 10.1145/944012.944013
[41] 梅家驹. 同义词词林[M]. 上海: 上海辞书出版社, 1983.
[41] (Mei Jiaju. Tongyici Cilin[M]. Shanghai: Shanghai Lexicographic Publishing House, 1983.)
[42] 田久乐, 赵蔚. 基于同义词词林的词语相似度计算方法[J]. 吉林大学学报(信息科学版), 2010, 28(6): 602-608.
[42] (Tian Jiule, Zhao Wei. Words Similarity Algorithm Based on Tongyici Cilin in Semantic Web Adaptive Learning System[J]. Journal of Jilin University(Information Science Edition), 2010, 28(6): 602-608.)
[43] 李鸿儒. 定性研究中的信度和效度[D]. 哈尔滨:哈尔滨工程大学, 2009.
[43] (Li Hongru. Reliability and Validity in Qualitative Research[D]. Harbin: Harbin Engineering University, 2009.)
[44] 王静. 著名专家解读《“十三五”国家科技创新规划》——刘德培、吕薇、薛澜的阐释[EB/OL].[2020-11-10]. http://news.sciencenet.cn/htmlnews/2016/8/353201.shtm.
[44] (Wang Jing. Renowned Experts Interpret the 13th Five-Year Plan for National Science and Technology Innovation-Explanations[EB/OL].[2020-11-10]. http://news.sciencenet.cn/htmlnews/2016/8/353201.shtm.)
[45] 中国政府网国务院政策文件库[DB/OL].[2020-11-10]. http://www.gov.cn/zhengce/zhengcewenjianku/index.htm.
[45] (Chinese Government Network State Council Policy Document Database [DB/OL].[2020-11-10]. http://www.gov.cn/zhengce/zhengcewenjianku/index.htm.)
[46] Mihalcea R, Tarau P. TextRank: Bringing Order into Text [C]// Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing. ACL, 2004: 404-411.
[47] 北京市科学技术委员会. 《北京市“十三五”时期加强全国科技创新中心建设规划》解读[EB/OL].[2020-11-20].http://kw.beijing.gov.cn/art/2016/10/9/art_2410_57010.html.
[47] (Beijing Municipal Science & Technnology Commission. Interpretation of Beijing’s 13th Five-Year Plan for Strengthening the Construction of a National Science and Technology Innovation Centre [EB/OL].[2020-11-20]. http://kw.beijing.gov.cn/art/2016/10/9/art_2410_57010.html.)
[1] Hua Bin,Wu Nuo,He Xin. Integrating Expert Reviews for Government Information Projects with Knowledge Fusion[J]. 数据分析与知识发现, 2021, 5(10): 124-136.
[2] Xu Hongxia,Yu Qianqian,Qian Li. Studying Content Interaction Data with Topic Model and Sentiment Analysis[J]. 数据分析与知识发现, 2020, 4(7): 110-117.
[3] Cai Jingxuan,Wu Jiang,Wang Chengkun. Predicting Usefulness of Crowd Testing Reports with Deep Learning[J]. 数据分析与知识发现, 2020, 4(11): 102-111.
[4] Hui Nie,Huan He. Identifying Implicit Features with Word Embedding[J]. 数据分析与知识发现, 2020, 4(1): 99-110.
[5] Bocheng Li,Yunqiu Zhang,Kaixi Yang. Extracting Emotion Tags from Comments of Microblog Commodities[J]. 数据分析与知识发现, 2019, 3(9): 115-123.
[6] Gang Li,Huayang Zhou,Jin Mao,Sijing Chen. Classifying Social Media Users with Machine Learning[J]. 数据分析与知识发现, 2019, 3(8): 1-9.
[7] Xiaofeng Li,Jing Ma,Chi Li,Hengmin Zhu. Identifying Commodity Names Based on XGBoost Model[J]. 数据分析与知识发现, 2019, 3(7): 34-41.
[8] Jiao Yan,Jing Ma,Kang Fang. Computing Text Semantic Similarity with Syntactic Network of Co-occurrence Distance[J]. 数据分析与知识发现, 2019, 3(12): 93-100.
[9] Qinghong Zhong,Xiaodong Qiao,Yunliang Zhang,Mengjuan Weng. Cross-media Fusion Method Based on LDA2Vec and Residual Network[J]. 数据分析与知识发现, 2019, 3(10): 78-88.
[10] Guijun Yang,Xue Xu,Fuqiang Zhao. Predicting User Ratings with XGBoost Algorithm[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[11] Zhou Lixin,Lin Jie. Extracting Product Features with NodeRank Algorithm[J]. 数据分析与知识发现, 2018, 2(4): 90-98.
[12] Huang Xiaoxi,Li Hanyu,Wang Rongbo,Wang Xiaohua,Chen Zhiqun. Recognizing Metaphor with Convolution Neural Network and SVM[J]. 数据分析与知识发现, 2018, 2(10): 77-83.
[13] Li Weiqing,Wang Weijun. Building Product Feature Dictionary with Large-scale Review Data[J]. 数据分析与知识发现, 2018, 2(1): 41-50.
[14] Li Changbing,Pang Chongpeng,Li Meiping. Extracting Product Features with Weight-based Apriori Algorithm[J]. 数据分析与知识发现, 2017, 1(9): 83-89.
[15] Guo Bo,Li Shouguang,Wang Hao,Zhang Xiaojun,Gong Wei,Yu Zhaojun,Sun Yu. Examining Product Reviews with Sentiment Analysis and Opinion Mining[J]. 数据分析与知识发现, 2017, 1(12): 1-9.
  Copyright © 2016 Data Analysis and Knowledge Discovery   Tel/Fax:(010)82626611-6626,82624938   E-mail:jishu@mail.las.ac.cn