Please wait a minute...
Advanced Search
数据分析与知识发现  2021, Vol. 5 Issue (10): 81-93     https://doi.org/10.11925/infotech.2096-3467.2021.0148
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于科技政策文本的程度词典构建研究*
郑新曼,董瑜()
中国科学院文献情报中心 北京 100190
中国科学院大学经济与管理学院图书情报与档案管理系 北京 100190
Constructing Degree Lexicon for STI Policy Texts
Zheng Xinman,Dong Yu()
National Science Library, Chinese Academy of Sciences, Beijing 100190, China
Department of Library, Information and Archives Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190, China
全文: PDF (1457 KB)   HTML ( 14
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 利用词典法辨识和量化我国科技政策文本用语中蕴含的决策者态度及其强弱程度,解决现有中文政策文本研究忽视词语语义强度的问题。【方法】 立足科技政策的功能定位和用语特征,提出程度词的概念。兼顾数量和语义构建程度词典,包括依据专家知识选取种子词,利用PMI算法进行词语扩展,使用同义词词林筛选词语。最后结合TextRank算法进行实验验证。【结果】 经信度和效度检验,构建的程度词典有效,结合程度词典的政策文本分析细粒度优于使用单一的文本挖掘算法。【局限】 程度词典的权重设计有待细化。【结论】 科技政策文本中的程度词丰富、规范且稳定,具有量化分析的价值;词典法可以有效识别并利用程度词,有助于深入挖掘政策文本的语义特征。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
郑新曼
董瑜
关键词 政策文本特征提取领域词典构建意见挖掘    
Abstract

[Objective] This paper constructs a sentiment lexicon for STI policy texts, aiming to identify and quantify the embedded attitudes of policy makers. It tries to address the issues of existing studies, which ignore the semantic intensity of words. [Methods] First, we summarized the characteristics of policy texts and proposed a method to construct degree lexicon. This lexicon chose seed words from expert knowledge, expanded domain degree words with the PMI algorithm, and screened these words with Tongyi Cilin. Finally, we combined the TextRank algorithm with the new lexicon and conducted an experimental validation. [Results] The constructed degree lexicon yielded better results in policy text analysis than the traditional single text mining algorithm. [Limitations] The weights of our lexicon needs to be refined. [Conclusions] The degree words in STI policy texts are abundant, standardized and stable. The new lexicon can effectively utilize degree words, and learn more semantic features of policy texts.

Key wordsPolicy Texts    Feature Extraction    Domain Lexicon Construction    Opinion Mining
收稿日期: 2021-02-18      出版日期: 2021-06-30
ZTFLH:  G350  
基金资助:*中国科学院文献情报能力建设专项(Y9290002)
通讯作者: 董瑜,ORCID:0000-0001-9006-5462     E-mail: dongy@mail.las.ac.cn
引用本文:   
郑新曼, 董瑜. 基于科技政策文本的程度词典构建研究*[J]. 数据分析与知识发现, 2021, 5(10): 81-93.
Zheng Xinman, Dong Yu. Constructing Degree Lexicon for STI Policy Texts. Data Analysis and Knowledge Discovery, 2021, 5(10): 81-93.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2021.0148      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2021/V5/I10/81
类型 特征概述
政策文本 高度凝练的书面用语;表达规范,用词稳定简洁;情感表达相对含蓄
评论文本 多为网络语言;内容简短;情感色彩强烈
微博文本 网络语言;字数有限制,有大量表情符号的应用,用词更新较快;情感色彩强烈
Table 1  三类文本的用语特征概述
词语来源 词语示例
HowNet“中文程度级别词语” 倍加 不过 更加 未免 相对 出头
HowNet“中文正面情感词语” 欢快 入迷 贪恋 答谢 妒恨 恭维
HowNet“中文负面情感词语” 哀愁 包容 不满 敌视 犹豫 责备
HowNet“中文主张词语” 发现 相信 觉得 以为 感觉 听说
“十三五”国家科技创新规划 加强 深化 促进 突破 完善 着力
Table 2  知网部分情感词与政策文本常用程度词的对比
Fig.1  基于中文政策文本的程度词典构建路径
规划名称 发布时间 规划时间 语料来源
《1956—1967年科学技术发展远景规划》 1956 1956—1967 科技部
《1963—1972年科学技术发展规划》 1963 1963—1972 科技部
《1978—1985年全国科学技术发展规划纲要》 1978 1978—1985 科技部
《全国科技发展“九五”计划和到2010年远景目标纲要》 1996 1996—2010 科技部
《国民经济和社会发展第十个五年计划科技教育发展专项规划》 2001 2001—2005 科技部
《国家“十一五”科学技术发展规划》 2006 2006—2010 科技部
《国家中长期科学和技术发展纲领》 2006 2006—2020 国务院
《国家“十二五”科学和技术发展规划》 2011 2011—2015 科技部
《“十三五”国家科技创新规划》 2016 2016—2020 科技部
《国家创新驱动发展战略纲要》 2016 2016—2050 国务院
Table 3  实验语料基本情况
标注 词性 标注 词性
a 形容词 v 动词
ad 副形词,直接作状语的形容词 vd 副动词,直接作状语的动词
an 名形词,具有名词功能的形容词 vn 名动词,指具有名词功能的动词
ag 形语素,形容词性语素 vl 动词性惯用语
al 形容词性惯用语 vf 趋向动词
d 副词 vx 形式动词
dg 副语素,副词性语素
Table 4  候选词的词性
Fig.2  基于专家解读意见标记程度词样例
种子词列表
主要 明确 重大 重点 迈进 加强 长远 推进
加速 健全 改善 突破 建立 建全 保障 引领
发展 及时 新兴 特别 加快 改变 赢得 推动
重视 大力 引进 引导 鼓励 力度 急需 紧缺
促进 探索 强化 深化 支持 完善 持续 加强
提升 充分 积极 优化 建立 健全 壮大 培育
形成 瞄准 聚焦 增强 奠定 重要 拓展 统筹
打造 集成 着力 发挥 坚持 主动 力争 提高
Table 5  去重后的种子词
词语 关联度 词性 词语 关联度 词性
攻克 98.697 1 v 开拓 96.126 2 v
稳定 97.799 7 a 跨越 93.877 3 v
攻关 97.194 3 v 迅速 86.277 3 ad
Table 6  与种子词关联度较高的候选词示例
词语1 词语2 词语相似度 相似度范围
发展 进步 1 0.9~1.0
加强 增强 1 0.9~1.0
推动 促进 1 0.9~1.0
加快 加速 1 0.9~1.0
进一步 更加 1 0.9~1.0
完善 健全 1 0.9~1.0
Table 7  语义相似度较高的程度词示例
词语1 词语2 词语相似度 相似度范围
重点 着力 0.96 0.9~1.0
迈进 发展 0.96 0.9~1.0
迈进 提高 0.96 0.9~1.0
加强 深化 0.96 0.9~1.0
加强 增强 1 0.9~1.0
加强 提高 1 0.9~1.0
Table 8  具有较高语义相似度的种子词示例
词语列表
主要 重大 重点 迈进 加强 推进 加速 健全 保障
发展 特别 加快 推动 大力 促进 强化 深化 支持
Table 9  语义相似度高于0.8的种子词示例
Fig.3  程度词典中的程度词在科技政策样本中的分布
Fig.4  程度词分布的统计
Fig.5  结合程度词典的政策文本分析流程
Fig.6  北京市十三五科技规划文本段落程度值波动图
文本
章节
原文
段落
专家解读的主要内容 程度值
前20的段落
段落
数量
占程度值前20
段落数的比例
1~9 建设全国科技创新中心面临的新形势和新使命 1,2,3,9 4 20%
10~19 明确“十三五”时期全国科技创新中心建设的总体思路和功能定位 11,16 2 10%
20~35 强化原始创新对于全国科技创新中心建设的作用(主要任务) 30 1 5%
36~71 强化科技创新与经济社会发展的深度结合(主要任务) 60,62,67,69 4 20%
72~95 支撑京津冀协同发展等国家战略(主要任务) 73,75,77,83,85,92 6 30%
96~121 以全面创新改革为主线(主要任务) 100,113,117 3 15%
Table 10  程度值前20的段落与专家解读的主要内容的对应情况
段落号 程度值 各段落Top10关键词
词语1 词语2 词语3 词语4 词语5 词语6 词语7 词语8 词语9 词语10
30 55 学科 研究 基础 交叉 信息学 科学 评估 网络 数据 跨学科
69 51 农业 装备 智能 技术 设施 科技 农机 共性 劳动生产率 成果
11 40 科技 经济社会 有机 衔接 全国 制度 科技体制 开放 领域 贯穿
2 38 科技 常态 经济 驱动 要素 供给 全国 中心 动力 依靠
67 36 种业 体系 生物 工程 自主 成果 创新能力 载体 蔬菜 林果
75 33 重点 中心 产业 能力 科技 合理 河北省 科技成果 技术 天津市
83 33 京津冀 先行 园区 总结 国家 中关村 示范区 自主 重点 承接
9 32 科技 经济 全国 中心 方面 能力 有待 资源 决定性 要素
77 32 京津冀 信息 国际 产业 地区 共享 资源 成果 科技 项目
3 31 协同 中心 京津冀 战略 科技 驱动 全国 交易 核心区 全球
60 29 设计 企业 产业 中心 培育 文化 相关 推动 发展 深度
85 29 生态 先行 利用 能源 矿产资源 绿色 共建 承德地区 示范 京津冀
1 28 科技 技术 全球 世界 战略 坚持 经济 网络 全国 中心
62 27 设计 技术 中心 文化 科技 产业 环节 城市 主线 共性
117 26 任务 规划 重点 目标 研究 实施方案 科技 部门 相关 制定
100 24 登记 企业 服务 部门 抵扣 合伙人 试点 纳税 所得额 住所
16 23 研究 经费 专利申请 协定 途径 基础 比重 合作 专利 增长率
73 23 重点 高端 城六区 绿色 服务业 条件 中心 产业 科技成果 旅游
92 22 资本 人才 投资 风险 国际 高端 科技成果 相关 企业 政策
113 22 创业 技术 服务平台 研究 服务 实验室 工程 认证 检验 融资
Table 11  20个重点段落的关键词
关键词结果
创新 科技 发展 技术 产业 建设 研究 推动 服务 企业
推进 中心 重点 开展 国际 建立 完善 人才 北京 机制
创业 加快 京津冀 国家 加强 领域 合作 实施 政策 文化
支持 应用 工程 平台 设计 高端 协同 基础 区域 转化
资源 全国 鼓励 促进 提升 科技
成果
探索 社会 全球 改革
Table 12  全文的前50个关键词
[1] 李钢. 公共政策内容分析方法:理论与应用[M]. 重庆: 重庆大学出版社, 2007.
[1] (Li Gang. Methods of Public Policy Content Analysis: Theory and Applications[M]. Chongqing: Chongqing University Press, 2007.)
[2] 郑新曼, 董瑜. 政策文本量化研究的综述与展望[J]. 现代情报, 2021, 41(2): 168-177.
[2] (Zheng Xinman, Dong Yu. Review on Quantitative Analysis of Political Texts[J]. Journal of Modern Information, 2021, 41(2): 168-177.)
[3] 魏韡, 向阳, 陈千. 中文文本情感分析综述[J]. 计算机应用, 2011, 31(12): 3321-3323.
[3] (Wei Wei, Xiang Yang, Chen Qian. Survey on Chinese Text Sentiment Analysis[J]. Journal of Computer Applications, 2011, 31(12): 3321-3323.)
[4] 赵妍妍, 秦兵, 石秋慧, 等. 大规模情感词典的构建及其在情感分类中的应用[J]. 中文信息学报, 2017, 31(2): 187-193.
[4] (Zhao Yanyan, Qin Bing, Shi Qiuhui, et al. Large-Scale Sentiment Lexicon Collection and Its Application in Sentiment Classification[J]. Journal of Chinese Information Processing, 2017, 31(2): 187-193.)
[5] 符淮青. 现代汉语词汇[M]. 第2版. 北京: 北京大学出版社, 2004.
[5] (Fu Huaiqing. Modern Chinese Word[M]. The 2nd Edition. Beijing: Peking University Press, 2004.)
[6] 朴镇秀. 现代汉语形容词的量研究[D]. 上海:复旦大学, 2009.
[6] (Piao Zhenxiu . Study of Quantity in Modern Chinese Adjectives[D]. Shanghai: Fudan University, 2009.)
[7] 吕文杰. 现代汉语程度范畴表达方式研究[D]. 长春:吉林大学, 2013.
[7] (Lü Wenjie. A Study on Expressions of Degree Category in Modern Chinese[D]. Changchun: Jilin University, 2013.)
[8] 张国宪. 形容词的记量[J]. 世界汉语教学, 1996, 10(4): 35-44.
[8] (Zhang Guoxian. Quantitative Measurement of Chinese Adjectives[J]. Chinese Teaching in the World, 1996, 10(4): 35-44.)
[9] 朱德熙. 现代汉语语法研究[M]. 北京: 商务印书馆出版社, 1985.
[9] (Zhu Dexi. Study on Modern Chinese Grammar[M]. Beijing: The Commercial Press, 1985.)
[10] 蔺璜, 郭姝慧. 程度副词的特点范围与分类[J]. 山西大学学报(哲学社会科学版), 2003, 26(2): 71-74.
[10] (Lin Huang, Guo Shuhui. On the Characteristics, Range and Classification of Adverbs of Degree[J]. Journal of Shanxi University(Philosophy and Social Sciences), 2003, 26(2): 71-74.)
[11] 刘平. 现代汉语程度副词及程度副词结构研究[D]. 武汉:武汉大学, 2011.
[11] (Liu Ping. A Study on Adverbs of Degree and Their Structures in Modern Chinese[D]. Wuhan: Wuhan University, 2011.)
[12] 李宇明. 程度与否定[J]. 世界汉语教学, 1999, 13(1): 29-36.
[12] (Li Yuming. Adverbs of Degree and Negation Particles[J]. Chinese Teaching in the World, 1999, 13(1): 29-36.)
[13] 赵国军. 现代汉语变量表达研究[D]. 上海:华东师范大学, 2008.
[13] (Zhao Guojun. On Expression of Interchange Between Quantity Subcategories in Modern Chinese[D]. Shanghai: East China Normal University, 2008.)
[14] 罗琼鹏. 等级性、量级结构与汉语性质形容词分类[J]. 汉语学习, 2018 (1): 27-38.
[14] (Luo Qiongpeng. Gradability, Scale Structure and Classification of Simple Adjectives in Chinese[J]. Chinese Language Learning, 2018 (1): 27-38.)
[15] 鲁英. 政治语篇中的人际元话语研究: 以2012年《国务院政府工作报告》为个案[J]. 外语学刊, 2012 (5): 52-55.
[15] (Lu Ying. On Interactional Metadiscourse in Political Texts: A Case Study of Report on the Work of Government (2012)[J]. Foreign Language Research, 2012(5): 52-55.)
[16] 陈涛涛. 党政机关公文写作处理:规则方法与范本[M]. 北京: 中国法制出版社, 2014.
[16] (Chen Taotao. The Writing and Processing of Official Documents for Party and Government Organs: Rules, Methods and Models[M]. Beijing: China Legal Publishing House, 2014.)
[17] 徐音华. 从改革开放以来的《国务院政府工作报告》看我国公文词汇的衍变[D]. 成都: 四川师范大学, 2012.
[17] (Xu Yinhua. From the Reform and Opening up of the “State Government Work Report” to See Our Documents Vocabulary Evolution[D]. Chengdu: Sichuan Normal University, 2012.)
[18] 李朦. 现代命令体公文语言研究[D]. 成都:四川师范大学, 2013.
[18] (Li Meng. A Study on the Language of Contemporary Injunctive Documents[D]. Chengdu: Sichuan Normal University, 2013.)
[19] 王国璋. 汉语褒贬义词语用法词典[M]. 北京: 华语教学出版社, 2001.
[19] (Wang Guozhang. A Dictionary of Chinese Praise and Blame Words[M]. Beijing: Sinolingua, 2001.)
[20] HowNet. OpenHowNet’s Home Page[EB/OL].[2021-06-18]. https://openhownet.thunlp.org/about_hownet.
[21] 李枫林, 范雅娴. 领域情感词典构建方法研究[J]. 图书馆理论与实践, 2019 (12): 60-65, 112.
[21] (Li Fenglin, Fan Yaxian. Research on Construction Method of Domain Sentiment Lexicon[J]. Library Theory and Practice, 2019 (12): 60-65, 112.)
[22] 敦欣卉, 张云秋, 杨铠西. 基于微博的细粒度情感分析[J]. 数据分析与知识发现, 2017, 1(7): 61-72.
[22] (Dun Xinhui, Zhang Yunqiu, Yang Kaixi. Fine-grained Sentiment Analysis Based on Weibo[J]. Data Analysis and Knowledge Discovery, 2017, 1(7): 61-72.)
[23] Wu F Z, Huang Y F, Song Y Q, et al. Towards Building a High-quality Microblog-specific Chinese Sentiment Lexicon[J]. Decision Support Systems, 2016, 87: 39-49.
doi: 10.1016/j.dss.2016.04.007
[24] 沈艳, 陈赟, 黄卓. 文本大数据分析在经济学和金融学中的应用:一个文献综述[J]. 经济学(季刊), 2019, 18(4): 1153-1186.
[24] (Shen Yan, Chen Yun, Huang Zhuo. A Literature Review of Textual Analysis in Economic and Financial Research[J]. China Economic Quarterly, 2019, 18(4): 1153-1186.)
[25] 胡家珩, 岑咏华, 吴承尧. 基于深度学习的领域情感词典自动构建: 以金融领域为例[J]. 数据分析与知识发现, 2018, 2(10): 95-102.
[25] (Hu Jiaheng, Cen Yonghua, Wu Chengyao. Constructing Sentiment Dictionary with Deep Learning: Case Study of Financial Data[J]. Data Analysis and Knowledge Discovery, 2018, 2(10): 95-102.)
[26] 汪昌云, 武佳薇. 媒体语气、投资者情绪与IPO定价[J]. 金融研究, 2015 (9): 174-189.
[26] (Wang Changyun, Wu Jiawei. Media Tone, Investor Sentiment and IPO Pricing[J]. Journal of Financial Research, 2015 (9): 174-189.)
[27] 蒋翠清, 郭轶博, 刘尧. 基于中文社交媒体文本的领域情感词典构建方法研究[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[27] (Jiang Cuiqing, Guo Yibo, Liu Yao. Constructing a Domain Sentiment Lexicon Based on Chinese Social Media Text[J]. Data Analysis and Knowledge Discovery, 2019, 3(2): 98-107.)
[28] 徐琳宏, 丁堃, 陈娜, 等. 中文文献引文情感语料库构建[J]. 情报学报, 2020, 39(1): 25-37.
[28] (Xu Linhong, Ding Kun, Chen Na, et al. Corpus Construction for Citation Sentiment in Chinese Literature[J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(1): 25-37.)
[29] Li J, Chen Y, Shen Y, et al. Measuring China’s Stock Market Sentiment[J/OL]. SSRN Electronic Journal, 2019. DOI: 10.2139/ssrn.3377684.
doi: 10.2139/ssrn.3377684
[30] 蒋健. 文本分类中特征提取和特征加权方法研究[D]. 重庆:重庆大学, 2010.
[30] (Jiang Jian. Study on Feature Selection and Feature Weighting of Text Classification[D]. Chongqing: Chongqing University, 2010.)
[31] Hoberg G, Phillips G. Text-Based Network Industries and Endogenous Product Differentiation[J]. Journal of Political Economy, 2016, 124(5): 1423-1465.
doi: 10.1086/688176
[32] 李婷婷, 姬东鸿. 基于SVM和CRF多特征组合的微博情感分析[J]. 计算机应用研究, 2015, 32(4): 978-981.
[32] (Li Tingting, Ji Donghong. Sentiment Analysis of Micro-blog Based on SVM and CRF Using Various Combinations of Features[J]. Application Research of Computers, 2015, 32(4): 978-981.)
[33] 曾子明, 杨倩雯. 基于LDA和AdaBoost多特征组合的微博情感分析[J]. 数据分析与知识发现, 2018, 2(8): 51-59.
[33] (Zeng Ziming, Yang Qianwen. Sentiment Analysis for Micro-blogs with LDA and AdaBoost[J]. Data Analysis and Knowledge Discovery, 2018, 2(8): 51-59.)
[34] 王科, 夏睿. 情感词典自动构建方法综述[J]. 自动化学报, 2016, 42(4): 495-511.
[34] (Wang Ke, Xia Rui. A Survey on Automatical Construction Methods of Sentiment Lexicons[J]. Acta Automatica Sinica, 2016, 42(4): 495-511.)
[35] 钮菊生. 论现代公共政策的功能与特点[J]. 江海学刊, 2001(5): 71-75.
[35] (Niu Jusheng. On the Function and Features of Modern Public Policy[J]. Jianghai Academic Journal (Bimonthly), 2001(5): 71-75.)
[36] 张宝建, 李鹏利, 陈劲, 等. 国家科技创新政策的主题分析与演化过程: 基于文本挖掘的视角[J]. 科学学与科学技术管理, 2019, 40(11): 15-31.
[36] (Zhang Baojian, Li Pengli, Chen Jin, et al. Thematic Analysis and Evolution Process of National Science and Technology Innovation Policy: Based on the Perspective of Text Mining[J]. Science of Science and Management of S. & T., 2019, 40(11): 15-31.)
[37] 尹均生. 中国写作学大辞典[M]. 北京: 中国检察出版社, 1998.
[37] (Yin Junsheng. Dictionary of Chinese Writing[M]. Beijing: China Procuratorial Press, 1998.)
[38] 杨正联. 公共政策文本解读的方法论[J]. 理论探讨, 2007(4): 143-147.
[38] (Yang Zhenglian. Methodologies for the Interpretation of Public Policy Texts[J]. Theoretical Investigation, 2007(4): 143-147.)
[39] Carvalho A, Pinto-Coelho Z, Seixas E. Listening to the Public -Enacting Power: Citizen Access, Standing and Influence in Public Participation Discourses[J]. Journal of Environmental Policy & Planning, 2019, 21(5): 563-576.
[40] Turney P D, Littman M L. Measuring Praise and Criticism: Inference of Semantic Orientation from Association[J]. ACM Transactions on Information Systems, 2003, 21(4): 315-346.
doi: 10.1145/944012.944013
[41] 梅家驹. 同义词词林[M]. 上海: 上海辞书出版社, 1983.
[41] (Mei Jiaju. Tongyici Cilin[M]. Shanghai: Shanghai Lexicographic Publishing House, 1983.)
[42] 田久乐, 赵蔚. 基于同义词词林的词语相似度计算方法[J]. 吉林大学学报(信息科学版), 2010, 28(6): 602-608.
[42] (Tian Jiule, Zhao Wei. Words Similarity Algorithm Based on Tongyici Cilin in Semantic Web Adaptive Learning System[J]. Journal of Jilin University(Information Science Edition), 2010, 28(6): 602-608.)
[43] 李鸿儒. 定性研究中的信度和效度[D]. 哈尔滨:哈尔滨工程大学, 2009.
[43] (Li Hongru. Reliability and Validity in Qualitative Research[D]. Harbin: Harbin Engineering University, 2009.)
[44] 王静. 著名专家解读《“十三五”国家科技创新规划》——刘德培、吕薇、薛澜的阐释[EB/OL].[2020-11-10]. http://news.sciencenet.cn/htmlnews/2016/8/353201.shtm.
[44] (Wang Jing. Renowned Experts Interpret the 13th Five-Year Plan for National Science and Technology Innovation-Explanations[EB/OL].[2020-11-10]. http://news.sciencenet.cn/htmlnews/2016/8/353201.shtm.)
[45] 中国政府网国务院政策文件库[DB/OL].[2020-11-10]. http://www.gov.cn/zhengce/zhengcewenjianku/index.htm.
[45] (Chinese Government Network State Council Policy Document Database [DB/OL].[2020-11-10]. http://www.gov.cn/zhengce/zhengcewenjianku/index.htm.)
[46] Mihalcea R, Tarau P. TextRank: Bringing Order into Text [C]// Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing. ACL, 2004: 404-411.
[47] 北京市科学技术委员会. 《北京市“十三五”时期加强全国科技创新中心建设规划》解读[EB/OL].[2020-11-20].http://kw.beijing.gov.cn/art/2016/10/9/art_2410_57010.html.
[47] (Beijing Municipal Science & Technnology Commission. Interpretation of Beijing’s 13th Five-Year Plan for Strengthening the Construction of a National Science and Technology Innovation Centre [EB/OL].[2020-11-20]. http://kw.beijing.gov.cn/art/2016/10/9/art_2410_57010.html.)
[1] 华斌, 吴诺, 贺欣. 基于知识融合的政务信息化项目多专家审批意见整合*[J]. 数据分析与知识发现, 2021, 5(10): 124-136.
[2] 蔡婧璇,吴江,王诚坤. 基于深度学习的众测报告有用性预测研究*[J]. 数据分析与知识发现, 2020, 4(11): 102-111.
[3] 李纲,周华阳,毛进,陈思菁. 基于机器学习的社交媒体用户分类研究 *[J]. 数据分析与知识发现, 2019, 3(8): 1-9.
[4] 文秀贤,徐健. 基于用户评论的商品特征提取及特征价格研究 *[J]. 数据分析与知识发现, 2019, 3(7): 42-51.
[5] 严娇,马静,房康. 基于融合共现距离的句法网络下文本语义相似度计算 *[J]. 数据分析与知识发现, 2019, 3(12): 93-100.
[6] 钟庆虹,乔晓东,张运良,翁梦娟. 基于LDA2Vec和残差网络的跨媒体融合方法研究 *[J]. 数据分析与知识发现, 2019, 3(10): 78-88.
[7] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[8] 张涛, 马海群. 一种基于LDA主题模型的政策文本聚类方法研究*[J]. 数据分析与知识发现, 2018, 2(9): 59-65.
[9] 黄孝喜, 李晗雨, 王荣波, 王小华, 谌志群. 基于卷积神经网络与SVM分类器的隐喻识别*[J]. 数据分析与知识发现, 2018, 2(10): 77-83.
[10] 李伟卿, 王伟军. 基于大规模评论数据的产品特征词典构建方法研究*[J]. 数据分析与知识发现, 2018, 2(1): 41-50.
[11] 李昌兵, 庞崇鹏, 李美平. 基于权重的Apriori算法在文本统计特征提取方法中的应用*[J]. 数据分析与知识发现, 2017, 1(9): 83-89.
[12] 刘红光,马双刚,刘桂锋. 基于降噪自动编码器的中文新闻文本分类方法研究*[J]. 现代图书情报技术, 2016, 32(6): 12-19.
[13] 杜思奇, 李红莲, 吕学强. 汉语组块分析在产品特征提取中的应用研究[J]. 现代图书情报技术, 2015, 31(9): 26-30.
[14] 张莉, 许鑫. 产品评论中的隐式属性抽取研究[J]. 现代图书情报技术, 2015, 31(12): 42-47.
[15] 路永和, 梁明辉. 遗传算法在改进文本特征提取方法中的应用[J]. 现代图书情报技术, 2014, 30(4): 48-57.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn