Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (6): 30-41    DOI: 10.11925/infotech.2096-3467.2018.0827
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于多视图协同的政策文本可视化研究*
杨亚楠1,3(),赵文辉2,张健1,3,谭珅1,3,张贝贝1,3
1(北京信息科技大学经济管理学院 北京 100192)
2(北京理工大学管理与经济学院 北京 100081)
3(绿色发展大数据决策北京市重点实验室 北京 100192)
Visualizing Policy Texts Based on Multi-View Collaboration
Yanan Yang1,3(),Wenhui Zhao2,Jian Zhang1,3,Shen Tan1,3,Beibei Zhang1,3
1(School of Economics and Management, Beijing University of Information Science and Technology, Beijing 100192, China)
2(School of Management and Economics, Beijing Institute of Technology, Beijing 100081, China)
3(Beijing Key Laboratory of Big Data Decision Making for Green Development, Beijing 100192, China)
全文: PDF(8125 KB)   HTML ( 10
输出: BibTeX | EndNote (RIS)      
摘要 

目的】通过多视图协同可视化的方式对时序文本挖掘过程进行可视化, 以实现多角度多层面洞察文本数据背后隐藏的规律和信息。【方法】基于文本词向量矩阵, 对多政策主体的政策时序文本, 通过数据清洗、计算TF-IDF值、构建向量空间模型、奇异值分解等文本挖掘技术进行信息提取和可交互的可视化探索分析。【结果】选取2016年1月-2017年8月北京市中关村示范区下属子园区的相关委内信息文本为样本, 采用文本挖掘技术和多视图协同可视化方法, 探索政策文本背后的规律, 验证了本文方法和框架的有效性。【局限】针对大规模文本具体细节单数据点的展示效果不佳, 文本挖掘技术有待进一步提升, 模型数据吞吐量有待基于大数据架构进一步增强。【结论】本文方法和框架能够对时序文本类数据做到充分的挖掘展示, 更好地把握数据背后的信息, 增强政策主体的决策依据。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
杨亚楠
赵文辉
张健
谭珅
张贝贝
关键词 文本挖掘文本可视化多视图协同政策分析    
Abstract

[Objective] This paper visualizes the text mining process through multi-view collaborative technique, aiming to identify the patterns and insights more effectively. [Methods] Based on the textual word vector matrix, we processed the texts of multi-policy subjects with data cleaning, TF-IDF calculation, vector space model, singular value decomposition and other methods. [Results] We examined effectivenesss of the proposed model with governmental information from Zhongguancun of Beijing during the period of January 2016 to August 2017. [Limitations] The framework could not visualize the single data points of large-scale texts. [Conclusions] Multi-view collaborative visualization is an effective way to interpretate text message.

Key wordsText Mining    Text Visualization    Multi-View Collaboration    Policy Analysis
收稿日期: 2018-07-25     
基金资助:*本文系北京市社会科学基金项目“北京高新技术产业制造服务化的转型机制研究——基于商业模式创新视角”(项目编号: 16JDGLA030)和促进高校内涵发展-研究生科技创新项目-经济管理学院“中关村经济数据的协同可视化与创新研究”(项目编号: 5111823513)的研究成果之一
引用本文:   
杨亚楠,赵文辉,张健,谭珅,张贝贝. 基于多视图协同的政策文本可视化研究*[J]. 数据分析与知识发现, 2019, 3(6): 30-41.
Yanan Yang,Wenhui Zhao,Jian Zhang,Shen Tan,Beibei Zhang. Visualizing Policy Texts Based on Multi-View Collaboration. Data Analysis and Knowledge Discovery, DOI:10.11925/infotech.2096-3467.2018.0827.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.0827
[1] 姜婷婷, 肖卫东, 张翀, 等. 基于桑基图的时间序列文本可视化方法[J]. 计算机应用研究, 2016, 33(9): 2683-2687.
[1] (Jiang Tingting, Xiao Weidong, Zhang Chong, et al.Text Visualization Method for Time Series Based on Sankey Diagram[J]. Application Research of Computers, 2016, 33(9): 2683-2687.)
[2] Wise J A, Thomas J J, Pennock K, et al.Visualizing the Non-Visual: Spatial Analysis and Interaction with Information from Text Documents[C]// Proceedings of the IEEE Symposium on Information Visualization. 1995: 51.
[3] 余红梅, 梁战平. 文本可视化技术与竞争情报[J]. 图书情报工作, 2011, 55(8): 79-83.
[3] (Yu Hongmei, Liang Zhanping.Text Visualization Technologies and Competitive Intelligence[J]. Library and Information Service, 2011, 55(8): 79-83.)
[4] 唐家渝, 刘知远, 孙茂松. 文本可视化研究综述[J]. 计算机辅助设计与图形学学报, 2013, 25(3): 273-285.
[4] (Tang Jiayu, Liu Zhiyuan, Sun Maosong.A Survey of Text Visualization[J]. Journal of Computer-Aided Design & Computer Graphics, 2013, 25(3): 273-285.)
[5] 张伟. 可视化分析技术在网络舆情研究中的应用[J]. 现代情报, 2016, 36(11): 82-86.
[5] (Zhang Wei.The Application of Visualization in Network Public Opinion Research[J]. Journal of Modern Information, 2016, 36(11): 82-86.)
[6] Lin C Y, Li T Y, Chen P. An Information Visualization System to Assist News Topics Exploration with Social Media[C]// Proceedings of the 7th 2016 International Conference on Social Media & Society. ACM, 2016: Article No.23.
[7] 刘芳. 信息可视化技术及应用研究[D]. 杭州: 浙江大学, 2013.
[7] (Liu Fang.Information Visualization Technology and Application Research[D]. Hangzhou: Zhejiang University, 2013.)
[8] 王璟, 夏培玲. 基于Web of Science的国际体育政策研究热点可视化分析[J]. 沈阳体育学院学报, 2013, 32(1):32-36.
[8] (Wang Jing, Xia Peiling .Visualization Analysis of Research Frontier and Hot Topics About International Sport Policy Based on Web of Science[J]. Journal of Shenyang Sport University, 2013, 32(1): 32-36.)
[9] 韩永君. 国外体育政策研究演进的可视化分析[J]. 上海体育学院学报, 2017, 41(2): 7-14.
[9] (Han Yongjun.The Visualization Analysis on the Evolution of Foreign Sport Policy Research[J]. Journal of Shanghai University of Sport, 2017, 41(2): 7-14.)
[10] 朱皆笑. 教育治理现代化研究热点及政策演进——基于SATI的可视化分析[J]. 教育科学研究, 2017(3):56-62.
[10] (Zhu Jiexiao.Research Hotspots and Policy Evolution of Education Governance Modernization——Visual Analysis Based on SATI[J]. Educational Science Research, 2017(3):56-62.
[11] 吴佳鑫. Web环境下信息可视化模型研究[D]. 武汉: 武汉大学, 2009.
[11] (Wu Jiaxin.Study on Information Visualization Model for World Wide Web[D]. Wuhan: Wuhan University, 2009.)
[12] 陈谊, 蔡进峰, 石耀斌, 等. 基于平行坐标的多视图协同可视分析方法[J]. 系统仿真学报, 2013, 25(1): 81-86.
[12] (Chen Yi, Cai Jinfeng, Shi Yaobin, et al.Coordinated Visual Analytics Method Based on Multiple Views with Parallel Coordinates[J]. Journal of System Simulation, 2013, 25(1): 81-86.)
[13] 胡华全, 吴玲达, 杨超, 等. 卫星时变拓扑网络多视图可视化分析框架[J]. 系统工程与电子技术, 2014, 36(2): 312-316.
[13] (Hu Huaquan, Wu Lingda, Yang Chao, et al.Multiple-View Framework of Visual Analytics for Time-Varying Satellite Topology Network[J]. Systems Engineering and Electronics, 2014, 36(2): 312-316.)
[14] 刘明超, 吴升, 余劲松弟. 基于多视图协同的时空数据可视分析方法[J]. 测绘科学技术学报, 2017, 34(2): 211-214.
[14] (Liu Mingchao, Wu Sheng, Yu Jinsongdi.Spatio-Temporal Data Visual Analysis Method Based on Multiple-View Collaboration[J]. Journal of Geomatics Science and Technology, 2017, 34(2): 211-214.)
[15] 施聪莺, 徐朝军, 杨晓江, 等. TFIDF算法研究综述[J]. 计算机应用, 2009, 29(S1): 167-170, 180.
[15] (Shi Congying, Xu Chaojun, Yang Xiaojiang, et al.Study of TFIDF Algorithm[J]. Journal of Computer Applications, 2009, 29(S1): 167-170, 180.)
[16] Torgerson W S.Multidimensional Scaling: I. Theory and Method[J]. Psychometrika, 1952, 17(4): 401-419.
[17] Kalman D.A Singularly Valuable Decomposition: The SVD of a Matrix[J]. College Mathematics Journal, 1996, 27(1): 2-23.
[1] 张梦吉,杜婉钰,郑楠. 引入新闻短文本的个股走势预测模型[J]. 数据分析与知识发现, 2019, 3(5): 11-18.
[2] 张宁,尹乐民,何立峰. 网络股评“发布者-关注者”BSI与股票市场关联性研究*[J]. 数据分析与知识发现, 2018, 2(6): 1-12.
[3] 范馨月,崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
[4] 汪强兵,章成志. 融合内容与用户手势行为的用户画像构建系统设计与实现*[J]. 数据分析与知识发现, 2017, 1(2): 80-86.
[5] 谢秀芳,张晓林. 针对科技路线图的文本挖掘研究: 集成分析及可视化*[J]. 数据分析与知识发现, 2017, 1(1): 16-25.
[6] 姚兆旭,马静. 面向微博话题的“主题+观点”词条抽取算法研究*[J]. 现代图书情报技术, 2016, 32(7-8): 78-86.
[7] 兰秋军,刘文星,李卫康,胡星野. 融合句法信息的金融论坛文本情感计算研究*[J]. 现代图书情报技术, 2016, 32(4): 64-71.
[8] 毕强, 刘健, 鲍玉来. 基于语义相似度的文本聚类研究*[J]. 数据分析与知识发现, 2016, 32(12): 9-16.
[9] 林园园,战洪飞,余军合,李长江,张凡. 基于产品评论的消费者情感波动分析模型构建及实证研究*[J]. 现代图书情报技术, 2016, 32(11): 44-53.
[10] 隋明爽,崔雷. 结合多种特征的CRF模型用于化学物质-疾病命名实体识别[J]. 现代图书情报技术, 2016, 32(10): 91-97.
[11] 杨如意,刘东苏,李慧. 一种融合外部特征的改进主题模型*[J]. 现代图书情报技术, 2016, 32(1): 48-54.
[12] 王颖, 吴振新, 谢靖. 面向科技文献的语义检索系统研究综述[J]. 现代图书情报技术, 2015, 31(5): 1-7.
[13] 郝玫, 杨晓媛. 中文网络客户评论可信度研究[J]. 现代图书情报技术, 2015, 31(2): 55-63.
[14] 叶川, 马静. 多媒体微博评论信息的主题发现算法研究[J]. 现代图书情报技术, 2015, 31(11): 51-59.
[15] 邵健, 章成志, 李蕾. Hashtag研究综述[J]. 现代图书情报技术, 2015, 31(10): 40-49.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn