Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (1): 69-73     https://doi.org/10.11925/infotech.1003-3513.2011.01.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于文本复杂网络的内容结构特征分析
刘红红1,2, 安海忠1,2, 高湘昀1,2
1. 中国地质大学资源环境管理实验室 北京 100083;
2. 中国地质大学人文经管学院 北京 100083
Research on Content Characteristics About Complex Network of Text
Liu Honghong1,2, An Haizhong1,2, Gao Xiangyun1,2
1. Lab of Resources and Environmental Management, China University of Geosciences, Beijing 100083, China;
2. School of Humanities and Economic Management, China University of Geosciences, Beijing 100083, China
全文: PDF (460 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对文本信息内容结构参差不齐的问题,提出一种评价文本内容结构分析方法,该方法将文本中的句子作为节点,句子之间的共同名词作为边,构建文本复杂网络,并选取复杂网络的拓扑性质对文本结构特征进行分析。基于一个新闻文本案例构建复杂网络,并计算度、强度、最短路径、加权聚类系数等衡量指标,这些指标能很好地评价文本内容结构的好坏,也为理解和提取文本的中心思想、生成摘要、文本检索过滤提供重要参考依据。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘红红
安海忠
高湘昀
关键词 文本复杂网络内容结构最短路径聚类系数    
Abstract

To solve the problem of irregular structure of some texts, this paper presents a method based on the complex network theory to evaluate the text structure. This method uses a node to represent a sentence and an edge between two nodes to represent a common word of two sentences, which construct the complex network of a text. Then the authors analyze characters of text structure by topological characteristics of text complex network. By building a text complex network based on a selected article, the degree, the degree of intensity, the shortest paths and the weighting clustering coefficients of this selected article are calculated. The results show that the structure of the text content can be effectively evaluated by this proposed method. Moreover, the results also provide important references to understand main ideas, to generate summaries and to filter text retrieval of a given text.

Key wordsComplex network of text    Content structure    Shortest path    Clustering coefficient
收稿日期: 2010-10-28      出版日期: 2011-02-12
: 

G203

 
基金资助:

本文系教育部人文社会科学研究一般项目(规划基金项目)“地质资料信息社会化服务模型研究:基于复杂网络分析”(项目编号:10YJA630001)的研究成果之一。

引用本文:   
刘红红, 安海忠, 高湘昀. 基于文本复杂网络的内容结构特征分析[J]. 现代图书情报技术, 2011, 27(1): 69-73.
Liu Honghong, An Haizhong, Gao Xiangyun. Research on Content Characteristics About Complex Network of Text. New Technology of Library and Information Service, 2011, 27(1): 69-73.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.01.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I1/69


[1] 王孟国.“显—隐”的经纬:高行健长篇小说文本结构研究
[J]. 福建师范大学学报:哲学社会科学版 ,2010(3):89-96.

[2] 何维,王宇. 基于句子关系图的网页文本主题句抽取
[J]. 现代图书情报技术 ,2009(3):58-61.

[3] 梁文婷,何中市,龙华,等.改进传统文本结构关系图的文本结构分析
[J]. 微计算机信息 ,2009,25 (3):213-215.

[4] 刘军万,刘飞飞.基于潜在语义索引的文本结构分析方法的研究
[J]. 情报方法 ,2004(4):56-58.

[5] Jenkins S, Kirk S R. Software Architecture Graphs as Complex Networks: A Novel Partitioning Scheme to Measure Stability and Evolution
[J]. Information Sciences,2007,177(12):2587-2601.

[6] Amancio D R,Antiqueira L L, Pardo T A S, et al.Complex Networks Analysis of Manual and Machine Translations
[J]. International Journal of Modern Physics C,2008,19 (4):583-598.

[7] Antiqueira L, Nunes M G V, Oliveira Jr O N,et al. Strong Correlations Between Text Quality and Complex Networks Features
[J].Physica A,2007,373(4):811-820.

[8] Antiqueira L,Pardo T A S,Nunes M G V,et al.Some Issues on Complex Networks for Author Characterization. In: Proceedings of the 4th Workshop in Information and Human Language Technology.2006:59-68.

[9] Antiqueira L, Oliveira Jr O N, Luciano da Fontoura Costa,et al.A Complex Network Approach to Text Summarization
[J].Information Sciences,2009,179(5):584-599.

[10] Pardo T A S,Antiqueira L,Nunes M G V,et al.Modeling and Evaluating Summaries Using Complex Networks. In: Proceedings of the 7th Workshop on Computational Processing of Written and Spoken Portuguese (PROPOR).2006:1-10.

[11] 中国科学院计算技术研究所.汉语词法分析系统(ICTCLAS分词系统). 2007.

[12] BorgattiS P, Everett M T, Freeman L C.社会分析软件UCINET. 加州大学.2002.

[13] 邹声文.全面提高教书育人水平,推动教育事业科学发展. 人民日报,2010-09-10(1).

[14] 周磊,龚志强,支蓉,等.利用复杂网络研究中国温度序列的拓扑性质
[J]. 物理学报 ,2008,59(2):7380-7389.

[1] 严娇,马静,房康. 基于融合共现距离的句法网络下文本语义相似度计算 *[J]. 数据分析与知识发现, 2019, 3(12): 93-100.
[2] 刘冰瑶, 马静, 李晓峰. 一种“特征降维”文本复杂网络的话题表示模型*[J]. 数据分析与知识发现, 2017, 1(11): 53-61.
[3] 孙伟, 郝爱语, 吕强. 位置映射技术在图书定位与导航中的应用[J]. 现代图书情报技术, 2015, 31(2): 85-90.
[4] 邢小云, 魏婧. 在线社会网络结构演化及其对口碑传播的影响研究[J]. 现代图书情报技术, 2011, 27(9): 60-65.
[5] 王立学,冷伏海,王海霞. 技术成熟度及其识别方法研究*[J]. 现代图书情报技术, 2010, 26(3): 58-63.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn