Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (4): 23-28     https://doi.org/10.11925/infotech.1003-3513.2008.04.05
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于凝聚式层次聚类算法的标签聚类研究*
曹高辉 焦玉英 成全
(武汉大学信息资源研究中心 武汉 430070)
Research on Tag Cluster Based on Hierarchical Agglomerative Clustering Algorithm
Cao Gaohui  Jiao Yuying  Cheng Quan
(Center for Studies of Information Resources, Wuhan University, Wuhan 430070, China)
全文: PDF (417 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

对标签、标注、大众分类等概念进行界定,指出现有标签标注系统中存在着标签描述信息的精确度不高、标签检索结果相关度低、标签缺乏有效组织等问题,提出采用凝聚式聚类算法对标签聚类,从而实现对标签的重新组织,为用户提供更好的标签导航、浏览机制。最后通过实验对标签聚类方法进行验证。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
焦玉英
成全
曹高辉
关键词 标签标签聚类凝聚式层次聚类    
Abstract

This paper firstly defines tag, tagging, folksonomy, then analyzes the limitation of collaborative tagging system. In order to achieve reorganization of the user tags and better tag navigation, browsing mechanism, the authors propose a method on using hierarchical agglomerative clustering algorithm to cluster the tags. Finally experiments certify the tag cluster method.

Key wordsTag    Tag cluster    Hierarchical agglomerative clustering algorithm
收稿日期: 2007-12-03      出版日期: 2008-04-25
ZTFLH: 

G250.7

 
基金资助:

*本文系教育部人文社会科学重点研究基地重大项目“网络环境下数字化信息服务研究”(项目编号:06JJD870006)的研究成果之一。

通讯作者: 曹高辉     E-mail: ghcao@mail.ccnu.edu.cn
作者简介: 曹高辉,焦玉英,成全
引用本文:   
曹高辉,焦玉英,成全. 基于凝聚式层次聚类算法的标签聚类研究*[J]. 现代图书情报技术, 2008, 24(4): 23-28.
Cao Gaohui,Jiao Yuying,Cheng Quan. Research on Tag Cluster Based on Hierarchical Agglomerative Clustering Algorithm. New Technology of Library and Information Service, 2008, 24(4): 23-28.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.04.05      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I4/23

[1] Golder S, Huberman B. Usage Patterns of Collaborative Tagging Systems[J]. Journal of Information Science, 2006(2): 198-208.
[2] Hammond T, Hannay T, Lund B, et al. Social Bookmaking Tools (I): a General Review[EB/OL]. [2007-12-05]. http://www.dlib.org/dlib/april05/hammond/04hammond.html.
[3] Mathes A. Folksonomies-Cooperative Classification and Communication Through Shared Metadata[EB/OL].[2007-11-10]. www.adammathes.com/academic/computer-mediated-communication/folksonomies.html.
[4] Begelman G, Keller P, Smadjia F. Automated Tag Clustering: Improving Search and Exploration in the Tag Space[C]. In: Collaborative Web Tagging Workshop, 15th International World Wide Web Conference, Edinburgh, UK, May 22-26,2006.
[5] Speroni. Tagclouds and Cultural Changes[EB/OL].[2007-11-10]. http://blog.pietrosperoni.it.
[6] Owen K, Daniel L. TagCloud Drawing: Algorithms for Cloud Visualization[C]. In: proceedings of Tagging and Metadata for Social Information Organization (WWW2007), 2007.
[7] Heymann P, Garcia-Molina H. Collaborative Creation of Communal Hierarchical Taxonomies in Social Tagging Systems[EB/OL]. [2007-11-10]. http://dbpubs.stanford.edu:8090/pub/2006-10.
[8] 孙建军, 成颖. 信息检索技术[M]. 北京:科学出版社,2004:201-202.
[9] 张建辉. K_means聚类算法研究及应用[D]. 武汉:武汉理工大学,2007.
[10] Yang Y, Pedersen J P. Feature Selection in Statistical Learning of Text Categorization[C]. In the 14th Int. Conf. On Machine Learning, San Francisco, 1997.
[11] Chuang S L, Chien L F. Taxonomy Generation for Text Segments: a Practical Web-based Approach[J]. ACM Transactions on Information Systems, 2005,23(4): 363-369.
[12] Chuang S L, Chien L F. Towards Automatic Generation of Query Taxonomy: A Hierarchical Query Clustering Approach[C]. In: Proceedings of the 2002 IEEE International Conference on Data Mining, Maebashi City. Japan:IEEE Computer Society Press, 75-82.
[13] Brandes U, Gaertler M, Wagner D. Experiments on Graph Clustering[C]. In: Proceedings of the 11th Annual European Symposium on Algorithms (ESA’03), volume 2832 of Lecture Notes in Computer Science, 2003:568-579.

[1] 盛嘉祺, 许鑫. 融合主题相似度与合著网络的学者标签扩展方法研究*[J]. 数据分析与知识发现, 2020, 4(8): 75-85.
[2] 叶佳鑫,熊回香,童兆莉,孟秋晴. 在线医疗社区中面向医生的协同标注研究*[J]. 数据分析与知识发现, 2020, 4(6): 118-128.
[3] 马娜,张智雄,吴朋民. 基于特征融合的术语型引用对象自动识别方法研究*[J]. 数据分析与知识发现, 2020, 4(1): 89-98.
[4] 李博诚,张云秋,杨铠西. 面向微博商品评论的情感标签抽取研究 *[J]. 数据分析与知识发现, 2019, 3(9): 115-123.
[5] 夏立新,曾杰妍,毕崇武,叶光辉. 基于LDA主题模型的用户兴趣层级演化研究 *[J]. 数据分析与知识发现, 2019, 3(7): 1-13.
[6] 叶佳鑫,熊回香. 基于标签的跨领域资源个性化推荐研究*[J]. 数据分析与知识发现, 2019, 3(2): 21-32.
[7] 毕崇武,叶光辉,李明倩,曾杰妍. 基于标签语义挖掘的城市画像感知研究 *[J]. 数据分析与知识发现, 2019, 3(12): 41-51.
[8] 李钰曼,陈志泊,许福. 基于KACC模型的文本分类研究 *[J]. 数据分析与知识发现, 2019, 3(10): 89-97.
[9] 蒋武轩,熊回香,叶佳鑫,安宁. 网络社交平台中社群标签动态生成研究 *[J]. 数据分析与知识发现, 2019, 3(10): 98-109.
[10] 叶光辉, 胡婧岚, 徐健, 夏立新. 社交博客标签增长态势与连接模式分析*[J]. 数据分析与知识发现, 2018, 2(6): 70-78.
[11] 陆伟, 罗梦奇, 丁恒, 李信. 深度学习图像标注与用户标注比较研究*[J]. 数据分析与知识发现, 2018, 2(5): 1-10.
[12] 张素琪, 高星, 霍士杰, 郭京津, 顾军华. 基于速度优化和社区偏向的标签传播算法*[J]. 数据分析与知识发现, 2018, 2(3): 60-69.
[13] 熊回香, 叶佳鑫, 蒋武轩. 改进的DBSCAN聚类算法在社会化标注中的应用*[J]. 数据分析与知识发现, 2018, 2(12): 77-88.
[14] 涂海丽, 唐晓波. 基于标签的商品推荐模型研究*[J]. 数据分析与知识发现, 2017, 1(9): 28-39.
[15] 邓三鸿, 傅余洋子, 王昊. 基于LSTM模型的中文图书多标签分类研究*[J]. 数据分析与知识发现, 2017, 1(7): 52-60.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn