Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. Issue (9): 40-44     https://doi.org/10.11925/infotech.1003-3513.2009.09.07
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于Porter算法的英文标签聚类方法研究*
窦永香 苏山佳 赵捧未
(西安电子科技大学经济管理学院 西安 710071)
An English Tag Clustering Method Based on the Porter Stemming Algorithm
Dou Yongxiang  Su Shanjia  Zhao Pengwei
(School of Economics and Management,Xidian University,  Xi’an 710071, China)
全文: PDF (464 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

针对大众标注中用户添加标签具有随意性且不受系统控制的问题,引入著名的Porter算法对英文标签进行词根提取,在此基础上提出可以根据用户需要进行精度选择的英文标签聚类算法,并利用标签云进行模拟实验。实验表明,采用此聚类算法有利于根据用户的需要组织标签并更准确地描述资源。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
窦永香
苏山佳
赵捧未
关键词 大众标注标签聚类    
Abstract

The tags added by users are free rein and uncontrolled in folksonomy systems,so the porter stemming algorithm is introduced firstly in this paper to extract the roots of English tags. Then the method of clustering English tags is brought forward, which chooses the precision following the user’s choice. Finally, making use of the tag cloud, simulation experiment is conducted and proves that this algorithm can make the English tags clustered according to the user’s requirement and describe the resource better.

Key wordsFolksonomy    Tag    Cluster
收稿日期: 2009-06-22      出版日期: 2009-09-25
: 

G250.7

 
基金资助:

*本文系国家自然科学基金项目“基于语义对等网的知识组织和灵捷检索研究” (项目编号:70873090)的研究成果之一。

通讯作者: 苏山佳     E-mail: sushanjia119@yeah.net
作者简介: 窦永香,苏山佳,赵捧未
引用本文:   
窦永香,苏山佳,赵捧未. 基于Porter算法的英文标签聚类方法研究*[J]. 现代图书情报技术, 2009, (9): 40-44.
Dou Yongxiang,Su Shanjia,Zhao Pengwei. An English Tag Clustering Method Based on the Porter Stemming Algorithm. New Technology of Library and Information Service, 2009, (9): 40-44.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.09.07      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V/I9/40

[1] 栾芳芳,陈雪强. Web2.0时代的Folksonomy研究[J]. 图书情报论坛,2008(2):54-56.
[2 ]The Porter Stemming Algorithm[EB/OL].[2009-02-10].http://tartarus.org/~martin/PorterStemmer/def.txt.
[3 ]Mathes A. Folksonomies-cooperative Classification and Communication Through Shared Metadata[EB/OL]. [2007-11-10].http://www.adammathes.com-/academic/computer-mediated-communication/folksonomies.html.
[4] 黄建年,侯汉清. Tag分类基本问题探究[J].情报理论与实践,2008,31(3):461-465.
[5] Abel F, Henze N, Krause D. Exploiting Additional Context for Graph-based Tag Recommendations in Folksonomy Systems[C]. In: Proceedings of IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, Singapore. 2008:148-154.
[6] Abbasi R, Staab S, Cimiano P. Organizing Resource on Tagging Systems Using T-ORG[C].In: Proceedings of the International Workshop on Bridging the Gap Between Semantic Web and Web2.0, Innsbruck, Austria. 2007:97-110.
[7] De Meo P, Quattrone G, Ursino D. Exploitation of Semantic Relationships and Hierarchical Data Structures to Support a User in His Annotation and Browsing Activities in Folksonomy[J]. Information System,2009,34(6):511-535.
[8] 曹高辉,焦玉英,成全. 基于凝聚式层次聚类算法的标签聚类研究[J]. 现代图书情报技术,2008(4):23-27.
[9] 王翠英. 标签的聚类分析研究[J]. 现代图书情报技术,2008(5):67-71.
[10] Tags Used by the Clients[DB/OL].[2009-01-03]. http://delicious.com.

[1] 王若琳, 牛振东, 蔺奇卡, 朱一凡, 邱萍, 陆浩, 刘东磊. 基于异质信息嵌入与RNN聚类参数预测的作者姓名消歧方法*[J]. 数据分析与知识发现, 2021, 5(8): 13-24.
[2] 陆泉, 何超, 陈静, 田敏, 刘婷. 基于两阶段迁移学习的多标签分类模型研究*[J]. 数据分析与知识发现, 2021, 5(7): 91-100.
[3] 王晰巍,贾若男,韦雅楠,张柳. 多维度社交网络舆情用户群体聚类分析方法研究*[J]. 数据分析与知识发现, 2021, 5(6): 25-35.
[4] 卢利农,祝忠明,张旺强,王小春. 基于Lingo3G聚类算法的机构知识库跨库知识整合与知识指纹服务实现[J]. 数据分析与知识发现, 2021, 5(5): 127-132.
[5] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[6] 丁浩, 艾文华, 胡广伟, 李树青, 索炜. 融合用户兴趣波动时序的个性化推荐模型*[J]. 数据分析与知识发现, 2021, 5(11): 45-58.
[7] 杨辰, 陈晓虹, 王楚涵, 刘婷婷. 基于用户细粒度属性偏好聚类的推荐策略*[J]. 数据分析与知识发现, 2021, 5(10): 94-102.
[8] 于丰畅,程齐凯,陆伟. 基于几何对象聚类的学术文献图表定位研究[J]. 数据分析与知识发现, 2021, 5(1): 140-149.
[9] 温萍梅,叶志炜,丁文健,刘颖,徐健. 命名实体消歧研究进展综述*[J]. 数据分析与知识发现, 2020, 4(9): 15-25.
[10] 邬金鸣,侯跃芳,崔雷. 基于医学主题词标引规则的词共现聚类分析结果自动判读和表达的研究[J]. 数据分析与知识发现, 2020, 4(9): 133-144.
[11] 席运江, 杜蝶蝶, 廖晓, 仉学红. 基于超网络的企业微博用户聚类研究及特征分析*[J]. 数据分析与知识发现, 2020, 4(8): 107-118.
[12] 盛嘉祺, 许鑫. 融合主题相似度与合著网络的学者标签扩展方法研究*[J]. 数据分析与知识发现, 2020, 4(8): 75-85.
[13] 叶佳鑫,熊回香,童兆莉,孟秋晴. 在线医疗社区中面向医生的协同标注研究*[J]. 数据分析与知识发现, 2020, 4(6): 118-128.
[14] 杨旭,钱晓东. 基于改进的Vicsek模型的社会网络同步聚类算法*[J]. 数据分析与知识发现, 2020, 4(4): 119-128.
[15] 熊回香,李晓敏,李跃艳. 基于图书评论属性挖掘的群组推荐研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 214-222.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn