Please wait a minute...
Advanced Search
现代图书情报技术  2016, Vol. 32 Issue (5): 30-37     https://doi.org/10.11925/infotech.1003-3513.2016.05.04
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于主题模型的Web服务聚类与发现机制*
李慧,胡云凤()
西安电子科技大学经济与管理学院 西安 710071
Clustering and Discovering Web Services with Topic Model
Li Hui,Hu Yunfeng()
School of Economics and Management, Xidian University, Xi’an 710071, China
全文: PDF (612 KB)   HTML ( 53
输出: BibTeX | EndNote (RIS)      
摘要 

目的】针对网络中海量的Web服务, 提出一种有效的Web服务聚类与发现方法。【方法】利用BTM学习整个Web服务描述文档集的隐含主题, 通过推理得出每个文档的主题分布, 并进行聚类。在此基础上, 创建一个快速的Web服务发现机制。【结果】与使用LDA和外部语料库等方法进行对比实验, 本文方法的查准率和标准折损累计增益均有所提高。【局限】仅考虑服务的功能信息, 未将服务的质量信息纳入算法。【结论】实验结果显示该方法可以更准确地发现符合用户需求的服务。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李慧
胡云凤
关键词 Web服务主题模型聚类发现    
Abstract

[Objective] We propose an effective method to cluster and discover the needed Web services. [Methods] First, we employed the Biterm Topic Model to learn the latent topics of the Web service description corpus. Second, we retrieved and clustered each document’s topic distribution. Finally, we created a mechanism to discover Web service quickly. [Results] The proposed method achieved better precision rate and normalized discounted cumulative gain than methods using Latent Dirichlet Allocation and external corpus. [Limitations] Only considered functions of the Web services, and did not include the quality factors to the algorithm. [Conclusions] The proposed method could identify the needed services more accurately.

Key wordsWeb service    Topic model    Clustering    Discovery
收稿日期: 2015-12-22      出版日期: 2016-06-24
基金资助:*本文系中央高校基本科研业务费专项资金资助项目“大数据环境下基于主题模型的信息服务研究”(项目编号: JB160606)的研究成果之一
引用本文:   
李慧,胡云凤. 基于主题模型的Web服务聚类与发现机制*[J]. 现代图书情报技术, 2016, 32(5): 30-37.
Li Hui,Hu Yunfeng. Clustering and Discovering Web Services with Topic Model. New Technology of Library and Information Service, 2016, 32(5): 30-37.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2016.05.04      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2016/V32/I5/30
[1] Farrag T A, Saleh A I, Ali H A.Semantic Web Services Matchmaking: Semantic Distance-based Approach[J]. Computer and Electrical Engineering, 2013, 39(2): 497-511.
[2] Lu G, Wang T, Zhang G, et al.Semantic Web Services Discovery Based on Domain Ontology [C]. In: Proceedings of the 2012 World Automation Congress (WAC). 2012: 1-4.
[3] 石敏, 赵文栋, 张磊. 一种基于本体划分的语义Web服务发现算法[J]. 计算机工程, 2014, 40(2): 175-179.
[3] (Shi Min, Zhao Wendong, Zhang Lei.A Semantic Web Service Discovery Algorithm Based on Ontology Partition[J]. Computer Engineering, 2014, 40(2): 175-179.)
[4] Atkinson C, Bostan P, Hummel O, et al.A Practical Approach to Web Service Discovery and Retrieval[C]. In: Proceedings of the 2007 IEEE International Conference on Web Service. 2007: 241-248.
[5] Yan X, Guo J, Lan Y, et al.A Biterm Topic Model for Short Texts [C]. In: Proceedings of the 22nd International World Wide Web Conferences. 2013: 1445-1456.
[6] Qu M, Liu S, Bao T.On the Trusted Ontology Model for Evaluating the Semantic Web Services[C]. In: Proceedings of the 14th International Conference on Computer Supported Cooperative Work in Design.2010: 368-369.
[7] Kopecky J, Vitvar T, Bournez C, et al.Semantic Annotations for WSDL and XML Schema[J]. IEEE Internet Computing, 2007, 11(6): 60-67.
[8] 杨惠荣, 刘珊珊, 尹宝才, 等. 基于语义距离的 Web 服务匹配算法[J]. 北京工业大学学报, 2011, 37(4): 591-595.
[8] (Yang Huirong, Liu Shanshan, Yin Baocai, et al.Matching Algorithm of Services Based on Semantic Distance[J]. Journal of Beijing University of Technology, 2011, 37(4): 591-595.)
[9] Abramowicz W, Haniewicz K, Kaczmarek M, et al.Architecture for Web Services Filtering and Clustering [C]. In: Proceedings of the 2nd International Conference on Internet and Web Applications and Services.2007.
[10] Nayak R, Lee B.Web Service Discovery with Additional Semantics and Clustering [C]. In: Proceedings of the 2007 IEEE/WIC/ACM International Conference on Web Intelligence. 2007: 555-558.
[11] Cassar G, Barnaghi P, Moessner K.Probabilistic Methods for Service Clustering [J]. In: Proceeding of the 4th International Workshop on Service Matchmaking & Resource Retrieval. 2010.
[12] Blei D M, Ng A Y, Jordan M I.Latent DirichletAllocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[13] Aznag M, Quafafou M, Rochd E M, et al.Probabilistic Topic Models for Web Services Clustering and Discovery[A]. // Service-Oriented and Cloud Computing[M]. Springer-Verlag Berlin Heidelberg, 2013.
[14] Blei D M, Lafferty J D.Correlated Topic Models[C]. In: Proceedings of the 23rd International Conference on Machine Learning. 2005.
[15] 魏强, 金芝, 许焱. 基于概率主题模型的物联网服务发现[J]. 软件学报, 2014, 25(8): 1640-1658.
[15] (Wei Qiang, Jin Zhi, Xu Yan.Service Discovery for Internet of Things Based on Probabilistic Topic Model[J]. Journal of Software, 2014, 25(8): 1640-1658.)
[16] Zhu Y, Li L, Luo L.Learning to Classify Short Text with Topic Model and External Knowledge[A]. //Knowledge Science, Engineering and Management[M]. Springer Berlin Heidelberg, 2013.
[17] Duda R O, Hart P E, Stork D G.模式分类[M]. 李宏东, 姚天翔等译. 第2版. 机械工业出版社, 2003.
[17] (Duda R O, Hart P E, Stork DG.Pattern Classification [M]. Translated by Li Hongdong, Yao Tianxiang, et al. The 2nd Edition. China Machine Press, 2003.)
[18] Lin J.Divergence Measures Based on the Shannon Entropy[J]. IEEE Transactions on Information Theory, 1991, 37(1): 145-151.
[19] Zhang Y L, Zheng Z B, Lyu M R.A QoS-aware Search Engine for Web Services [C]. In: Proceedings of the 8th International Conference on Web Services. Miami, Florida, USA. 2010.
[20] Cover T M, Hart P E.Nearest Neighbor Pattern Classification[J]. IEEE Transactions on Information Theory, 1967, 13(1): 21-27.
[1] 王若琳, 牛振东, 蔺奇卡, 朱一凡, 邱萍, 陆浩, 刘东磊. 基于异质信息嵌入与RNN聚类参数预测的作者姓名消歧方法*[J]. 数据分析与知识发现, 2021, 5(8): 13-24.
[2] 王晰巍,贾若男,韦雅楠,张柳. 多维度社交网络舆情用户群体聚类分析方法研究*[J]. 数据分析与知识发现, 2021, 5(6): 25-35.
[3] 马莹雪,赵吉昌. 自然灾害期间微博平台的舆情特征及演变*——以台风和暴雨数据为例[J]. 数据分析与知识发现, 2021, 5(6): 66-79.
[4] 卢利农,祝忠明,张旺强,王小春. 基于Lingo3G聚类算法的机构知识库跨库知识整合与知识指纹服务实现[J]. 数据分析与知识发现, 2021, 5(5): 127-132.
[5] 伊惠芳,刘细文. 一种专利技术主题分析的IPC语境增强Context-LDA模型研究[J]. 数据分析与知识发现, 2021, 5(4): 25-36.
[6] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[7] 张鑫,文奕,许海云. 一种融合表示学习与主题表征的作者合作预测模型*[J]. 数据分析与知识发现, 2021, 5(3): 88-100.
[8] 赵天资, 段亮, 岳昆, 乔少杰, 马子娟. 基于Biterm主题模型的新闻线索生成方法 *[J]. 数据分析与知识发现, 2021, 5(2): 1-13.
[9] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[10] 丁浩, 艾文华, 胡广伟, 李树青, 索炜. 融合用户兴趣波动时序的个性化推荐模型*[J]. 数据分析与知识发现, 2021, 5(11): 45-58.
[11] 王松, 杨洋, 刘新民. 基于图注意力网络的开放式创新社区用户创意潜在价值发现研究*[J]. 数据分析与知识发现, 2021, 5(11): 89-101.
[12] 陈浩, 张梦毅, 程秀峰. 融合主题模型与决策树的跨地区专利合作关系发现与推荐*——以广东省和武汉市高校专利库为例[J]. 数据分析与知识发现, 2021, 5(10): 37-50.
[13] 杨辰, 陈晓虹, 王楚涵, 刘婷婷. 基于用户细粒度属性偏好聚类的推荐策略*[J]. 数据分析与知识发现, 2021, 5(10): 94-102.
[14] 于硕,Hayat Dino Bedru,储新倍,袁宇渊,万良田,夏锋. 科学发现偶然性研究综述[J]. 数据分析与知识发现, 2021, 5(1): 16-35.
[15] 于丰畅,程齐凯,陆伟. 基于几何对象聚类的学术文献图表定位研究[J]. 数据分析与知识发现, 2021, 5(1): 140-149.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn