Please wait a minute...
Advanced Search
现代图书情报技术  2016, Vol. 32 Issue (5): 30-37    DOI: 10.11925/infotech.1003-3513.2016.05.04
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于主题模型的Web服务聚类与发现机制*
李慧,胡云凤()
西安电子科技大学经济与管理学院 西安 710071
Clustering and Discovering Web Services with Topic Model
Li Hui,Hu Yunfeng()
School of Economics and Management, Xidian University, Xi’an 710071, China
全文: PDF(612 KB)   HTML ( 52
输出: BibTeX | EndNote (RIS)      
摘要 

目的】针对网络中海量的Web服务, 提出一种有效的Web服务聚类与发现方法。【方法】利用BTM学习整个Web服务描述文档集的隐含主题, 通过推理得出每个文档的主题分布, 并进行聚类。在此基础上, 创建一个快速的Web服务发现机制。【结果】与使用LDA和外部语料库等方法进行对比实验, 本文方法的查准率和标准折损累计增益均有所提高。【局限】仅考虑服务的功能信息, 未将服务的质量信息纳入算法。【结论】实验结果显示该方法可以更准确地发现符合用户需求的服务。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李慧
胡云凤
关键词 Web服务主题模型聚类发现    
Abstract

[Objective] We propose an effective method to cluster and discover the needed Web services. [Methods] First, we employed the Biterm Topic Model to learn the latent topics of the Web service description corpus. Second, we retrieved and clustered each document’s topic distribution. Finally, we created a mechanism to discover Web service quickly. [Results] The proposed method achieved better precision rate and normalized discounted cumulative gain than methods using Latent Dirichlet Allocation and external corpus. [Limitations] Only considered functions of the Web services, and did not include the quality factors to the algorithm. [Conclusions] The proposed method could identify the needed services more accurately.

Key wordsWeb service    Topic model    Clustering    Discovery
收稿日期: 2015-12-22     
基金资助:*本文系中央高校基本科研业务费专项资金资助项目“大数据环境下基于主题模型的信息服务研究”(项目编号: JB160606)的研究成果之一
引用本文:   
李慧,胡云凤. 基于主题模型的Web服务聚类与发现机制*[J]. 现代图书情报技术, 2016, 32(5): 30-37.
Li Hui,Hu Yunfeng. Clustering and Discovering Web Services with Topic Model. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2016.05.04.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2016.05.04
[1] Farrag T A, Saleh A I, Ali H A.Semantic Web Services Matchmaking: Semantic Distance-based Approach[J]. Computer and Electrical Engineering, 2013, 39(2): 497-511.
[2] Lu G, Wang T, Zhang G, et al.Semantic Web Services Discovery Based on Domain Ontology [C]. In: Proceedings of the 2012 World Automation Congress (WAC). 2012: 1-4.
[3] 石敏, 赵文栋, 张磊. 一种基于本体划分的语义Web服务发现算法[J]. 计算机工程, 2014, 40(2): 175-179.
[3] (Shi Min, Zhao Wendong, Zhang Lei.A Semantic Web Service Discovery Algorithm Based on Ontology Partition[J]. Computer Engineering, 2014, 40(2): 175-179.)
[4] Atkinson C, Bostan P, Hummel O, et al.A Practical Approach to Web Service Discovery and Retrieval[C]. In: Proceedings of the 2007 IEEE International Conference on Web Service. 2007: 241-248.
[5] Yan X, Guo J, Lan Y, et al.A Biterm Topic Model for Short Texts [C]. In: Proceedings of the 22nd International World Wide Web Conferences. 2013: 1445-1456.
[6] Qu M, Liu S, Bao T.On the Trusted Ontology Model for Evaluating the Semantic Web Services[C]. In: Proceedings of the 14th International Conference on Computer Supported Cooperative Work in Design.2010: 368-369.
[7] Kopecky J, Vitvar T, Bournez C, et al.Semantic Annotations for WSDL and XML Schema[J]. IEEE Internet Computing, 2007, 11(6): 60-67.
[8] 杨惠荣, 刘珊珊, 尹宝才, 等. 基于语义距离的 Web 服务匹配算法[J]. 北京工业大学学报, 2011, 37(4): 591-595.
[8] (Yang Huirong, Liu Shanshan, Yin Baocai, et al.Matching Algorithm of Services Based on Semantic Distance[J]. Journal of Beijing University of Technology, 2011, 37(4): 591-595.)
[9] Abramowicz W, Haniewicz K, Kaczmarek M, et al.Architecture for Web Services Filtering and Clustering [C]. In: Proceedings of the 2nd International Conference on Internet and Web Applications and Services.2007.
[10] Nayak R, Lee B.Web Service Discovery with Additional Semantics and Clustering [C]. In: Proceedings of the 2007 IEEE/WIC/ACM International Conference on Web Intelligence. 2007: 555-558.
[11] Cassar G, Barnaghi P, Moessner K.Probabilistic Methods for Service Clustering [J]. In: Proceeding of the 4th International Workshop on Service Matchmaking & Resource Retrieval. 2010.
[12] Blei D M, Ng A Y, Jordan M I.Latent DirichletAllocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[13] Aznag M, Quafafou M, Rochd E M, et al.Probabilistic Topic Models for Web Services Clustering and Discovery[A]. // Service-Oriented and Cloud Computing[M]. Springer-Verlag Berlin Heidelberg, 2013.
[14] Blei D M, Lafferty J D.Correlated Topic Models[C]. In: Proceedings of the 23rd International Conference on Machine Learning. 2005.
[15] 魏强, 金芝, 许焱. 基于概率主题模型的物联网服务发现[J]. 软件学报, 2014, 25(8): 1640-1658.
[15] (Wei Qiang, Jin Zhi, Xu Yan.Service Discovery for Internet of Things Based on Probabilistic Topic Model[J]. Journal of Software, 2014, 25(8): 1640-1658.)
[16] Zhu Y, Li L, Luo L.Learning to Classify Short Text with Topic Model and External Knowledge[A]. //Knowledge Science, Engineering and Management[M]. Springer Berlin Heidelberg, 2013.
[17] Duda R O, Hart P E, Stork D G.模式分类[M]. 李宏东, 姚天翔等译. 第2版. 机械工业出版社, 2003.
[17] (Duda R O, Hart P E, Stork DG.Pattern Classification [M]. Translated by Li Hongdong, Yao Tianxiang, et al. The 2nd Edition. China Machine Press, 2003.)
[18] Lin J.Divergence Measures Based on the Shannon Entropy[J]. IEEE Transactions on Information Theory, 1991, 37(1): 145-151.
[19] Zhang Y L, Zheng Z B, Lyu M R.A QoS-aware Search Engine for Web Services [C]. In: Proceedings of the 8th International Conference on Web Services. Miami, Florida, USA. 2010.
[20] Cover T M, Hart P E.Nearest Neighbor Pattern Classification[J]. IEEE Transactions on Information Theory, 1967, 13(1): 21-27.
[1] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法
研究 *
[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[2] 李柯,佐々木勇和. 基于多维小波聚类的空间文本数据情感分布分析[J]. 数据分析与知识发现, 2019, 3(7): 14-22.
[3] 曾庆田,胡晓慧,李超. 融合主题词嵌入和网络结构分析的主题关键词提取方法 *[J]. 数据分析与知识发现, 2019, 3(7): 52-60.
[4] 周成,魏红芹. 专利价值评估与分类研究*——基于自组织映射支持向量机[J]. 数据分析与知识发现, 2019, 3(5): 117-124.
[5] 余本功,陈杨楠,杨颖. 基于nBD-SVM模型的投诉短文本分类*[J]. 数据分析与知识发现, 2019, 3(5): 77-85.
[6] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[7] 吴江,赵颖慧,高嘉慧. 医疗舆情事件的微博意见领袖识别与分析研究*[J]. 数据分析与知识发现, 2019, 3(4): 53-62.
[8] 肖连杰,郜梦蕊,苏新宁. 一种基于模糊C-均值聚类的欠采样集成不平衡数据分类算法*[J]. 数据分析与知识发现, 2019, 3(4): 90-96.
[9] 温廷新,李洋子,孙静霜. 基于多因素特征选择与AFOA/K-means的新闻热点发现方法*[J]. 数据分析与知识发现, 2019, 3(4): 97-106.
[10] 吴菊华,王煜,黎明,蔡少云. 基于加权知识网络的在线健康社区用户知识发现*[J]. 数据分析与知识发现, 2019, 3(2): 108-117.
[11] 席林娜,窦永香. 基于计划行为理论的微博用户转发行为影响因素研究*[J]. 数据分析与知识发现, 2019, 3(2): 13-20.
[12] 叶佳鑫,熊回香. 基于标签的跨领域资源个性化推荐研究*[J]. 数据分析与知识发现, 2019, 3(2): 21-32.
[13] 张杰,赵君博,翟东升,孙宁宁. 基于主题模型的微藻生物燃料产业链专利技术分析*[J]. 数据分析与知识发现, 2019, 3(2): 52-64.
[14] 刘俊婉,龙志昕,王菲菲. 基于LDA主题模型与链路预测的新兴主题关联机会发现研究*[J]. 数据分析与知识发现, 2019, 3(1): 104-117.
[15] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn