Please wait a minute...
Advanced Search
数据分析与知识发现  0, Vol. Issue (): 1-     https://doi.org/10.11925/infotech.2096-3467. 2020. 0062
  本期目录 | 过刊浏览 | 高级检索 |
基于翻译模型的科研合作预测研究
陈文杰
(中国科学院成都文献情报中心 成都  610041)
Research Collaboration Prediction Based on Translation Model
Chen Wenjie
(Chengdu Library and Information Center, Chinese Academy of Sciences, Chengdu 610041, China)
全文: PDF (839 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]为促进科研人员间的交流合作,实现科研效率最大化,本文提出了一种改进的翻译模型TransTopic用于干细胞领域的科研合作预测研究。

[方法] TransTopic旨在将科研合作网络中的节点和边统一映射为低维向量,首先利用LDA主题模型抽取边上论文描述文档的主题分布特征,然后使用深度自编码器将主题特征编码为边向量,接着基于翻译机制得到节点向量,最后通过向量间的语义计算实现科研合作预测。

[结果] TransTopic在链接预测上的AUC(95.21%)和MeanRank(17.48)指标均表现最优,并且主题预测的准确率达到了86.52%。

[局限]合作预测方法仅考虑了一步的翻译路径,并且作者的机构、研究兴趣和发文等级等多元信息没有得到充分的利用。

[结论]基于翻译模型的预测方法可以有效完成干细胞领域的科研合作预测工作。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 翻译模型深度自编码器主题模型链接预测     
Abstract

[Objective] Promote exchanges and cooperation among scientific researchers to maximize scientific research efficiency. This paper proposes an improved translation model TransTopic for predictive research in scientific research cooperation in the field of stem cells.

[Methods] TransTopic aims to uniformly map the nodes and edges in the scientific research cooperation network to low-dimensional vectors. First, use the LDA topic model to extract the topic distribution features of the paper description documents on the edges, and then use the deep autoencoder to encode the topic features into edge vectors. The node vector is obtained based on the translation mechanism, and finally the scientific cooperation prediction is achieved through the semantic calculation between the vectors.

[Results] TransTopic's AUC (95.21%) and MeanRank (17.48) indicators for link prediction perform best, and the topic prediction accuracy rate reaches 86.52%.

[Limitations] The collaborative prediction method only considers a one-step translation path, and information such as the author's institution, research interest, and publication level are not fully utilized.

[Conclusions] The prediction method based on the translation model can effectively complete the scientific research cooperation prediction in the field of stem cells.

Key words Translation Model    Deep Autoencoder    Topic Model    Link Prediction
     出版日期: 2020-06-17
ZTFLH:  TP391,G255  
引用本文:   
陈文杰. 基于翻译模型的科研合作预测研究 [J]. 数据分析与知识发现, 0, (): 1-.
Chen Wenjie. Research Collaboration Prediction Based on Translation Model . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467. 2020. 0062      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 余传明,原赛,朱星宇,林虹君,张普亮,安璐. 基于深度学习的热点事件主题表示研究*[J]. 数据分析与知识发现, 2020, 4(4): 1-14.
[2] 潘有能,倪秀丽. 基于Labeled-LDA模型的在线医疗专家推荐研究*[J]. 数据分析与知识发现, 2020, 4(4): 34-43.
[3] 陈文杰. 基于翻译模型的科研合作预测研究*[J]. 数据分析与知识发现, 2020, 4(10): 28-36.
[4] 余传明,李浩男,王曼怡,黄婷婷,安璐. 基于深度学习的知识表示研究:网络视角*[J]. 数据分析与知识发现, 2020, 4(1): 63-75.
[5] 凌洪飞,欧石燕. 面向主题模型的主题自动语义标注研究综述 *[J]. 数据分析与知识发现, 2019, 3(9): 16-26.
[6] 聂维民,陈永洲,马静. 融合多粒度信息的文本向量表示模型 *[J]. 数据分析与知识发现, 2019, 3(9): 45-52.
[7] 曾庆田,胡晓慧,李超. 融合主题词嵌入和网络结构分析的主题关键词提取方法 *[J]. 数据分析与知识发现, 2019, 3(7): 52-60.
[8] 余本功,陈杨楠,杨颖. 基于nBD-SVM模型的投诉短文本分类*[J]. 数据分析与知识发现, 2019, 3(5): 77-85.
[9] 席林娜,窦永香. 基于计划行为理论的微博用户转发行为影响因素研究*[J]. 数据分析与知识发现, 2019, 3(2): 13-20.
[10] 张杰,赵君博,翟东升,孙宁宁. 基于主题模型的微藻生物燃料产业链专利技术分析*[J]. 数据分析与知识发现, 2019, 3(2): 52-64.
[11] 刘俊婉,龙志昕,王菲菲. 基于LDA主题模型与链路预测的新兴主题关联机会发现研究*[J]. 数据分析与知识发现, 2019, 3(1): 104-117.
[12] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[13] 张涛, 马海群. 一种基于LDA主题模型的政策文本聚类方法研究*[J]. 数据分析与知识发现, 2018, 2(9): 59-65.
[14] 俞琰, 赵乃瑄. 加权专利文本主题模型研究*[J]. 数据分析与知识发现, 2018, 2(4): 81-89.
[15] 王丽, 邹丽雪, 刘细文. 基于LDA主题模型的文献关联分析及可视化研究[J]. 数据分析与知识发现, 2018, 2(3): 98-106.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn