Please wait a minute...
Advanced Search
数据分析与知识发现  2020, Vol. 4 Issue (2/3): 153-164     https://doi.org/10.11925/infotech.2096-3467.2019.0633
  专辑 本期目录 | 过刊浏览 | 高级检索 |
一种融合患者咨询文本与决策机理的医生推荐算法*
叶佳鑫,熊回香(),蒋武轩
华中师范大学信息管理学院 武汉 430079
A Physician Recommendation Algorithm Integrating Inquiries and Decisions of Patients
Ye Jiaxin,Xiong Huixiang(),Jiang Wuxuan
School of Information Management, Central China Normal University, Wuhan 430079, China
全文: PDF (771 KB)   HTML ( 10
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 研究患者选择医生时的决策机理,构建融合患者决策机理的医生推荐方法,提升医生推荐的效果。【方法】 利用Word2Vec训练词向量模型计算患者与医生间基于文本的相似度,得到基于咨询文本的医生评分。以因子分析为基础,分析影响患者选择医生时的决策因素,得到基于患者决策机理的医生评分,融合两种评分实现医生推荐。【结果】 以“好大夫在线”上的相关数据为例对所提医生推荐算法进行实证研究,在进行医生推荐时同时考虑了患者与医生间的文本相似度与患者的决策因素,推荐的医生更为符合患者实际需求。【局限】 患者的历史决策行为有待进一步分析,在推荐时主要是面向单一患者进行推荐,时间成本较高。【结论】 本文所提方法适用于进行医生的精准推荐,能有效满足患者需求。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
叶佳鑫
熊回香
蒋武轩
关键词 医生推荐决策机理Word2Vec在线医疗平台    
Abstract

[Objective] This paper investigates the decision-making mechanism of patients choosing doctors, aiming to build a better physician recommendation system.[Methods] First, we used Word2Vec to train the word vector model, and calculated the similarity between patients and doctors. Then, we analyzed the decision-making behaviors of patients choosing doctors. Finally, we combined the scores of doctors based on their similarity with patient needs and the latter’s decision mechanism to generate a recommended list.[Results] We conducted an empirical study with data from “Hao Daifu (Great Doctors)”. The proposed algorithm could help patients find doctors meeting their needs.[Limitations] The patient’s decision-making history needs to be analyzed. Our recommendation algorithm is for a single patient, which is costly.[Conclusions] The proposed method could recommend appropriate doctors meeting patient’s needs.

Key wordsDoctor Recommended    Decision Mechanism    Word2Vec    Online Medical Platform
收稿日期: 2019-06-10      出版日期: 2020-04-26
ZTFLH:  G354  
基金资助:*本文系华中师范大学中央高校基本科研业务费(人文社科类)重大项目“基于语义网的在线健康信息的挖掘与推荐研究”(CCNU19Z02004);华中师范大学优秀博士学位论文培育计划项目的研究成果之一(2019YBZZ096)
通讯作者: 熊回香     E-mail: hxxiong@mail.ccnu.edu.cn
引用本文:   
叶佳鑫,熊回香,蒋武轩. 一种融合患者咨询文本与决策机理的医生推荐算法*[J]. 数据分析与知识发现, 2020, 4(2/3): 153-164.
Ye Jiaxin,Xiong Huixiang,Jiang Wuxuan. A Physician Recommendation Algorithm Integrating Inquiries and Decisions of Patients. Data Analysis and Knowledge Discovery, 2020, 4(2/3): 153-164.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2019.0633      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2020/V4/I2/3/153
Fig.1  医生推荐模型框架
姓名 职称 对应
患者数
(人)
诊断
费用
(元)
总访
问量
(次)
总文章数(篇) 总患者数(人) 诊后
报道数
(人)
感谢
信数
(个)
心意
礼物数
(个)
注册
时间(年)
患者
对话数
(个)
医生
对话数
(个)
左晟 副主任 21 20 6 341 11 121 10 1 6 2018 369 153
朱奇志 副主任 16 40 50 939 2 60 0 1 9 2013 311 89
朱蓬燕 主治 8 15 46 757 26 82 33 9 5 2017 168 66
朱保 主治 0 10 263 456 0 2 348 2 168 77 233 2016 1 875 623
周忠辉 副主任 18 20 39 117 18 167 7 3 1 2018 266 116
周云芝 主任 8 80 1 118 745 7 1 167 134 9 43 2009 374 151
周文胜 主任 19 30 99 496 2 178 100 14 13 2017 315 104
安建峰 副主任 6 60 1 301 699 0 2 778 1 602 74 164 2009 463 203
Table 1  医生基本信息数据集(① https://www.haodf.com/jibing/zhiqiguanyan.htm.)(共305位)
医生姓名 文本序号 咨询文本
左晟 1 吸烟后胸闷,感觉有东西压迫,呼吸较费力,一天一包烟左右,一旦不抽烟症状会有所减轻,一抽烟就有胸闷,持续了大约三天了,症状之前没有发生过,去年10月左右检查过心电图,今年2月也拍过胸片……
左晟 2 半个月之前感冒咳嗽,之前咳嗽有痰,吃了药,还挂了头孢,虽然现在没痰了,但是咳嗽一直没好全,现在早上和晚上睡都不咳,就是中午到下午这段时间干咳无痰,有时候张口说话就忍不住想咳嗽……
左晟 3 不咳嗽,就是早晨感觉胸口有痰,使劲刻出来,是浓黄色,有时是褐色,中午和晚上吃过饭,自己主动把他刻出来,是白色比较稀。鼻涕是浓白涕,难擤出来,出来都一小块,一小块……
安建峰 3 125 诊后治疗和康复相关问题
Table 2  患者咨询文本数据集(共3 125个)
姓名 职称 诊断费用(元) 总访问量
(次)
总文章数(篇) 总患者数(人) 诊后报道数(人) 感谢信数(个) 心意礼物数(个) 注册天数(天) 平均每天
患者数(人)
平均每天
访问量(次)
医患
对话比
左晟 2 20 6 341 11 121 10 1 6 373 0.324 17.000 0.415
朱奇志 2 40 50 939 2 60 0 1 9 2 110 0.028 24.142 0.286
朱蓬燕 1 15 46 757 26 82 33 9 5 842 0.097 55.531 0.393
周忠辉 2 20 39 117 18 167 7 3 1 332 0.503 117.822 0.436
周云芝 3 80 1 118 745 7 1 167 134 9 43 3 496 0.334 320.007 0.404
周文胜 3 30 99 496 2 178 100 14 13 753 0.236 132.133 0.330
周凤丽 2 40 406 163 3 1 017 542 36 201 3 841 0.265 105.744 0.429
安建峰 2 60 1 301 699 0 2 778 1 602 74 164 3 688 0.753 352.955 0.438
Table 3  医生基本信息集(共200位)
医生姓名 文本序号 咨询文本
左晟 1 吸烟后胸闷,感觉有东西压迫,呼吸较费力,一天一包烟
左晟 2 半个之前感冒咳嗽,之前咳嗽有痰,吃了药,还挂了头孢
左晟 3 不咳嗽,就是早晨感觉胸口有痰,使劲刻出来,是浓黄色
左晟 4 几年前查出有轻微的肺结核,医生说没事,去单位体检的
左晟 5 咳嗽好长时间了,春节前一次感冒引起的咳嗽一直到现在
陈安琪 2 830 头晕恶心眼痛困乏颈椎不舒服
Table 4  患者咨询文本数据集(共2 830个)
词语

维度
1 2 3 4 100
V咳嗽 -1.033 0.285 0.821 0.422 -0.400
V发烧 0.310 -0.568 4.438 -0.498 -0.423
V发炎 0.188 -1.073 -0.416 0.496 -1.078
V支气管 0.124 1.828 -0.381 0.888 -1.179
V感冒 1.294 -1.827 1.592 0.642 -3.470
Table 5  训练词语的词向量
测试词

词语
词语1 相似度 词语2 相似度 词语3 相似度
咳嗽 干咳 0.864 0.732 流鼻涕 0.660
发烧 退 0.796 低烧 0.795 高烧 0.765
发炎 扁桃体 0.856 化脓 0.879 流涕 0.743
支气管 扩张 0.843 管壁 0.769 肺气肿 0.749
Table 6  基于词向量模型的词语相似度
医生姓名 文本序号 句向量
左晟 1 (V吸烟+V+V胸闷+…+V)/文本词数
2 (V半个+V之前+V感冒+…+V头孢)/文本词数
3 (V+V咳嗽+V早餐+…+V黄色)/文本词数
4 (V几年+V查出+V轻微+…+V)/文本词数
5 (V咳嗽+V好长时间+V春节+…+V现在)/文本词数
陈安琪 1 (V感觉+V感冒+V+…+V)/文本词数
2 (V有次+V感觉+V左腹+…+V)/文本词数
3 (V之前+V检查+V血糖+…+V)/文本词数
4 (V+V失眠+V入睡+…+V)/文本词数
5 (V怀孕+V+V今天+…+V)/文本词数
Table 7  医生特征表示示例(共200位)
测试患者序号 医生姓名 职称 句向量
1 欧阳文献 3 (V验血+V常规+V巨细胞+…+V定量)/文本词数
2 周云芝 3 (V平时+V+V吹风+…+V刺激性)/文本词数
3 周文胜 3 (V医生+V您好+V半个+…+V)/文本词数
4 赵琪 2 (V第一次+V咳血+V治疗+…+V详细资料)/文本词数
30 秦少文 1 (V婆婆+V慢性+V支气管炎+…+V咳嗽)/文本词数
Table 8  测试患者数据集示例(共30位)
医生姓名 医生序号 医生对应文本 测试
患者1
测试
患者2
测试
患者30
欧阳文献 1 1 0.590 0.061 0.272
2 0.537 0.221 0.262
3 0.466 0.479 0.089
4 0.692 0.078 0.044
5 0.655 0.447 0.364
均值 0.588 0.257 0.206
陈安琪 200 1 0.251 0.661 0.389
2 0.493 0.420 0.205
3 0.727 0.261 0.245
4 0.262 0.630 0.314
5 0.369 0.535 0.480
均值 0.420 0.500 0.327
Table 9  医生与测试患者间相似度示例
测试患者1 测试患者2 测试患者30
医生序号 医生得分 医生序号 医生得分 医生序号 医生得分
15 1.000 116 1.000 186 1.000
48 0.995 168 0.995 11 0.995
158 0.990 165 0.990 114 0.990
89 0.985 103 0.985 30 0.985
1 0.980 11 0.980 69 0.980
77 0.975 74 0.975 79 0.975
196 0.970 146 0.970 87 0.970
3 0.965 71 0.965 16 0.965
61 0.960 65 0.960 110 0.960
116 0.000 158 0.000 157 0.000
Table 10  基于咨询文本的医生评分示例
患者序号 医生序号 医生 得分排序 得分 患者序号 医生序号 医生 得分排序 得分
10 11 张铭正 1 1.000 2 2 周云芝 59 0.709
12 96 朱奇志 1 1.000 16 101 赵海金 65 0.678
15 100 赵晓刚 1 1.000 13 97 周忠辉 68 0.663
17 102 张彦亮 2 0.995 9 10 张念志 73 0.638
1 1 欧阳文献 5 0.980 6 6 张伟 87 0.568
30 183 秦少文 16 0.925 4 4 赵琪 89 0.558
19 104 张鸿 18 0.915 8 8 张齐武 94 0.533
5 5 张炜 31 0.849 28 181 涂波 97 0.518
26 179 温鹏 33 0.839 29 182 邵川 106 0.472
18 103 张晓阳 42 0.794 3 3 周文胜 116 0.422
11 95 左晟 47 0.769 27 180 王红星 126 0.372
21 174 朱蓬燕 52 0.744 14 98 钟爱虹 137 0.317
22 175 仲敏 52 0.744 24 177 张凤 137 0.317
7 7 张斯为 53 0.739 23 176 张永明 152 0.241
25 178 徐汝洪 58 0.714 20 105 张方 167 0.166
Table 11  测试患者选择的医生得分
患者10
咨询文本
推荐
医生
医生对应患者 对应患者咨询文本
两个宝宝咳嗽打喷嚏鼻塞吐奶吃奶胃口不好 张铭正 对应患者1 宝宝睡着咳嗽怎么回事起来玩耍不咳嗽
对应患者2 婴儿咳嗽口臭原因药能好得快
对应患者3 宝宝咳嗽厉害十天希望早点得到好治疗
对应患者4 咳嗽喘喘得挺厉害抗生素过敏
对应患者5 反复咳嗽流鼻涕不发烧
Table 12  测试患者10相关数据
因子

主因子
1 2 3 4
平均每天访问量 0.894
总访问量 0.884
总文章数 0.733
平均每天患者数 0.655 0.644
诊后报道数 0.867
感谢信数 0.808
心意礼物数 0.791
注册天数 0.767
职称 0.691
诊断费用 0.523
医患对话比 0.861
Table 13  旋转后因子载荷矩阵
主因子 因子-权值
主因子1 平均每天访问量-0.282;总访问量-0.279;总文章数-0.232;平均每天患者数-0.207
主因子2 诊后报道数-0.351;感谢信数-0.328;心意礼物数-0.321
主因子3 注册天数-0.387;职称-0.349;诊断费用-0.264
主因子4 医患对话比-1
主因子5 负诊断费用-1
Table 14  因子权值矩阵
因子医生 平均每天访问量 总访
问量
总文
章数
诊断
费用
负诊断费用
欧阳文献 0.729 0.693 0.013 0.600 0.400
周云芝 0.543 0.683 0.008 0.600 0.400
周文胜 0.322 0.191 0.002 0.200 0.800
赵琪 0.678 0.794 0.035 0.200 0.800
张炜 0.894 0.910 0.076 0.600 0.400
陈安琪 0.171 0.055 0.005 0.000 1.000
Table 15  基于各因子的医生得分
医生 主因子1 主因子2 主因子3 主因子4 主因子5
欧阳文献 0.701 0.895 0.673 0.221 0.400
周云芝 0.505 0.385 0.797 0.563 0.400
周文胜 0.245 0.321 0.456 0.171 0.800
赵琪 0.740 0.279 0.754 0.930 0.800
张炜 0.855 0.618 0.894 0.523 0.400
陈安琪 0.198 0.051 0.004 0.990 1.000
Table 16  基于各主因子的医生得分
测试患者-医生 主因子1 主因子2 主因子3 主因子4 主因子5
24-张凤 0.472 0.674 0.056 0.216 0.800
23-张永明 0.543 0.627 0.198 0.452 0.400
20-张方 0.497 0.568 0.484 0.623 0.600
Table 17  测试患者对应医生的决策得分
测试患者序号 基于患者咨询文本 融合患者咨询文本与决策机理
对应医生得分 排序第一医生 对应医生得分 排序第一医生
24 0.317 张铭正 0.462 张铭正
23 0.241 贾钰华 0.357 史锁芳
20 0.166 朱奇志 0.303 赵晓刚
Table 18  医生推荐结果
患者20咨询文本 推荐模型 医生 医生对应患者 对应患者咨询文本
没有症状入职。体检拍胸片发现阴影 基于患者咨询文本 朱奇志 对应患者1 医生您好两半之前医院做保乳手术术后
对应患者2 检查见双肺纹理增粗模糊伴多发小叶中心结节
对应患者3 在备孕期中间感冒咳嗽厉害拍胸片想咨询
对应患者4 朱老师您好我份北医三院发现左肺上叶磨玻璃结节差
对应患者5 肺部有个环形三份肺炎做气管镜
医患对话比 0.286
融合患者咨询文本与
决策机理
赵晓刚 对应患者1 腰痛干咳门诊拍肾彩超做尿常规血常规
对应患者2 后背左侧疼拍肺CT医生诊断还没发展肺癌
对应患者3 近期有时候睡觉会咳嗽睡醒痰比较上个号做血象
对应患者4 您好赵医生我于瑞金医院体检发现右上肺.MM磨
对应患者5 二十天前感冒咳嗽痰化痰止咳处理后胸闷干咳
医患对话比 0.466
Table 19  测试患者20推荐医生情况
[1] 孙国强, 由丽孪, 陈思 , 等. 互联网+医疗模式的初步探索[J]. 中国数字医学, 2015,10(6):15-18.
[1] ( Sun Guoqiang, You Liluan, Chen Si , et al. Preliminary Exploration of Internet+Medical Model[J]. China Digital Medicine, 2015, 10(6):15-18).
[2] 国务院办公厅关于促进“互联网+医疗健康”发展的意见[EB/OL]. [ 2019- 06- 02]. http://www.gov.cn/zhengce/content/2018-04/28/content_5286645.htm.
[2] ( Opinions of the General Office of the State Council on Promoting the Development of “Internet+Medical Health”[EB/OL]. [ 2019- 06- 02]. http://www.gov.cn/zhengce/content/2018-04/28/content_5286645.htm.)
[3] Liu F, Yu C, Meng W , et al. Effective Keyword Search in Relational Databases [C]// Proceedings of the 2006 ACM SIGMOD International Conference on Management of Data. ACM, 2006: 563-574.
[4] 朱凡微, 吴明晖, 金苍宏 , 等. 基于关键字的数据库搜索研究综述[J]. 计算机应用研究, 2008,25(11):3238-3242.
[4] ( Zhu Fanwei, Wu Minghui, Jin Canghong , et al. Survey of Keyword-Based Search over Databases[J]. Application Research of Computers, 2008,25(11):3238-3242.)
[5] 李宗伟, 张艳辉, 栾东庆 . 哪些因素影响消费者的在线购买决策?——顾客感知价值的驱动作用[J]. 管理评论, 2017,29(8):136-146.
[5] ( Li Zongwei, Zhang Yanhui, Luan Dongqing . What Factors Influence Consumers’ Online Purchasing Decisions?——Customer Perceived Value Drivers[J]. Management Review, 2017,29(8):136-146.)
[6] Lay-Yee K L, Kok-Siew H, Yin-Fah B C . Factors Affecting Smartphone Purchase Decision Among Malaysian Generation Y[J]. International Journal of Asian Social Science, 2013,3(12):2426-2440.
[7] Sujata J, Yatin J, Abhijit C , et al. Factors Affecting Smartphone Purchase Among Indian Youth: A Descriptive Analysis[J]. Indian Journal of Science and Technology, 2016,9(15):1-10.
[8] Choi N . Factors Affecting Undergraduates’ Selection of Online Library Resources in Academic Tasks[J]. Library Hi Tech, 2015,33(2):272-291.
[9] 吴江, 周露莎 . 网络健康信息服务用户购买决策的影响因素研究[J]. 情报学报, 2017,36(10):1058-1065.
[9] ( Wu Jiang, Zhou Lusha . Study of Factors That Influence Users’ Purchasing Decision of Health Information Services[J]. Journal of the China Society for Scientific and Technical Information, 2017,36(10):1058-1065.)
[10] 查先进, 李力, 严亚兰 , 等. 数字图书馆环境下信息有用性和信息获取影响因素研究——信息获取自我效能的调节效果[J]. 情报学报, 2017,36(7):669-681.
[10] ( Zha Xianjin, Li Li, Yan Yalan , et al. Research on Impacting Factors of Information Usefulness and Information Acquisition in the Context of Digital Libraries: The Moderating Effect of Self-efficacy in Acquiring Information[J]. Journal of the China Society for Scientific and Technical Information, 2017,36(7):669-681.)
[11] Huang Y F, Liu P, Pan Q , et al. A Doctor Recommendation Algorithm Based on Doctor Performances and Patient Preferences [C]// Proceedings of the 2012 International Conference on Wavelet Active Media Technology and Information Processing (ICWAMTIP). IEEE, 2012: 92-95.
[12] Jiang H, Xu W . How to Find Your Appropriate Doctor: An Integrated Recommendation Framework in Big Data Context [C]// Proceedings of the 2014 IEEE Symposium on Computational Intelligence in Healthcare and E-Health (CICARE). IEEE, 2014: 154-158.
[13] 徐守坤, 吴伟伟 . 基于语义的医疗资源均衡推荐算法[J]. 计算机工程, 2015,41(9):74-79.
[13] ( Xu Shoukun, Wu Weiwei . Balance Recommendation Algorithm for Medical Resources Based on Semantic[J]. Computer Engineering, 2015,41(9):74-79.)
[14] 李勇, 黄俊 . 信息通信[J].信息通信, 2018(2):67-70.
[14] ( Li Yong, Huang Jun . A Search of Personalized Doctor Recommendation Algorithm[J]. Information & Communications,2018(2):67-70.)
[15] Tian B, Zhang Y, Chen X , et al. DRGAN: A GAN-Based Framework for Doctor Recommendation in Chinese On-Line QA Communities [C]// Proceedings of the 2019 International Conference on Database Systems for Advanced Applications. Springer, 2019: 444-447.
[16] 林鑫, 桑运鑫, 龙存钰 . 基于用户决策机理的个性化推荐[J]. 图书情报工作, 2019,63(2):99-106.
[16] ( Lin Xin, Sang Yunxin, Long Cunyu . Personalized Recommendation Based on User Decision-making Mechanism[J]. Library and Information Service, 2019,63(2):99-106.)
[17] 高山, 刘炜, 崔勇 , 等. 一种融合多种用户行为的协同过滤推荐算法[J]. 计算机科学, 2016,43(9):227-231.
[17] ( Gao Shan, Liu Wei, Cui Yong , et al. Collaborative Filtering Algorithm Integrating Multiple User Behaviors[J]. Computer Science, 2016,43(9):227-231.)
[18] Huang Z X, Lu X D, Duan H L , et al. Collaboration-based Medical Knowledge Recommendation[J]. Artificial Intelligence in Medicine, 2012,55(1):13-24.
[19] Mikolov T, Sutskever I, Chen K , et al. Distributed Representations of Words and Phrases and Their Compositionality [C]// Proceedings of the 26th International Conference on Neural Information Processing Systems. 2013,2:3111-3119.
[20] 熊富林, 邓怡豪, 唐晓晟 . Word2vec的核心架构及其应用[J]. 南京师范大学学报:工程技术版, 2015,15(1):43-48.
[20] ( Xiong Fulin, Deng Yihao, Tang Xiaosheng . The Architecture of Word2vec and Its Applications[J]. Journal of Nanjing Normal University: Engineering and Technology Edition, 2015,15(1):43-48.)
[21] Zhu Y, Yan E, Wang F . Semantic Relatedness and Similarity of Biomedical Terms: Examining the Effects of Recency, Size, and Section of Biomedical Publications on the Performance of Word2vec[J]. BMC Medical Informatics and Decision Making, 2017,17(1): Article No. 95.
[22] Xu C, Liu D . Chinese Text Summarization Algorithm Based on Word2vec[J]. Journal of Physics: Conference Series, 2018,976:012006.
[23] 李心蕾, 王昊, 刘小敏 , 等. 面向微博短文本分类的文本向量化方法比较研究[J]. 数据分析与知识发现, 2018,2(8):41-50.
[23] ( Li Xinlei, Wang Hao, Liu Xiaomin , et al. Comparing Text Vector Generators for Weibo Short Text Classification[J]. Data Analysis and Knowledge Discovery, 2018,2(8):41-50.)
[24] 刘芊, 蓝国赈 . 科技信息[J].科技信息, 2008(36):102-103,105.
[24] ( Liu Qian, Lan Guozhen . Factor Analysis and Empirical Analysis Based on SPSS[J]. Scientific Information, 2008(36):102-103,105.)
[1] 李跃艳,熊回香,李晓敏. 在线问诊平台中基于组合条件的医生推荐研究*[J]. 数据分析与知识发现, 2020, 4(8): 130-142.
[2] 唐晓波,高和璇. 基于关键词词向量特征扩展的健康问句分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 66-75.
[3] 叶佳鑫,熊回香,童兆莉,孟秋晴. 在线医疗社区中面向医生的协同标注研究*[J]. 数据分析与知识发现, 2020, 4(6): 118-128.
[4] 岳丽欣,刘自强,胡正银. 面向趋势预测的热点主题演化分析方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 22-34.
[5] 陶兴,张向先,郭顺利,张莉曼. 学术问答社区用户生成内容的W2V-MMR自动摘要方法研究*[J]. 数据分析与知识发现, 2020, 4(4): 109-118.
[6] 薛福亮,刘丽芳. 一种基于CRF与ATAE-LSTM的细粒度情感分析方法*[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[7] 龚丽娟,王昊,张紫玄,朱立平. Word2Vec对海关报关商品文本特征降维效果分析*[J]. 数据分析与知识发现, 2020, 4(2/3): 89-100.
[8] 蒋翠清,郭轶博,刘尧. 基于中文社交媒体文本的领域情感词典构建方法研究*[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[9] 李心蕾, 王昊, 刘小敏, 邓三鸿. 面向微博短文本分类的文本向量化方法比较研究*[J]. 数据分析与知识发现, 2018, 2(8): 41-50.
[10] 高永兵, 杨贵朋, 张娣, 马占飞. 基于突显词博文聚类的官微事件检测方法*[J]. 数据分析与知识发现, 2017, 1(9): 57-64.
[11] 张琴, 郭红梅, 张智雄. 融合词嵌入表示特征的实体关系抽取方法研究*[J]. 数据分析与知识发现, 2017, 1(9): 8-15.
[12] 夏天. 词向量聚类加权TextRank的关键词抽取*[J]. 数据分析与知识发现, 2017, 1(2): 28-34.
[13] 刘睿伦, 叶文豪, 高瑞卿, 唐梦嘉, 王东波. 基于大数据岗位需求的文本聚类研究*[J]. 数据分析与知识发现, 2017, 1(12): 32-40.
[14] 罗文馨,陈翀,邓思艺. 基于Word2Vec及大众健康信息源的疾病关联探测[J]. 现代图书情报技术, 2016, 32(9): 78-87.
[15] 宁建飞,刘降珍. 融合Word2vec与TextRank的关键词抽取研究[J]. 现代图书情报技术, 2016, 32(6): 20-27.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn