Please wait a minute...
Data Analysis and Knowledge Discovery  2020, Vol. 4 Issue (2/3): 153-164    DOI: 10.11925/infotech.2096-3467.2019.0633
Current Issue | Archive | Adv Search |
A Physician Recommendation Algorithm Integrating Inquiries and Decisions of Patients
Ye Jiaxin,Xiong Huixiang(),Jiang Wuxuan
School of Information Management, Central China Normal University, Wuhan 430079, China
Download: PDF(771 KB)   HTML ( 3
Export: BibTeX | EndNote (RIS)      
Abstract  

[Objective] This paper investigates the decision-making mechanism of patients choosing doctors, aiming to build a better physician recommendation system.[Methods] First, we used Word2Vec to train the word vector model, and calculated the similarity between patients and doctors. Then, we analyzed the decision-making behaviors of patients choosing doctors. Finally, we combined the scores of doctors based on their similarity with patient needs and the latter’s decision mechanism to generate a recommended list.[Results] We conducted an empirical study with data from “Hao Daifu (Great Doctors)”. The proposed algorithm could help patients find doctors meeting their needs.[Limitations] The patient’s decision-making history needs to be analyzed. Our recommendation algorithm is for a single patient, which is costly.[Conclusions] The proposed method could recommend appropriate doctors meeting patient’s needs.

Key wordsDoctor Recommended      Decision Mechanism      Word2Vec      Online Medical Platform     
Received: 10 June 2019      Published: 26 April 2020
ZTFLH:  G354  
Corresponding Authors: Huixiang Xiong     E-mail: hxxiong@mail.ccnu.edu.cn

Cite this article:

Ye Jiaxin,Xiong Huixiang,Jiang Wuxuan. A Physician Recommendation Algorithm Integrating Inquiries and Decisions of Patients. Data Analysis and Knowledge Discovery, 2020, 4(2/3): 153-164.

URL:

http://manu44.magtech.com.cn/Jwk_infotech_wk3/EN/10.11925/infotech.2096-3467.2019.0633     OR     http://manu44.magtech.com.cn/Jwk_infotech_wk3/EN/Y2020/V4/I2/3/153

Doctor Recommendation Framework
姓名 职称 对应
患者数
(人)
诊断
费用
(元)
总访
问量
(次)
总文章数(篇) 总患者数(人) 诊后
报道数
(人)
感谢
信数
(个)
心意
礼物数
(个)
注册
时间(年)
患者
对话数
(个)
医生
对话数
(个)
左晟 副主任 21 20 6 341 11 121 10 1 6 2018 369 153
朱奇志 副主任 16 40 50 939 2 60 0 1 9 2013 311 89
朱蓬燕 主治 8 15 46 757 26 82 33 9 5 2017 168 66
朱保 主治 0 10 263 456 0 2 348 2 168 77 233 2016 1 875 623
周忠辉 副主任 18 20 39 117 18 167 7 3 1 2018 266 116
周云芝 主任 8 80 1 118 745 7 1 167 134 9 43 2009 374 151
周文胜 主任 19 30 99 496 2 178 100 14 13 2017 315 104
安建峰 副主任 6 60 1 301 699 0 2 778 1 602 74 164 2009 463 203
Basic Doctor Data(305 in Total)
医生姓名 文本序号 咨询文本
左晟 1 吸烟后胸闷,感觉有东西压迫,呼吸较费力,一天一包烟左右,一旦不抽烟症状会有所减轻,一抽烟就有胸闷,持续了大约三天了,症状之前没有发生过,去年10月左右检查过心电图,今年2月也拍过胸片……
左晟 2 半个月之前感冒咳嗽,之前咳嗽有痰,吃了药,还挂了头孢,虽然现在没痰了,但是咳嗽一直没好全,现在早上和晚上睡都不咳,就是中午到下午这段时间干咳无痰,有时候张口说话就忍不住想咳嗽……
左晟 3 不咳嗽,就是早晨感觉胸口有痰,使劲刻出来,是浓黄色,有时是褐色,中午和晚上吃过饭,自己主动把他刻出来,是白色比较稀。鼻涕是浓白涕,难擤出来,出来都一小块,一小块……
安建峰 3 125 诊后治疗和康复相关问题
Patient Consultation Text Data (3 125 in Total)
姓名 职称 诊断费用(元) 总访问量
(次)
总文章数(篇) 总患者数(人) 诊后报道数(人) 感谢信数(个) 心意礼物数(个) 注册天数(天) 平均每天
患者数(人)
平均每天
访问量(次)
医患
对话比
左晟 2 20 6 341 11 121 10 1 6 373 0.324 17.000 0.415
朱奇志 2 40 50 939 2 60 0 1 9 2 110 0.028 24.142 0.286
朱蓬燕 1 15 46 757 26 82 33 9 5 842 0.097 55.531 0.393
周忠辉 2 20 39 117 18 167 7 3 1 332 0.503 117.822 0.436
周云芝 3 80 1 118 745 7 1 167 134 9 43 3 496 0.334 320.007 0.404
周文胜 3 30 99 496 2 178 100 14 13 753 0.236 132.133 0.330
周凤丽 2 40 406 163 3 1 017 542 36 201 3 841 0.265 105.744 0.429
安建峰 2 60 1 301 699 0 2 778 1 602 74 164 3 688 0.753 352.955 0.438
Basic Doctor Information(200 in Total)
医生姓名 文本序号 咨询文本
左晟 1 吸烟后胸闷,感觉有东西压迫,呼吸较费力,一天一包烟
左晟 2 半个之前感冒咳嗽,之前咳嗽有痰,吃了药,还挂了头孢
左晟 3 不咳嗽,就是早晨感觉胸口有痰,使劲刻出来,是浓黄色
左晟 4 几年前查出有轻微的肺结核,医生说没事,去单位体检的
左晟 5 咳嗽好长时间了,春节前一次感冒引起的咳嗽一直到现在
陈安琪 2 830 头晕恶心眼痛困乏颈椎不舒服
Patient Consultation Text Data (2 830 in Total)
词语

维度
1 2 3 4 100
V咳嗽 -1.033 0.285 0.821 0.422 -0.400
V发烧 0.310 -0.568 4.438 -0.498 -0.423
V发炎 0.188 -1.073 -0.416 0.496 -1.078
V支气管 0.124 1.828 -0.381 0.888 -1.179
V感冒 1.294 -1.827 1.592 0.642 -3.470
Word Vector of Training Words
测试词

词语
词语1 相似度 词语2 相似度 词语3 相似度
咳嗽 干咳 0.864 0.732 流鼻涕 0.660
发烧 退 0.796 低烧 0.795 高烧 0.765
发炎 扁桃体 0.856 化脓 0.879 流涕 0.743
支气管 扩张 0.843 管壁 0.769 肺气肿 0.749
Word Similarity Based on Word Vector Model
医生姓名 文本序号 句向量
左晟 1 (V吸烟+V+V胸闷+…+V)/文本词数
2 (V半个+V之前+V感冒+…+V头孢)/文本词数
3 (V+V咳嗽+V早餐+…+V黄色)/文本词数
4 (V几年+V查出+V轻微+…+V)/文本词数
5 (V咳嗽+V好长时间+V春节+…+V现在)/文本词数
陈安琪 1 (V感觉+V感冒+V+…+V)/文本词数
2 (V有次+V感觉+V左腹+…+V)/文本词数
3 (V之前+V检查+V血糖+…+V)/文本词数
4 (V+V失眠+V入睡+…+V)/文本词数
5 (V怀孕+V+V今天+…+V)/文本词数
Doctor Characteristic(200 in Total)
测试患者序号 医生姓名 职称 句向量
1 欧阳文献 3 (V验血+V常规+V巨细胞+…+V定量)/文本词数
2 周云芝 3 (V平时+V+V吹风+…+V刺激性)/文本词数
3 周文胜 3 (V医生+V您好+V半个+…+V)/文本词数
4 赵琪 2 (V第一次+V咳血+V治疗+…+V详细资料)/文本词数
30 秦少文 1 (V婆婆+V慢性+V支气管炎+…+V咳嗽)/文本词数
Testing Patient Data(30 in Total)
医生姓名 医生序号 医生对应文本 测试
患者1
测试
患者2
测试
患者30
欧阳文献 1 1 0.590 0.061 0.272
2 0.537 0.221 0.262
3 0.466 0.479 0.089
4 0.692 0.078 0.044
5 0.655 0.447 0.364
均值 0.588 0.257 0.206
陈安琪 200 1 0.251 0.661 0.389
2 0.493 0.420 0.205
3 0.727 0.261 0.245
4 0.262 0.630 0.314
5 0.369 0.535 0.480
均值 0.420 0.500 0.327
Similarity Between Doctor and Testing Patient
测试患者1 测试患者2 测试患者30
医生序号 医生得分 医生序号 医生得分 医生序号 医生得分
15 1.000 116 1.000 186 1.000
48 0.995 168 0.995 11 0.995
158 0.990 165 0.990 114 0.990
89 0.985 103 0.985 30 0.985
1 0.980 11 0.980 69 0.980
77 0.975 74 0.975 79 0.975
196 0.970 146 0.970 87 0.970
3 0.965 71 0.965 16 0.965
61 0.960 65 0.960 110 0.960
116 0.000 158 0.000 157 0.000
Doctor’s Score Based on Consultation Text
患者序号 医生序号 医生 得分排序 得分 患者序号 医生序号 医生 得分排序 得分
10 11 张铭正 1 1.000 2 2 周云芝 59 0.709
12 96 朱奇志 1 1.000 16 101 赵海金 65 0.678
15 100 赵晓刚 1 1.000 13 97 周忠辉 68 0.663
17 102 张彦亮 2 0.995 9 10 张念志 73 0.638
1 1 欧阳文献 5 0.980 6 6 张伟 87 0.568
30 183 秦少文 16 0.925 4 4 赵琪 89 0.558
19 104 张鸿 18 0.915 8 8 张齐武 94 0.533
5 5 张炜 31 0.849 28 181 涂波 97 0.518
26 179 温鹏 33 0.839 29 182 邵川 106 0.472
18 103 张晓阳 42 0.794 3 3 周文胜 116 0.422
11 95 左晟 47 0.769 27 180 王红星 126 0.372
21 174 朱蓬燕 52 0.744 14 98 钟爱虹 137 0.317
22 175 仲敏 52 0.744 24 177 张凤 137 0.317
7 7 张斯为 53 0.739 23 176 张永明 152 0.241
25 178 徐汝洪 58 0.714 20 105 张方 167 0.166
Score of Doctor Selected by the Testing Patient
患者10
咨询文本
推荐
医生
医生对应患者 对应患者咨询文本
两个宝宝咳嗽打喷嚏鼻塞吐奶吃奶胃口不好 张铭正 对应患者1 宝宝睡着咳嗽怎么回事起来玩耍不咳嗽
对应患者2 婴儿咳嗽口臭原因药能好得快
对应患者3 宝宝咳嗽厉害十天希望早点得到好治疗
对应患者4 咳嗽喘喘得挺厉害抗生素过敏
对应患者5 反复咳嗽流鼻涕不发烧
Data of Testing Patient No.10
因子

主因子
1 2 3 4
平均每天访问量 0.894
总访问量 0.884
总文章数 0.733
平均每天患者数 0.655 0.644
诊后报道数 0.867
感谢信数 0.808
心意礼物数 0.791
注册天数 0.767
职称 0.691
诊断费用 0.523
医患对话比 0.861
Rotated Factor Load Matrix
主因子 因子-权值
主因子1 平均每天访问量-0.282;总访问量-0.279;总文章数-0.232;平均每天患者数-0.207
主因子2 诊后报道数-0.351;感谢信数-0.328;心意礼物数-0.321
主因子3 注册天数-0.387;职称-0.349;诊断费用-0.264
主因子4 医患对话比-1
主因子5 负诊断费用-1
Factor Weight Matrix
因子医生 平均每天访问量 总访
问量
总文
章数
诊断
费用
负诊断费用
欧阳文献 0.729 0.693 0.013 0.600 0.400
周云芝 0.543 0.683 0.008 0.600 0.400
周文胜 0.322 0.191 0.002 0.200 0.800
赵琪 0.678 0.794 0.035 0.200 0.800
张炜 0.894 0.910 0.076 0.600 0.400
陈安琪 0.171 0.055 0.005 0.000 1.000
Score of Doctor Based on Factors
医生 主因子1 主因子2 主因子3 主因子4 主因子5
欧阳文献 0.701 0.895 0.673 0.221 0.400
周云芝 0.505 0.385 0.797 0.563 0.400
周文胜 0.245 0.321 0.456 0.171 0.800
赵琪 0.740 0.279 0.754 0.930 0.800
张炜 0.855 0.618 0.894 0.523 0.400
陈安琪 0.198 0.051 0.004 0.990 1.000
Score of Doctor Based on Main Factor
测试患者-医生 主因子1 主因子2 主因子3 主因子4 主因子5
24-张凤 0.472 0.674 0.056 0.216 0.800
23-张永明 0.543 0.627 0.198 0.452 0.400
20-张方 0.497 0.568 0.484 0.623 0.600
Decision Score of Doctor of Testing Patient
测试患者序号 基于患者咨询文本 融合患者咨询文本与决策机理
对应医生得分 排序第一医生 对应医生得分 排序第一医生
24 0.317 张铭正 0.462 张铭正
23 0.241 贾钰华 0.357 史锁芳
20 0.166 朱奇志 0.303 赵晓刚
Results of Doctor Recommendation
患者20咨询文本 推荐模型 医生 医生对应患者 对应患者咨询文本
没有症状入职。体检拍胸片发现阴影 基于患者咨询文本 朱奇志 对应患者1 医生您好两半之前医院做保乳手术术后
对应患者2 检查见双肺纹理增粗模糊伴多发小叶中心结节
对应患者3 在备孕期中间感冒咳嗽厉害拍胸片想咨询
对应患者4 朱老师您好我份北医三院发现左肺上叶磨玻璃结节差
对应患者5 肺部有个环形三份肺炎做气管镜
医患对话比 0.286
融合患者咨询文本与
决策机理
赵晓刚 对应患者1 腰痛干咳门诊拍肾彩超做尿常规血常规
对应患者2 后背左侧疼拍肺CT医生诊断还没发展肺癌
对应患者3 近期有时候睡觉会咳嗽睡醒痰比较上个号做血象
对应患者4 您好赵医生我于瑞金医院体检发现右上肺.MM磨
对应患者5 二十天前感冒咳嗽痰化痰止咳处理后胸闷干咳
医患对话比 0.466
Situation of Recommended Doctor of Testing Patient 20
[1] 孙国强, 由丽孪, 陈思 , 等. 互联网+医疗模式的初步探索[J]. 中国数字医学, 2015,10(6):15-18.
[1] ( Sun Guoqiang, You Liluan, Chen Si , et al. Preliminary Exploration of Internet+Medical Model[J]. China Digital Medicine, 2015, 10(6):15-18).
[2] 国务院办公厅关于促进“互联网+医疗健康”发展的意见[EB/OL]. [ 2019- 06- 02]. http://www.gov.cn/zhengce/content/2018-04/28/content_5286645.htm.
[2] ( Opinions of the General Office of the State Council on Promoting the Development of “Internet+Medical Health”[EB/OL]. [ 2019- 06- 02]. http://www.gov.cn/zhengce/content/2018-04/28/content_5286645.htm.)
[3] Liu F, Yu C, Meng W , et al. Effective Keyword Search in Relational Databases [C]// Proceedings of the 2006 ACM SIGMOD International Conference on Management of Data. ACM, 2006: 563-574.
[4] 朱凡微, 吴明晖, 金苍宏 , 等. 基于关键字的数据库搜索研究综述[J]. 计算机应用研究, 2008,25(11):3238-3242.
[4] ( Zhu Fanwei, Wu Minghui, Jin Canghong , et al. Survey of Keyword-Based Search over Databases[J]. Application Research of Computers, 2008,25(11):3238-3242.)
[5] 李宗伟, 张艳辉, 栾东庆 . 哪些因素影响消费者的在线购买决策?——顾客感知价值的驱动作用[J]. 管理评论, 2017,29(8):136-146.
[5] ( Li Zongwei, Zhang Yanhui, Luan Dongqing . What Factors Influence Consumers’ Online Purchasing Decisions?——Customer Perceived Value Drivers[J]. Management Review, 2017,29(8):136-146.)
[6] Lay-Yee K L, Kok-Siew H, Yin-Fah B C . Factors Affecting Smartphone Purchase Decision Among Malaysian Generation Y[J]. International Journal of Asian Social Science, 2013,3(12):2426-2440.
[7] Sujata J, Yatin J, Abhijit C , et al. Factors Affecting Smartphone Purchase Among Indian Youth: A Descriptive Analysis[J]. Indian Journal of Science and Technology, 2016,9(15):1-10.
[8] Choi N . Factors Affecting Undergraduates’ Selection of Online Library Resources in Academic Tasks[J]. Library Hi Tech, 2015,33(2):272-291.
[9] 吴江, 周露莎 . 网络健康信息服务用户购买决策的影响因素研究[J]. 情报学报, 2017,36(10):1058-1065.
[9] ( Wu Jiang, Zhou Lusha . Study of Factors That Influence Users’ Purchasing Decision of Health Information Services[J]. Journal of the China Society for Scientific and Technical Information, 2017,36(10):1058-1065.)
[10] 查先进, 李力, 严亚兰 , 等. 数字图书馆环境下信息有用性和信息获取影响因素研究——信息获取自我效能的调节效果[J]. 情报学报, 2017,36(7):669-681.
[10] ( Zha Xianjin, Li Li, Yan Yalan , et al. Research on Impacting Factors of Information Usefulness and Information Acquisition in the Context of Digital Libraries: The Moderating Effect of Self-efficacy in Acquiring Information[J]. Journal of the China Society for Scientific and Technical Information, 2017,36(7):669-681.)
[11] Huang Y F, Liu P, Pan Q , et al. A Doctor Recommendation Algorithm Based on Doctor Performances and Patient Preferences [C]// Proceedings of the 2012 International Conference on Wavelet Active Media Technology and Information Processing (ICWAMTIP). IEEE, 2012: 92-95.
[12] Jiang H, Xu W . How to Find Your Appropriate Doctor: An Integrated Recommendation Framework in Big Data Context [C]// Proceedings of the 2014 IEEE Symposium on Computational Intelligence in Healthcare and E-Health (CICARE). IEEE, 2014: 154-158.
[13] 徐守坤, 吴伟伟 . 基于语义的医疗资源均衡推荐算法[J]. 计算机工程, 2015,41(9):74-79.
[13] ( Xu Shoukun, Wu Weiwei . Balance Recommendation Algorithm for Medical Resources Based on Semantic[J]. Computer Engineering, 2015,41(9):74-79.)
[14] 李勇, 黄俊 . 信息通信[J].信息通信, 2018(2):67-70.
[14] ( Li Yong, Huang Jun . A Search of Personalized Doctor Recommendation Algorithm[J]. Information & Communications,2018(2):67-70.)
[15] Tian B, Zhang Y, Chen X , et al. DRGAN: A GAN-Based Framework for Doctor Recommendation in Chinese On-Line QA Communities [C]// Proceedings of the 2019 International Conference on Database Systems for Advanced Applications. Springer, 2019: 444-447.
[16] 林鑫, 桑运鑫, 龙存钰 . 基于用户决策机理的个性化推荐[J]. 图书情报工作, 2019,63(2):99-106.
[16] ( Lin Xin, Sang Yunxin, Long Cunyu . Personalized Recommendation Based on User Decision-making Mechanism[J]. Library and Information Service, 2019,63(2):99-106.)
[17] 高山, 刘炜, 崔勇 , 等. 一种融合多种用户行为的协同过滤推荐算法[J]. 计算机科学, 2016,43(9):227-231.
[17] ( Gao Shan, Liu Wei, Cui Yong , et al. Collaborative Filtering Algorithm Integrating Multiple User Behaviors[J]. Computer Science, 2016,43(9):227-231.)
[18] Huang Z X, Lu X D, Duan H L , et al. Collaboration-based Medical Knowledge Recommendation[J]. Artificial Intelligence in Medicine, 2012,55(1):13-24.
[19] Mikolov T, Sutskever I, Chen K , et al. Distributed Representations of Words and Phrases and Their Compositionality [C]// Proceedings of the 26th International Conference on Neural Information Processing Systems. 2013,2:3111-3119.
[20] 熊富林, 邓怡豪, 唐晓晟 . Word2vec的核心架构及其应用[J]. 南京师范大学学报:工程技术版, 2015,15(1):43-48.
[20] ( Xiong Fulin, Deng Yihao, Tang Xiaosheng . The Architecture of Word2vec and Its Applications[J]. Journal of Nanjing Normal University: Engineering and Technology Edition, 2015,15(1):43-48.)
[21] Zhu Y, Yan E, Wang F . Semantic Relatedness and Similarity of Biomedical Terms: Examining the Effects of Recency, Size, and Section of Biomedical Publications on the Performance of Word2vec[J]. BMC Medical Informatics and Decision Making, 2017,17(1): Article No. 95.
[22] Xu C, Liu D . Chinese Text Summarization Algorithm Based on Word2vec[J]. Journal of Physics: Conference Series, 2018,976:012006.
[23] 李心蕾, 王昊, 刘小敏 , 等. 面向微博短文本分类的文本向量化方法比较研究[J]. 数据分析与知识发现, 2018,2(8):41-50.
[23] ( Li Xinlei, Wang Hao, Liu Xiaomin , et al. Comparing Text Vector Generators for Weibo Short Text Classification[J]. Data Analysis and Knowledge Discovery, 2018,2(8):41-50.)
[24] 刘芊, 蓝国赈 . 科技信息[J].科技信息, 2008(36):102-103,105.
[24] ( Liu Qian, Lan Guozhen . Factor Analysis and Empirical Analysis Based on SPSS[J]. Scientific Information, 2008(36):102-103,105.)
[1] Xue Fuliang,Liu Lifang. Fine-Grained Sentiment Analysis with CRF and ATAE-LSTM[J]. 数据分析与知识发现, 2020, 4(2/3): 207-213.
[2] Gong Lijuan,Wang Hao,Zhang Zixuan,Zhu Liping. Reducing Dimensions of Custom Declaration Texts with Word2Vec[J]. 数据分析与知识发现, 2020, 4(2/3): 89-100.
[3] Cuiqing Jiang,Yibo Guo,Yao Liu. Constructing a Domain Sentiment Lexicon Based on Chinese Social Media Text[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[4] Xinlei Li,Hao Wang,Xiaomin Liu,Sanhong Deng. Comparing Text Vector Generators for Weibo Short Text Classification[J]. 数据分析与知识发现, 2018, 2(8): 41-50.
[5] Yongbing Gao,Guipeng Yang,Di Zhang,Zhanfei Ma. Detecting Events from Official Weibo Profiles Based on Post Clustering with Burst Words[J]. 数据分析与知识发现, 2017, 1(9): 57-64.
[6] Qin Zhang,Hongmei Guo,Zhixiong Zhang. Extracting Entity Relationship with Word Embedding Representation Features[J]. 数据分析与知识发现, 2017, 1(9): 8-15.
[7] Tian Xia. Extracting Keywords with Modified TextRank Model[J]. 数据分析与知识发现, 2017, 1(2): 28-34.
[8] Ruilun Liu,Wenhao Ye,Ruiqing Gao,Mengjia Tang,Dongbo Wang. Research on Text Clustering Based on Requirements of Big Data Jobs[J]. 数据分析与知识发现, 2017, 1(12): 32-40.
[9] Luo Wenxin,Chen Chong,Deng Siyi. Detecting Disease Associations with Word2Vec from Consumer Health Information[J]. 现代图书情报技术, 2016, 32(9): 78-87.
[10] Ning Jianfei,Liu Jiangzhen. Using Word2vec with TextRank to Extract Keywords[J]. 现代图书情报技术, 2016, 32(6): 20-27.
  Copyright © 2016 Data Analysis and Knowledge Discovery   Tel/Fax:(010)82626611-6626,82624938   E-mail:jishu@mail.las.ac.cn