Data Analysis and Knowledge Discovery  2020, Vol. 4 Issue (2/3): 153-164    DOI: 10.11925/infotech.2096-3467.2019.0633
A Physician Recommendation Algorithm Integrating Inquiries and Decisions of Patients
Ye Jiaxin,Xiong Huixiang(),Jiang Wuxuan
School of Information Management, Central China Normal University, Wuhan 430079, China
[Objective] This paper investigates the decision-making mechanism of patients choosing doctors, aiming to build a better physician recommendation system.[Methods] First, we used Word2Vec to train the word vector model, and calculated the similarity between patients and doctors. Then, we analyzed the decision-making behaviors of patients choosing doctors. Finally, we combined the scores of doctors based on their similarity with patient needs and the latter’s decision mechanism to generate a recommended list.[Results] We conducted an empirical study with data from “Hao Daifu (Great Doctors)”. The proposed algorithm could help patients find doctors meeting their needs.[Limitations] The patient’s decision-making history needs to be analyzed. Our recommendation algorithm is for a single patient, which is costly.[Conclusions] The proposed method could recommend appropriate doctors meeting patient’s needs.

Key wordsDoctor Recommended      Decision Mechanism      Word2Vec      Online Medical Platform     
Received: 10 June 2019      Published: 26 April 2020
ZTFLH:  G354  
Corresponding Authors: Huixiang Xiong

Cite this article:

Ye Jiaxin,Xiong Huixiang,Jiang Wuxuan. A Physician Recommendation Algorithm Integrating Inquiries and Decisions of Patients. Data Analysis and Knowledge Discovery, 2020, 4(2/3): 153-164.

URL:

Doctor Recommendation Framework
姓名 职称 对应
总文章数(篇) 总患者数(人) 诊后
左晟 副主任 21 20 6 341 11 121 10 1 6 2018 369 153
朱奇志 副主任 16 40 50 939 2 60 0 1 9 2013 311 89
朱蓬燕 主治 8 15 46 757 26 82 33 9 5 2017 168 66
朱保 主治 0 10 263 456 0 2 348 2 168 77 233 2016 1 875 623
周忠辉 副主任 18 20 39 117 18 167 7 3 1 2018 266 116
周云芝 主任 8 80 1 118 745 7 1 167 134 9 43 2009 374 151
周文胜 主任 19 30 99 496 2 178 100 14 13 2017 315 104
安建峰 副主任 6 60 1 301 699 0 2 778 1 602 74 164 2009 463 203
Basic Doctor Data(305 in Total)
医生姓名 文本序号 咨询文本
左晟 1 吸烟后胸闷,感觉有东西压迫,呼吸较费力,一天一包烟左右,一旦不抽烟症状会有所减轻,一抽烟就有胸闷,持续了大约三天了,症状之前没有发生过,去年10月左右检查过心电图,今年2月也拍过胸片……
左晟 2 半个月之前感冒咳嗽,之前咳嗽有痰,吃了药,还挂了头孢,虽然现在没痰了,但是咳嗽一直没好全,现在早上和晚上睡都不咳,就是中午到下午这段时间干咳无痰,有时候张口说话就忍不住想咳嗽……
左晟 3 不咳嗽,就是早晨感觉胸口有痰,使劲刻出来,是浓黄色,有时是褐色,中午和晚上吃过饭,自己主动把他刻出来,是白色比较稀。鼻涕是浓白涕,难擤出来,出来都一小块,一小块……
安建峰 3 125 诊后治疗和康复相关问题
Patient Consultation Text Data (3 125 in Total)
姓名 职称 诊断费用(元) 总访问量
总文章数(篇) 总患者数(人) 诊后报道数(人) 感谢信数(个) 心意礼物数(个) 注册天数(天) 平均每天
左晟 2 20 6 341 11 121 10 1 6 373 0.324 17.000 0.415
朱奇志 2 40 50 939 2 60 0 1 9 2 110 0.028 24.142 0.286
朱蓬燕 1 15 46 757 26 82 33 9 5 842 0.097 55.531 0.393
周忠辉 2 20 39 117 18 167 7 3 1 332 0.503 117.822 0.436
周云芝 3 80 1 118 745 7 1 167 134 9 43 3 496 0.334 320.007 0.404
周文胜 3 30 99 496 2 178 100 14 13 753 0.236 132.133 0.330
周凤丽 2 40 406 163 3 1 017 542 36 201 3 841 0.265 105.744 0.429
安建峰 2 60 1 301 699 0 2 778 1 602 74 164 3 688 0.753 352.955 0.438
Basic Doctor Information(200 in Total)
医生姓名 文本序号 咨询文本
左晟 1 吸烟后胸闷,感觉有东西压迫,呼吸较费力,一天一包烟
左晟 2 半个之前感冒咳嗽,之前咳嗽有痰,吃了药,还挂了头孢
左晟 3 不咳嗽,就是早晨感觉胸口有痰,使劲刻出来,是浓黄色
左晟 4 几年前查出有轻微的肺结核,医生说没事,去单位体检的
左晟 5 咳嗽好长时间了,春节前一次感冒引起的咳嗽一直到现在
陈安琪 2 830 头晕恶心眼痛困乏颈椎不舒服
Patient Consultation Text Data (2 830 in Total)

1 2 3 4 100
V咳嗽 -1.033 0.285 0.821 0.422 -0.400
V发烧 0.310 -0.568 4.438 -0.498 -0.423
V发炎 0.188 -1.073 -0.416 0.496 -1.078
V支气管 0.124 1.828 -0.381 0.888 -1.179
V感冒 1.294 -1.827 1.592 0.642 -3.470
Word Vector of Training Words

词语1 相似度 词语2 相似度 词语3 相似度
咳嗽 干咳 0.864 0.732 流鼻涕 0.660
发烧 退 0.796 低烧 0.795 高烧 0.765
发炎 扁桃体 0.856 化脓 0.879 流涕 0.743
支气管 扩张 0.843 管壁 0.769 肺气肿 0.749
Word Similarity Based on Word Vector Model
医生姓名 文本序号 句向量
左晟 1 (V吸烟+V+V胸闷+…+V)/文本词数
2 (V半个+V之前+V感冒+…+V头孢)/文本词数
3 (V+V咳嗽+V早餐+…+V黄色)/文本词数
4 (V几年+V查出+V轻微+…+V)/文本词数
5 (V咳嗽+V好长时间+V春节+…+V现在)/文本词数
陈安琪 1 (V感觉+V感冒+V+…+V)/文本词数
2 (V有次+V感觉+V左腹+…+V)/文本词数
3 (V之前+V检查+V血糖+…+V)/文本词数
4 (V+V失眠+V入睡+…+V)/文本词数
5 (V怀孕+V+V今天+…+V)/文本词数
Doctor Characteristic(200 in Total)
测试患者序号 医生姓名 职称 句向量
1 欧阳文献 3 (V验血+V常规+V巨细胞+…+V定量)/文本词数
2 周云芝 3 (V平时+V+V吹风+…+V刺激性)/文本词数
3 周文胜 3 (V医生+V您好+V半个+…+V)/文本词数
4 赵琪 2 (V第一次+V咳血+V治疗+…+V详细资料)/文本词数
30 秦少文 1 (V婆婆+V慢性+V支气管炎+…+V咳嗽)/文本词数
Testing Patient Data(30 in Total)
医生姓名 医生序号 医生对应文本 测试
欧阳文献 1 1 0.590 0.061 0.272
2 0.537 0.221 0.262
3 0.466 0.479 0.089
4 0.692 0.078 0.044
5 0.655 0.447 0.364
均值 0.588 0.257 0.206
陈安琪 200 1 0.251 0.661 0.389
2 0.493 0.420 0.205
3 0.727 0.261 0.245
4 0.262 0.630 0.314
5 0.369 0.535 0.480
均值 0.420 0.500 0.327
Similarity Between Doctor and Testing Patient
测试患者1 测试患者2 测试患者30
医生序号 医生得分 医生序号 医生得分 医生序号 医生得分
15 1.000 116 1.000 186 1.000
48 0.995 168 0.995 11 0.995
158 0.990 165 0.990 114 0.990
89 0.985 103 0.985 30 0.985
1 0.980 11 0.980 69 0.980
77 0.975 74 0.975 79 0.975
196 0.970 146 0.970 87 0.970
3 0.965 71 0.965 16 0.965
61 0.960 65 0.960 110 0.960
116 0.000 158 0.000 157 0.000
Doctor’s Score Based on Consultation Text
患者序号 医生序号 医生 得分排序 得分 患者序号 医生序号 医生 得分排序 得分
10 11 张铭正 1 1.000 2 2 周云芝 59 0.709
12 96 朱奇志 1 1.000 16 101 赵海金 65 0.678
15 100 赵晓刚 1 1.000 13 97 周忠辉 68 0.663
17 102 张彦亮 2 0.995 9 10 张念志 73 0.638
1 1 欧阳文献 5 0.980 6 6 张伟 87 0.568
30 183 秦少文 16 0.925 4 4 赵琪 89 0.558
19 104 张鸿 18 0.915 8 8 张齐武 94 0.533
5 5 张炜 31 0.849 28 181 涂波 97 0.518
26 179 温鹏 33 0.839 29 182 邵川 106 0.472
18 103 张晓阳 42 0.794 3 3 周文胜 116 0.422
11 95 左晟 47 0.769 27 180 王红星 126 0.372
21 174 朱蓬燕 52 0.744 14 98 钟爱虹 137 0.317
22 175 仲敏 52 0.744 24 177 张凤 137 0.317
7 7 张斯为 53 0.739 23 176 张永明 152 0.241
25 178 徐汝洪 58 0.714 20 105 张方 167 0.166
Score of Doctor Selected by the Testing Patient
医生对应患者 对应患者咨询文本
两个宝宝咳嗽打喷嚏鼻塞吐奶吃奶胃口不好 张铭正 对应患者1 宝宝睡着咳嗽怎么回事起来玩耍不咳嗽
对应患者2 婴儿咳嗽口臭原因药能好得快
对应患者3 宝宝咳嗽厉害十天希望早点得到好治疗
对应患者4 咳嗽喘喘得挺厉害抗生素过敏
对应患者5 反复咳嗽流鼻涕不发烧
Data of Testing Patient No.10

1 2 3 4
平均每天访问量 0.894
总访问量 0.884
总文章数 0.733
平均每天患者数 0.655 0.644
诊后报道数 0.867
感谢信数 0.808
心意礼物数 0.791
注册天数 0.767
职称 0.691
诊断费用 0.523
医患对话比 0.861
Rotated Factor Load Matrix
主因子 因子-权值
主因子1 平均每天访问量-0.282;总访问量-0.279;总文章数-0.232;平均每天患者数-0.207
主因子2 诊后报道数-0.351;感谢信数-0.328;心意礼物数-0.321
主因子3 注册天数-0.387;职称-0.349;诊断费用-0.264
主因子4 医患对话比-1
主因子5 负诊断费用-1
Factor Weight Matrix
因子医生 平均每天访问量 总访
欧阳文献 0.729 0.693 0.013 0.600 0.400
周云芝 0.543 0.683 0.008 0.600 0.400
周文胜 0.322 0.191 0.002 0.200 0.800
赵琪 0.678 0.794 0.035 0.200 0.800
张炜 0.894 0.910 0.076 0.600 0.400
陈安琪 0.171 0.055 0.005 0.000 1.000
Score of Doctor Based on Factors
医生 主因子1 主因子2 主因子3 主因子4 主因子5
欧阳文献 0.701 0.895 0.673 0.221 0.400
周云芝 0.505 0.385 0.797 0.563 0.400
周文胜 0.245 0.321 0.456 0.171 0.800
赵琪 0.740 0.279 0.754 0.930 0.800
张炜 0.855 0.618 0.894 0.523 0.400
陈安琪 0.198 0.051 0.004 0.990 1.000
Score of Doctor Based on Main Factor
测试患者-医生 主因子1 主因子2 主因子3 主因子4 主因子5
24-张凤 0.472 0.674 0.056 0.216 0.800
23-张永明 0.543 0.627 0.198 0.452 0.400
20-张方 0.497 0.568 0.484 0.623 0.600
Decision Score of Doctor of Testing Patient
测试患者序号 基于患者咨询文本 融合患者咨询文本与决策机理
对应医生得分 排序第一医生 对应医生得分 排序第一医生
24 0.317 张铭正 0.462 张铭正
23 0.241 贾钰华 0.357 史锁芳
20 0.166 朱奇志 0.303 赵晓刚
Results of Doctor Recommendation
患者20咨询文本 推荐模型 医生 医生对应患者 对应患者咨询文本
没有症状入职。体检拍胸片发现阴影 基于患者咨询文本 朱奇志 对应患者1 医生您好两半之前医院做保乳手术术后
对应患者2 检查见双肺纹理增粗模糊伴多发小叶中心结节
对应患者3 在备孕期中间感冒咳嗽厉害拍胸片想咨询
对应患者4 朱老师您好我份北医三院发现左肺上叶磨玻璃结节差
对应患者5 肺部有个环形三份肺炎做气管镜
医患对话比 0.286
赵晓刚 对应患者1 腰痛干咳门诊拍肾彩超做尿常规血常规
对应患者2 后背左侧疼拍肺CT医生诊断还没发展肺癌
对应患者3 近期有时候睡觉会咳嗽睡醒痰比较上个号做血象
对应患者4 您好赵医生我于瑞金医院体检发现右上肺.MM磨
对应患者5 二十天前感冒咳嗽痰化痰止咳处理后胸闷干咳
医患对话比 0.466
Situation of Recommended Doctor of Testing Patient 20
