Please wait a minute...
Advanced Search
数据分析与知识发现  2022, Vol. 6 Issue (2/3): 151-166     https://doi.org/10.11925/infotech.2096-3467.2021.0947
  专辑 本期目录 | 过刊浏览 | 高级检索 |
基于招聘广告的岗位人才需求分析框架构建与实证研究*
岳铁骐,傅友斐,徐健()
中山大学信息管理学院 广州 510006
An Analysis Framework for Job Demands from Job Postings
Yue Tieqi,Fu Youfei,Xu Jian()
School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China
全文: PDF (3748 KB)   HTML ( 34
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 面向网络招聘广告提出一个完整、系统的岗位人才需求分析的框架,并基于框架对我国互联网行业人才需求进行分析。【方法】 采集互联网行业招聘广告,构建LDA模型以实现岗位需求的主题挖掘与分类,利用Word2Vec模型与依存句法分析得到主题词-程度词词表并构建主题本体。【结果】 实证分析发现互联网行业岗位主要分布于我国的东南沿海与一线城市,计算机技术和个人素质能力是互联网行业最为看重的两项主题能力,不同类别的岗位对人才的能力需求差异较大;并基于框架构建了对不同岗位需求的量化评价。【局限】 校园招聘的数据样本较少,导致分析结果与实际情况存在偏差;构建LDA模型时分词不够完善,某些主题代表性不强。【结论】 实证分析表明岗位人才需求分析框架对人才市场需求和岗位能力要求的分析是有效的,并依据分析结果提出了制定职业规划、提高培养计划灵活性等建议。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
岳铁骐
傅友斐
徐健
关键词 招聘广告岗位人才需求分析LDA主题模型本体    
Abstract

[Objective] This paper proposes a complete and systematic framework to analyze qualifications from online job postings. It then examines the requirements of Internet-related jobs with the framework. [Methods] First, we retrieved recruitment advertisements for the Internet industry. Then, we constructed an LDA model for topic mining and classification of job descriptions. Finally, we used the Word2Vec model and dependency syntax analysis to obtain the topic-word and degree-word lists to construct the topic ontology. [Results] The empirical analysis revealed the status quo of the Internet industry positions, such as the regional and category distributions, as well as the required qualification for different types of positions. [Limitations] There were few data samples for campus recruitment, which led to deviations between the analysis results and the actual situation. The word-segmentation is not perfect for the LDA model, and some topics were not representative. [Conclusions] The proposed framework could effectively analyze job postings.

Key wordsRecruitment Advertisement    Job Demand Analysis    LDA Topic Model    Ontology
收稿日期: 2021-08-31      出版日期: 2022-04-14
ZTFLH:  TP274  
基金资助:*中山大学本科教学质量工程项目的研究成果之一(20000-31911130)
通讯作者: 徐健,ORCID: 0000-0003-4886-4708     E-mail: issxj@mail.sysu.edu.cn
引用本文:   
岳铁骐, 傅友斐, 徐健. 基于招聘广告的岗位人才需求分析框架构建与实证研究*[J]. 数据分析与知识发现, 2022, 6(2/3): 151-166.
Yue Tieqi, Fu Youfei, Xu Jian. An Analysis Framework for Job Demands from Job Postings. Data Analysis and Knowledge Discovery, 2022, 6(2/3): 151-166.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2021.0947      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2022/V6/I2/3/151
Fig.1  岗位人才需求分析框架
Fig.2  不同主题个数对应的主题一致性分数
Fig.3  主题个数为6时的主题模型可视化
主题 主题分项 主题词
主题2:个人素质能力 精神素质 创新能力
学习能力
团队合作精神
责任感
敬业精神
进取精神
抗压性
适应能力
求知欲
办事能力 执行能力
沟通能力
协调能力
解决问题能力
应变能力
分析能力
表达能力
条理性
Table 1  “个人素质能力”主题分项主题词词表
主题 主题分项 主题词 一般程度词 较强程度词 强程度词
主题1:业务技能要求 市场运营 运营 了解(6)、理解(1)、懂(1) 熟悉(16)、做过(2)、喜欢(2) 热爱(16)
推广 了解(7) 熟悉(14)、做好(3)、掌握(1)、喜欢(1) 热爱(2)、精通(1)
调研 了解(1)
竞品分析
销售与客户管理 产品销售
客户关系 做好(8)
客户资源
客户资料
Table 2  主题词-程度词词表(部分)
Fig.4  计算机技术主题本体
Fig.5  两个时间段招聘岗位数排名前5的省份/ 直辖市占比
Fig.6  两个时间段岗位类型占比
Fig.7  两时间段岗位要求各主题的词频占比
2015年11月-2016年4月 2019年10月-2019年11月
推广 7.06% 本科 9.22%
运营 6.71% 运营 7.74%
责任感 6.45% 学习能力 5.13%
沟通能力 5.52% 沟通能力 5.03%
学习能力 4.27% 算法 4.63%
大专 3.69% 责任感 4.36%
团队合作精神 3.63% Python 3.69%
本科 2.97% C++ 3.49%
收集 2.83% 数据分析 3.33%
执行能力 2.23% Java 2.97%
Table 3  两时间段词频占比排名前10的主题词
岗位分类 主题1:
业务技能要求
主题2:
个人素质能力
主题3:
计算机技术
主题4:
项目技能要求
主题5:
互联网产品技能要求
主题6:
教育背景
技术类 0.340 0.888 1.970 0.770 0.537 0.936
运营类 3.065 1.115 0.045 1.010 2.092 0.842
市场与销售类 1.670 1.142 0.032 0.978 0.801 0.756
职能类 0.764 1.201 0.016 0.762 0.662 1.038
设计类 0.278 0.705 0.081 2.446 1.284 2.002
产品类 1.852 1.386 0.108 1.066 2.710 0.877
金融类 0.784 1.189 0.187 1.720 0.502 1.028
Table 4  2019年10月-2019年11月各主题与各岗位之间的相关度
排名 2015年11月-2016年4月 2019年10月-2019年11月
主题词节点 点度中心度 主题词节点 点度中心度
1 责任感 103 本科 87
2 沟通能力 99 团队合作精神 81
3 团队合作精神 97 C++ 81
4 学习能力 96 Python 80
5 Javascript 94 学习能力 78
6 本科 91 Java 77
7 HTML 90 沟通能力 76
8 数据库 89 责任感 75
9 CSS 88 算法 74
10 运营 87 运营 67
Table 5  两时间段点度中心性排名前10的主题词节点
Fig.8  两时间段技术类岗位主题词共现网络
群组1 群组2 群组3
主题词节点 点度中心度 主题词节点 点度中心度 主题词节点 点度中心度
责任感 103 沟通能力 99 数据库 89
学习能力 96 团队合作精神 97 运营 87
本科 91 Javascript 94 Java 85
Android 82 HTML 90 Linux 83
表达能力 81 CSS 88 Python 77
移动互联网 81 Jquery 87 操作系统 70
协调能力 80 Ajax 83 调研 69
分析能力 79 大专 80 数学 60
算法 78 执行能力 70 通信 58
C++ 78 产品设计 69 数据分析 56
Table 6  2015年11月-2016年4月技术类岗位每个群组点度中心性排名前10的主题词
群组1 群组2 群组3
主题词节点 点度中心度 主题词节点 点度中心度 主题词节点 点度中心度
Javascript 60 C++ 81 本科 87
HTML 54 Python 80 团队合作精神 81
CSS 47 Java 77 学习能力 78
Ajax 34 算法 74 沟通能力 76
Jquery 25 数学 66 责任感 75
XHTML 22 Linux 60 运营 67
交互设计 21 硕士 59 数据库 63
dom 20 计算机专业 57 通信 63
Flash 14 软件工程 56 表达能力 55
机器学习 55 求知欲 52
Table 7  2019年10月-2019年11月技术类岗位各群组点度中心性排名前10的主题词
公司 岗位 岗位描述
用友网络 软件测试工程师 1、负责产品的日常测试工作,用自动化工具进行脚本录制、调试及回放;
2、根据需求进行产品测试用例设计;
3、执行测试用例并反馈跟踪BUG,定位问题性质,推进问题解决;
4、改进和完善测试流程及方法;
5、提交测试报告,保证产品质量;
6、统招本科以上学历,计算机类专业;
7、工作细心、有责任心有较强的沟通能力,且具有良好的团队协作精神;
8、学习能力强,能够很快适应快节奏的工作环境;
9、了解自动化、白盒、性能测试,掌握常见的白盒测试工具以及开源测试工具;
10、掌握.net开发语言以及Python、Shell其中一种脚本语言。
网易 内容运营 1、协同相关的业务链条,如市场,运营等,探索从内容维度辅助业务圈粉和品牌力的推广;
2、负责严选商品内容的规划和呈现,包括但不仅限于商品卖点,品牌力塑造传达,以及商品故事包装等维度探索;
3、探索严选商品内容的价值和输出方式,结合用户痛点和需求,打造严选内容价值;
4、产出符合商品规划的内容专题,并能通过数据分析和复盘,优化内容,商详,为提升整体商品转化赋能;
5、本科及以上学历,熟悉内容电商相关平台或热门内容平台,有公众号等新媒体媒介内容运营的尝试及探索经验者优先;
6、优秀的文字功底,活跃的创意思维,较高的审美调性和把控力;
7、有良好的合作意识与沟通协调能力;
8、具有优秀的学习能力和独立思考能力。
Table 8  岗位招聘文本
公司和岗位 主题词或得分项 命中的程度词或得分主题词 主题词或得分项最终得分
用友网络:软件测试工程师 学习能力 ['强'] 2
团队合作精神 ['具有'] 1
责任感 ['有'] 1
Python ['掌握'] 2
测试用例 1
测试报告 1
学历 ['本科'] 2
沟通能力 ['强', '有'] 2
网易:内容运营 学习能力 ['优秀', '具有'] 3
协调能力 ['有'] 1
学历 ['本科'] 2
运营 1
推广 1
数据分析 1
新媒体 1
Table 9  得分的主题词与得分项
Fig.9  岗位要求主题评分雷达图
[1] Papoutsoglou M, Mittas N, Angelis L. Mining People Analytics from StackOverflow Job Advertisements[C]// Proceedings of the 43rd Euromicro Conference on Software Engineering and Advanced Applications (SEAA). IEEE, 2017: 108-115.
[2] Surakka S. Analysis of Technical Skills in Job Advertisements Targeted at Software Developers[J]. Informatics in Education, 2005, 4(1):102-122.
doi: 10.15388/infedu.2005.07
[3] 彩广畏. 从网络招聘信息看我国人才需求状况[D]. 长沙: 湖南师范大学, 2017.
[3] ( Cai Guangwei. The Situation of Talent Demand in China from the Viewpoint of Network Recruitment Information[D]. Changsha: Hunan Normal University, 2017.)
[4] 胡忠义, 李雅, 吴江, 等. 基于招聘信息的商务智能人才需求分析与启示[J]. 信息资源管理学报, 2019, 9(3):111-118.
[4] ( Hu Zhongyi, Li Ya, Wu Jiang, et al. Analysis of Recruitment Information on Business Intelligence Professionals: Recruitment Requirement and Enlightenment[J]. Journal of Information Resources Management, 2019, 9(3):111-118.)
[5] 李尚昊, 郝琦. 内容分析与文本挖掘在信息分析应用中的比较研究[J]. 图书馆学研究, 2015(23):37-42.
[5] ( Li Shanghao, Hao Qi. A Comparative Study of Content Analysis and Text Mining in the Application of Information Analysis[J]. Research on Library Science, 2015(23):37-42.)
[6] Todd P A, McKeen J D, Gallupe R B. The Evolution of IS Job Skills: A Content Analysis of IS Job Advertisements from 1970 to 1990[J]. MIS Quarterly, 1995, 19(1):1-27.
doi: 10.2307/249709
[7] Yadav A K S, Bankar P D. Employment Opportunities in LIS Field in India: A Content Analysis of Positions Advertised[J]. Annals of Library and Information Studies, 2016, 63(1):53-58.
[8] Xu T, Zhu H S, Zhu C, et al. Measuring the Popularity of Job Skills in Recruitment Market: A Multi-Criteria Approach[OL]. arXiv Preprint, arXiv:1712.03087.
[9] 陈媛媛, 董伟. 社会需求导向下图书情报专业毕业生就业技能分析[J]. 图书情报工作, 2017, 61(19):66-73.
[9] ( Chen Yuanyuan, Dong Wei. Analysis on the Employment Skills of Library and Information Science Graduates Under the Guidance of Social Needs[J]. Library and Information Service, 2017, 61(19):66-73.)
[10] 赵丹. 网络招聘信息的分析与挖掘[D]. 贵阳: 贵州财经大学, 2017.
[10] ( Zhao Dan. Analysis and Mining of Network Recruitment Information[D]. Guiyang: Guizhou University of Finance and Economics, 2017.)
[11] Mikolov T, Sutskever I, Chen K, et al. Distributed Representations of Words and Phrases and Their Compositionality[OL]. arXiv Preprint, arXiv:1310.4546.
[12] 第四届“泰迪杯”全国数据挖掘挑战赛赛题[EB/OL].(2016-03-29. https://www.tipdm.org/qk/729.jhtml.
[12] (Questions of the 4th “Teddy Cup” National Data Mining Challenge[EB/OL].(2016-03-29. https://www.tipdm.org/qk/729.jhtml. )
[13] 八爪鱼采集器[EB/OL].(2021-07-16). https://www.bazhuayu.com/.
[13] (Bazhuayu Crawler. (2021-07-16). https://www.bazhuayu.com/. )
[14] Blei D M, Ng A Y, Jordan M I. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003, 3:993-1022.
[15] 刘畅. 数据类岗位招聘需求信息研究[D]. 兰州: 兰州财经大学, 2019.
[15] ( Liu Chang. Research on Recruitment Demand Information of Data Job[D]. Lanzhou: Lanzhou University of Finance and Economics, 2019.)
[16] 李轩. 基于知识图谱的教育领域知识问答系统的研究与应用[D]. 长春: 吉林大学, 2019.
[16] ( Li Xuan. Research and Application of Knowledge Question Answering System in Education Based on Knowledge Graph[D]. Changchun: Jilin University, 2019.)
[17] 张文秀, 朱庆华. 领域本体的构建方法研究[J]. 图书与情报, 2011(1):16-19.
[17] ( Zhang Wenxiu, Zhu Qinghua. Research on Construction Methods of Domain Ontology[J]. Library and Information, 2011(1):16-19.)
[18] 张俊峰. 国内网站招聘岗位需求特征挖掘及其应用研究[D]. 蚌埠: 安徽财经大学, 2017.
[18] ( Zhang Junfeng. Research on Demand Characteristics Mining and Application of Domestic Website Recruitment[D]. Bengbu: Anhui University of Finance & Economics, 2017.)
[19] 廖君华, 陈军营, 白如江. 基于引文内容挖掘的科技创新路径识别方法与开源工具研究[J]. 现代情报, 2018, 38(7):113-121.
[19] ( Liao Junhua, Chen Junying, Bai Rujiang. Research on Technology Innovation Path Recognition Method and Open Source Tool Based on Citation Content Mining[J]. Journal of Modern Information, 2018, 38(7):113-121.)
[20] Jieba分词[EB/OL].(2021-07-16). https://github.com/fxsjy/jieba.
[20] (Jieba Segmentation. (2021-07-16). https://github.com/fxsjy/jieba. )
[1] 周云泽, 闵超. 基于LDA模型与共享语义空间的新兴技术识别——以自动驾驶汽车为例*[J]. 数据分析与知识发现, 2022, 6(2/3): 55-66.
[2] 盛姝, 黄奇, 杨洋, 解绮雯, 秦新国. HL7 FHIR框架下中国医疗领域信息交换研究与解决方案[J]. 数据分析与知识发现, 2021, 5(11): 13-28.
[3] 曾桢,李纲,毛进,陈璟浩. 区域公共安全数据治理与业务领域本体研究*[J]. 数据分析与知识发现, 2020, 4(9): 41-55.
[4] 强韶华,罗云鹿,李玉鹏,吴鹏. 基于RBR和CBR的金融事件本体推理研究 *[J]. 数据分析与知识发现, 2019, 3(8): 94-104.
[5] 邓诗琦,洪亮. 面向智能应用的领域本体构建研究*——以反电话诈骗领域为例[J]. 数据分析与知识发现, 2019, 3(7): 73-84.
[6] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[7] 席林娜,窦永香. 基于计划行为理论的微博用户转发行为影响因素研究*[J]. 数据分析与知识发现, 2019, 3(2): 13-20.
[8] 张杰,赵君博,翟东升,孙宁宁. 基于主题模型的微藻生物燃料产业链专利技术分析*[J]. 数据分析与知识发现, 2019, 3(2): 52-64.
[9] 刘俊婉,龙志昕,王菲菲. 基于LDA主题模型与链路预测的新兴主题关联机会发现研究*[J]. 数据分析与知识发现, 2019, 3(1): 104-117.
[10] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[11] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[12] 何有世, 何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[13] 唐慧慧, 王昊, 张紫玄, 王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[14] 庞贝贝, 苟娟琼, 穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[15] 王丽, 邹丽雪, 刘细文. 基于LDA主题模型的文献关联分析及可视化研究[J]. 数据分析与知识发现, 2018, 2(3): 98-106.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn