基于大数据岗位需求的文本聚类研究*
刘睿伦, 叶文豪, 高瑞卿, 唐梦嘉, 王东波

Research on Text Clustering Based on Requirements of Big Data Jobs
Liu Ruilun,Ye Wenhao,Gao Ruiqing,Tang Mengjia,Wang Dongbo
表3 参与聚类的关键词词频
序号 关键词 频次 序号 关键词 频次
1 本科及以上 1 529 16 良好的沟通能力 416
2 计算机相关专业 1 434 17 责任心强 371
3 有经验者优先 1 408 18 excel 368
4 数据库 1 131 19 数据仓库 367
5 数据挖掘 874 20 办公软件 359
6 统计学 868 21 团队合作精神 357
7 三年以上 723 22 业务需求 351
8 二年以上 564 23 机器学习 349
9 一年以上 551 24 hadoop 341
10 相关工作经验 538 25 独立完成 340
11 数据库工程师 518 26 对数据敏感 330
12 大数据 466 27 学习能力 324
13 逻辑思维能力 428 28 大专及以上 306
14 沟通能力 422 29 数据处理 296
15 开发经验 417 30 逻辑分析能力 295