Advanced Search
 
公 告
作者指南
行业动态
  首页 > 行业动态
Kaggle 通过16 000 份问卷揭示数据科学家平均画像

  近日, Kaggle 官网发布了一份关于数据科学和机器学习的调查报告, 通过分析超过16 000 份相关用户的调查问卷, 给出了数据科学行业从业人员的基本概况, 在工作中使用比较多的方法以及对初入该行业的人的建议。

  该报告的在线网页中包括一些交互式可视化图, 用户可以轻松地找到自己想知道的内容。该报告的主要发现有:

  (1) 数据科学家的平均年龄在30 岁左右, 不同国家之间又略有不同。例如, 印度受访者的平均年龄比澳大利亚受访者要小9 岁。

  (2) 受访者中拥有硕士学位的人占比最高, 但是在薪水最高(15 万美元以上)的人中, 拥有博士学位的人最多。

  (3) 年龄为30 岁, 拥有硕士学位, 年收入约为5.5 万美元的数据科学家处于平均水平。在美国, 机器学习工程师平均工资最高。

  (4) 在实际工作中, 在军事/安全领域, 神经网络方法的应用稍微多一点。除了这两个领域, Logistic 回归是使用频率最高的数据科学方法。

  (5) 虽然Python 从整体上来说或许是最常使用的工具, 但是, 统计学家更多使用R 语言。

  (6) 关系数据是在所有行业(除了学术和军事/安全领域)中最常使用的数据类型, 而学术和军事/安全领域中最常使用的数据类型是文本数据。

  (7) 受访者中使用GitHub 分享代码的人占比最高, 但在大公司(员工人数超过10 000)使用电子邮件等方式分享代码的人更多, 甚少使用云。而小型公司(员工数少于10 人)在云上分享会更灵活。

  (8) 一般来说, 脏数据是在数据科学领域中最常见的问题。此外, 公司政治问题、缺乏管理、缺少财务支持也是最让大家头疼的。

  最后, 报告还对新手数据科学家如何进入这个领域给出了一些来自受访者的建议。

  报告地址详见: https://www.kaggle.com/kaggle/kaggle-survey-2017。除了可以下载完整的报告, 还可以下载完整的匿名数据集。

  (编译自: https://www.kaggle.com/surveys/2017、https://www.leiphone.com/news/201711/jO00VZhAzo7a2zRL.html)

(本刊讯)

发布时间: 2017-12-29   浏览: 807
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn