Advanced Search
  首页 > 行业动态
新手数据科学家常犯的13 个错误

  越来越多的企业需要数据支持其决策, 业界对数据科学家的需求是巨大的, 但数据科学人才短缺。成为一名数据科学家并不容易, 需要解决问题的能力、结构化思维、编码能力等各种技术技能。新手数据科学家常犯的13 个错误如下。

  (1)学习理论概念而不应用它们。使理论和实践达到平衡, 每当学习一个新概念, 请立即找到可以应用的数据集或问题,以便更好地理解理论知识。

  (2)跳过基础知识直接学习机器学习技术。正如房子是一砖一瓦建造的, 数据科学家也是由掌握一个个知识点开始的, 因而需要先夯实相关知识点, 如线性代数、微积分、概率论、统计学。

  (3)完全依靠认证和学位。虽然认证很有价值, 但只有当这些知识应用到实际问题并将其展示出来时才有价值, 因此应该永远保持开放学习的态度。

  (4)误以为机器学习竞赛中看到的是真实现状。竞赛所提供的数据集都是清洗后干净的数据集, 而真实世界里的数据并非如此, “花费70-80%的时间, 收集、清洗数据”是很普遍的。

  (5)注重模型的精度胜过其适用性和可解释性。实际上, 简单的模型要优先于任何复杂的、堆砌的集成模型。

  (6)在简历中使用过多的数据科学术语。以简洁明快的方式展示背景知识及所取得的成就。

  (7)优先考虑该使用的工具和库而不是业务本身要解决的问题。寻找特定领域的数据集并着手处理它们, 将掌握工具和库与领域提出的业务问题结合起来。

  (8)没有花费足够的时间去探索和可视化数据。花时间了解数据集并尝试不同的可视化图表, 能够对要解决的挑战或问题有更为深入的理解。

  (9)缺乏结构化的方法解决问题。没有结构化的思维方式解决问题是随意的, 可以通过简单的培训和严谨的方法获得结构化的思维方式。

  (10)试图一次学习多个工具。工具只是实现数据科学的一种手段而不是最终目标。因此, 选择一个工具并坚持下去, 直到掌握它为止。

  (11)不能坚持学习。数据科学家需要长期的努力和学习。

  (12)远离讨论和竞赛。数据科学需要讨论、思考和头脑风暴, 需要合作并理解其他数据科学家的观点。

  (13)不提升沟通技巧。沟通技巧是最容易被数据科学家低估和忽略的一项能力, 一种实用的方法是向非技术人员解释数据科学术语, 它可以帮助衡量问题阐述的清晰度。

  (编译自: https://www.analyticsvidhya.com/blog/2018/07/13-common-mistakes-aspiring-fresher-data-scientists-make-how-to-avoid-them/)

(本刊讯)

发布时间: 2018-09-10   浏览: 8012
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn