Data Science Curriculums Around the World: An Empirical Study
Chao Lemen1,2(), Yang Canjun2, Wang Shengjie2, Zhao Junpeng2, Xu Mengtian2
1Key Laboratory of Data Engineering and Knowledge Engineering (Renmin University of China), Beijing 100872, China 2School of Information Resource Management, Renmin University of China, Beijing 100872, China
[Objective] This paper identifies the common features of existing Data Science curriculums around the world. It also addresses the main challenges facing these courses as well as possible solutions. [Methods] We conducted an empirical study with the help of text analysis techniques to examine the data science curriculums from China and abroad. [Results] We found common features of the retrieved curriculums and the differences between them and other related courses. [Limitations] Our study focused on the curriculum issues, therefore, more research is needed to discuss data science as a discipline. [Conclusions] This paper addresses the top ten key challenges facing data science curriculum and then proposes some solutions.
Introduction to Computational Thinking and Data Science (edx)
2016
网授
麻省理工学院(MIT)
Eric Grimson等
不限
Process Mining: The Practice of Data Science (Coursea)
2016
网授
埃因霍芬理工大学
Wil van der Aalst
硕士
Data Science
2016
面授
法国圣艾蒂安大学
Marc Sebban
不限
Fundamentals of Data Science
2017
面授
牛津大学
Julian Gallop
不限
数据科学
2017
面授
中国人民大学
朝乐门
不限
Data Science
不详
面授
伦敦大学
Aysha Chaudhary
数据相关/硕士
数据科学的课程调研
数据科学的课程链
对比项目
数据工程师
数据科学家
工作重点
数据的管理
基于数据的管理/决策
基本素质
工程化/标准化/ 规范化做事能力
批判性思考、问题 意识与创造力
领域差异性
领域共性较高, 领域依赖度较低
领域差异性明显, 领域依赖度较低
数据科学家与数据工程师的区别
开设课程 和学校
A Practical Approach to Data Science 哈佛大学
Intro to Data Science 华盛顿大学
Intro to Data Science Udacity平台
A Crash Course in Data Science 约翰·霍普金斯大学
Introduction to Data Science 哥伦比亚大学
Fundamentals of Data Science 牛津大学
基础理论
√
√
√
√
√
√
数据加工
√
√
√
√
√
√
统计学
√
√
×
√
√
√
机器学习
×
√
×
√
√
×
数据可视化
√
√
√
×
×
×
数据管理
√
√
×
×
√
√
数据计算
√
√
√
×
√
×
数据分析
√
√
√
×
√
√
数据科学工具
√
√
√
√
√
√
典型数据科学课程的对比分析
对比项目
专业数据科学家
专业中的数据科学家
成长过程
起点并非领域专家, 通过学习数据科学课程直接成长为数据 科学家
先已成为领域专家, 然后通过学习数据科学课程逐渐成为数据科学家
知识广度(数据科学)
较小(仅限于数据科学)
较大(不仅掌握领域知识, 而且还掌握数据科学)
知识深度(数据科学)
较深
较高
角色定位
指导、组织、管理、监督、评价专业中的数据科学家
配合与支持专业数据科学家
相关课程(举例)
华盛顿大学的《Intro to Data Science》; 哈佛大学的《A Practical Approach to Data Science》; 中国人民大学的《数据科学》
哥伦比亚大学的《Introduction to Data Science》; 大数据科学与应用系列讲座
数据科学家的差异性
数据科学的知识体系[14]
序号
设计原则
应该
不应该
1
最终目标
培养数据科学家
培养数据工程师/ 数据管理员
2
主要特色
侧重数据科学的 基础理论
侧重数据科学的 理论基础
3
首要任务
培育兴趣与自学能力
讲解数据科学的 全部理论
4
基本前提
统筹数据科学课程链
脱离于相关课程 的独立设计
数据科学课程设计的四项基本原则
数据科学课程的目标群体
数据科学课程的专业差异性
数据科学课程建设中的瓶颈
数据科学课程的学科定位
数据科学课程与数据科学专业的区别与联系
[1]
Baumer B.A Data Science Course for Undergraduates: Thinking with Data[J]. The American Statistician, 2015, 69(4): 334-342.
doi: 10.1080/00031305.2015.1081105
[2]
Paisley J. Machine Learning for Data Science [OL]. [2016- 09-25]. .
[3]
Grimson E.Introduction to Computational Thinking and Data Science [OL]. [2016-08-25]..
[4]
D’Alessandro B. Intro to Data Science [OL]. [2016-08-25]. .
[5]
Pozdnukhov A. Data Science for Smart Cities [OL]. [2016- 08-25]. .
[6]
Mata-Toledo R A. A Practical Approach to Data Science [OL].[2016-08-25]. .
[7]
Anscombe F J.Graphs in Statistical Analysis[J]. The American Statistician, 1973, 27(1): 17-21.
[8]
Schutt R, O’Neil C. Doing Data Science: Straight Talk from the Frontline[M]. O’Reilly Media, Inc., 2013.
[9]
Zumel N, Mount J, Porzak J.Practical Data Science with R[M]. Manning Publications, 2014.
[10]
Holtz D.Introduction to Data Science [OL]. [2016-08-26]..
[11]
Microsoft. NUS and Microsoft Collaborate on Data Science Education and Research [OL].[2016-09-28]. .
[12]
Howe B, Franklin M J, Freire J, et al.Should We All be Teaching intro to Data Science Instead of Intro to Databases[C]//Proceedings of the 2014 ACM SIGMOD International Conference on Management of Data. ACM, 2014: 917-918.
[13]
朝乐门. 数据科学[M]. 北京: 清华大学出版社, 2016: 41-42.
[13]
(Chaolemen Borjigin.Data Science [M]. Beijing: Tsinghua University Press, 2016: 41-42.)
[14]
朝乐门. 数据科学理论与实践[M]. 北京: 清华大学出版社, 2017: 15.
[14]
(Chaolemen Borjigin.Data Science: Theory and Practice [M]. Beijing: Tsinghua University Press, 2017: 15.)