Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (6): 12-21     https://doi.org/10.11925/infotech.2096-3467.2017.06.02
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
全球数据科学课程建设现状的实证分析*
朝乐门1,2(), 杨灿军2, 王盛杰2, 赵俊鹏2, 许梦甜2
1数据工程与知识工程教育部重点实验室(中国人民大学) 北京 100872
2中国人民大学信息资源管理学院 北京 100872
Data Science Curriculums Around the World: An Empirical Study
Chao Lemen1,2(), Yang Canjun2, Wang Shengjie2, Zhao Junpeng2, Xu Mengtian2
1Key Laboratory of Data Engineering and Knowledge Engineering (Renmin University of China), Beijing 100872, China
2School of Information Resource Management, Renmin University of China, Beijing 100872, China
全文: PDF (1280 KB)   HTML ( 4
输出: BibTeX | EndNote (RIS)      
摘要 

目的】在调查分析全球数据科学课程建设现状的基础上, 提出数据科学课程的共性特点、主要挑战及解决对策。【方法】采用实证研究方法和内容分析方法调查分析国内外数据科学课程的建设现状、成功经验与存在问题。【结果】提炼出全球数据科学课程的共性以及数据科学与其他相关课程之间的差异性。【局限】对数据科学人才培养的讨论主要聚焦于课程建设层面, 而对专业层面的讨论不多。【结论】本文提出数据科学课程建设中的10个核心问题及其解决方案。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
朝乐门
杨灿军
王盛杰
赵俊鹏
许梦甜
关键词 数据科学大数据课程设计    
Abstract

[Objective] This paper identifies the common features of existing Data Science curriculums around the world. It also addresses the main challenges facing these courses as well as possible solutions. [Methods] We conducted an empirical study with the help of text analysis techniques to examine the data science curriculums from China and abroad. [Results] We found common features of the retrieved curriculums and the differences between them and other related courses. [Limitations] Our study focused on the curriculum issues, therefore, more research is needed to discuss data science as a discipline. [Conclusions] This paper addresses the top ten key challenges facing data science curriculum and then proposes some solutions.

Key wordsData Science    Big Data    Curriculum Design
收稿日期: 2017-06-12      出版日期: 2017-08-25
ZTFLH:  TP393  
基金资助:*本文系国家社会科学基金项目“数据连续性的实现方法与保障机制研究”(项目编号: 15BTQ054)的研究成果之一
引用本文:   
朝乐门, 杨灿军, 王盛杰, 赵俊鹏, 许梦甜. 全球数据科学课程建设现状的实证分析*[J]. 数据分析与知识发现, 2017, 1(6): 12-21.
Chao Lemen,Yang Canjun,Wang Shengjie,Zhao Junpeng,Xu Mengtian. Data Science Curriculums Around the World: An Empirical Study. Data Analysis and Knowledge Discovery, 2017, 1(6): 12-21.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.06.02      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I6/12
课程名称 年份 形式 学校 开课教师 选课要求
Data Science: Large-scale Advanced Data
Analysis
2011 面授 佛罗里达大学 Daisy Zhe Wang 硕士
Data Science and Analytics Thought Leaders 2012 面授 加州大学伯克利分校 Ram Akella等 不限
Introduction to Data Science 2012 面授 哥伦比亚大学 Rachel Schutt 不限
Introduction to Data Science 2013 面授 谢菲尔德大学 Paul Clough 数据相关/硕士
Data Science(Coursea) 2014 网授 约翰·霍普金斯大学 Roger D. Peng等 不限
Executive Data Science(Coursea) 2014 网授 约翰·霍普金斯大学 Roger D. Peng等 不限
Data Science at Scale (Coursea) 2014 网授 华盛顿大学 Bill Howe 不限
Data Science 2014 面授 哈佛大学 Rafael Irizarry等 本科
Intro to Data Science 2014 面授 纽约大学 Brian D’Alessandro 不限
大数据科学与应用系列讲座(MOOC学院) 2015 网授 清华大学 李军 不限
Foundations of Data Science 2015 面授 加州大学伯克利分校 John DeNero 不限
Data Sciences Basic 2015 面授 美国东北大学 Akira Suzuki 不限
Fundamentals of Data Science 2015 面授 慕尼黑大学 Goeran Kauermann 统计与科学相关
A Practical Approach to Data Science 2016 面/网授 哈佛大学 Ramon Mata-Toledo 不限
Introduction to Computational Thinking and
Data Science (edx)
2016 网授 麻省理工学院(MIT) Eric Grimson等 不限
Process Mining: The Practice of
Data Science (Coursea)
2016 网授 埃因霍芬理工大学 Wil van der Aalst 硕士
Data Science 2016 面授 法国圣艾蒂安大学 Marc Sebban 不限
Fundamentals of Data Science 2017 面授 牛津大学 Julian Gallop 不限
数据科学 2017 面授 中国人民大学 朝乐门 不限
Data Science 不详 面授 伦敦大学 Aysha Chaudhary 数据相关/硕士
  数据科学的课程调研
  数据科学的课程链
对比项目 数据工程师 数据科学家
工作重点 数据的管理 基于数据的管理/决策
基本素质 工程化/标准化/
规范化做事能力
批判性思考、问题
意识与创造力
领域差异性 领域共性较高,
领域依赖度较低
领域差异性明显,
领域依赖度较低
  数据科学家与数据工程师的区别
开设课程
和学校
A Practical Approach to Data Science
哈佛大学
Intro to Data Science
华盛顿大学
Intro to Data Science
Udacity平台
A Crash Course in Data Science
约翰·霍普金斯大学
Introduction to Data Science
哥伦比亚大学
Fundamentals of Data Science
牛津大学
基础理论
数据加工
统计学 ×
机器学习 × × ×
数据可视化 × × ×
数据管理 × ×
数据计算 × ×
数据分析 ×
数据科学工具
  典型数据科学课程的对比分析
对比项目 专业数据科学家 专业中的数据科学家
成长过程 起点并非领域专家, 通过学习数据科学课程直接成长为数据
科学家
先已成为领域专家, 然后通过学习数据科学课程逐渐成为数据科学家
知识广度(数据科学) 较小(仅限于数据科学) 较大(不仅掌握领域知识, 而且还掌握数据科学)
知识深度(数据科学) 较深 较高
角色定位 指导、组织、管理、监督、评价专业中的数据科学家 配合与支持专业数据科学家
相关课程(举例) 华盛顿大学的《Intro to Data Science》; 哈佛大学的《A Practical
Approach to Data Science》; 中国人民大学的《数据科学》
哥伦比亚大学的《Introduction to Data Science》;
大数据科学与应用系列讲座
  数据科学家的差异性
  数据科学的知识体系[14]
序号 设计原则 应该 不应该
1 最终目标 培养数据科学家 培养数据工程师/
数据管理员
2 主要特色 侧重数据科学的
基础理论
侧重数据科学的
理论基础
3 首要任务 培育兴趣与自学能力 讲解数据科学的
全部理论
4 基本前提 统筹数据科学课程链 脱离于相关课程
的独立设计
  数据科学课程设计的四项基本原则
  数据科学课程的目标群体
  数据科学课程的专业差异性
  数据科学课程建设中的瓶颈
  数据科学课程的学科定位
  数据科学课程与数据科学专业的区别与联系
[1] Baumer B.A Data Science Course for Undergraduates: Thinking with Data[J]. The American Statistician, 2015, 69(4): 334-342.
doi: 10.1080/00031305.2015.1081105
[2] Paisley J. Machine Learning for Data Science [OL]. [2016- 09-25]. .
[3] Grimson E.Introduction to Computational Thinking and Data Science [OL]. [2016-08-25]..
[4] D’Alessandro B. Intro to Data Science [OL]. [2016-08-25]. .
[5] Pozdnukhov A. Data Science for Smart Cities [OL]. [2016- 08-25]. .
[6] Mata-Toledo R A. A Practical Approach to Data Science [OL].[2016-08-25]. .
[7] Anscombe F J.Graphs in Statistical Analysis[J]. The American Statistician, 1973, 27(1): 17-21.
[8] Schutt R, O’Neil C. Doing Data Science: Straight Talk from the Frontline[M]. O’Reilly Media, Inc., 2013.
[9] Zumel N, Mount J, Porzak J.Practical Data Science with R[M]. Manning Publications, 2014.
[10] Holtz D.Introduction to Data Science [OL]. [2016-08-26]..
[11] Microsoft. NUS and Microsoft Collaborate on Data Science Education and Research [OL].[2016-09-28]. .
[12] Howe B, Franklin M J, Freire J, et al.Should We All be Teaching intro to Data Science Instead of Intro to Databases[C]//Proceedings of the 2014 ACM SIGMOD International Conference on Management of Data. ACM, 2014: 917-918.
[13] 朝乐门. 数据科学[M]. 北京: 清华大学出版社, 2016: 41-42.
[13] (Chaolemen Borjigin.Data Science [M]. Beijing: Tsinghua University Press, 2016: 41-42.)
[14] 朝乐门. 数据科学理论与实践[M]. 北京: 清华大学出版社, 2017: 15.
[14] (Chaolemen Borjigin.Data Science: Theory and Practice [M]. Beijing: Tsinghua University Press, 2017: 15.)
[1] 邱尔丽,何鸿魏,易成岐,李慧颖. 基于字符级CNN技术的公共政策网民支持度研究 *[J]. 数据分析与知识发现, 2020, 4(7): 28-37.
[2] 王建冬,于施洋. 构建国家经济大脑的实践探索与初步设想 *[J]. 数据分析与知识发现, 2020, 4(7): 2-17.
[3] 王建冬. 大数据在经济监测预测研究中的应用进展*[J]. 数据分析与知识发现, 2020, 4(1): 12-26.
[4] 孔贝贝,谢靖,钱力,常志军,吴振新. 科技大数据增值丰富化方法研究与工具研发 *[J]. 数据分析与知识发现, 2019, 3(7): 113-122.
[5] 董晓舟,陈信康. 电子折扣券弹性与经济效益的关系研究 ——一个基于电商平台大数据的混合模型[J]. 数据分析与知识发现, 2019, 3(6): 42-49.
[6] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[7] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[8] 钱力,谢靖,常志军,吴振新,张冬荣. 基于科技大数据的智能知识服务体系研究设计*[J]. 数据分析与知识发现, 2019, 3(1): 4-14.
[9] 胡吉颖,谢靖,钱力,付常雷. 基于知识图谱的科技大数据知识发现平台建设*[J]. 数据分析与知识发现, 2019, 3(1): 55-62.
[10] 谢靖,钱力,师洪波,孔贝贝,胡吉颖. 科研学术大数据的精准服务架构设计*[J]. 数据分析与知识发现, 2019, 3(1): 63-71.
[11] 沈志宏,姚畅,侯艳飞,吴林寰,李跃鹏. 关联大数据管理技术: 挑战、对策与实践*[J]. 数据分析与知识发现, 2018, 2(1): 9-20.
[12] 申雪锋, 柯永振, 姚楠. 多视图合作的联盟数据可视化分析[J]. 数据分析与知识发现, 2017, 1(3): 21-28.
[13] 刘睿伦, 叶文豪, 高瑞卿, 唐梦嘉, 王东波. 基于大数据岗位需求的文本聚类研究*[J]. 数据分析与知识发现, 2017, 1(12): 32-40.
[14] 岑咏华,王曰芬. 大数据环境下社会舆情分析与决策支持的研究视角和关键问题*[J]. 现代图书情报技术, 2016, 32(7-8): 3-11.
[15] 杨爱东,刘东苏. 基于Hadoop的微博舆情监控系统模型研究[J]. 现代图书情报技术, 2016, 32(5): 56-63.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn