Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (4): 67-75     https://doi.org/10.11925/infotech.2096-3467.2017.04.08
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
一种基于滑动窗口模型的MOOCs辍学率预测方法*
卢晓航1, 王胜清2(), 黄俊杰1, 陈文广1, 闫增旺1
1北京大学信息管理系 北京 100871
2北京大学教师教学发展中心 北京 100871
Predicting Dropout Rates of MOOCs with Sliding Window Model
Lu Xiaohang1, Wang Shengqing2(), Huang Junjie1, Chen Wenguang1, Yan Zengwang1
1Department of Information Management, Peking University, Beijing 100871, China
2Center of Faculty Development, Peking University, Beijing 100871, China
全文: PDF (3345 KB)   HTML ( 2
输出: BibTeX | EndNote (RIS)      
摘要 

目的】通过北京大学在Coursera平台上运行的课程数据, 对学生的辍学行为进行研究, 以期预测学生的辍学点和辍学行为, 改建教学慕课质量和方法。【方法】在课程数据基础上, 提取19个特征, 使用机器学习算法构建滑动窗口模型, 动态预测学习者辍学率。【结果】模型预测准确率高, 普遍在90%以上, 效果稳定, 支持向量机(SVM)和长短记忆网络(LSTM)方法建模效果更好。【局限】课程数据选课人数偏多, 没有考虑其他课程数据稀疏问题, 模型的可移植性仍需要进一步考虑。【结论】使用滑动窗口模型建模, 能够帮助MOOC课程教师和设计者动态地追踪课程学习者辍学行为, 准确率高, 可以帮助教师通过快速的反馈来调整课程, 降低辍学率。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
卢晓航
王胜清
黄俊杰
陈文广
闫增旺
关键词 MOOC辍学点辍学率滑动窗口模型辍学预测    
Abstract

[Objective] This paper aims to improve the MOOCs curriculum quality and pedagogy by analyzing the dropout behaviors with data from the MOOC of Peking University on Coursera. [Methods] We extracted 19 major features from the logs and then constructed a siding window model to predict the dropout rates. [Results] The precision of the proposed model was maintained above 90%. The SVM and LSTM methods further improved the performance of the proposed model. [Limitations] The new method needs to be examined with smaller sized courses. [Conclusions] Predicting dropout rates could help us improve the course quality effectively.

Key wordsMOOC    Dropout Point    Dropout Rates    Sliding Window Model    Dropout Prediction
收稿日期: 2017-02-27      出版日期: 2017-05-24
ZTFLH:  G434  
基金资助:* 本文系教育部在线教育研究中心教育基金(全通教育)重点项目“慕课在线教学组织方法实证研究”(项目编号: 2016ZD301)的研究成果之一
引用本文:   
卢晓航, 王胜清, 黄俊杰, 陈文广, 闫增旺. 一种基于滑动窗口模型的MOOCs辍学率预测方法*[J]. 数据分析与知识发现, 2017, 1(4): 67-75.
Lu Xiaohang,Wang Shengqing,Huang Junjie,Chen Wenguang,Yan Zengwang. Predicting Dropout Rates of MOOCs with Sliding Window Model. Data Analysis and Knowledge Discovery, 2017, 1(4): 67-75.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.04.08      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I4/67
课程ID 课程名 注册人数 记录有成绩 最终成绩大于0 最终成绩大于60 通过比例(%)
methodologysocial2-001 社会调查与研究方法(下) 3 566 3 184 371 185 5.1879
methodologysocial-001 社会调查与研究方法(上) 7 836 6 051 6 051 255 3.2542
pkubioinfo-002 2014生物信息学002 16 714 15 790 1 268 510 3.0513
pkubioinfo-001 2013生物信息学001 18 367 18 367 1 620 520 2.8312
pkubioinfo-003 生物信息学-导论与方法 16 958 16 072 909 360 2.1229
  课程注册人数与通过比例
课程ID 有论坛
行为
成绩
大于60
有论坛行为且
成绩大于60
有论坛行为在有成绩
学习者中占比(%)
有论坛行为在成绩大于60
的学习者中的占比(%)
pkubioinfo-001 2 645 580 511 68.3333 88.1034
pkubioinfo-002 1 425 508 395 54.5741 77.7559
pkubioinfo-003 1 523 358 316 66.9967 88.2682
methodologysocial-001 1 165 290 269 17.8318 92.7586
methodologysocial2-001 326 203 153 64.4205 75.3695
  有学习成绩与有论坛行为重合率统计
特征 字段 数据类型 备注
点击流 page_view
page_view_quiz
page_view_forum
page_view_lecture
page_view_wiki
viedo_view_times
video_pause_times
video_pause_speed
Int
Int
Int
Int
Int
Int
Int
Float
查看网页
查看测试页面
查看论坛页面
查看视频页面
观看课程wiki
观看视频次数
视频暂停次数
播放速率
作业测试 try_hw
try_quiz
try_lec
Int
Int
Int
尝试作业次数
尝试小测次数
尝试讲座次数
论坛行为 view_forum
thread_forum
post_thread
post_comments
Upvote
Downvote
add_tag
del_tag
Int
Int
Int
Int
Int
Int
Int
Int
查看论坛
查看线程
创建线程
发表评论
点赞
反对
增加标签
删除标签
  提取特征列表
  课程开始结束时间示意
  课程在线学习人数变动示意图
  课程辍学人数变动示意图
  开始点及辍学点关系
  滑动窗口示意
  各个模型在5门课程上的预测准确率(w1=3, w2=1)
  各个模型在5门课程上的预测准确率(w1=3, w2=3)
[1] Amnueypornsakul B, Bhat S, Chinprutthiwong P.Predicting Attrition Along the Way: The UIUC Model[C]// Proceedings of the EMNLP 2014 Workshop on Analysis of Large Scale Social Interaction in MOOCs, Doha, Qatar. Association for Computational Linguistics, 2014: 55-59.
[2] Sinha T, Jermann P, Li N, et al. Your Click Decides Your Fate: Inferring Information Processing and Attrition Behavior from MOOC Video Clickstream Interactions[OL]. arXiv Preprint. arXiv:1407.7131, 2014.
[3] Taylor C, Veeramachaneni K, O’Reilly U M. Likely to Stop? Predicting Stopout in Massive Open Online Courses[OL]. arXiv Preprint. arXiv:1408.3382, 2014.
[4] Kloft M, Stiehler F, Zheng Z, et al.Predicting MOOC Dropout over Weeks Using Machine Learning Methods[C]// Proceedings of the EMNLP 2014 Workshop on Analysis of Large Scale Social Interaction in MOOCs, Doha, Qatar. Association for Computational Linguistics, 2014.
[5] Sharkey M, Sanders R.A Process for Predicting MOOC Attrition[C]//Proceedings of the EMNLP 2014 Workshop on Analysis of Large Scale Social Interaction in MOOCs,Doha, Qatar. Association for Computational Linguistics, 2014: 50-54.
[6] Yang D, Sinha T, Adamson D, et al.“Turn on, Tune in, Drop out”: Anticipating Student Dropouts in Massive Open Online Courses[C]//Proceedings of the 2013 NIPS Data-driven Education Workshop. 2013: 11-14.
[7] Lipsitz S R.Categorical Data Analysis[J]. Statistics in Medicine, 1992, 13(11): 1791-1792.
[8] Cortes C, Vapnik V.Support-Vector Networks[J]. Machine Learning, 1995, 20(3): 273-297.
[9] Rosenblatt F.Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms[J]. American Journal of Psychology, 1962, 7(3): 218-219.
[10] Hochreiter S, Schmidhuber J.Long Short-Term Memory[J]. Neural Computation, 1997, 9(8): 1-32.
[1] 蔡永明,刘璐,王科唯. 网络虚拟学习社区重要用户与核心主题联合分析*[J]. 数据分析与知识发现, 2020, 4(6): 69-79.
[2] 胡德华, 任磊, 车丹. 国家精品课程网上资源用户满意度评价模型构建[J]. 现代图书情报技术, 2013, 29(1): 75-82.
[3] 李嘉, 张朋柱, 李欣苗, Jihie Kim. 一种通过挖掘研讨记录来促进学生思考的在线督导系统[J]. 现代图书情报技术, 2012, 28(4): 10-16.
[4] 王满,徐朝军. 网络课程资源自动量化评价研究*[J]. 现代图书情报技术, 2010, 26(1): 88-93.
[5] 罗立群,张慰,陈金鑫. 基础教育黄页网站自动生成系统的设计与实现[J]. 现代图书情报技术, 2007, 2(8): 80-83.
[6] 陆国平,龚岚. 基于C/S结构的硕士研究生招生管理系统的设计与实现[J]. 现代图书情报技术, 2005, 21(4): 72-76.
[7] 王永丽,王伟,沈秀丽. “信息检索与利用”网络课程辅助系统——智能测试系统的设计*[J]. 现代图书情报技术, 2004, 20(4): 75-77.
[8] 周文芳,范丰龙. 基于UDP数据组播的网络教室程序的设计和实现[J]. 现代图书情报技术, 2004, 20(2): 84-86.
[9] 梁红. 流媒体技术在文献检索课网络教学中的应用[J]. 现代图书情报技术, 2003, 19(4): 87-90.
[10] 黄晴珊. 基于Authorware网络信息检索多媒体CAI课件的开发*[J]. 现代图书情报技术, 2003, 19(1): 79-81.
[11] 李红,田义梅. “文献检索与利用”课件设计[J]. 现代图书情报技术, 2002, 18(6): 82-83.
[12] 赖荣. 在基于NT的教学网上拓展模拟Internet服务[J]. 现代图书情报技术, 2001, 17(1): 62-64.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn