肖奎, 谭顺风, 孙诗婧, 张淼, 李志飞, 张龑, 王时绘
预出版日期: 2026-02-09
[目的]概念先决关系是一种知识之间的依赖关系,它决定着一个领域中知识概念的学习顺序,可用于课程规划、学习路径设计等教育场景。现有方法通常利用图的邻接矩阵聚合每个概念节点的邻居信息,进行先决关系识别。然而,知识概念往往具有长距离依赖性,而现有方法在很大程度上忽略了这一问题。[方法]为解决此问题,本文提出一种基于维基百科的长距离概念先决关系发现方法(LongCPR)。具体而言,本文将维基百科词条标题视为概念,并以概念为节点构建领域的概念引用图和概念导航图,进而分别通过图的邻接矩阵和PPMI矩阵提取概念的短距离和长距离特征,最终实现概念先决关系(特别是长距离先决关系)的准确预测。[结果]LongCPR方法在多个公开数据集上表现均优于基线模型,其中在MOOC数据集中的ROC曲线下面积达到了92.18%,与现有方法相比提高了2.04%。[局限]LongCPR方法主要依赖维基百科知识库的内容,因此对于维基百科中不存在的概念,其先决关系的预测会受到一定的影响。[结论]在三个真实世界数据集上的实验结果表明,本文方法在短距离与长距离概念先决关系预测中优于现有方法。