一种结合借阅时间特征分析的读者兴趣可视化识别方法
李树青1, 王建强2
1南京财经大学信息工程学院 南京 210046
2美国纽约州布法罗大学图书信息研究系 布法罗 14260
摘要

利用用户访问中的时间信息可以增强对用户个性化兴趣特征的识别能力。结合图书馆的图书推荐服务,提出利用读者借阅记录中的时间信息来构造读者个性化模式的方法。首先介绍三个基于读者借阅时间特征分析的扩展时间指标,并对读者阅读兴趣程度的识别方法和读者兴趣时序演变趋势可视化设计两方面内容进行详细说明。最后,对相关测试实验及其改进效果进行必要的说明。

关键词: 个性化; 时间分析; 可视化; 图书推荐服务
A Visualization and Recognition Method of Readers’ Interests with the Analysis of the Characteristics of Borrowing Time
Li Shuqing1, Wang Jianqiang2
1College of Information Engineering, Nanjing University of Finance & Economics, Nanjing 210046, China
2Department of Library and Information Studies, Graduate School of Education, University at Buffalo, The State University of New York, Buffalo 14260, USA
Abstract

The recognition of the characteristics of users’ personalized interests can be enhanced by utilizing of the information in the users’ accessing time. This paper proposes a method of constructing readers’ personalized profiles with the timing information of readers’ borrowing records in book recommendation service of library. This paper begins with the introduction of three extended time indexes based on the analysis of the characteristics of readers’ borrowing time, meantime, it also discusses the recognition of the degree of readers’ interests, and the visualization of timing evolution trend of readers’ interests. Finally, some related experiments that show the performance improvements are reported.

Keyword: Personalization; Time analysis; Visualization; Book recommendation service
1 引 言

图书馆为了提高专业馆员的服务能力,提高包含热门图书推荐和新书推荐在内的图书推荐服务效果,都需要识别读者兴趣来改进和提高服务水平。和其他应用领域相比,图书馆图书推荐服务是一个更加需要个性化服务的重要应用领域,主要原因有两个:

(1)目前图书馆服务的个性化程度依然不高,图书馆个性化技术的应用程度仍然较低[ 1]。文献[2]通过调研
认为即使对于一些诸如EBSCO、ProQuest等大型文献数据库,要满足用户的个性化需求依然还有很长的路要走。这种问题在图书馆的图书推荐服务领域表现依然很明显。

(2)由于图书阅读不同于一般的产品消费和娱乐休闲,大部分读者的借阅行为往往与自身的阅读兴趣和专业背景有非常密切的关系。与网页搜索、产品搜索相比,读者用户所借阅图书的专指性更强,目标性也更明确。因此只有准确了解读者个性化兴趣特征,才能更好地服务于面向图书馆读者用户的图书推荐服务。

2 文献回顾

在很长时间内,人们都是从静态角度来考查用户的兴趣特征,对不同时期的用户兴趣指标都赋予同样的含义。事实上,用户的兴趣具有随着时间的变化而变化的特点。文献[3]开始关注时间敏感(Time-aware)的方法,这些方法往往会对较近时间内用户关注的事物赋予更高的权重。但是,由于推荐客体自身的特点差别,时间变化特征往往显得非常复杂。不同用户对同一产品也会有不同的兴趣演化趋势。因此需要将个性化推荐技术和时间特征分析方法进行结合。目前,相关学者主要从三个方面对结合时间特征分析的个性化推荐方法做了研究。

(1)利用时序分析方法,即测度新旧程度与用户满意度的相关性,往往采用逐步遗忘(Gradual Forgetting)的策略,优先考虑反映用户新兴趣的特征值[ 4]。如文献[5]使用对用户未来偏好预期的准确度权值和数据产生的时间来综合考虑时间因素的影响。文献[4]区分用户购买产品的时间和产品的使用期限,并利用两者的时间差值,结合协同过滤方法以增强用户兴趣的表达效果。文献[5]利用时间函数来增强本体节点类别的时间演变表达能力,这些时间函数可以很好地刻画诸如线性、指数型等演变趋势。如文献[6]使用滑窗(Sliding Window)来分割用户搜索网页的会话过程。文献[7]则认为在一次用户浏览网页的会话中,后期访问网页中的信息更能准确地反映用户的最终兴趣,并以网页在浏览过程的位序来分配不同的权值。

(2)分析用户行为的时间特征。如文献[8]通过分析Twitter用户的发布内容及其发布时间,认为在较早时间发布特定主题的用户往往对该主题拥有更长的关注周期。文献[9]通过引入“时空轨迹(Spatio-Temporal Trajectory)”方法来综合考虑用户访问对象类型和时间顺序,实现一种基于聚类方法的个性化医疗保健门户站点的设计。文献[10]和文献[11]从用户搜索的短期会话行为和长期搜索历史中分析探测用户的个性化兴趣特征。文献[12]通过结合用户搜索行为中的短期行为和长期行为来更为准确地分析用户个性化兴趣特征。文献[13]将从上下文中抽取的时间信息与位置信息结合起来构造决策树以分析用户的兴趣特征。文献[14]发现用户在一天的不同时间段和一周的不同时间,都会呈现明显的规律性查询行为。文献[15]将一天时间细分为工作和休息的不同阶段,并根据不同时间的点击流信息分别设计不同的个性化模式和相应的权值表达,以实现更为准确的个性化推荐效果。

(3)考虑关注时机。相对而言,很少有学者关注个性化服务中的推荐时机问题,事实上,时间越长越能准确地获取用户的个性化兴趣特征,从而更好地服务用户,但是相关的时间滞后性往往导致实际推荐效果越来越差。文献[16]根据用户对展示时间(Presentation Timing)和推荐类型(Recommendation Type)的不同反映及其与两者之间的交互,详细分析了时机问题对用户购买行为的影响,但是仅限于对一次会话中相关产品的分析。

目前,图书馆个性化推荐服务的相关研究主要集中在与数据挖掘和统计分析等相关的领域。其中,利用读者借阅记录是一种常见的研究方法,能很好地识别出用户的个性化兴趣特征,据此可以提供包括图书在内的各种文献推荐服务[ 17]。文献[18]把读者借阅行为分为续借、超期借阅、正常借阅和盲目借阅4种类型,并根据其相对借阅时间计算读者对图书的兴趣度,最终实现了一个基于协同过滤技术的图书推荐系统。文献[19]提出利用建立的读者多兴趣特征库来计算读者兴趣特征的特征词库以及索引库与书籍的相似度,并据此实现了一种可操作性和扩展性较好的混合推荐算法。文献[20]采用显性和隐性相结合方法,将借阅信息与用户注册信息和历史查询信息结合,完成了对读者用户个性化兴趣特征信息的表达。在最新的相关研究中,文献[21]通过图书特征向量来计算图书的相似性,并据此判断与读者特征向量的相似性,设计一个基于多特征的个性化图书推荐算法。但是,结合时序分析的相关研究依然很少。文献[22]提出一种基于序列模式挖掘的读者借阅行为分析方法,通过将借阅事务转化为序列数据库,采用基于PrefixSpan的算法来识别读者借阅行为序列模式。但以上文献较少与个性化服务进行有效结合,利用时间特征信息来改进个性化服务的相关研究则更少。

本文采用的方法主要考虑了时序分析和用户行为的时间特征分析,以期探索出一条利用时间特征分析方法发现读者借阅兴趣特征的新思路,更好地服务于图书推荐应用领域。

3 基于读者借阅时间特征分析的扩展时间指标

本文提出三个结合读者借阅行为分析的扩展时间指标:有效类别借阅相对时长、平均借阅跨期和借阅时间。所有指标都是面向读者个人的借阅记录,以天为基本时间单位,下面分别予以说明:

(1)有效类别借阅相对时长

对于读者感兴趣的图书,借阅时间越长则说明读者兴趣程度越高。笔者注意到,读者在一次借阅行为中如果同时借阅多本同类别的图书,或者在已借某种类别图书并且未还时,又继续借阅了同类别的其他图书,往往能够充分说明读者对该主题非常感兴趣。因此,可以采用对同一类别图书合并考查借阅时长的新思路,即对于某一类别图书而言,如果读者始终保持较高的借阅总时长,那么读者对该类别图书的借阅时长才能更有效地反映读者的主要阅读兴趣。该指标的基本计算方法如下所示:

其中,m表示当前读者所借某一图书类别下图书的总数,n表示当前读者对该类别下某一图书的总借阅次数,periodj表示对该图书的第j次借阅时长,timefirst和timelast表示当前读者借阅某一类别图书最初的时间和最后一次的时间,N表示规范化函数。可以看出,只有所借图书属于在单位时间内借阅总时长较高的图书类别,并且自身被借阅的时长较长,才会获得较大的权值。

(2)平均借阅跨期

所谓借阅跨期是指在一本图书借阅期间,该读者用户共进行了几次完整的对其他图书的借阅和归还行为,其中一天多次的借阅归还行为只算一次。平均借阅跨期是指在当前读者对同一图书的多次借阅中,每次借阅跨期的平均值。考查该指标的主要原因在于影响读者借阅时间的有些因素是客观因素,比如放假或者读者外出一段时间不在学校。该指标的基本计算方法如下所示:

其中,lendingStep表示在对一本图书的某次借阅期间发生的借阅跨期数,lendingCount表示对一本图书总的借阅次数,N表示规范化函数。

(3)借阅新旧程度

它是指一本图书最近一次借阅发生的时间。由于读者兴趣具有随时间变化的现象,时间越近,越能反映读者当前的阅读兴趣特征。该指标的基本计算方法如下所示:

其中,lendingTime表示读者借阅图书的时间,startTime和endTime分别表示整个读者借阅历史记录的最早时间和最近时间,N表示规范化函数。

在上述三个指标中,前两个指标主要考查读者用户行为的时间特征,第三个指标则主要利用了时序分析方法。

4 读者阅读兴趣程度的识别方法

利用上述三个指标,可以对读者的主要阅读兴趣进行多角度的综合查看和分析。主要识别方法有以下两种:.

4.1 图书兴趣识别

上述三个指标值经过使用最大值相除的规范化方法后,可置于三维空间坐标中。显然,权值越大,推荐价值越大,因此X点(1,1,1)是最优点,只需计算每本图书指标权值与最优点的距离即可测度不同图书与读者兴趣的相关度,该值越小,则相关度越高,方法如下所示:

4.2 结合关键词分析的图书类别兴趣识别

(1)图书类别兴趣相似度.

由于识别类别兴趣相似度的关键点在于找出读者对该类别兴趣的最大程度,因此采用计算各个类别下不同读者兴趣权值的最小值来表达,具体如下所示:

其中,typeof表示书所在的类别,booki表示属于bookj所在类别下的每本图书。

(2)图书类别下关键词的识别

本文使用读者所借图书的标题信息获取关键词,使用中国科学院计算技术研究所的中文分词系统ICTCLAS进行分词。为增强关键词表达用户兴趣的有效性,需要在词语兴趣权值和词语辨别力两方面对关键词进行加权处理。

词语兴趣权值采用所属图书的兴趣权值累加值来表达,如下所示:

其中,bookij表示类别j下标题含有当前关键词i的图书,累加可以从图书兴趣权值和词频两个方面综合测度当前关键词的兴趣权值。

对于每个关键词的词语辨别力,则结合同一关键词在不同图书类别下的权值差异进行考虑。对于每一个图书类别的关键词,如果最经常出现在当前类别下而不经常出现在其他类别下,则可以认为该关键词更能够准确地表达当前类别的特征。本文提出的具体权值算法如下所示:

其中,termFrequencyi表示关键词i在所有图书中出现的次数,termFrequencyij表示关键词i在类别j下图书中出现的次数。实验证实,该权值大于0.1即可取得较好的相关词语过滤效果。

根据已有的读者兴趣特征,可以对每次加入推荐列表的图书,逐本计算每本图书与读者兴趣的相似程度,具体方法如下所示:

由于用户最近关注的内容往往构成给读者推荐的主要类型,因此可以采用关键词所在图书的借阅新旧程度值来计算每本图书与用户兴趣的相似度,并以此来替换keywordWeight1,以表达与推荐活动密切相关的最近阅读兴趣,如下所示:

5 实验说明

笔者获取南京财经大学图书馆汇文借阅系统1999年11月到2010年9月共计3 968 305条有效借阅记录作为实验数据,涉及的图书163 947本,几乎涵盖了学校图书馆的所有馆藏书籍;读者70 640名,包括学校教师和数届学生。该系统数据以MARC来表达同一种图书,同一种图书的每一本都具有一个唯一的资源号,每个读者也具有唯一的用户号。

5.1 针对图书的实验结果

实验数据以读者“A023”为例,“A023”是信息工程学院教师,在记录集合中的借阅记录为275条。按照读者兴趣权值由高到低取前10本图书,如表1所示:

表1 读者“A023”具有高指标权值的前10本图书
可以看出,利用该指标得到的排序结果综合考虑各种时间因素,以下对排名靠前的几个记录分别予以说明:

(1)《DSLR数码单反摄影创作与后期修饰》的读者兴趣权值排名最高,主要原因有两个:摄影类图书是该读者借阅历史记录中最近一年(2010年)的主要借阅对象;该类图书拥有最长的借阅持有时间,并在持有期间借阅了大量同类图书。摄影类图书的具体借阅记录如表2所示:

表2 在借阅历史记录中最近一年读者“A023”对摄影类图书的借阅情况

《摄影从入门到提高》是排名第二的摄影类图书,原因与(1)相同。

(2)《JSP高级程序设计》借阅次数排名第二(3次),从借阅记录中可以发现两者几乎是同时被该读者借阅的,但第一次借阅《JSP高级程序设计》的时间段包含了第一次借阅《JSP程序设计》的时间段,因此在有效类别借阅相对时长和平均借阅跨期指标上前者都会高于后者。具体借阅情况如表3所示:

表3 读者“A023”对JSP相关图书的借阅情况
(3)《Oracle9i for Windows 手册》是借阅次数最多的一本图书,但是由于借阅时间久远,最终的读者兴趣权值排名相对降低。

5.2 针对图书类别的实验结果

在读者“A023”最新借阅的三本图书中,有两本与Java编程相关。直接从借阅历史来看,这些介绍较新编程技术的新书难以在有效类别借阅相对时长和平均借阅跨期指标获得较高的权值,因此都没有出现在排名前20的读者兴趣权值表格中。但如果按照这两本书所涉及的类别进行分析,将得到完全不同的结果。它们所属的“TP312”类是“程序语言、算法语言”类别,相关的借阅记录如表4所示:

表4 每年单次借阅持有时间最长的图书及其借阅时间

可以看出,在同一类别“TP312”中,该读者关注的具体编程技术从VB和C++等传统桌面开发语言逐渐转向Java等网络开发语言,并在2008年后逐渐关注JSP及其相关Web框架技术等。每个类别得到按照权值排名的关键词列表,如表5所示:

表5 读者“A023”具有高指标排名的前5个图书类别及其相关关键词主题

为说明方法的有效性,对上述结果作对比分析。如选择类别“TP312”,该类别主要为程序语言和算法语言,直接按照读者借阅图书中关键词出现的频次得到“A023”读者在“TP312”类别下借阅图书关键词的情况,如表6所示:

表6 读者“A023” 在“TP312”类别下借阅图书的前5个相关关键词统计结果

可以看出,除了“JAVA”关键词具有较高的绝对词频外,“VISUAL”和“XML”的词频并没有“C”高。通过结合读者借阅行为和借阅时间,“VISUAL”和“XML” 的权值获得了较大提升,这一点可以从表5得到印证。

5.3 读者兴趣时序演变趋势的可视化呈现方法

基本设计思路是:将有效类别借阅相对时长和平均借阅跨期两个指标分别定义为二维坐标平面上的x点和y点,以窗口左下角点作为原点(0,0);对节点进行权值处理,节点离原点越近,权值越高,越能反映读者的主要阅读兴趣;以月作为借阅时间单位,将利用不同时间点前的历史借阅记录得到的已有图书权值形成在z轴上的不同深度的点,基本界面如图1所示:

图1 查看读者对不同图书类别的兴趣程度

图1右侧列出当前读者所有已借图书的主要类别,并以不同颜色区分,左侧按照三维坐标显示相应图书节点,颜色代表类别,大小代表z轴即时间轴,越小表示借阅时间越久远。从图1中可以看出,红色的图书节点代表“TP(自动化技术、计算机技术)”类别,是当前读者的主要兴趣类型。点击该节点即可看到该类别的下级类别详细信息,如图2所示:

图2 查看读者对某一图书类别下子类别的兴趣程度

图2右侧显示出当前所选类别下的所有子类别,并以不同颜色区分。其中黄色节点(TP312:程序语言、算法语言,主题多为Java编程方面)的数量最多,表明当前读者的主要借阅兴趣;而较近时间内的天蓝色节点(TP393:计算机网络,主题多为网络开发和Web搜索)的有效类别借阅相对时长明显较低而平均借阅跨期则非常高,表明读者的潜在阅读兴趣;而黑色节点(TP301:理论、方法,主题多为信息安全)则具有相对更高的有效类别借阅相对时长和更低的平均借阅跨期,而且借阅时间较为久远。

用户可以通过滑动时间滑钮来观察各个时间点上的读者兴趣模式及其时间演变的趋势。如在图3所示的时间点上,可以注意到该读者有关信息检索相关主题的兴趣呈现从传统读者工作(G252)领域转向情报检索(G354)领域的明显趋势。

图3 查看读者对某一图书类别下子类别的兴趣变化趋势

5.4 用户满意度评测结果分析

最后采用人工评价方法测试该方法的实际有效性和用户满意度。选择10位教师和10位学生用户,由不同测试者独立评价该系统返回的前10本推荐新书。这10本推荐新书已经按照图书和读者的兴趣相似度进行排序,因此要求用户逐次评价前i本(i∈[1,10])的满意度,满意度分为三个级别,3表示最优,1表示最差,最终统计结果如表7所示:

表7 用户评价情况的统计结果
读者用户对新书推荐列表中的图书,呈现较为明显的随着推荐数量增加而满意度逐渐增高而后略有降低的现象,同时全部满意度的平均值为2.605,明显高出满意度平均值,显示出用户非常满意最终的推荐结果。

6 结 语

本文提出的利用读者借阅行为中时间信息来识别用户个性化兴趣特征的方法,主要考虑了时序分析和用户行为的时间特征分析这两个方面,并据此完成了相关的个性化图书推荐实验。不过,该方法仍然存在需要进一步完善的地方,主要有以下两点:增加时机选择问题,能否利用读者借阅历史中所借书籍的相关借阅关系和次序,增强反映读者阅读兴趣信息时间演化的表达能力,初步的设想是将从诸如所在学期、当前时间等外在因素和读者自身内在因素两个角度来进行结合设计;目前选择的实验领域是图书借阅领域,在其他产品购买、商品推荐和网页搜索领域,是否存在一种更为通用的利用时间信息来识别用户个性化兴趣特征的方法。这些都构成了下一阶段主要的研究目标。

参考文献
[1] McLaughlin J E. Personalization in Library Databases: Not Persuasive Enough?[J]. Library Hi Tech, 2011, 294): 605-622. [本文引用:1]
[2] Zand ian F, Riahinia N, Azimi A, et al. An Evaluation of Alert Services: Quantity Versus Quality[J]. Program: Electronic Library and Information Systems, 2010, 441): 5-12. [本文引用:1] [JCR: 0.377]
[3] Lee T Q, Park Y, Park Y T. An Empirical Study on Effectiveness of Temporal Information as Implicit Ratings[J]. Expert Systems with Applications, 2009, 362): 1315-1321. [本文引用:1] [JCR: 1.854]
[4] Liu D R, Shih Y Y. Hybrid Approaches to Product Recommendation Based on Customer Life Time and Purchase Preferences[J]. Journal of Systems and Software, 2005, 772): 181-191. [本文引用:1] [JCR: 1.135]
[5] Ding Y, Li X, Orlowska M E. Recency-based Collaborative Filtering[C]. In: Proceedings of the 17th Australasian Database Conference. 2006: 99-107. [本文引用:1]
[6] Yu J, Gong J, Liu F F. Building Search Context with Sliding Window for Information Seeking[C]. In: Proceedings of the 3rd International Conference on Computer Research and Development. 2011: 274-277. [本文引用:1]
[7] Yu J, Liu F F, Zhao H H. Building User Profile Based on Concept and Relation for Web Personalized Services[C]. In: Proceedings of the International Conference on Innovation and Information Management. 2012: 165-172. [本文引用:1]
[8] Abel F, Gao Q, Houben G J, et al. Analyzing Temporal Dynamics in Twitter Profiles for Personalized Recommendations in the Social Web[C]. In: Proceedings of the 3rd International Conference on Web Science, Koblenz, Germany. 2011: 1-8. [本文引用:1]
[9] Abraham S, Sojan Lal P, Georgeet D. WEBTRACLUS: A Spatio-Temporal Trajectory Clustering Tool for Personalization in Healthcare Web Portals[C]. In: Proceedings of the 4th International Conference on Pervasive Technologies Related to Assistive Environments(PETRA ’11). New York, NY, USA: ACM, 2011: 65-66. [本文引用:1]
[10] White R W, Bennett P N, Dumais S T. Predicting Short-term Interests Using Activity-based Search Context[C]. In: Proceedings of the 19th ACM International Conference on Information and Knowledge Management. 2010: 1009-1018. [本文引用:1]
[11] Sontag D, Collins-Thompson K, Bennett P N, et al. Probabilistic Models for Personalizing Web Search[C]. In: Proceedings of the 5th ACM International Conference on Web Search and Data Mining. 2012: 433-442. [本文引用:1]
[12] Bennett P N, White R W, Chu W, et al. Modeling the Impact of Short-and Long-term Behavior on Search Personalization[C]. In: Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2012: 185-194. [本文引用:1]
[13] Yang D, Nie T Z, Shen D R, et al. Personalized Web Search with User Geographic and Temporal Preferences[C]. In: Proceedings of the 13th Asia-Pacific Web Conference on Web Technologies and Applications. 2011: 95-106. [本文引用:1]
[14] Boughareb D, Farah N. Toward a Web Search Personalization Approach Based on Temporal Context[C]. In: Proceedings of Communications in Computer and Information Science. 2011: 33-44. [本文引用:1]
[15] Dhanalakshmi D, Kousalya R, Saravanan V. Time Based Web User Personalization and Search[J]. International Journal of Computer Applications, 2012, 4623): 11-17. [本文引用:1]
[16] Ho S Y, Bodoff D, Tam K Y. Timing of Adaptive Web Personalization and Its Effects on Online Consumer Behavior[J]. Information Systems Research, 2011, 223): 660-679. [本文引用:1]
[17] 胡蓓蓓. 基于知识决策的数字图书馆个性化推荐[J]. 情报学报, 2007, 263): 448-455. (Hu Beibei. Personalized Recommendation in Digital Library Based on Knowledge Decision-making[J]. Journal of the China Society for Scientific and Technical Information, 2007, 263): 448-455. ) [本文引用:1] [CJCR: 1.1348]
[18] 景民昌, 于迎辉. 基于借阅时间评分的协同图书推荐模型与应用[J]. 图书情报工作, 2012, 563): 117-120. (Jing Minchang, Yu Yinghui. CF Recommending Model Based on Borrowing-time Scores and Its Application[J]. Library and Information Service, 2012, 563): 117-120. ) [本文引用:1] [CJCR: 1.193]
[19] 马健, 杜泽宇, 李树青, 等. 基于多兴趣特征分析的图书馆个性化图书推荐方法[J]. 现代图书情报技术, 20126): 1-8. (Ma Jian, Du Zeyu, Li Shuqing. Personalized Book Recommendation Algorithm Based on Multi-interest Analysis in Library[J]. New Technology of Library and Information Service, 20126): 1-8. ) [本文引用:1] [CJCR: 1.073]
[20] 张炜, 李斌. 基于联机公共查询目录的读者行为挖掘的个性化智能服务系统构建[J]. 情报理论与实践, 2009, 3210): 68-71. (Zhang Wei, Li Bin. Construction of the Individual Intelligent Service System Based on the Mining of Readers’ Behavior in OPAC Database[J]. Information Studies: Theory & Application, 2009, 3210): 68-71. ) [本文引用:1] [CJCR: 1.5]
[21] 李克潮, 梁正友. 基于多特征的个性化图书推荐算法[J]. 计算机工程, 2012, 3811): 34-37. (Li Kechao, Liang Zhengyou. Personalized Book Recommendation Algorithm Based on Multi-feature [J]. Computer Engineering, 2012, 3811): 34-37. ) [本文引用:1] [CJCR: 0.492]
[22] 陈春颖, 熊拥军. 基于序列模式挖掘的读者借阅行为分析[J]. 图书情报知识, 20114): 92-96. (Chen Chunying, Xiong Yongjun. The Analysis of Reader Borrow Behavior Based on Sequential Pattern Mining[J]. Document, Information & Knowledge, 20114): 92-96. ) [本文引用:1] [CJCR: 1.169]