Advanced Search

数据分析与知识发现  2017 , 1 (12): 49-62 https://doi.org/10.11925/infotech.2096-3467.2017.0786

研究论文

图书馆数字资源聚合质量预测模型构建*——基于改进遗传算法和BP神经网络

闫晶12, 毕强1, 李洁1, 王福1

1吉林大学管理学院 长春 130022
2东北电力大学经济管理学院 吉林 132012

Construction of Aggregation Quality Predicting Model for Digital Resource in Library ——Based on Improved Genetic Algorithm and BP Neural Network

Yan Jing12, Bi Qiang1, Li Jie1, Wang Fu1

1School of Management, Jilin University, Changchun 130022, China
2School of Economic Management, Northeast Electric Power University, Jilin 132012, China

中图分类号:  G25 TP393

通讯作者:  通讯作者: 闫晶, ORCID: 0000-0003-2637-5831, E-mail: 39262832@qq.com

收稿日期: 2017-08-8

修回日期:  2017-10-10

网络出版日期:  2017-12-25

版权声明:  2017 《数据分析与知识发现》编辑部 《数据分析与知识发现》编辑部

基金资助:  *本文系国家自然科学基金项目“语义网络环境下数字资源多维度聚合与可视化研究”(项目编号: 71273111)的研究成果之一

展开

摘要

目的】针对图书馆数字资源聚合质量评价要求, 基于遗传算法对BP神经网络进行改进, 进而构建更为优化的图书馆数字资源聚合质量预测模型。【方法】利用遗传算法计算简单、对待求解问题依赖小、并发线程计算速度快等优点, 通过广义海明距离定义种群提高种群多样性, 进行种群选择、交叉、变异操作, 求解初始权重和阈值; 将改进的遗传算法引入BP神经网络, 通过权重和阈值的不断调整, 快速收敛至适应度设定值, 最终实现预测结果的进一步优化。【结果】采用MATLAB R2014a平台进行仿真实验, 预测结果平均误差2.74E-04, 同实际数据误差小, 模型精度较高。程序运行总时长18.56秒, 且三步就收敛到误差目标, 模型收敛速度快, 相较单一的遗传算法和BP算法具有更高的预测精度和效率。【局限】样本数据质量有待提高; 实验中未采用Train的其他快速训练函数进行训练时间和预测精度对比; 种群数量因计算复杂性而受限。【结论】模型能够对图书馆数字资源聚合质量做出高效、客观预测, 应用前景和延展性较好, 能有效运用于图书馆数字资源聚合质量评价结果检验、大样本评价以及大样本预测领域。

关键词: 数字资源 ; 聚合质量 ; 模型构建 ; 遗传算法 ; BP神经网络

Abstract

[Objective] This paper proposes a model to predict the quality of library digital resource aggregation with the help of improved BP neural network based on genetic algorithm. [Methods] The genetic algorithm is simple in computing, less dependent on the problems to be solved, and could quickly calculate concurrent threads. First, we obtained the initial weight and threshold with increased population diversity,selection, crossover and variation. Second, we introduced the improved genetic algorithm to the BP neural network, which rapidly reached the fitness setting level by constantly adjusting the weight and threshold values. Finally, we further optimized the performance of the prediction model. [Results] We used MATLAB R2014a platform to examine the proposed model and the average number of prediction errors was 2.74E-04, which was smaller than the actual data. It took the program 18.56 seconds or three steps to finish the task. The prediction accuracy and efficiency of the proposed model was better than the single genetic or BP algorithms. [Limitations] The quality of sample data needs to be improved. We did not compare our training time and prediction accuracy with those of other quick training functions. The population numbers are limited due to computational complexity. [Conclusions] The proposed model could predict the quality of digital resource aggregation efficiently and objectively.

Keywords: Digital Resource ; Aggregation Quality ; Model Construction ; Genetic Algorithm ; BP Neural Network

0

PDF (1280KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

闫晶, 毕强, 李洁, 王福. 图书馆数字资源聚合质量预测模型构建*——基于改进遗传算法和BP神经网络[J]. 数据分析与知识发现, 2017, 1(12): 49-62 https://doi.org/10.11925/infotech.2096-3467.2017.0786

Yan Jing, Bi Qiang, Li Jie, Wang Fu. Construction of Aggregation Quality Predicting Model for Digital Resource in Library ——Based on Improved Genetic Algorithm and BP Neural Network[J]. Data Analysis and Knowledge Discovery, 2017, 1(12): 49-62 https://doi.org/10.11925/infotech.2096-3467.2017.0786

1 引 言

随着云存储、大数据、物联网技术的发展, 数字图书馆资源数量急剧攀升, 导致数字图书馆数据体量更大、数据结构更加复杂。同时, 数字图书馆用户来源多样、多元化一站式检索和个性精准化知识需求高。在数字图书馆资源和用户均发生较大变化的现实情境下, 国内外学者更多聚焦于通过资源聚合等技术手段展开数字图书馆资源质量理论研究[1], 而基于技术视角采用建模方式对图书馆数字资源聚合质量进行预测, 则除了具有一定的理论创新价值, 还能从操作层面有效地指引数字图书馆资源建设, 最终切实地提高用户满意度。

目前国内外学者对图书馆质量的相关研究主要集中在资源质量、服务质量评价方面, 从研究方法上看, 大多学者主要采用模糊综合评价法、层次分析法、数学运算评价和预测, 也有少部分学者基于BP神经网络或遗传算法展开预测研究。国外学者Garibay等[2]提出质量功能展开(QFD)-卡诺模型评价数字图书馆服务质量; Heradio等[3]采用模糊语言建模方式从用户视角对数字图书馆功能质量进行评价。国内学者贾洁等[4]基于BP神经网络构建模型, 对图书馆电子资源质量进行预测; 张秀华等[5]基于粗糙集和BP神经网络建立模型对复合图书馆馆藏质量展开预测研究。陈莺[6]利用遗传算法对基于BP神经网络的图书馆服务质量预测模型进行优化, 提高网络收敛速度和预测精度。

BP神经网络和遗传算法虽然在图书馆质量评价和预测领域被有效应用, 但在图书馆数字资源聚合质量预测方面的研究成果却较少。并且, BP神经网络(Back Propagation)通常是指基于误差反向算法的多层前馈神经网络[7], 而遗传算法(Genetic Algorithm)则是基于生物进化思想提出的一种全局优化算法, 其本质是意图通过直接搜索方法以达到不依赖具体问题而求得最优解[8]。在实践中, 以上两种算法的单独运用, 可能存在诸如收敛速度慢、网络结构受限、样本依赖性强等一个或多个问题。同时, 采用模糊综合评价法、层次分析法等方法展开评价指标研究, 需要在构建指标体系后, 由专家组给出各级指标权重, 然后通过打分方式, 结合指标权重计算最终的样本综合评价结果。当样本数量较大时, 计算过程繁杂、过分依赖于人工, 均可能降低评价精度和效率。而应用改进的遗传算法优化BP神经网络, 则可作为上述研究方法的补充, 能够对上述研究结论的可靠性进行验证, 利于发现计算过程的错误。并且, 可以基于训练好的模型直接输入样本数据, 使用计算机实现大量样本的数字资源聚合质量评价, 也可以针对实践层面拟采取的聚合技术应用目标调整个别指标数据, 预测其可能带来的图书馆数字资源聚合质量提升效果, 从而有利于针对预测结果, 采取最为有效的聚合技术和方法优化数字资源。因此, 基于改进的遗传算法对BP神经网络进行优化, 能够弥补BP算法和标准遗传算法的缺陷、提升算法搜索能力, 进而提高运算效率和精度[9]。同时, 模型应用前景和延展性较好, 可有效运用于图书馆数字资源聚合质量评价结果检验、大样本评价以及预测领域。

基于以上论述, 并结合前期研究成果, 本文创新性地将遗传算法和BP神经网络相结合, 运用于图书馆数字资源聚合质量模型研究, 在收敛算法持续优化基础上构建模型, 实现对图书馆数字资源聚合质量的评估和预测, 以期弥补目前资源聚合研究的不足, 指引图书馆数字资源聚合质量的提升方向, 也可作为数字图书馆数字资源聚合领域的辅助决策工具。

2 相关理论

2.1 图书馆数字资源聚合质量

图书馆数字资源是指以数字形式存在的图书馆信息资源[10], 包括学术论文、网络书目、科技报告、标准信息等多种类型的数字资源[11]。随着大数据时代的到来, 图书馆数字资源的海量性、多样性、复杂性和异构性特点更为明显。因此, 图书馆采取基于跨库检索、OPAC、链接和导航等方式来优化数字资源。然而, 这些模式仍然不能解决资源海量化问题[12]。国内外学者纷纷着眼于利用聚合技术有效组织图书馆数字资源, 力图通过对图书馆数字资源语义挖掘、消冗、语义融合、关联发现, 在收集、挖掘、融合海量信息资源基础上, 使信息资源聚集成簇, 实现知识自主协同、共享及智能化服务, 为使用者提供更具丰富内涵的图书馆数字资源聚类信息[13]

因此, 根植于数字资源聚合理论的图书馆数字资源聚合质量概念应运而生。图书馆数字资源聚合质量着重衡量对图书馆海量、多样、复杂、异构性数字资源聚合结果满足用户体验和感知的程度[14]。图书馆数字资源聚合质量较高, 则表明其有效解决了数字资源孤岛和超载问题, 用户检索和个性化推荐结果匹配度高、针对性强, 大大提高了图书馆数字资源利用效率和用户满意度[12]。集合图书馆数字资源概念和数字资源聚合理论, 本文将图书馆数字资源聚合质量界定为针对图书馆数字资源海量性、多样性、复杂性、异构性特点, 采用数字资源聚合技术和方法, 建立整体、局部有序的图书馆数字资源情境, 满足多元化用户明确或隐含的知识需要能力的特性总和。

2.2 BP神经网络

BP神经网络是多层前馈网络, 其网络模型如图1[10]所示。

图1   BP神经网络模型

   

可见, BP神经网络由输入层、隐含层、输出层构成, 并且网络传播方向有正向亦有反向。为减少误差, BP算法以误差对权重系数的偏导数梯度下降法修正系数。在模型训练阶段, 样本数据作为输入层信号先向前传播到隐含层, 经函数作用再将隐含层输出信号传播到输出层, 比较输出数据和期望输出的差异, 如果误差精度不足或训练次数不够, 则进入反向传播, 误差信息原路返回, 通过再次修改神经元权重系数, 减少误差并循环反复, 直至误差收敛至期望值[15]

图1中节点的作用激励函数一般表示为$f(x)=\frac{1}{1+{{e}^{\frac{-x}{q}}}}$ (q为Sigmoid参数), BP算法一般包括以下步骤[16]

①每层权值Wij初始化;

②提供一组输入数据和目标样本;

③计算中间层各单元输出;

④计算输出层各单元响应;

⑤计算输出层单元学习误差;

⑥计算中间层单元学习误差;

⑦修正中间层连接权重和阈值;

⑧修正输出层连接权重和阈值;

⑨选取下一组训练样本, 返回步骤③执行至样本训练结束;

⑩重新选择样本, 重复执行步骤③直至网络收敛。

2.3 遗传算法

遗传算法是基于遗传学和自然选择机理的随机、进化、迭代的搜索方法。同传统搜索算法最大的区别在于, 遗传算法从随机初始群体开始, 种群中每个个体(染色体)经随机选择、变异、交叉, 生成下一代更适应环境的个体(染色体), 种群随着一代代进化不断获取越来越好的生存区域, 最后收敛到最适应环境的个体(染色体), 从而得到求解问题的最优解(也可能是次优解)。遗传算法被广泛运用于管理科学、计算科学、社会科学领域, 对于复杂的多维空间、非线性优化问题更为适用[17]

遗传算法步骤如图2[13]所示, 包括7个步骤[18]

图2   遗传算法步骤

   

①编码。主要是确定码制, 形成基因码链;

②初始化。随机选择初始种群, 种群规模一般30-160为宜;

③适应度估计。计算每个个体适应度, 适应度越高的个体则代表较高质量的解;

④选择。选择也称再生, 即选择适应环境较好的个体繁殖下一代, 适应度越高下一代个体数目越多;

⑤交叉。从被选中的下一代个体以一定概率随机进行相对应基因交换, 以产生新的个体;

⑥变异。随机选择一个个体以一定概率执行变异, 以使同质种群亦能产生新个体;

⑦最优收敛。如果最优个体适应度低于期望阈值或适应度不断上升, 即未求得最优解, 则返回步骤③循环执行, 直至最优解产生, 算法结束。

2.4 基于遗传算法的BP神经网络优化

BP算法虽然具有数据资料要求低、可以拟合非线性关系而处理非线性数据、能够筛选结构未知的变量、提高困难问题求解精度等优点, 但同时也存在收敛速度慢、耗时长、易陷入局部极小、训练过程若震荡则会导致网络无法收敛、网络结构确定困难、样本依赖性强等缺点, 上述BP神经网络的自身缺陷极大影响了其进一步的应用和发展[19]。而遗传算法相比BP算法计算简单, 对待求解问题依赖小, 并发线程搜寻最优解, 计算速度得以大幅提升, 能使搜索过程收敛于全局最优解。同时, 遗传算法的粗粒度计算得到精确解较为困难, 需要依赖局部搜索算法弥补不足, 这恰恰又是BP算法的优点。

鉴于基于遗传算法对BP神经网络进行优化能够极大地提高评价或预测模型精度或效率, 众多学者均做出了卓有成效的研究。张秀华等[20]构建了GABPNN组合模型, 将遗传算法和BP神经网络相结合, 对图书馆绩效进行评价。邰丽君等[21]采用附加动量法改进遗传算法, 进而优化神经网络实现模型在销售预测中的应用。罗长寿等[22]在增大种群离散度、使子代个体均匀分布思想指导下, 改进遗传算法优化神经网络模型。何士龙等[19]将BP 学习算法作为变异算子优化遗传算法, 同时通过广义海明距离定义种群个体以对遗传算法进行改进。基于以上学者研究成果, 本文基于何士龙等[19]通过广义海明距离定义种群个体以对遗传算法进行改进思想, 张秀华等[20]、邰丽君等[21]和罗长寿等[22]的改进遗传算法优化神经网络模型思想, 将改进后的遗传算法引入BP神经网络构建预测模型(简称GA2BP), 采用互为补偿的方式求解图书馆数字资源聚合质量预测问题。

3 预测模型构建

3.1 评价指标体系及样本数据

(1) 评价指标体系

大数据时代, 聚合作为数字图书馆资源质量提升的重要手段, 已成为数字图书馆研究领域的热点, 图书馆数字资源聚合质量评价的研究成果也不断涌现。国外学者Tani等[23]、Cummings[24]、Tejeda-Lorente等[25]、Kokkinos等[26]基于网格网络、元数据、语义、计量等视角, 从多个层面提出数字图书馆资源聚合质量的评价要素。肖奎等[27]、邱均平等[28]、张博等[29]、赵文轩等[30]、王振蒙等[31]则对限定领域的网络文档资源质量、“网络观”下的文献质量、协同知识生产社区的内容质量、关联书目数据质量建立指标体系进行评价。课题组前期亦展开了图书馆数字资源聚合质量影响因素的深入研究[32], 研究发现, 从计量、语义视角构建图书馆数字资源聚合质量评价体系, 具有创新性、前瞻性、可操作性, 能拓宽相关领域研究视角, 也能对图书馆数字资源聚合质量的提升提供指导。

因此, 本文在国内外学者研究基础上, 并结合前期研究成果, 遵循“系统性、完整性、可操作性”的指标构建原则, 从计量和语义融合角度, 选取26个资源聚合质量评价指标: 检索结果相关度(X1)、推荐结果相关度(X2)、三元组数量(X3)、实体数量(X4)、词表数据完整性(X5)、链接完整性(X6)、表述实体完整性(X7)、类和属性有效性(X8)、数据类型匹配性(X9)、内容准确性(X10)、元数据准确性(X11)、资源主体可信度(X12)、主体协议许可率(X13)、资源更新及时性(X14)、人机交互及时性(X15)、数据资源重复性(X16)、数据资源类型及数量(X17)、实时可视性(X18)、增强审视性(X19)、网络密度(X20)、K-核子网(X21)、接近中心性(X22)、资源扩展性(X23)、资源开放性(X24)、资源聚合广度(X25)、资源聚合深度(X26)。

(2) 评价指标解释及度量

指标体系包括主观指标和客观指标两类, 主观指标主要采取专家组成员以用户身份体验数字图书馆服务, 从数字资源聚合视角对各指标进行打分方式实现度量; 客观指标数据由本文研究团队采取直接获取、直接下载、URL信息编码抽取、数据接口采集以及编程获取等方式获取。需要说明的是, 因待评价的是图书馆数字资源“聚合”质量, 因此, 主要衡量“聚合”后的数字资源质量, 没有应用聚合技术和方法聚合数字资源, 没有针对用户语义输入或使用习惯进行聚合数字资源个性化推荐, 即便其数字资源类型较多、数量较大、更新及时, 甚至资源可视化也很好, 但仍然不会获得较高的分数。

①检索结果相关度(X1)是指用户输入信息的语义和预期检索结果同最终检索结果的概念相关程度。在评分时, 首先检视检索结果是基于输入信息的精确匹配/中心词匹配还是基于输入信息语义的广泛匹配, 如果检索结果是基于用户输入信息语义的广泛匹配并且同预期检索结果相关度较高, 则应给予较高的分值。

②推荐结果相关度(X2)指数字图书馆通过对用户兴趣、偏好和信息消费行为的分析和挖掘, 主动向用户推荐的聚合资源同用户需求的相关程度[33], 同X1指标类似, 推荐结果必须是基于语义的广泛匹配才能有较好的评分表现;

③三元组数量(X3)是指聚合资源数据陈述中资源、用户和标签三元组要素数量。

④实体数量(X4)是指聚合资源中规范(或变型)的主体、客体、谓词数量[34]

X3、X4指标评价虽然仍是以“聚合”的数字资源为前提, 但进一步从语义丰富性予以考察。客观性指标X3的基础性数据通过API、编程或直接方式获取, 统计量为包含完整三元组的网络节点数量。X4则以包含完整的主体、客体、谓词的资源数量为基础。

⑤词表数据完整性(X5)是指数字图书馆词表资源、概念术语词表完整程度[35]

⑥链接完整性(X6)是指聚合后的数据资源服务器名称、路径、链接协议、文件完整程度。

⑦表述实体完整性(X7)则衡量数据资源描述格式、拼写、缩写、属性值的完整性[36]

X5、X6、X7指标, 从语义完整性审视图书馆数字资源的聚合质量。

⑧类和属性有效性(X8)是指聚合资源数据集是否定义了所有的类和属性, 对语法、句法的规则约束是否完整。

⑨数据类型匹配性(X9)是指聚合资源数据集数据类型是否准确、数据字段长度是否匹配[37]

X8、X9指标基于语义视角, 从图书馆聚合后的资源数据集的语法有效性予以考察。

⑩内容准确性(X10)主要是指数据资源文本准确性、图片是否缺失、图片辨识度[38]

⑪元数据准确性(X11)是指元数据描述聚合数据资源属性的准确程度[39]

X10、X11指标亦基于语义视角, 衡量内容数据和元数据的准确性。

⑫资源主体可信度(X12)是指数字图书馆主办方、资源提供方、运营方、聚合技术支持方权威性。

⑬主体协议许可率(X13)是指用于聚合的原始数据资源获得其他相关机构或个人的应用许可比率。

X12、X13指标主要体现主体权威性, 并重点参考聚合技术应用和数字资源聚合实施经验进行评分。X13指标通过计算已授权资源和全部资源数量比值给出。

⑭资源更新及时性(X14)是指聚合资源内容更新是否及时。

⑮人机交互及时性(X15)是指对用户的交互需求是否能够基于机器智能技术及时回应。

X14、X15指标要求专家从服务及时性予以审视, 并注重对基于语义的聚合资源更新速度、频率及同用户的智能交互等方面的衡量。

⑯数据资源重复性(X16)是指聚合数据资源价值密度高低以及重复率。

⑰数据资源类型及数量指标(X17)衡量聚合资源类型丰裕度、数量多少以及主流文献资源覆盖率[40]

X16、X17指标从语义和计量融合视角, 考察图书馆数字资源丰裕度。客观性指标X16基础数据按照$\frac{\text{1}-\alpha }{\beta }\times \frac{\sum\nolimits_{j=1}^{m}{\sum\nolimits_{i=1}^{n}{\frac{{{\gamma }_{i}}}{{{\delta }_{j}}}}}}{mn}$计算, 其中$\alpha $为重复的样本数据资源数量, β 为所有样本资源数量, m为所有样本资源字节数, n为关键字重复字节数, γ 为关键字字节数, δ为资源内容字节数, 样本资源采取利用爬虫工具Post关键字抽样形式获取。

⑱实时可视性(X18)强调聚合结果应基于大数据实时渲染技术进行图形可视化, 并衡量面向用户的场景化水平。

⑲增强审视性指标(X19)对可视化后的聚合数据可读性、分析、理解、利用难度进行衡量[41]

X18、X19指标亦从语义和计量融合视角, 考察采用计量和可视化技术, 对基于语义聚合后的图书馆数字资源进行可视化的程度。

⑳网络密度(X20)指聚合资源融合网络的节点密度。

㉑K-核子网(X21)指核心节点网络规模。

㉒接近中心性(X22)指中心节点不受其他节点控制的能力。

X20、X21、X22指标是“网络观”思想下的社会网络分析指标[42], 从计量视角出发, 对图书馆聚合资源网络融合度进行度量。上述指标样本数据通过网络爬虫获取图书馆聚合网络所有节点以及部分资源的链入、链出关系, 以链接关系为边, 以数字图书馆为节点, 构建图书馆数字资源聚合网络, 使用Gephi软件及其内置算法计算相应指标值。

㉓资源扩展性(X23)是指数据资源同其他任何相关资源的无缝链接、无限扩展性。

㉔资源开放性(X24)是指聚合数据资源容易被外界发现与利用的程度。

㉕资源聚合广度(X25)描述数据资源内部整合、外部整合、不同系统整合程度。

㉖资源聚合深度(X26)侧重数据资源统一检索、同其他相关资源集成度和关系展示性[43]

上述指标对图书馆聚合资源整合度予以度量, 重点反映聚合技术应用带来的数字资源延展性、开放性。

(3) 样本数据获取

运用GA2BP模型进行图书馆数字资源聚合质量预测需要训练样本和检验样本, 而样本选择必须具备典型性和代表性。因此, 本文选择比较有代表性的国内外10个数字图书馆作为评价主体, 如表1所示。

表1   国内外数字图书馆样本

   

来源数字图书馆网址
国外1.Library of Congresshttps://www.loc.gov
2.Elsevier Libraryhttp://www.sciencedirect.com
3.EmeraldPublishhttp://emeraldgrouppublishing.com
4.Cambridge University
Library
http://www.lib.cam.ac.uk
5.California State Libraryhttp://www.library.ca.gov
国内6.国家图书馆http://www.nlc.cn
7.知网http://www.cnki.net
8.万方http://www.wanfangdata.com.cn
9.吉林大学图书馆http://lib.jlu.edu.cn
10.广州图书馆http://www.gzlib.gov.cn

新窗口打开

在评价过程中, 首先由4名高校图书馆学科博士生导师、4名数字图书馆高层管理人员及技术运维人员、4名数字图书馆资深普通用户组成12人专家组, 上述人员在数字图书馆信息资源聚合理论研究、实践运营、读者服务等方面具有丰富的经验。其次, 将评价指标打分表通过邮件方式发送给每位专家, 并明确有关指标含义和评分标准。接着, 针对检索结果相关度、推荐结果相关度、词表数据完整性、链接完整性、表述实体完整性、元数据准确性等主观性指标, 要求专家以上文指标解释为依据, 确定一个或多个检索词, 结合行业经验、理论背景、使用习惯等, 针对各评价指标分别形成5级度量标准。然后, 在相对独立情况下, 访问待测评数字图书馆体验服务, 形成小样本量的评价指标和度量标准的主观匹配印象。最后, 按照李克特5级量表(较差-1, 一般-2, 好-3, 较好-4, 非常好-5), 依据同一指标不同样本的表现参考降/升序排列次序进行评分。针对三元组数量、实体数量、主体协议许可率、数据资源重复性、网络密度、K-核子网、接近中心性等客观性指标, 由本文研究团队采取直接下载、URL信息编码抽取、数据接口采集以及编程获取等方式获取客观数据, 如表2所示。

表2   客观指标基础数据表

   

编号X3X4X13X16X20X21X22
13054100.00%5.96%0.003294.74
24342100.00%5.63%0.002312.72
33839100.00%4.35%0.00284.16
4393880.00%3.98%0.002484.08
54740100.00%2.61%0.002424.15
64960100.00%7.68%0.001544.98
73051100.00%6.72%0.001184.24
88130100.00%6.53%0.003204.03
9303166.67%3.62%0.003193.45
107434100.00%6.68%0.001173.37
说明以10个文献
为样本估计
以10个文献
为样本估计
结合数字图书馆官方
数据和用户自主发布
资源抽样估计
Post随机检索词10个为样本估计以链接关系为边,
以资源站为节点
度大于10的核心
子网节点数量
待测评数字
图书馆节点
接近中心度

新窗口打开

经过整理、调整主客观数据并统一量纲, 最终结果如表3所示。

表3   样本数据表

   

编号X1X2X3X4X5X6X7X8X9X10X11X12X13输出
12.612.612.613.482.611.742.612.611.742.612.613.483.483.48
22.632.632.632.633.512.631.752.632.633.511.750.883.512.63
32.593.452.592.593.452.593.453.452.592.592.592.593.452.59
42.562.562.562.562.562.562.561.712.563.422.562.562.563.42
52.642.642.642.643.522.641.762.642.643.522.642.642.642.64
63.493.492.623.492.622.623.493.493.492.622.623.493.493.49
74.353.482.613.483.482.614.353.482.613.483.483.483.484.35
84.352.613.482.613.483.483.482.612.613.483.482.613.483.48
93.482.612.612.613.482.611.742.612.613.482.612.611.742.61
102.612.613.482.612.613.482.613.482.612.613.482.613.482.61
编号X14X15X16X17X18X19X20X21X22X23X24X25X26输出
11.743.483.483.483.483.483.482.613.483.482.613.482.613.48
21.753.512.632.630.881.752.632.631.753.511.751.751.752.63
32.592.592.593.452.593.452.592.593.453.453.452.593.452.59
42.563.422.562.563.422.563.423.422.562.563.422.563.423.42
52.642.641.762.642.642.642.642.642.642.642.642.642.642.64
63.493.493.493.493.492.622.623.493.492.623.492.623.493.49
73.482.613.483.483.482.612.612.613.483.483.483.482.614.35
83.482.613.483.482.612.613.482.612.613.482.613.482.613.48
92.612.612.612.612.612.613.482.612.613.482.613.482.612.61
102.612.613.482.612.612.611.742.612.612.613.482.612.612.61

新窗口打开

3.2 GA2BP预测模型

为充分发挥遗传算法和BP算法的优点, 提高图书馆数字资源聚合质量预测精度, 本文构建了GA2BP预测模型, 如图3所示, 算法框架如图4所示。

图3   GA2BP图书馆数字资源聚合质量预测模型

   

图4   GA2BP模型算法框架

   

模型基本思想为, 基于训练样本数据, 运用遗传算法搜索到全局最优点边缘附近; 运用BP算法进行局部搜索, 求解全局最优点; 基于训练好的模型, 输入检验数据对模型进行检验, 模型主要执行过程和算法如下。

(1) 开始。在此过程, 主要内容是编码设计, 构建个体结构, 确定输入层、隐含层、输出层网络层数, 确认各层节点数[44]。编码一般采取二进制, 输入层节点数m、输出层节点数n可以由待求解问题单元数确定, 隐含层节点数I采取试错法按照公式(1)[44]确定初始值, 其中$\alpha $为1到10之间的常数。

$I\text{=}\sqrt{m+n}+\alpha $ (1)

(2) 训练样本输入, 样本数据归一, 消除量纲差异对网络影响, 样本数据按照公式(2)[45]进行归一处理。其中${{x}_{i}}$表示输入/输出数据, ${{x}_{\max }}$表示数据组中最大值, ${{x}_{\min }}$为数据组中最小值[45]

${{\tilde{x}}_{i}}=\frac{{{x}_{i}}-{{x}_{\min }}}{{{x}_{\max }}-{{x}_{\min }}}$ (2)

(3) 遗传算法参数输入。种群规模(NNID)、进化代数(MaxGen)、交叉(Px)变异(Pm)概率输入[46]

(4) 随机产生种群个体[47]。为提高算法精度, 保证种群多样性, 种群个体通过广义海明距离[48]定义, 如公式(3)[19]所示。其中, pi表示种群的第i个体, ${{H}_{g}}(g_{i}^{p},g_{j}^{p})$表示ij个体的编码位置。

${{H}_{m}}({{p}_{i}},{{p}_{j}})=\frac{1}{2n+1}\sum\nolimits_{p=1}^{2n+1}{{{H}_{g}}(g_{i}^{p},g_{j}^{p})}$ (3)

(5) 随机确定输入-隐含层连接权重${{\omega }_{ij}}$、隐含-输出层连接权重${{\nu }_{jt}}$、隐含层输出阈值${{\theta }_{j}}$、输出层输出阈值${{\gamma }_{t}}$。按公式(4)[21]计算隐含层输出${{s}_{j}}$, 按公式(5)[21]计算输出层输出${{L}_{t}}$。

${{s}_{j}}=f(\sum\nolimits_{j=1}^{m}{{{\omega }_{ij}}{{x}_{i}}-{{\theta }_{j}}})$ (4)

${{L}_{t}}=f(\sum\nolimits_{j=1}^{n}{{{\nu }_{jt}}{{s}_{j}}-{{\gamma }_{t}}})$ (5)

(6) 适应度和误差计算。按照公式(6)[21]计算输出误差Dt, 其中$\varphi $表示样本数, St代表t样本期望输出[49]。基于均方根误差最小原则和遗传算法需要, 将误差转化为最大化适应度函数${{F}_{t}}$, 见公式(7)[21]

${{D}_{t}}=\frac{1}{\varphi }\sum\nolimits_{t=1}^{\varphi }{\sqrt{{{({{L}_{t}}-{{S}_{t}})}^{2}}}}$ (6)

${{F}_{t}}=\frac{1}{{{D}_{t}}}=\frac{\varphi }{\sum\nolimits_{t=1}^{\varphi }{\sqrt{{{({{L}_{t}}-{{S}_{t}})}^{2}}}}}$ (7)

(7) 计算个体概率、产生新个体。计算每个个体染色体的适应概率和累计概率, 基于概率, 经随机选取个体、染色体交叉变异操作形成新种群[50]

(8) 结果输出。产生的新种群返回步骤(4)重复执行, 直至进化代数完成, 输出初始值${{\omega }_{ij}}$、${{\nu }_{jt}}$、${{\theta }_{j}}$、${{\gamma }_{t}}$。

(9) 权重、阈值调整。计算误差和适应度[51], 若不符合精度要求, 则按照公式(8)-公式(11)[22,51]调整权重和阈值, 其中$\alpha $为学习效率。

${{\nu }_{jt}}(n+1)={{\nu }_{jt}}(n)+\alpha {{D}_{t}}{{S}_{j}}$ (8)

${{\gamma }_{t}}(n+1)={{\gamma }_{t}}(n)+\alpha {{D}_{t}}$ (9)

${{\omega }_{ij}}(n+1)={{\omega }_{ij}}(n)+\alpha {{D}_{j}}$ (10)

${{\theta }_{j}}(n+1)={{\theta }_{j}}(n)+\alpha {{D}_{t}}$ (11)

(10) 学习结束。直至样本训练完毕, 误差D满足精度要求, 即网络收敛, 输出最优值${{\omega }_{ij}}$、${{\nu }_{jt}}$、${{\theta }_{j}}$、${{\gamma }_{t}}$。

4 仿真研究

4.1 实验平台

实验平台选择MATLAB R2014a[52], 操作系统为Windows7 Service Pack1, 客户端环境是Java SE Development Kit 7、.NET Framework 4.5.2、C++ 2010、Python 3.6。实验平台的遗传算法模块基于开源包Jpag改写, 变异算法调用Mutation函数, 交叉算法调用Cross函数; BP神经网络模块调用L-M优化算法的Trainlm函数, 适应度计算调用Sim函数。实验过程中样本数据首先进行归一处理, 数据结果进行反归一处理。

4.2 初始环境配置

(1) 确定网络结构

较多的隐含层虽然增加了神经网络处理能力, 但同时带来计算复杂化、耗时较长的不利结果[53], 因此, 本文采用输入层、隐含层、输出层三层网络结构进行仿真。在各层节点数确定方面, 26个评价指标作为输入层节点数, 聚合质量评价结果1个节点作为输出层元素, 对应26个输入层单元, 隐含层拥有较多节点, 采用试错法并基于公式(1), 最终确定隐含层节点数为17。

(2) 函数及参数设置

本文设计的神经网络只有一个隐含层, 需要中间层和输出层传递函数, 经参考有关文献, 最终选取隐含层、输出层传递函数分别为对数S函数、线性函数。BP神经网络学习效率$\alpha $取值0.9、动态参数0.7、允许误差条件为${{D}_{t}}\le $0.00001、迭代次数100次。遗传算法主要参数配置为选择概率0.1, 交叉变异概率分别为0.3、0.1, 进化代数80。

(3) 样本和检验数据

选择编号1、2、3、4、5、6、7、8等8个数字图书馆作为训练样本, 将编号9和10这两个数字图书馆评分作为检验数据。

(4) 输入数据

模型最终输入数据为表2样本数据、模型参数配置数据, 如表4所示。

表4   模型参数输入数据

   

输入参数输入值输入参数输入值
输入层节点数26学习效率0.9
隐含层节点数17动态参数0.7
输出层节点数1允许误差0.00001
进化代数80交叉概率0.3
迭代次数100变异、选择概率0.1

新窗口打开

4.3 模型训练及检测

(1) 训练模型

基于GA2BP模型, 将表2的样本编号为1-8的数据作为训练网络, 对数字图书馆信息资源聚合网络权重和阈值进行优化, 整个模型训练过程如图5所示。

图5   模型训练过程

   

程序运行总时长为18.56秒。训练样本输出结果见表5所示, 训练误差如图6所示。

表5   GA2BP模型训练样本输出

   

样本
编号
实际
预测
误差样本
编号
实际
预测
误差
13.483.4631-1.31E-0352.642.61542.42E-04
22.632.66375.12E-0463.493.44530.91E-03
32.592.51653.47E-0474.354.3212-2.13E-04
43.423.41326.25E-0483.483.4452-1.43E-03

新窗口打开

图6   GA2BP模型训练误差

   

可见, 实际值和模型预测值非常接近, 误差绝对值介于1.31E-03至6.25E-04之间, 同时经计算平均误差为5.59E-03, 说明平均误差也较小, 模型预测精度较高。

为提升模型的网络收敛效率, 变更遗传代数和迭代次数进行多次训练, 最优结果如图7和8所示。

图7   GA2BP模型训练迭代次数

   

图8   误差进化曲线

   

图7可知, 迭代次数在0-15, 适应度函数值迅速下降, 随后逐步放缓。而图8则从遗传进化过程, 反映网络的收敛效率, 自训练开始, 误差即迅速下降, 虽然在5-14代有所放缓, 但在15代则大幅度降到输出目标。从训练性能和训练状态曲线来看(图9图10), 仅仅三步就收敛到误差目标。综上, 本文构建的GA2BP模型, 计算效率高, 网络收敛速度快。

图9   训练性能曲线
(注: Best与Goal重合。)

   

图10   训练状态曲线

   

(2) 模型检测和对比

为检测模型有效性, 更好地体现GA2BP模型优越性, 本文将表2样本编号为9、10的数据输入模型, 输出计算结果。同时, 将检测数据单一应用遗传算法、BP神经网络分别进行预测值对比, 结果如表6所示。

表6   三种不同模型检测样本输出结果对比

   

模型样本编号实际值预测值误差平均误差
GA2BP92.612.60763.12E-042.74E-04
102.612.60772.35E-04
GA92.612.62151.15E-021.14E-02
102.612.62121.12E-02
BP92.612.61545.43E-034.57E-03
102.612.61373.70E-03

新窗口打开

可以看出, GA2BP模型检测样本输出结果同专家打分值存在极小误差, 平均误差从1.14E-02下降到2.74E-04, 而应用GA遗传算法的预测值则相对误差较大, BP神经算法则误差适中。为进一步比较模型精度, 将三种网络预测值和检测样本真实值绘图比较, 如图11所示。可明显看出GA2BP模型优化后的网络拟合精度高, 预测值极接近真实值。

图11   GA2BP同GA、BP预测结果对比

   

总之, 遗传算法优化BP神经网络建立GA2BP模型, 在网络泛化能力保障的条件下, 预测网络性能得到有效提高, 预测精度和预测效率也大幅提升。将优化后的GA2BP模型应用于图书馆数字资源聚合质量研究领域, 可以为图书馆数字资源聚合质量评价和预测提供可靠参考, 并可据此确定有关聚合质量优化参数和流程, 也可作为从实践层面指导数字图书馆聚合质量提升的辅助决策工具。

5 结 语

GA2BP模型在图书馆数字资源聚合质量预测过程中, 除了能最大程度避免人为的偏好、计算错误外, 还具有问题依赖小、收敛速度快、耗时较少、网络易收敛、样本依赖低等优点, 从而能够对图书馆数字资源聚合质量做出高效、精准、客观的预测。同时, 可以基于训练好的模型直接输入样本数据, 使用计算机实现大量样本的数字资源聚合质量评价, 也可以针对实践层面拟采取的聚合技术应用目标调整个别指标数据, 预测其变化可能对图书馆数字资源聚合质量带来的动态影响, 从而有利于针对预测结果, 采取最为有效的聚合技术和方法优化图书馆数字资源。总之, 模型应用前景和延展性较好, 可有效运用于图书馆数字资源聚合质量评价结果检验、大样本评价以及大样本预测领域。该模型也可作为一种评价标准, 在重复利用过程中, 通过调整参数、优化模型方式不断补充和更新。

本文研究, 在理论层面基于改进的遗传算法和BP神经网络构建了GA2BP图书馆数字资源聚合质量预测模型, 具有一定的理论创新价值; 在实践层面, 以国内外10个数字图书馆数据为样本, 应用MATLAB R2014a平台进行仿真实验, 结果表明, 预测结果平均误差2.74E-04, 同实际数据误差小, 模型精度较高。程序运行总时长18.56秒, 且三步就收敛到误差目标, 模型收敛速度快, 相较单一的遗传算法和BP算法有更高的预测精度和效率。总之, 仿真实验验证了模型的有效性, 能够为数字图书馆建设方、运营方及用户针对预测结果提升资源聚合质量提供指导。

本文局限在于, 实验中未采用train的其他快速训练函数进行训练时间和预测精度对比、种群数量因计算复杂性而受限、样本数据质量有待提高。同时, 本文模型仅仅同GA算法、BP算法进行了比较, 未来将考虑利用SVM神经网络算法对本文模型进行对比检验。

作者贡献声明:

闫晶: 提出研究命题和研究思路, 模型构建及验证, 撰写及修改论文;

毕强: 论文最终版本修订;

李洁: 采集、清洗和分析数据;

王福: 收集文献, 翻译摘要。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: 39262832@qq.com。

[1] 闫晶, 毕强, 李洁, 王福. PredictResult.csv. 数据集及预测结果.


参考文献

[1] 毕强, 王传清, 李洁.

基于语义的数字资源超网络聚合研究

[J]. 情报科学, 2015, 33(3): 8-12.

URL      [本文引用: 1]      摘要

在梳理基于语义的数字资源深度聚合研究现状的基础上,引入超网络理论,分析数字资源超网络中的语义关系类型,探讨基于语义的数字资源超网络深度聚合的流程和方法,总结基于语义的数字资源超网络聚合的模式,为超网络视域下的数字资源深度聚合提供理论和方法参考。

(Bi Qiang, Wang Chuanqing, Li Jie.

Exploration of In-depth Aggregation of Digital Resources Supernetworks Based on Semantics

[J]. Information Science, 2015, 33(3): 8-12.)

URL      [本文引用: 1]      摘要

在梳理基于语义的数字资源深度聚合研究现状的基础上,引入超网络理论,分析数字资源超网络中的语义关系类型,探讨基于语义的数字资源超网络深度聚合的流程和方法,总结基于语义的数字资源超网络聚合的模式,为超网络视域下的数字资源深度聚合提供理论和方法参考。
[2] Garibay C, Gutiérrez H, Figueroa A.

Evaluation of a Digital Library by Means of Quality Function Deployment (QFD) and the Kano Model

[J]. The Journal of Academic Librarianship, 2010, 36(2): 125-132.

https://doi.org/10.1016/j.acalib.2010.01.002      URL      [本文引用: 1]      摘要

This paper proposes utilizing a combination of the Quality Function Deployment (QFD)–Kano model as a useful tool to evaluate service quality. The digital library of the University of Guadalajara (Mexico) is presented as a case study. Data to feed the QFD–Kano model was gathered by an online questionnaire that was made available to users on the library's website. The study makes clear that by listening to the voice of the customer (VOC), relevant information may be obtained about issues that should be improved in order to increase customer satisfaction.
[3] Heradio R, Cabrerizo F J, Fernández-Amorós D, et al.

A Fuzzy Linguistic Model to Evaluate the Quality of Library 2.0 Functionalities

[J]. International Journal of Information Management, 2013, 33(4): 642-654.

https://doi.org/10.1016/j.ijinfomgt.2013.04.001      URL      Magsci      [本文引用: 1]      摘要

Libraries incessantly undergo change determined by evolving user needs. These are often induced by the emergence of previously unavailable tools. Web 2.0 represents an example of such a need-shifting technology, which has led to an embrace of new user interactivity services for many library websites, thus coined Library 2.0. This paradigm shift calls for new evaluation models to include the implementation of Web 2.0 technologies. The aim of this paper is to present such a model, and to evaluate the quality of Library 2.0 functionalities, measuring the quality of the 2.0 services offered through the websites based on user perception. We adopt fuzzy linguistic modeling to represent user perception, and apply aggregation operations to linguistic labels in order to evaluate the quality of the new services. Furthermore, our model subsumes the LibQUAL+ methodology, allowing for the identification of specific 2.0 functionalities in need of improvement and of those outstandingly satisfied by the system.
[4] 贾洁, 彭奇志.

基于BP神经网络的图书馆电子资源质量评价研究

[J]. 图书情报工作, 2010, 54(21): 84-87.

URL      Magsci      [本文引用: 1]      摘要

建立基于用户满意度的图书馆电子资源质量评价指标体系,并利用BP网络构建模型实现图书馆电子资源质量评价.结果表明,基于BP神经网络的图书馆电子资源质量评价模型是一个合理的、可行的、精度较高的预测模型,基于人工神经网络的电子资源评价方法是一种很好的评价方法.

(Jia Jie, Peng Qizhi.

Research on the Quality Evaluation of Library Electronic Resources Based on BP Neural Network

[J]. Library and Information Service, 2010, 54(21): 84-87.)

URL      Magsci      [本文引用: 1]      摘要

建立基于用户满意度的图书馆电子资源质量评价指标体系,并利用BP网络构建模型实现图书馆电子资源质量评价.结果表明,基于BP神经网络的图书馆电子资源质量评价模型是一个合理的、可行的、精度较高的预测模型,基于人工神经网络的电子资源评价方法是一种很好的评价方法.
[5] 张秀华, 辛江美.

基于粗糙集和BP神经网络的复合图书馆馆藏质量评价研究

[J]. 情报理论与实践, 2009, 32(11): 107-111.

URL      [本文引用: 1]      摘要

建立了基于粗糙集和BP神经网络的复合图书馆馆藏质量评价模型,首先运用粗糙集模型对评价指标体系中的指标进行约简,消除冗余,然后把约简后得到的评价指标输入到BP神经网络中进行智能训练,最后把待评价的检测样本输入到训练好的BP网络中,得到了馆藏质量实际输出值,实际输出与期望输出结果相吻合,从而证明了评价的可行性和有效性。

(Zhang Xiuhua, Xin Jiangmei.

Research on the Evaluation of Hybrid Library Collection Quality Based on Rough Set and BP Neural Network

[J]. Information Studies: Theory & Application, 2009, 32(11): 107-111.)

URL      [本文引用: 1]      摘要

建立了基于粗糙集和BP神经网络的复合图书馆馆藏质量评价模型,首先运用粗糙集模型对评价指标体系中的指标进行约简,消除冗余,然后把约简后得到的评价指标输入到BP神经网络中进行智能训练,最后把待评价的检测样本输入到训练好的BP网络中,得到了馆藏质量实际输出值,实际输出与期望输出结果相吻合,从而证明了评价的可行性和有效性。
[6] 陈莺.

基于遗传算法的BP神经网络在高校图书馆流通服务质量评价中的应用研究

[J]. 情报探索, 2014(10): 12-15.

https://doi.org/10.3969/j.issn.1005-8095.2014.10.003      URL      [本文引用: 1]      摘要

针对高校图书馆流通服务质量问题,建立了评价系统的BP神经网络模型,利用遗传算法对传统的BP神经网络权值进行全局优化运算,提高了网络收敛速度,并经过实例计算验证了该模型的有效性。

(Chen Ying.

Study on Applications of Genetic Algorithm- based BP Neural Network in University Library Circulation Service Quality Evaluation

[J]. Information Research, 2014 (10): 12-15.)

https://doi.org/10.3969/j.issn.1005-8095.2014.10.003      URL      [本文引用: 1]      摘要

针对高校图书馆流通服务质量问题,建立了评价系统的BP神经网络模型,利用遗传算法对传统的BP神经网络权值进行全局优化运算,提高了网络收敛速度,并经过实例计算验证了该模型的有效性。
[7] Werbos P J.

From Backpropagation to Neurocontrol

[C]// Proceedings of the International Conference on Neural Networks, Fuzzy Systems, Evolutionary Computing, and Virtual Reality. 1996: 476.

[本文引用: 1]     

[8] Bagley J D.

The Behavior of Adaptive Systems Which Employ Genetic and Correlation Algorithms

[D]. Ann Arbor, MI, USA: University of Michigan, 1967.

[本文引用: 1]     

[9] 付晓明, 王福林, 尚家杰.

基于多子代遗传算法优化BP神经网络

[J]. 计算机仿真, 2016, 33(3): 258-263.

https://doi.org/10.3969/j.issn.1006-9348.2016.03.057      URL      [本文引用: 1]      摘要

针对BP算法的缺陷以及标准遗传算法优化BP神经网络权值和阈值的不足,为了提高算法的全局搜索能力,提出了采用自适应动态调整权值和阈值区间的多子代遗传算法的BP神经网络算法。上述算法由权值和阈值构成的父代种群交叉产生多于父代个体数量的多子代种群,根据当前多子代种群个体适应度值的变化而自适应调整搜索区间,并通过种群内部竞争操作保留具有更高适应度值的优秀个体,从而使整个神经网络具有较小的误差和较快的收敛速度。仿真发现,与采用标准遗传算法的BP神经网络算法相比,采用多子代遗传算法的BP神经网络算法具有更高的学习精度和更快的收敛速度。仿真结果证明,自适应动态调整权值和阈值区间的多子代遗传算法对BP神经网络的优化优于基本遗传算法。

(Fu Xiaoming, Wang Fulin, Shang Jiajie.

Optimized BP Neural Network Algorithm Based on Multi-Child Genetic Algorithm

[J]. Computer Simulation, 2016, 33(3): 258-263.)

https://doi.org/10.3969/j.issn.1006-9348.2016.03.057      URL      [本文引用: 1]      摘要

针对BP算法的缺陷以及标准遗传算法优化BP神经网络权值和阈值的不足,为了提高算法的全局搜索能力,提出了采用自适应动态调整权值和阈值区间的多子代遗传算法的BP神经网络算法。上述算法由权值和阈值构成的父代种群交叉产生多于父代个体数量的多子代种群,根据当前多子代种群个体适应度值的变化而自适应调整搜索区间,并通过种群内部竞争操作保留具有更高适应度值的优秀个体,从而使整个神经网络具有较小的误差和较快的收敛速度。仿真发现,与采用标准遗传算法的BP神经网络算法相比,采用多子代遗传算法的BP神经网络算法具有更高的学习精度和更快的收敛速度。仿真结果证明,自适应动态调整权值和阈值区间的多子代遗传算法对BP神经网络的优化优于基本遗传算法。
[10] Bhattacharya U.

Digital Information Resources and Digital Information Literacy: A Symbiotic Approach

[M]. Inflibnet Centre, 2007.

[本文引用: 2]     

[11] 王菲菲, 邱均平.

信息计量视角下的数字文献资源语义化模型研究

[J]. 情报资料工作, 2015, 36(4): 62-69.

URL      Magsci      [本文引用: 1]      摘要

在前期研究基础上,文章致力于对计量分析与语义本体进行全面深入 的类比分析,进而提出数字文献资源计量语义化理论框架;对基于计量分析的语义化机理与模式进行分解阐述,进一步构建系统化的数字文献资源计量语义化模型, 该模型由数字文献资源元数据构建、信息计量与统计分析、计量语义化分析、计量语义知识提取与发现、计量语义化应用五个模块组成,具有易操作多功能、可扩展 便推理、互操作广应用等特点.

(Wang Feifei, Qiu Junping.

Analysis of Digital Document Resource Semantic Model Under the Perspective of Informetrics

[J]. Information and Documentation Services, 2015, 36(4): 62-69.)

URL      Magsci      [本文引用: 1]      摘要

在前期研究基础上,文章致力于对计量分析与语义本体进行全面深入 的类比分析,进而提出数字文献资源计量语义化理论框架;对基于计量分析的语义化机理与模式进行分解阐述,进一步构建系统化的数字文献资源计量语义化模型, 该模型由数字文献资源元数据构建、信息计量与统计分析、计量语义化分析、计量语义知识提取与发现、计量语义化应用五个模块组成,具有易操作多功能、可扩展 便推理、互操作广应用等特点.
[12] 高劲松, 程娅, 梁艳琪.

基于关联数据的图书馆数字资源语义互联研究

[J]. 情报科学, 2017, 35(1): 8-13.

URL      Magsci      [本文引用: 2]      摘要

【目的/意义】更加有效地组织图书馆数字资源。【方法/过程】构建了一个基于关联数据的图书馆数字资源语义互联模型, 该模型主要包括六个层次结构, 分别是数据层、 标识层、 描述层、 本体层、 逻辑层和应用层。然后, 提出了该互联模型的具体实现方法, 通过对图书馆数字资源的采集与标识、 RDF元数据的构建、 本体的设计与构建以及基于关联数据的语义推理和映射来实现图书馆数字资源的语义互联。【结果/结论】以图书馆元数据本体为实验数据, 通过 FaCT++推理机和映射系统 Falcon-AO进行实验, 实现资源间的语义互联。关键词:关联数据; 语义互联;数字资

(Gao Jinsong, Cheng Ya, Liang Yanqi.

Semantic Interconnection Model of Library Digital Resources Based on Linked Data

[J]. Information Science, 2017, 35(1): 8-13.

URL      Magsci      [本文引用: 2]      摘要

【目的/意义】更加有效地组织图书馆数字资源。【方法/过程】构建了一个基于关联数据的图书馆数字资源语义互联模型, 该模型主要包括六个层次结构, 分别是数据层、 标识层、 描述层、 本体层、 逻辑层和应用层。然后, 提出了该互联模型的具体实现方法, 通过对图书馆数字资源的采集与标识、 RDF元数据的构建、 本体的设计与构建以及基于关联数据的语义推理和映射来实现图书馆数字资源的语义互联。【结果/结论】以图书馆元数据本体为实验数据, 通过 FaCT++推理机和映射系统 Falcon-AO进行实验, 实现资源间的语义互联。关键词:关联数据; 语义互联;数字资
[13] 李洁.

基于SNA的馆藏数字资源知识聚合可视化研究

[D].长春: 吉林大学, 2016.

[本文引用: 2]     

(Li Jie.

Study on Knowledge Aggregation of Digital Resources Based on SNA

[D]. Changchun: Jilin University, 2016.)

[本文引用: 2]     

[14] 曾群, 刘昊, 李瑞婻.

基于知识关联理论的数字图书馆信息资源聚合研究

[J]. 图书馆学研究, 2016(23): 36-41.

[本文引用: 1]     

(Zeng Qun, Liu Hao, Li Ruinan.

Research on Digital Library Information Resources Aggregation Based on Knowledge Relevance Theory

[J]. Research on Library Science, 2016 (23): 36-41.)

[本文引用: 1]     

[15] 鞠建伟, 梁花侠.

高校图书馆服务用户满意度的BP神经网络模型的建立

[J]. 情报杂志, 2004, 23(8): 103-104.

https://doi.org/10.3969/j.issn.1002-1965.2004.08.042      URL      [本文引用: 1]      摘要

用户满意度是普遍应用于产品质量,用户满意度评价高校图书馆读者服务是一种已被图书馆界接受的方法。 在研究用户满意度指标体系的基础上,建立适合定性、定量评估高校图书馆读者满意程度的BP神经网络模型。

(Ju Jianwei, Liang Huaxia.

The Application of BP Model in CS Evaluation of University Library

[J]. Journal of Intelligence, 2004, 23(8): 103-104.)

https://doi.org/10.3969/j.issn.1002-1965.2004.08.042      URL      [本文引用: 1]      摘要

用户满意度是普遍应用于产品质量,用户满意度评价高校图书馆读者服务是一种已被图书馆界接受的方法。 在研究用户满意度指标体系的基础上,建立适合定性、定量评估高校图书馆读者满意程度的BP神经网络模型。
[16] 林仕高, 欧元贤.

BP神经网络学习参数优化研究

[J]. 微计算机信息, 2010, 26(16): 199-200.

https://doi.org/10.3969/j.issn.2095-6835.2010.16.080      URL      [本文引用: 1]      摘要

讨论了在训练BP神经网络的过程中总结出一些基础参数的设定,给出了一个快速收敛并避免局部最小点的神经网络训练方法并用VC++6.0编程实现之。

(Lin Shigao, Ou Yuanxian.

Research of the Optimization of the Learning Parameters in BP Neural Network

[J]. Microcomputer Information, 2010, 26(16): 199-200.)

https://doi.org/10.3969/j.issn.2095-6835.2010.16.080      URL      [本文引用: 1]      摘要

讨论了在训练BP神经网络的过程中总结出一些基础参数的设定,给出了一个快速收敛并避免局部最小点的神经网络训练方法并用VC++6.0编程实现之。
[17] 孔国利, 张璐璐.

遗传算法的广义回归神经网络建模方法

[J]. 计算机工程与设计, 2017, 38(2): 488-493.

URL      [本文引用: 1]      摘要

针对广义回归神经网络中光滑因子难以确定,影响建模精度以及模型泛化能力等问题,提出一种基于遗传算法优化广义回归神经网络的高精度建模方法。以广义回归神经模型为基础构建测试样本,预测误差与光滑因子之间的函数,作为适应度函数;通过遗传算法对光滑因子进行优化,以模型输出值误差达到最小时的光滑因子为最优,提高网络模型精度。测试函数建模实验结果表明,与传统的广义回归神经网络相比,该方法预测值均方根误差下降89.45%,平均绝对误差下降91.53%,平均相对误差下降97.65%,能有效提高建模精度和模型泛化能力,为复杂工业的非线性系统建模提供了有效的方法。

(Kong Guoli, Zhang Lulu.

Generalized Regression Neural Network Modeling Method Based on Genetic Algorithm

[J]. Computer Engineering and Design, 2017, 38(2): 488-493.)

URL      [本文引用: 1]      摘要

针对广义回归神经网络中光滑因子难以确定,影响建模精度以及模型泛化能力等问题,提出一种基于遗传算法优化广义回归神经网络的高精度建模方法。以广义回归神经模型为基础构建测试样本,预测误差与光滑因子之间的函数,作为适应度函数;通过遗传算法对光滑因子进行优化,以模型输出值误差达到最小时的光滑因子为最优,提高网络模型精度。测试函数建模实验结果表明,与传统的广义回归神经网络相比,该方法预测值均方根误差下降89.45%,平均绝对误差下降91.53%,平均相对误差下降97.65%,能有效提高建模精度和模型泛化能力,为复杂工业的非线性系统建模提供了有效的方法。
[18] 朱春媚, 莫鸿强.

一类适应度函数的遗传算法编码

[J]. 计算机应用, 2017, 37(7): 1972-1976, 1998.

https://doi.org/10.11772/j.issn.1001-9081.2017.07.1972      URL      [本文引用: 1]      摘要

针对在探讨适应度函数的周期性特点与整数编码元数之间的关联特性时,一阶积木块数量对编码性能的评价不一定成立的问题,提出以累积逃脱概率(AEP)作为遗传算法(GA)编码性能的评价指标,对以频率为正整数m的整数次幂的正弦函数为基函数线性组合构成的适应度函数编码展开研究。首先给出了该类适应度函数的一般形式和m进制整数编码的含义;然后介绍了AEP的定义,并根据函数特点制定了AEP的计算方法;最后分析比较了该类适应度函数在不同整数编码下的AEP,指出其采用m元整数编码时更容易进化。仿真结果表明,该类适应度函数采用m元整数编码时,其最终优化结果和群体适应度均值的上升时间皆明显优于其他编码,反映了AEP能有效评价编码的性能,并再次验证了对于该类适应度函数m元整数编码优于非m元整数编码的结论。

(Zhu Chunmei, Mo Hongqiang.

Encoding of Genetic Algorithm for a Class of Fitness Functions

[J]. Journal of Computer Applications, 2017, 37(7): 1972-1976, 1998.)

https://doi.org/10.11772/j.issn.1001-9081.2017.07.1972      URL      [本文引用: 1]      摘要

针对在探讨适应度函数的周期性特点与整数编码元数之间的关联特性时,一阶积木块数量对编码性能的评价不一定成立的问题,提出以累积逃脱概率(AEP)作为遗传算法(GA)编码性能的评价指标,对以频率为正整数m的整数次幂的正弦函数为基函数线性组合构成的适应度函数编码展开研究。首先给出了该类适应度函数的一般形式和m进制整数编码的含义;然后介绍了AEP的定义,并根据函数特点制定了AEP的计算方法;最后分析比较了该类适应度函数在不同整数编码下的AEP,指出其采用m元整数编码时更容易进化。仿真结果表明,该类适应度函数采用m元整数编码时,其最终优化结果和群体适应度均值的上升时间皆明显优于其他编码,反映了AEP能有效评价编码的性能,并再次验证了对于该类适应度函数m元整数编码优于非m元整数编码的结论。
[19] 何士龙, 苏子林.

论优化BP神经网络的一种改进遗传算法

[J]. 科技情报开发与经济, 2011, 21(1): 119-121.

https://doi.org/10.3969/j.issn.1005-6033.2011.01.053      URL      [本文引用: 4]      摘要

为了全面优化BP神经网络,使之具有较好的泛化性能,改进并设计了一种遗传算法,并通过算法对比测试表明,改进后的遗传算法减少了内存占用量,保证了种群的多样性,提高了算法的运行速度和收敛效果。

(He Shilong, Su Zilin.

An Improved Genetic Algorithm for Optimizing BP (Back Propagation) Neural Network

[J]. Sci-Tech Information Development & Economy, 2011, 21(1): 119-121.)

https://doi.org/10.3969/j.issn.1005-6033.2011.01.053      URL      [本文引用: 4]      摘要

为了全面优化BP神经网络,使之具有较好的泛化性能,改进并设计了一种遗传算法,并通过算法对比测试表明,改进后的遗传算法减少了内存占用量,保证了种群的多样性,提高了算法的运行速度和收敛效果。
[20] 张秀华, 高伟.

基于GA-BPNN组合模型的图书馆绩效评价及实证研究

[J]. 情报学报, 2012, 31(8): 890-896.

https://doi.org/10.3772/j.issn.1000-0135.2012.08.014      URL      [本文引用: 2]      摘要

针对国内外图书馆绩效评价过程中评价方法存在的局限性,以及绩效评价系统指标因素的模糊性、不确定性、难以量化等特征,提出了遗传算法和BP神经网络算法相结合的GA—BPNN组合模型对其进行评价,首先建立基于GA—BPNN的评价模型,运用遗传算法GA优化BP神经网络的连接权值和阈值,然后把优化好连接权值和阈值输入BP网络进行智能网络训练,最后把待评价的测试样本输入到训练好的BP网络中进行实证分析,得到图书馆绩效评价的实际输出值,与传统BP神经网络算法得出的结果对比,拟合精度、准确度、效率大幅提高,从而证明该模型具有较好的可行性和实用性。

(Zhang Xiuhua, Gao Wei.

Library Performance Evaluation and an Empirical Study Based on GA-BPNN Combinatorial Model

[J]. Journal of the China Society for Scientific and Technical Information, 2012, 31(8): 890-896.)

https://doi.org/10.3772/j.issn.1000-0135.2012.08.014      URL      [本文引用: 2]      摘要

针对国内外图书馆绩效评价过程中评价方法存在的局限性,以及绩效评价系统指标因素的模糊性、不确定性、难以量化等特征,提出了遗传算法和BP神经网络算法相结合的GA—BPNN组合模型对其进行评价,首先建立基于GA—BPNN的评价模型,运用遗传算法GA优化BP神经网络的连接权值和阈值,然后把优化好连接权值和阈值输入BP网络进行智能网络训练,最后把待评价的测试样本输入到训练好的BP网络中进行实证分析,得到图书馆绩效评价的实际输出值,与传统BP神经网络算法得出的结果对比,拟合精度、准确度、效率大幅提高,从而证明该模型具有较好的可行性和实用性。
[21] 邰丽君, 胡如夫, 赵韩, .

改进遗传神经网络算法在销售预测中的应用研究

[J]. 现代图书情报技术, 2012(1): 63-67.

URL      [本文引用: 6]      摘要

针对传统BP神经网络销售预测算法存在学习效率低、收敛速度慢、易陷于局部极小值等不足,提出改进措施:采用自适应学习效率提高算法的有效性和收敛性,采用附加动量法提高算法的适应性,采用改进的遗传算法优化神经网络的权值,利用改进遗传算法全局寻优的特性实现快速寻优及精确预测的目的。最后用实例计算验证本算法。

(Tai Lijun, Hu Rufu, Zhao Han, et al.

Application Research of Improved Genetic Neural Network Algorithm in Sales Forecast

[J]. New Technology of Library and Information Service, 2012(1): 63-67.)

URL      [本文引用: 6]      摘要

针对传统BP神经网络销售预测算法存在学习效率低、收敛速度慢、易陷于局部极小值等不足,提出改进措施:采用自适应学习效率提高算法的有效性和收敛性,采用附加动量法提高算法的适应性,采用改进的遗传算法优化神经网络的权值,利用改进遗传算法全局寻优的特性实现快速寻优及精确预测的目的。最后用实例计算验证本算法。
[22] 罗长寿, 周丽英.

改进遗传算法的神经网络模型研究

[J]. 情报杂志, 2005, 24(5): 65-66.

https://doi.org/10.3969/j.issn.1002-1965.2005.05.024      URL      [本文引用: 3]      摘要

神经网络模型及遗传算法在信息识别、分析与处理方面有着广泛的应用前景.通过对实数编码的遗传算法进行分析,给出了一种改进的优化神经网络模型权值的遗传算法,试验表明,改进的遗传算法可以使神经网络模型的收敛性和稳定性得到明显改善,并且可以减少优化时间.

(Luo Changshou, Zhou Liying.

Research on the Neural Network Model for Improving Genetic Algorithm

[J]. Journal of Intelligence, 2005, 24(5): 65-66.)

https://doi.org/10.3969/j.issn.1002-1965.2005.05.024      URL      [本文引用: 3]      摘要

神经网络模型及遗传算法在信息识别、分析与处理方面有着广泛的应用前景.通过对实数编码的遗传算法进行分析,给出了一种改进的优化神经网络模型权值的遗传算法,试验表明,改进的遗传算法可以使神经网络模型的收敛性和稳定性得到明显改善,并且可以减少优化时间.
[23] Tani A, Candela L, Castelli D.

Dealing with Metadata Quality: The Legacy of Digital Library Efforts

[J]. Information Processing & Management, 2013, 49(6): 1194-1205.

https://doi.org/10.1016/j.ipm.2013.05.003      URL      [本文引用: 1]      摘要

In this work, we elaborate on the meaning of metadata quality by surveying efforts and experiences matured in the digital library domain. In particular, an overview of the frameworks developed to characterize such a multi-faceted concept is presented. Moreover, the most common quality-related problems affecting metadata both during the creation and the aggregation phase are discussed together with the approaches, technologies and tools developed to mitigate them. This survey on digital library developments is expected to contribute to the ongoing discussion on data and metadata quality occurring in the emerging yet more general framework of data infrastructures.
[24] Cummings J.

Full-Text Aggregation: An Examination of Metadata Accuracy and Implications for Resource Sharing

[J]. Serials Review, 2003, 29(1): 11-15.

https://doi.org/10.1016/S0098-7913(02)00256-3      URL      [本文引用: 1]      摘要

This study compared two lists of full-text content available in Academic Search Elite. EBSCO provided the lists to the University College of the Fraser Valley. In this study, focus was placed on the accuracy of the claims of full-text content, because the staff and library users at University College of the Fraser Valley (UCFV, British Columbia) depend on this database as part of the libraries' journal collection. Interlibrary loan staff routinely used a printed list of Academic Search Elite to check whether the journal was available at UCFV in electronic form; therefore, an accurate supplemental list or lists of the library's electronic journals was essential for cost-conscious interlibrary loan staff. The results of the study were that there were inaccuracies in the coverage of fifty-seven percent of the journals sampled. Serials Review 2003; 29:11-15.
[25] Tejeda-Lorente A, Porcel C, Peis E, et al.

A Quality Based Recommender System to Disseminate Information in a University Digital Library

[J]. Information Sciences, 2014, 261: 52-69.

https://doi.org/10.1016/j.ins.2013.10.036      URL      [本文引用: 1]      摘要

Recommender systems evaluate and filter the great amount of information available on the Web, so they could be used in an academic environment to help users in their searches of relevant information. In the literature, a lot of approaches for generating personalized recommendations of information items in such environment can be found. Usually, these approaches use user profiles and/or features of items to predict those relevant items, but they do not take into account the quality of these items. To overcome this problem, in this paper we propose a new recommender system based on quality. This system uses the quality of the items to estimate their relevance. The system measures the item quality and takes into account this measure like a new factor to be considered in the recommendation process. In such a way, we present a recommender system based on items quality, to help users to access relevant research resources. This recommender systems is developed by using a fuzzy linguistic approach and it has been tested satisfactorily in a university digital library.
[26] Kokkinos P, Varvarigos E A.

Scheduling Efficiency of Resource Information Aggregation in Grid Networks

[J]. Future Generation Computer Systems, 2012, 28(1): 9-23.

https://doi.org/10.1016/j.future.2011.06.008      URL      [本文引用: 1]      摘要

We consider information aggregation as a method for reducing the information exchanged in a Grid network and used by the resource manager in order to make scheduling decisions. In this way, information is summarized across nodes and sensitive or detailed information can be kept private, while resources are still publicly available for use. We present a general framework for information aggregation, trying to identify issues that relate to aggregation in Grids. In this context, we describe a number of techniques, including single point and intra-domain aggregation, define appropriate grid-specific domination relations and operators for aggregating static and dynamic resource information, and discuss resource selection optimization functions. The quality of an aggregation scheme is measured both by its effects on the efficiency of the scheduler decisions and also by the reduction it brings on the amount of resource information recorded, a tradeoff that we examine in detail. Simulation experiments demonstrate that the proposed schemes achieve significant information reduction, either in the amount of information exchanged, or in the frequency of the updates, while at the same time maintaining most of the value of the original information as expressed by a stretch factor metric we introduce.
[27] 肖奎, 罗保山, 吴天吉.

一种限定领域的网络文档资源质量评价方法——以维基百科为例

[J]. 情报理论与实践, 2016, 39(12): 120-123.

https://doi.org/10.16353/j.cnki.1000-7490.2016.12.022      URL      [本文引用: 1]      摘要

文章提出一种限定领域的维基百科词条质量评价方法,以实现精确计算维基百科词条质量值的目标。实验表明,该方法计算的词条质量值与人工评定的质量等级基本相符。

(Xiao Kui, Luo Baoshan, Wu Tianji.

An Approach for the Quality Evaluation of Web Document Resources in Specific Domains: A Case Study of Wikipedia

[J]. Information Studies: Theory & Application, 2016, 39(12): 120-123.)

https://doi.org/10.16353/j.cnki.1000-7490.2016.12.022      URL      [本文引用: 1]      摘要

文章提出一种限定领域的维基百科词条质量评价方法,以实现精确计算维基百科词条质量值的目标。实验表明,该方法计算的词条质量值与人工评定的质量等级基本相符。
[28] 邱均平, 董克.

引文网络中文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例

[J]. 中国图书馆学报, 2013, 39(2): 111-120.

URL      Magsci      [本文引用: 1]      摘要

科学文献之间通过引用关系构成了特定研究主题的知识网络,其单向无回路的特征揭示了学科主题的知识结构和发展过程。本文以WOS数据库中XML研究论文所构成的引文网络为例,利用引文关系权重与文献节点权重确定核心文献,并在此基础上从阈值和权值“高地”两个角度对核心文献进行聚合。研究发现:文献核心程度的确定过程充分考虑了不同引用实质上的重要程度区别,据此计算得到的引文和文献节点权重能够准确反映文献的质量;阈值聚合能够迅速发现整个学科发展过程中最核心的文献和引文;权值“高地”聚合分析结果更为多样,并能弥补阈值聚合在揭示次重要子结构方面的不足,发现整个知识体系发展过程中丰富的研究维度。图6。表4。参考文献11。

(Qiu Junping, Dong Ke.

Methods and Empirical Research on Deep Integration of Literature in Citation Network: Case Study on XML Research Literature from WOS

[J]. Journal of Library Science in China, 2013, 39(2): 111-120.)

URL      Magsci      [本文引用: 1]      摘要

科学文献之间通过引用关系构成了特定研究主题的知识网络,其单向无回路的特征揭示了学科主题的知识结构和发展过程。本文以WOS数据库中XML研究论文所构成的引文网络为例,利用引文关系权重与文献节点权重确定核心文献,并在此基础上从阈值和权值“高地”两个角度对核心文献进行聚合。研究发现:文献核心程度的确定过程充分考虑了不同引用实质上的重要程度区别,据此计算得到的引文和文献节点权重能够准确反映文献的质量;阈值聚合能够迅速发现整个学科发展过程中最核心的文献和引文;权值“高地”聚合分析结果更为多样,并能弥补阈值聚合在揭示次重要子结构方面的不足,发现整个知识体系发展过程中丰富的研究维度。图6。表4。参考文献11。
[29] 张博, 乔欢.

协同知识生产社区的内容质量评估模型研究——以维基百科为例

[J]. 现代情报, 2015, 35(10): 17-22.

https://doi.org/10.3969/j.issn.1008-0821.2015.10.004      URL      [本文引用: 1]      摘要

基于互联网平台的大规模用户协作知识生产是一种新颖的知识生产模式,这种模式能够有效利用海量用户的集体智慧,提高知识传播的范围。但是,与传统的知识生产不同,这种生产模式由于参与人员水平参差不齐,内容质量难以保证,针对此种生产模式建立有效的内容质量评估和控制机制问题非常必要。本文采用层次分析方法,以维基百科为实例建立了协同知识生产社区的内容质量评估模型,综合体现用户需求和内容特征,能够为网络内容的质量控制和网络知识平台的建设与运营提供有益的方法支撑。

(Zhang Bo, Qiao Huan.

Evaluating the Quality of Content in Online Collaborative Knowledge Production Communities

[J]. Journal of Modern Information, 2015, 35(10): 17-22.)

https://doi.org/10.3969/j.issn.1008-0821.2015.10.004      URL      [本文引用: 1]      摘要

基于互联网平台的大规模用户协作知识生产是一种新颖的知识生产模式,这种模式能够有效利用海量用户的集体智慧,提高知识传播的范围。但是,与传统的知识生产不同,这种生产模式由于参与人员水平参差不齐,内容质量难以保证,针对此种生产模式建立有效的内容质量评估和控制机制问题非常必要。本文采用层次分析方法,以维基百科为实例建立了协同知识生产社区的内容质量评估模型,综合体现用户需求和内容特征,能够为网络内容的质量控制和网络知识平台的建设与运营提供有益的方法支撑。
[30] 赵文轩, 李春旺.

关联数据质量评价方法研究述评

[J]. 情报理论与实践, 2016, 39(2): 134-138.

https://doi.org/10.16353/j.cnki.1000-7490.2016.02.028      URL      [本文引用: 1]      摘要

[目的/意义]近年来关联数据数量飞速增长,伴随而来的数据垃圾、语义与语法错误等低质量现象屡见不鲜,数据集质量问题受到普遍关注.全面分析关联数据质量评价的研究内容与方法,为质量控制与评价体系的构建提供参考;[方法/过程]系统梳理国外关联数据质量相关的研究动态,总结评价方法的演变过程,归纳与分析各种评价类型的内容、模式、特点与优缺点,在此基础上进行文献综述;[结果/结论]关联数据的质量评价类型主要分为基于单一指标的评价、基于多维指标的评价与质量评价指标体系.质量控制与评价体系的研究将向指标程度完整、公认度高、可行性强的方向寻求发展.

(Zhao Wenxuan, Li Chunwang.

Research on Quality Evaluation Method for Correlation Data

[J]. Information Studies: Theory & Application, 2016, 39(2): 134-138.)

https://doi.org/10.16353/j.cnki.1000-7490.2016.02.028      URL      [本文引用: 1]      摘要

[目的/意义]近年来关联数据数量飞速增长,伴随而来的数据垃圾、语义与语法错误等低质量现象屡见不鲜,数据集质量问题受到普遍关注.全面分析关联数据质量评价的研究内容与方法,为质量控制与评价体系的构建提供参考;[方法/过程]系统梳理国外关联数据质量相关的研究动态,总结评价方法的演变过程,归纳与分析各种评价类型的内容、模式、特点与优缺点,在此基础上进行文献综述;[结果/结论]关联数据的质量评价类型主要分为基于单一指标的评价、基于多维指标的评价与质量评价指标体系.质量控制与评价体系的研究将向指标程度完整、公认度高、可行性强的方向寻求发展.
[31] 王振蒙, 姜恩波.

关联书目数据质量评估框架构建与实证评估

[J]. 图书情报工作, 2016, 60(15): 108-115.

https://doi.org/10.13266/j.issn.0252-3116.2016.15.015      URL      [本文引用: 1]      摘要

[目的/意义]分析和评估国家图书馆发布的关联数据集,以了解典型国家级资源的数据质量状况,为其他图书馆的数据发布和应用集成提供借鉴。[方法/过程]在现有质量评估指标体系的基础上构建针对关联书目数据的质量评估框架和指标,通过人工调研和自动统计、分析方法对关联数据集的RDF词汇、URI有效性等7个指标进行统计和分析。[结果/结论]5个国家图书馆发布的图书关联数据集在RDF词汇、著录项描述、信息关联等3方面显示出较为明显的一致性,在语法检测及URI的有效性检测等方面显示出国家图书馆数据的高质量。

(Wang Zhenmeng, Jiang Enbo.

Building and Empirical Assessment of Quality Assessment Framework of Linked Bibliographic Data

[J]. Library and Information Service, 2016, 60(15): 108-115.)

https://doi.org/10.13266/j.issn.0252-3116.2016.15.015      URL      [本文引用: 1]      摘要

[目的/意义]分析和评估国家图书馆发布的关联数据集,以了解典型国家级资源的数据质量状况,为其他图书馆的数据发布和应用集成提供借鉴。[方法/过程]在现有质量评估指标体系的基础上构建针对关联书目数据的质量评估框架和指标,通过人工调研和自动统计、分析方法对关联数据集的RDF词汇、URI有效性等7个指标进行统计和分析。[结果/结论]5个国家图书馆发布的图书关联数据集在RDF词汇、著录项描述、信息关联等3方面显示出较为明显的一致性,在语法检测及URI的有效性检测等方面显示出国家图书馆数据的高质量。
[32] 王福.

数字图书馆资源聚合质量影响因素研究

[J]. 情报理论与实践, 2016, 39(12): 86-90, 113.

https://doi.org/10.16353/j.cnki.1000-7490.2016.12.016      URL      [本文引用: 1]      摘要

[目的/意义]虽然目前数字图书馆资源聚合理论体系不断完善、方法不断丰富,但鲜有聚合质量的研究成果问世.为对数字图书馆资源聚合质量评价体系构建提供依据,有必要对资源聚合质量影响因素进行研究.[方法/过程]运用系统论、归纳演绎法、管理学等方法对资源聚合质量影响因素从多个维度进行挖掘,形成模块化的数字图书馆资源聚合影响因素体系.[结果/结论]构建了数字图书馆资源聚合质量影响因素体系,为数字图书馆资源聚合质量评价体系的构建奠定了良好的基础.[局限]由于聚合质量涉及的影响因素较多,对影响因素总结不是很全面,需要下一步深入研究.

(Wang Fu.

Research on the Factors Affecting the Quality of Digital Library Resources Aggregation

[J]. Information Studies: Theory & Application, 2016, 39(12): 86-90, 113.)

https://doi.org/10.16353/j.cnki.1000-7490.2016.12.016      URL      [本文引用: 1]      摘要

[目的/意义]虽然目前数字图书馆资源聚合理论体系不断完善、方法不断丰富,但鲜有聚合质量的研究成果问世.为对数字图书馆资源聚合质量评价体系构建提供依据,有必要对资源聚合质量影响因素进行研究.[方法/过程]运用系统论、归纳演绎法、管理学等方法对资源聚合质量影响因素从多个维度进行挖掘,形成模块化的数字图书馆资源聚合影响因素体系.[结果/结论]构建了数字图书馆资源聚合质量影响因素体系,为数字图书馆资源聚合质量评价体系的构建奠定了良好的基础.[局限]由于聚合质量涉及的影响因素较多,对影响因素总结不是很全面,需要下一步深入研究.
[33] 刘宏哲, 须德.

基于本体的语义相似度和相关度计算研究综述

[J]. 计算机科学, 2012, 39(2): 8-13.

https://doi.org/10.3969/j.issn.1002-137X.2012.02.002      URL      [本文引用: 1]      摘要

语义相似度和相关度计算广泛应用于自然语言处理中,已有大量语义 相似度和相关度算法被提出.分析总结了树和图结构中影响概念相似度或相关度的因素,综述了基于本体的英文语义相似度和相关度计算方法,明确了语义相似度和 相关度的区别与联系,系统地对算法进行了分类,最后对每类算法进行了详细的比较.

(Liu Hongzhe, Xu De.

Ontology Based Semantic Similarity and Relatedness Measures Review

[J]. Computer Science, 2012, 39(2): 8-13.)

https://doi.org/10.3969/j.issn.1002-137X.2012.02.002      URL      [本文引用: 1]      摘要

语义相似度和相关度计算广泛应用于自然语言处理中,已有大量语义 相似度和相关度算法被提出.分析总结了树和图结构中影响概念相似度或相关度的因素,综述了基于本体的英文语义相似度和相关度计算方法,明确了语义相似度和 相关度的区别与联系,系统地对算法进行了分类,最后对每类算法进行了详细的比较.
[34] Yeung C A, Gibbins N, Shadbolt N.

Understanding the Semantics of Ambiguous Tags in Folksonomies

[C]// Proceedings of the 1st International Conference on Emergent Semantics and Ontology Evolution. 2007.

[本文引用: 1]     

[35] 吴贝贝, 夏翠娟.

关联书目数据模型比较研究

[J]. 图书馆杂志, 2015, 34(5): 71-79.

[本文引用: 1]     

(Wu Beibei, Xia Cuijuan.

Comparative Study of Linked Bibliographic Data Models in Libraries

[J]. Library Journal, 2015, 34(5): 71-79.)

[本文引用: 1]     

[36] 孙琛琛, 申德荣, 寇月, .

面向关联数据的联合式实体识别方法

[J]. 计算机学报, 2015, 38(9): 1739-1754.

https://doi.org/10.11897/SP.J.1016.2015.01739      URL      [本文引用: 1]      摘要

文中提出一种基于图的、迭代的联合式实体识别方法.初始时,将多类型的、关联的实体数据对象集合构建实体数据对象关系图,将基于语义路径的相似度和属性相似度结合起来判断数据对象是否匹配;然后,合并匹配成功的数据对象,并对对象图中的相应数据对象结点及其周边执行局部图收缩,这两个操作使对象图的局部语义变得更丰富,促使该局部范围内产生出新的候选匹配对象对,以待后续识别,实现相似度传递,形成一个迭代的识别过程.随着不断迭代,对象图的语义不断丰富,提高了联合式实体识别的准确性.通过实验证明文中提出的方法比已有的联合式实体识别方法和基于对象关系的单类型实体识别方法具有更高的准确性.

(Sun Chenchen, Shen Derong, Kou Yue, et al.

A Related Data Oriented Joint Entity Resolution Approach

[J]. Chinese Journal of Computers, 2015, 38(9): 1739-1754.)

https://doi.org/10.11897/SP.J.1016.2015.01739      URL      [本文引用: 1]      摘要

文中提出一种基于图的、迭代的联合式实体识别方法.初始时,将多类型的、关联的实体数据对象集合构建实体数据对象关系图,将基于语义路径的相似度和属性相似度结合起来判断数据对象是否匹配;然后,合并匹配成功的数据对象,并对对象图中的相应数据对象结点及其周边执行局部图收缩,这两个操作使对象图的局部语义变得更丰富,促使该局部范围内产生出新的候选匹配对象对,以待后续识别,实现相似度传递,形成一个迭代的识别过程.随着不断迭代,对象图的语义不断丰富,提高了联合式实体识别的准确性.通过实验证明文中提出的方法比已有的联合式实体识别方法和基于对象关系的单类型实体识别方法具有更高的准确性.
[37] 姜恩波, 王振蒙.

关联数据质量评估研究综述

[J]. 情报杂志, 2016, 35(4): 171-176.

https://doi.org/10.3969/j.issn.1002-1965.2016.04.031      URL      [本文引用: 1]      摘要

[目的/意义]梳理关联数据质量评估理论和工具的发展情况,了解其发展特征,阐明质量评估对提高关联数据质量的重要性,为关联数据质量的改善与应用提供借鉴和新的思路。[方法/过程]通过文献调研,揭示关联数据当前存在较为严重的质量问题。另外,从评估体系、评估方法以及评估工具三个方面介绍国外关联数据质量评估领域的发展现状。[结果/结论]关联数据质量评估领域理论发展较快,而应用评估工具需要加速发展,并在此基础上提出了"开源众筹插件"的建议开发模式。

(Jiang Enbo, Wang Zhenmeng.

The Quality Evaluation of Linked Data: An Overview

[J]. Journal of Intelligence, 2016, 35(4): 171-176.)

https://doi.org/10.3969/j.issn.1002-1965.2016.04.031      URL      [本文引用: 1]      摘要

[目的/意义]梳理关联数据质量评估理论和工具的发展情况,了解其发展特征,阐明质量评估对提高关联数据质量的重要性,为关联数据质量的改善与应用提供借鉴和新的思路。[方法/过程]通过文献调研,揭示关联数据当前存在较为严重的质量问题。另外,从评估体系、评估方法以及评估工具三个方面介绍国外关联数据质量评估领域的发展现状。[结果/结论]关联数据质量评估领域理论发展较快,而应用评估工具需要加速发展,并在此基础上提出了"开源众筹插件"的建议开发模式。
[38] 唐一之, 张仲义.

基于本体的知识聚合策略

[J]. 吉首大学学报: 自然科学版, 2008, 29(2): 72-76.

https://doi.org/10.3969/j.issn.1007-2985.2008.02.020      URL      [本文引用: 1]      摘要

探讨了本体论在知识库管理中的应用和方法,给出了基于本体论知识库元模型结构,阐述了知识库本体的建立和融合过程,并利用有色Petri网对融合工程进行验证.

(Tang Yizhi, Zhang Zhongyi.

Ontology-Based Study on Knowledge Aggregation Strategy

[J]. Journal of Jishou University: Natural Science Edition, 2008, 29(2): 72-76.)

https://doi.org/10.3969/j.issn.1007-2985.2008.02.020      URL      [本文引用: 1]      摘要

探讨了本体论在知识库管理中的应用和方法,给出了基于本体论知识库元模型结构,阐述了知识库本体的建立和融合过程,并利用有色Petri网对融合工程进行验证.
[39] 黄莺.

元数据质量的定量评估方法综述

[J]. 图书情报工作, 2013, 57(4): 143-148.

https://doi.org/10.7536/j.jssn.0252-3116.2013.04.025      URL      Magsci      [本文引用: 1]      摘要

在元数据质量研究成果的基础上总结出元数据质量的涵义,并以此涵义为基础,归纳元数据评估的4个主要维度:完整性、准确性、一致性、期望满足程度.在对比 元数据质量评估方式的基础上得出自动化评估是质量管理的必要举措.为实现自动评估,将信息熵、信息检索中向量空间模型、逆文献频率加权法等理论应用到4个 主要维度的量化中,提出具体的定量评估计算公式;最后介绍其他常见评估维度的定量评估思路和自动化定量评估方面需要进一步深入的研究工作.

(Huang Ying.

Review on Quantitative Assessment of Metadata Quality

[J]. Library and Information Service, 2013, 57(4): 143-148.)

https://doi.org/10.7536/j.jssn.0252-3116.2013.04.025      URL      Magsci      [本文引用: 1]      摘要

在元数据质量研究成果的基础上总结出元数据质量的涵义,并以此涵义为基础,归纳元数据评估的4个主要维度:完整性、准确性、一致性、期望满足程度.在对比 元数据质量评估方式的基础上得出自动化评估是质量管理的必要举措.为实现自动评估,将信息熵、信息检索中向量空间模型、逆文献频率加权法等理论应用到4个 主要维度的量化中,提出具体的定量评估计算公式;最后介绍其他常见评估维度的定量评估思路和自动化定量评估方面需要进一步深入的研究工作.
[40] 欧石燕, 胡珊, 张帅.

本体与关联数据驱动的图书馆信息资源语义整合方法及其测评

[J]. 图书情报工作, 2014, 58(2): 5-13.

https://doi.org/10.13266/j.issn.0252-3116.2014.02.001      URL      [本文引用: 1]      摘要

探索语义网技术在图书馆信息资源整合中的应用。首先,提出一个本体与关联数据驱动的资源语义整合框架,实现:①图书馆中不同格式、不同类型文献资源的整合;②不同数据集合中信息资源的语义整合;③图书馆馆藏资源与外界相关资源的链接与集成,从而构成一个可无限延伸与扩展的开放的资源整合体系。其次,构建一个资源整合演示系统。最后,将该系统与使用传统资源整合方式的CALIS OPAC系统和CNKI进行实验对比。

(Ou Shiyan, Hu Shan, Zhang Shuai.

An Ontology & Linked Data Driven Semantic Integration Method of Library Information Resources and Its Evaluation

[J]. Library and Information Service, 2014, 58(2): 5-13.)

https://doi.org/10.13266/j.issn.0252-3116.2014.02.001      URL      [本文引用: 1]      摘要

探索语义网技术在图书馆信息资源整合中的应用。首先,提出一个本体与关联数据驱动的资源语义整合框架,实现:①图书馆中不同格式、不同类型文献资源的整合;②不同数据集合中信息资源的语义整合;③图书馆馆藏资源与外界相关资源的链接与集成,从而构成一个可无限延伸与扩展的开放的资源整合体系。其次,构建一个资源整合演示系统。最后,将该系统与使用传统资源整合方式的CALIS OPAC系统和CNKI进行实验对比。
[41] 邱均平, 方国平.

高校图书馆语义化馆藏资源深度聚合模式及其应用研究

[J]. 图书馆学研究, 2014(21): 64-71.

URL      [本文引用: 1]      摘要

馆藏资源深度聚合有利于图书馆向用户提供更精细化、系统化的知识服务。文章提出3种馆藏资源深度聚合模式:基于元数据的深度聚合模式、基于计量分析的深度聚合模式、基于领域本体的深度聚合模式,并对3种聚合模式做了对比分析。针对我国目前高校图书馆学科服务平台建设存在的一些问题,理论性地探索了将馆藏资源深度聚合模式运用到高校图书馆学科服务平台建设中来,希望借此重新定位高校图书馆学科服务平台建设。

(Qiu Junping, Fang Guoping.

Research on the Depth Aggregation Model and Its Application of the Semantic Collection in University Libraries

[J]. Research on Library Science, 2014 (21): 64-71.)

URL      [本文引用: 1]      摘要

馆藏资源深度聚合有利于图书馆向用户提供更精细化、系统化的知识服务。文章提出3种馆藏资源深度聚合模式:基于元数据的深度聚合模式、基于计量分析的深度聚合模式、基于领域本体的深度聚合模式,并对3种聚合模式做了对比分析。针对我国目前高校图书馆学科服务平台建设存在的一些问题,理论性地探索了将馆藏资源深度聚合模式运用到高校图书馆学科服务平台建设中来,希望借此重新定位高校图书馆学科服务平台建设。
[42] 王晰巍, 赵丹, 张长亮, .

基于社会网络的新媒体网络舆情信息传播研究——以反腐倡廉话题为例

[J]. 情报杂志, 2016, 35(3): 103-110.

URL      [本文引用: 1]     

(Wang Xiwei, Zhao Dan, Zhang Changliang, et al.

Research on Public Opinion Information Dissemination of New Media Network Based on Social Network - Taking the Anti-corrruption Campaign as an Example

[J]. Journal of Information, 2016, 35(3): 103-110.)

URL      [本文引用: 1]     

[43] 苏新宁.

大数据时代数字图书馆面临的机遇和挑战

[J]. 中国图书馆学报, 2015, 41(6): 4-12.

https://doi.org/10.13530/j.cnki.jlis.150028      URL      [本文引用: 1]      摘要

大数据时代,网络学术资源建设快速发展,大有取代数字图书馆之势。在这样一种背景下.数字图书馆建设要有大数据思维:在资源建设方面,要拓展资源范畴,增加资源整合的广度,加强资源组织加工的深度:在技术应用方面,重视语义技术,加强聚类技术的应用,广泛应用数据分析技术,提升检索技术与水平;在服务方面,丰富数字图书馆服务产品,服务模式由被动、等待、共性化转向积极主动、自动推送和个性化。未来数字图书馆要跳出传统资源建设的框架,树立全方位服务的理念,提供全资源服务,拓展服务方式和传播形式,数字图书馆馆员应该立志成为数据分析家。

(Su Xinning.

Opportunities and Challenges Faced by Digital Libraries in the Era of Big Data

[J]. Journal of Library Science in China, 2015, 41(6): 4-12.)

https://doi.org/10.13530/j.cnki.jlis.150028      URL      [本文引用: 1]      摘要

大数据时代,网络学术资源建设快速发展,大有取代数字图书馆之势。在这样一种背景下.数字图书馆建设要有大数据思维:在资源建设方面,要拓展资源范畴,增加资源整合的广度,加强资源组织加工的深度:在技术应用方面,重视语义技术,加强聚类技术的应用,广泛应用数据分析技术,提升检索技术与水平;在服务方面,丰富数字图书馆服务产品,服务模式由被动、等待、共性化转向积极主动、自动推送和个性化。未来数字图书馆要跳出传统资源建设的框架,树立全方位服务的理念,提供全资源服务,拓展服务方式和传播形式,数字图书馆馆员应该立志成为数据分析家。
[44] 饶浩, 陈海媚.

主成分分析与BP神经网络在微博舆情预判中的应用

[J]. 现代情报, 2016, 36(7): 58-62.

https://doi.org/10.3969/j.issn.1008-0821.2016.07.011      URL      [本文引用: 2]      摘要

首先通过主成分分析消除原始指标之间的相关性,使指标数量变少且相互之间不相关,从而构建综合预判指标,再利用BP神经网络建立微博舆情预判模型。实验选取2013年微博热门话题作为训练样本,选取2014年的话题作为预测。实验结果表明,主成分分析有助于去除原始样本数据的冗余,简化了网络的复杂度,所得到的结果更加准确。因此,该模型较仅使用BP神经网络的准确性更高。

(Rao Hao, Chen Haimei.

Application of Micro-blog Public Opinion Prediction Based on Combination of Principal Component Analysis and BP Neural Network

[J]. Journal of Modern Information, 2016, 36(7): 58-62.)

https://doi.org/10.3969/j.issn.1008-0821.2016.07.011      URL      [本文引用: 2]      摘要

首先通过主成分分析消除原始指标之间的相关性,使指标数量变少且相互之间不相关,从而构建综合预判指标,再利用BP神经网络建立微博舆情预判模型。实验选取2013年微博热门话题作为训练样本,选取2014年的话题作为预测。实验结果表明,主成分分析有助于去除原始样本数据的冗余,简化了网络的复杂度,所得到的结果更加准确。因此,该模型较仅使用BP神经网络的准确性更高。
[45] 徐恺英, 常改, 邢天亮.

基于SVM神经网络的高校科研能力评价模型构建

[J]. 图书情报工作, 2011, 55(22): 52-55.

URL      Magsci      [本文引用: 2]      摘要

利用SVM神经网络的原理,建立SVM评估模型并在MATLAB中进行仿真,得出的测试结果与某机构的评价分析结果吻合,从而实现对高校科研能力的评估,为评价模型的广泛应用提供新的思路和方法。

(Xu Kaiying, Chang Gai, Xing Tianliang.

Evaluation Model of Universtiy Scientific Research Ability Based on SVM Neural Network

[J]. Library and Information Service, 2011, 55(22): 52-55.)

URL      Magsci      [本文引用: 2]      摘要

利用SVM神经网络的原理,建立SVM评估模型并在MATLAB中进行仿真,得出的测试结果与某机构的评价分析结果吻合,从而实现对高校科研能力的评估,为评价模型的广泛应用提供新的思路和方法。
[46] 于海东.

社会网络中的知识扩散路径优化设计

[J]. 情报科学, 2014, 32(7): 114-118.

URL      [本文引用: 1]      摘要

知识扩散效率已成为衡量国家或 地区科技创新能力的关键指标,但科研协作成本的客观存在制约了知识扩散。社会网络节点间科研协作成本可以通过节点间总距离来描述,主动优化总路径距离有助 于提高知识扩散效率,避免节点主体自治的盲目性。本文为此提出一种基于遗传算法的社会网络下知识扩散路径优化模型,并对该模型的算法进行了设计和改进,最 后通过仿真案例检验了算法的有效性。

(Yu Haidong.

Optimization of Knowledge Diffusion Route in Social Network

[J]. Information Science, 2014, 32(7): 114-118.)

URL      [本文引用: 1]      摘要

知识扩散效率已成为衡量国家或 地区科技创新能力的关键指标,但科研协作成本的客观存在制约了知识扩散。社会网络节点间科研协作成本可以通过节点间总距离来描述,主动优化总路径距离有助 于提高知识扩散效率,避免节点主体自治的盲目性。本文为此提出一种基于遗传算法的社会网络下知识扩散路径优化模型,并对该模型的算法进行了设计和改进,最 后通过仿真案例检验了算法的有效性。
[47] 杜戈, 韩增奇, 李宁霞, .

基于神经网络和遗传算法的信息传输安全风险度评估模型

[J]. 情报杂志, 2010, 29(S1): 207-209.

https://doi.org/10.3969/j.issn.1002-1965.2010.z1.067      URL      [本文引用: 1]      摘要

如何有效地认识信息传输过程中的风险和避免这些风险,是信息安全管理过程中的一个重大实际问题.将人工神经网络技术和遗传算法引入到信息传输风险度评估中,建立了信息传输风险度的数学评估模型,并用实例说明了该方法的应用过程.结果表明,该方法产生的风险度基本接近于期望结果.

(Du Ge, Han Zengqi, Li Ningxia, et al.

An Assessment Model of Information Transmission Security Risk Based on Neural Network and Genetic Algorithm

[J]. Journal of Intelligence, 2010, 29(S1): 207-209.)

https://doi.org/10.3969/j.issn.1002-1965.2010.z1.067      URL      [本文引用: 1]      摘要

如何有效地认识信息传输过程中的风险和避免这些风险,是信息安全管理过程中的一个重大实际问题.将人工神经网络技术和遗传算法引入到信息传输风险度评估中,建立了信息传输风险度的数学评估模型,并用实例说明了该方法的应用过程.结果表明,该方法产生的风险度基本接近于期望结果.
[48] 徐承爱, 林伟, 肖红.

一种基于加权海明距离的自适应遗传算法

[J]. 华南师范大学学报: 自然科学版, 2015, 47(6): 121-127.

https://doi.org/10.6054/j.jscnun.2015.05.003      URL      [本文引用: 1]      摘要

针对普通遗传算法易出现早熟收敛和搜索效率低的缺陷,提出一种基于加权海明距离的自适应遗传算法.该算法综合考虑个体间加权海明距离和适应度值,自适应调整交叉概率和变异概率;采用精英保留法,保证最优个体不被破坏;使用双重停机准则,减少不必要的计算时间,提高遗传搜索效率.最后,运用经典测试函数对该算法进行了仿真实验.结果表明,该算法可以显著提高遗传优化的全局搜索能力,加快遗传算法的收敛速度.

(Xu Cheng’ai, Lin Wei, Xiao Hong.

An Adaptive Genetic Algorithm Based on Weighted Hamming Distance

[J]. Journal of South China Normal University: Natural Science Edition, 2015, 47(6): 121-127.)

https://doi.org/10.6054/j.jscnun.2015.05.003      URL      [本文引用: 1]      摘要

针对普通遗传算法易出现早熟收敛和搜索效率低的缺陷,提出一种基于加权海明距离的自适应遗传算法.该算法综合考虑个体间加权海明距离和适应度值,自适应调整交叉概率和变异概率;采用精英保留法,保证最优个体不被破坏;使用双重停机准则,减少不必要的计算时间,提高遗传搜索效率.最后,运用经典测试函数对该算法进行了仿真实验.结果表明,该算法可以显著提高遗传优化的全局搜索能力,加快遗传算法的收敛速度.
[49] 危志明, 陈琪.

基于遗传神经网络的图书馆流通量预测

[J]. 情报探索, 2009(10): 5-7.

https://doi.org/10.3969/j.issn.1005-8095.2009.10.002      URL      [本文引用: 1]      摘要

针对图书馆流通量预测问题.提出了基于遗传神经网络的预测模型。该模型采用遗传算法作为神经网络权值全局搜索算法,BP算法作为局部搜索算法。结合实例进行计算,结果表明,该算法用于预测图书馆流通量是可行和有效的。

(Wei Zhiming, Chen Qi.

Research on Prediction of Library Circulation Based on Genetic Neural Network

[J]. Information Research, 2009 (10): 5-7.)

https://doi.org/10.3969/j.issn.1005-8095.2009.10.002      URL      [本文引用: 1]      摘要

针对图书馆流通量预测问题.提出了基于遗传神经网络的预测模型。该模型采用遗传算法作为神经网络权值全局搜索算法,BP算法作为局部搜索算法。结合实例进行计算,结果表明,该算法用于预测图书馆流通量是可行和有效的。
[50] 黄光球, 汪晓海, 刘兆明.

基于神经网络-交叉变异-FFT的组合加解密方法

[J]. 情报杂志, 2006, 25(10): 5-7.

[本文引用: 1]     

(Huang Guangqiu, Wang Xiaohai, Liu Zhaoming.

A Combining Encryption and Decryption Algorithm Based on Neural Networks Cross-and-Variation and FFT

[J]. Journal of Intelligence, 2006, 25(10): 5-7.)

[本文引用: 1]     

[51] 张修文, 付佳, 孙达辰, .

基于遗传算法优化的BPNN读者满足率评价模型

[J]. 中华医学图书情报杂志, 2013, 22(10): 68-70.

https://doi.org/10.3969/j.issn.1671-3982.2013.10.018      URL      [本文引用: 2]      摘要

在分析读者满足率意义及与其相关因素的基础上,提出了基于遗传算法优化的BPNN读者满足率评价模型,并通过实验验证了其有效性。

(Zhang Xiuwen, Fu Jia, Sun Dachen, et al.

Genetic Algorithm-based Optimal Assessment Model of BPNN Readers’ Satisfaction Rate

[J]. Chinese Journal of Medical Library and Information Science, 2013, 22(10): 68-70.)

https://doi.org/10.3969/j.issn.1671-3982.2013.10.018      URL      [本文引用: 2]      摘要

在分析读者满足率意义及与其相关因素的基础上,提出了基于遗传算法优化的BPNN读者满足率评价模型,并通过实验验证了其有效性。
[52] MathWorks. MATLAB R2014a [CP]. 2014.

[本文引用: 1]     

[53] 赵伟, 张秀华.

基于遗传神经网络的图书馆成效评估研究

[J]. 情报理论与实践, 2013, 36(12): 94-98.

URL      [本文引用: 1]      摘要

针对国内外图书馆成效评估的研究现状,以基于遗传神经网络算法的组合模型对图书馆成效进行评估。首先,构建了图书馆成效评估的评估体系,其次,建立遗传神经网络算法模型,对图书馆成效进行评估仿真实验及实证分析,得到了图书馆成效评估的实际输出值,与传统神经网络算法的输出结果相对比可知,遗传神经网络算法具有更好的拟合精度、准确度及效率,从而证明了遗传神经网络算法在图书馆成效评估中的实用性及可行性。

(Zhao Wei, Zhang Xihua.

Evaluation on Library Effectiveness Based on Genetic Neural Network

[J]. Information Studies: Theory & Application, 2013, 36(12): 94-98.)

URL      [本文引用: 1]      摘要

针对国内外图书馆成效评估的研究现状,以基于遗传神经网络算法的组合模型对图书馆成效进行评估。首先,构建了图书馆成效评估的评估体系,其次,建立遗传神经网络算法模型,对图书馆成效进行评估仿真实验及实证分析,得到了图书馆成效评估的实际输出值,与传统神经网络算法的输出结果相对比可知,遗传神经网络算法具有更好的拟合精度、准确度及效率,从而证明了遗传神经网络算法在图书馆成效评估中的实用性及可行性。
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn

/