本专题在梳理和总结数字资源语义互联的相关理论、方法、模型及其应用环境的基础上,立足于语义网格环境,从数字图书馆知识组织系统构建的发展方向和应用需求出发,基于元数据、领域本体、桥本体和本体解析体系为核心要素构建语义模型,以语义模型为核心,提出了数字图书馆知识组织语义互联的应用模型。综合理论研究和应用研究,结合对医学领域的应用需求分析,设计实现了基于语义网格的、面向医学领域的语义互联原型系统(Medicine-Oriented Semantic Interconnection Simulation System,MOSISS)。
基于元数据、领域本体、桥本体和本体解析体系为核心要素构建语义模型,提出数字图书馆知识组织语义互联的应用模型,以语义异构和结构异构的电子病历为案例,设计和部分实现面向医学领域的语义互联模拟系统,从应用层面对数字图书馆知识组织语义互联进行探讨。
采用静态和动态相结合的方案构建桥本体,利用Protégé 3.4静态构建桥本体的类、子类和属性,在Eclipse SDKv3.4.2开发平台下,通过语义相似度计算动态构建桥本体的实例和属性值,最终形成可共享的OWL语言描述的桥本体。
面向医学领域的语义互联模拟系统(MOSISS)是数字资源语义互联研究的实例支撑。语义标注子系统是MOSISS的重点子系统。在基于本体的语义标注思想指导下,阐述该子系统的设计思想、体系结构以及功能,探索多领域本体在语义标注中的应用,为用户提供一种共享数据的方式。
以书目对象基于形式形态多样性、生命周期变化性、复合对象复杂性的序化问题作为书目语义化组织的研究起点,提出并初步实践基于本体构建语义关联、通过关联数据的一致化语义描述方法(RDFS/OWL)和统一存取机制(SPARQL)进行语义化组织的方法。
基于MVC模式设计并实现一个B/S结构的政务信息资源分类系统,描述该系统的体系架构和业务逻辑,重点解决数据抽象、业务关联、权限控制和可视化等关键问题。经运行测试,系统能较好地满足分类机制和跨部门业务关联的需求,并实现对整个分类体系以及业务关联关系的可视化。
研究国内外现有术语语义层次关联的主要方法,针对如何获取术语语义层次内部结构的关键问题,构建术语语义层次获取流程,采用多重聚类方法获取层次关系,结合综合相似度计算方法提取层次内部的聚类标签,并选取一定的语料进行实验,验证该流程的合理性。
针对目前用户对电子政务信息服务效率的迫切需求,从信息资源组织的角度,在数据元的微观层面为电子政务信息服务快速响应提供解决思路,构建以快速响应为导向的电子政务信息服务模型,并对模型进行实例验证。
利用自组织映射(SOM)人工神经网络方法分析60种有代表性的国外图书情报类期刊的热点主题及Journal of Information Science(JIS)从1981-2007年的主题发展趋势。利用改进的SOM输出方式——属性叠加矩阵,识别出60种期刊的7类热点主题,并构造一种新的SOM显示方式“热点属性投影”, 结合常见的U-matrix图,分析JIS期刊的热点主题在过去27年间的发展过程与规律。其研究结果在一定程度上可以反映国外图书情报类期刊主题的发展规律。该研究方法为期刊热点主题识别及发展趋势研究提供较为完整的工具与思路。
介绍相似重复数据清理的步骤、框架和衡量标准。重点对检测和清除算法按照算法类型及相关改进思路进行分类综述,给出算法的适用范围和优缺点,概括现有的数据清理工具(如Merge/Purge)。对相似重复记录清理领域的研究问题进行展望,将知识和语义的概念引入到数据清理框架中是未来重要的发展趋势。
针对目前用于专利分析的数据存在来源单一、预处理操作不够、可挖掘程度浅等问题,设计并实现异构专利数据源集成方案,即从七国两组织的专利数据库获取数据到本地专利数据库;以本地数据库为基础数据源,利用SSIS工具通过ETL(数据抽取-数据转换-数据装载)操作,生成规范的、集成的高质量数据;进而将其加载到事先围绕KPI(关键性能指标)分析构建好的专利数据仓库中,从而为专利多维分析以及数据挖掘提供有效的数据支持。
从图书情报领域的分类法及相关理念入手,研究构建网络科学数据资源的分类导航平台。引入动态面分类法对科学数据资源目录进行组织,在此基础上,提出可行的多维关键词与多维分类关联的标引方法;设计基于分类与关键词关联权重的排序方案,使用该构建方案开发的实验系统可以有效地对分散网络科学数据资源进行分类并提供导航服务。
针对古籍数字化图像多为二值图像的特征,设计应用二值图像数字水印技术保护其版权的方案,分析水印嵌入的安全性和不可见性。实验结果表明,该方法能够有效地满足数字化古籍的版权保护需要。
针对目前图书管理系统架构在实现信息共享方面的技术瓶颈,引入REST概念,介绍并分析RESTful Web服务架构,以图书管理工作中的入库、修改、报废、查询和借还业务为例,设计并实现基于RESTful Web服务的图书管理系统,为构建适合轻量级信息共享的图书管理系统提供参考,并通过测试证实该系统在实现轻量级图书信息共享方面的优越性和可行性。
将Google 图书搜索引擎嵌入到Web OPAC中,实现Web OPAC的图书预览功能,并详细介绍实现的技术思路和具体实现步骤,利用Web OPAC为用户提供更好的信息服务。