介绍复合数字对象语义存交研究进展,包括复合数字对象语义表达研究现状,复合数字对象语义存储研究现状,以及复合数字对象语义存交相关项目的研究情况。
数字图书馆的非文献资源包括用户、用户产生的信息和用户行动,它们是社会网络、社会媒体与虚拟世界的元数据对象。在虚拟世界系统的基础上(含登记系统、地图系统、动态消息系统、快照系统和库存系统等),讨论数字图书馆能够以用户建模和信息系统模块来发展虚拟科研环境、虚拟校园和虚拟知识型社会等。
介绍基于本体的科学家网络VIVO中的数据摄取工具,分析关系数据模型向RDF数据模型的批量数据摄取并与VIVO本体匹配的原理,阐述工具应用流程,为基于本体构建的信息服务系统或语义网应用中存在的异构数据摄取问题提供解决方法,并讨论该工具的特色和存在的问题。
通过对图书馆主要使用的7 种开源OPAC系统在基本技术信息、检索功能、检索结果的显示和输出、Web2.0功能等方面进行调查和对比分析,对其存在的问题进行探讨,为国内图书馆选用开源OPAC系统提供指导及借鉴。
针对新闻组的海量性及相关编码特点设计新闻帖抓取流程,采用多线程方式加快新闻帖的抓取及解析速度,同时设计一种便于海量数据断点续传的数据存储结构,通过实验采集验证该方法能有效达到信息检测的数据采集要求,抓取及解析新闻帖的速度比普通单线程抓取解析方式有显著提高。
借用UMLS的语义网络构建顶层本体,建立疾病知识和UMLS中语义类型的映射关系,并对UMLS的语义关系进行细化,通过细化的语义关系将疾病与其相关的知识关联,构建疾病与症状、检查、药物、医疗器械与医疗法规之间的关联关系,实现疾病知识的整合。通过实例展示疾病知识整合的过程。
提出一种多粒度的用户行为数据收集方法,该方法以可配置的插件形式嵌入服务器端收集数据。实验证明,该方法能提高Web使用挖掘的数据质量,简化Web使用挖掘预处理工作,并为后续挖掘工作提供多种粒度的信息,从而为分析Web用户的行为提供优质数据源。
采用聚类分析的方法,对汉字的特征进行研究和分析,找出其内在规律,根据汉字具有“成簇性”的特点,对中文字符串进行精细化匹配,给出基于改进编辑距离的相似度计算模型。实验结果表明,该模型对中文字符串的相似度具有更为精细的体现。
应用系统动力学方法对产学研研发合作中的信息资源配置演化机理进行定性与定量研究,构建系统动力学模型,并利用该模型对我国2010-2025年产学研研发合作中的信息资源配置情况进行模拟仿真,根据仿真结果提出信息资源优化配置方案,以此提高研发合作中信息资源的投入-产出效益。
采用空间计量学理论,以定量的方法对网络学术信息的空间依赖性进行分析。研究发现,地理距离影响着网络学术信息的地理空间分布情况,当两个空间单元的地理位置越接近时,网络学术信息在这两个空间单元的分布情况越相似,网络学术信息分布的空间依赖性的确存在,但空间依赖性大小并不相同,中国网络学术信息分布的空间依赖性比美国要大。
以国内财经网站和讯微博为例,使用计量学方法,对用户特性进行统计分析,并使用可视化软件Pajek进行可视化分析。研究表明,微博客用户的特性,关注者数、被关注者数和博文数均具有统计特性,地域差异明显;另外,两种类型的用户群体之和占用户总体的近90%,具有很强的代表性,为深入研究微博客用户行为提供参考。
对智慧图书馆进行定义,分析北京邮电大学研制的感知的智慧图书馆示范系统的系统框架和关键技术,对系统实现的功能进行描述。旨在厘清智慧图书馆的概念,为未来开发和部署真正意义上的智慧图书馆提供一定的策略指导。
通过对关联规则综合评价的探讨,提出基于支持度、置信度、Jaccard兴趣度、吸引度和收益因素,面向网上书店和数字图书馆的图书推荐模型,运用熵权法和相对比较法确定模型中指标的权重,并对模型的算法进行研究。通过开发的网上书店系统对模型的功能进行验证,结果表明:该模型能够很好地为用户提供推荐图书。
对于搜索引擎返回的结果太多且较少考虑用户个性差异等缺陷,提出根据用户查询意图,实时给予多个主题的搜索建议,帮助用户更准确地描述所需信息,修正查询词与真实意图之间的差距,提高检索效率。同时运用K-means算法,对资源类别的意图特征值相似用户进行聚类,缩小查找目标对象最近邻居的范围,提高搜索建议的实时响应速度。实验结果表明,该方法是可行的。
提出一种融合网络望远镜和入侵检测思想的分布式蜜罐CPot(Click-based honeyPot)。通过在外网联通的虚拟数字图书馆实验平台中部署CPot,在图书馆的安全系统中进行长达半年的测试,证明CPot具备监控范围广、捕获能力强、功能强大和安全性好等特点,经验证CPot可以极大地提高数字图书馆的安全性,在图书馆网络安全方面有较高的实用价值。