针对国家科技计划项目信息资源长期保存系统建设所涉及到的标准,从系统构成的角度,提出相关的技术标准化体系框架,并应用于国家科技计划项目信息资源长期保存系统设计中,重点在于明确通用标准、专业标准以及标准的选择和应用的重要性。
分析元数据自动抽取的现实需求,对元数据自动抽取的相关研究进行阐述,然后对DROID、 NLNZ Metadata Extractor、Metadata Miner Catalogue PRO 3种典型的元数据自动抽取器进行分析比较;在讨论目前元数据自动抽取技术局限性的基础上,对该技术进行总结和展望。
设计研发基于J2EE的网络实时咨询音视频模块,从该模块的技术体系结构、数据流程、关键技术机理及未来走向等方面予以阐述。
在指出跨语言信息检索技术中大部分实现方法存在分离现象的基础上,介绍将提问式翻译与检索过程统一的思想,并探讨将提问式翻译与检索过程统一的方法。
对标签、标注、大众分类等概念进行界定,指出现有标签标注系统中存在着标签描述信息的精确度不高、标签检索结果相关度低、标签缺乏有效组织等问题,提出采用凝聚式聚类算法对标签聚类,从而实现对标签的重新组织,为用户提供更好的标签导航、浏览机制。最后通过实验对标签聚类方法进行验证。
针对传统TF-IDF在文本过滤时存在的缺点,提出一种基于特征词抽取的文本过滤算法。简要分析文档信息过滤原理和流程,重点讨论文档信息过滤算法设计及技术实现。实验结果表明,所提出的算法可有效对文档信息进行过滤,能够提高信息检索质量。
利用机器学习和自然语言处理技术中的有关方法,研究从语料中抽取概念关系为领域本体构建服务。对等级关系以及领域关系的抽取方法作详细阐述,并通过实验证明该方法是有效的。
在本体基础上通过语义相似度和相关度的计算,利用语义推理将描述的隐含语义显式化,以充分挖掘出与检索内容相关的信息,实现相关信息的语义融合,提高查准率和查全率。研究基于本体的语义相似度和相关度的计算方法,并通过该语义检索方法的实现,证明该方法在语义检索系统开发中的可行性。
通过核心扩展及自顶向下的方法构建院士本体,解决如何表达“院士”概念这一问题。文中详细叙述院士本体的构建思路及具体构建过程,并给出院士实例的部分收集模板、实例封装关键策略及其VBA程序代码。
网络舆情分析是信息处理领域内的一个新兴且有实用价值的方向。分析网络舆情分析的基本问题,提出难点以及相关的解决方案,并在此基础上设计基于主题的网络舆情分析模型。
以中文博客圈为考察对象,揭示博客圈的特征和演化机制。基于博客圈的共同用户关系构建博客圈间的复杂网络,并探讨其度分布情况。最后提出一个博客圈间复杂网络的演化模型,以此模型所模拟的结果与实证结果吻合效果较好。
对评价指标形式化进行界定,分析指标形式化的原理,重点探讨指标形式化所涉及的两个关键问题,为指标的形式化提供有效途径。提出一种多层次、二维的指标映射模型,该量化模型实现从网站评价目标到度量的转换;设计一种简单的指标映射模型定义语言IMMDL,实现指标的形式化表示。
针对图书馆中心机房监管的现状,采用SNMP网络管理协议,对中心机房硬件设备、数字资源运行情况和机房环境实现统一的智能化监管。
分析现有图书馆附书光盘管理系统的不足并提出解决方案,在此基础上利用软件与数据库技术设计和实现图书馆附书光盘下载系统,方便读者利用图书馆附盘图书。
在讨论网格安全性需求的基础上提出一种可伸缩、可扩展的访问控制安全策略与相应的安全模型,并提出一种灵活的访问控制安全策略,它支持网格计算环境固有的动态性、可伸缩性和可扩展性。相应的访问控制安全模型基于该策略进行设计,通过基于XML的查询请求/断言应答语言SAML和可扩展访问控制语言XACML来支持身份认证和访问控制。
总结了在信息检索与信息分析的中间环节数据格式转换中存在的困难,并结合文本文件、Word软件、VC++编程以及EXCEL软件各自特殊功能,设计了一套较为通用、简单的数据转换程序,开发了一个简单实用的小软件,并介绍了软件的使用方法和实现算法。
简要介绍SFX在清华大学图书馆的应用,分析SFX的实现原理以及INNOPAC作为SFX链接源获取链接服务存在的局限,最后详细阐述利用INNOPAC的Z39.50接口扩展SFX链接服务的思路和具体实现。
利用透明代理技术,实现对电子阅览室用户网络访问的控制;采用Ajax和PHP技术,开发用于Squid代理服务器访问控制的Web管理系统,提高了电子阅览室的管理效率。
利用CSSCI (2004-2006)年数据对我国图书情报学领域期刊的发文、引文及期刊评价指标进行全面的分析,以便了解《现代图书情报技术》的研究特色,提高该期刊的学术影响力。