简要介绍关联数据产生和发展的背景、关联数据的定义、基本原则及应用框架,从资源发现服务、数据融合与语义检索服务、学术研究和学术交流作用、跨机构的关联数据的开放与复用等方面分析关联数据驱动的图书馆Web应用现状,最后对图书馆应用关联数据提出几点建议。
使用概念格技术对Web学术信息搜索结果进行再处理,通过提取结果文献集的特征词,以检出的文献为对象,以经过分类后能高度概括文献集内容的特征词集作为属性集,建立“搜索结果”概念格,以此实现检索结果的聚类表达,帮助用户进一步获得检索目标。
针对现有的命名实体识别方法不能很好地处理专业领域特定命名抽取的问题,提出一种基于启发式规则的专业命名识别方法。以中文文本中化学物质命名为研究对象,分析其领域特征及统计语言特征,建立适用于化学领域文献命名识别的启发式规则,为专业领域的命名实体识别提供新的解决方案。对比实验证明本文的方法能有效提升专业命名识别的效率。
分析词间关系错误检查在叙词表编制和本体转化中的必要性,并从机辅编表系统、具体检查方法等方面对叙词表错误检查的相关研究进行概括性介绍。根据研究目标,着重分析等级关系中循环错误的具体形式,设计并实现一个用于检查等级关系循环错误的算法。分别对自定义数据和叙词表数据进行实验,结果显示,该算法能有效地检查出等级关系中的所有循环错误。
以南开大学图书馆Unicorn系统为基础,介绍基于最大频繁模式挖掘算法的书目推荐系统的设计与实现,详细描述利用Unicorn系统中积累的借阅数据分析读者的行为模式,提供个性化书目推荐的方法。该系统利用图书馆现有资源拓展读者服务,可以提高现行自动化借阅系统的使用效率。
引入编辑距离的概念,探讨如何构造标签树,并利用标签树匹配算法来量化网页结构相似度。该算法被应用于Web信息抽取,通过URL相似度算法进行样本网页的粗聚类,进一步采用树的相似度匹配算法实现细聚类,从而获取模板网页。在模板网页的基础上,再次引入结构相似度算法并结合基于模板网页的抽取规则实现网页的自动化抽取。实验证明,该算法的引入能够有效提高包装器的抽取精度和半自动化能力。
重点介绍近10年来国外词汇化树邻接语法的新进展和新应用,总结其理论的发展沿革,指出该语法的研究意义及在汉语中的应用价值, 并分析说明其在汉语中的研究现状和研究难点,最后探讨和展望该语法在汉语中的应用发展方向。
为提高农民获取信息的便利性,文章着重面向农民问答系统的开发,提出问答系统由知识库构建、问句处理、信息检索、答案抽取4个模块组成,其中问句处理是研究重点。在总结农民问句特点的基础上,提出基于疑问词和短语的问句分类方法,并在问句处理过程中采用去除客气词、建立针对非正式疑问词和无疑问词时的“特殊规则表”等方法,以有效地进行问句归类及关键词提取。同时利用所构建的“同义词扩展词表”扩充关键词,并设定不同的权重基准,为信息检索模块的处理奠定基础。
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化检索分别进行设计和实现,构建一个基于XML的中文博硕士论文检索系统。
应用拉普拉斯谱分析方法研究科学论文的词同现网络,从拉普拉斯谱逆序分布、拉普拉斯谱密度、拉普拉斯谱特征值极值三个角度对比分析真伪科学论文词同现网络的拉普拉斯谱特征。通过对比分析发现,真伪论文词同现网络的拉普拉斯谱特征存在明显差别,可以利用这些差别对真伪论文进行甄别。
基于2009年最新提出的广度中心度的概念及计算方法,对世界顶级的三种管理信息系统期刊中的数据构建合著网络,进行成分分析,在此基础上计算出5个成分中的作者的广度中心度,并对广度中心度分值较高的一些作者的背景及其合作者的研究领域进行详细的调查和分析。结果表明,管理信息系统作为一门综合性较强的学科,其研究者整体的合作行为是较活跃的;而且在广度中心度分值较高的作者中,有很多都是管理信息系统领域的知名专家学者,他们与很多领域的学者有过合作。因此,广度中心度确实可以用来评价专家学者的重要程度。
对ResCarta工具包进行深入研究,基于ResCarta工具包对数字对象按照METS标准、MODS标准进行标引,建立ResCarta数字仓储,提供本地数字对象检索、浏览服务,通过与OAI收割系统集成,为远端OAI服务提供方提供以OAI-PMH协议收割元数据并通过标识符链接访问对象数据的服务。
介绍清华大学图书馆网络拓扑结构。针对网络系统的特色进行分析,并且对网络系统中IPv6/IPv4 双栈和无线网络给出网络配置的方法。
针对图书馆的培训讲座业务,设计并实现一个图书馆讲座预约系统。该系统包括读者留言的发布与管理、讲座信息的录入与管理、讲座的预约及取消预约、讲座评论的发布与管理等多项功能,并采用Ajax技术来为读者用户提供友好的系统界面。
介绍手机图书馆系统针对ILASII使用自行开发的数据库,不能直接访问并且不对外提供系统集成应用程序接口的情况下,通过ILASII的“Web网上图书馆”实现与其整合,给出详细的分析及编程实现过程。
总结温州医学院图书馆自习室管理系统的设计、开发和测试工作。该系统基于B/S结构,利用现有校园一卡通系统,通过Flash、ASP和数据库等软件技术,实现自动分发座位、选择交换座位、座位保留超时管理和图形动画显示座位位置及状态等功能,解决高校图书馆自习室普遍出现的由于抢座、占座而导致的座位利用率低等问题。