主要研究和实现CAS模式下的统一认证和门户管理方式,详细阐述统一认证和门户管理的实现机理和工作流程。门户管理包括用户管理、资源管理、系统管理三个方面,其中重点介绍用户管理中的角色、权限控制和资源管理中的各种类型资源的管理方法。
提出数字图书馆门户系统的一种新模式。在研究开源项目Liferay后,提出以Liferay作为多维化门户系统技术平台的实现方案。最后介绍开发的门户系统中所集成的服务。
介绍OAI协议和开源软件ARC、OAICat,在对OAI-PMH互操作协议和ARC、OAICat的深刻研究的基础上,设计实现开源环境下的数字仓储和服务系统,主要分析研究系统的系统框架和主要功能结构。该系统集成OAI-PMH协议定义的两个角色即数据提供方和服务提供方,并成功集成到数字图书馆集成系统中。
在介绍Web集成融汇概念、技术发展过程的基础上,重点讨论集成融汇模式、组织机制以及当前应用状况,并分析集成融汇所面临的挑战与未来发展趋势。
通过分析传统的规范控制,介绍传统规范控制的功能需求和规范控制的新框架(FRBR),引申出网络资源规范控制的必要性和可行性,最后总结出网络资源规范控制的功能需求和系统架构。
针对网格资源动态性、异构性的特点,提出基于双向拍卖进行网格资源管理的方法,构建基于双向拍卖的网格资源分配模型,描述模型中资源用户、用户代理、网格资源提供者及本地拍卖市场等组件的功能。根据买、卖双方的资源需求,提出双向拍卖算法及资源调度方案,利用资源价格的博弈机制,使交易双方能在不完全的信息环境下,获得各自最大的资源效用。进而,通过贝叶斯均衡计算,推算出双向拍卖中资源用户的最优化竞价策略,为有效地调节动态负载平衡、提高系统资源的使用率提供有益的参考。
对国内外词汇知识的Web服务研究现状进行调研分析,比较OCLC术语服务、英国高级叙词表、FAO多语种农业叙词表、STAR、中文叙词表本体网络术语学服务等国内外主要研究项目。介绍汉语科技词系统的基本架构、数据模型、功能模块和基于Web服务的汉语科技词系统应用模型、接口封装、部署、以及性能测试情况。最后对下一步研究工作进行展望。
提出一种基于最大词重的文本特征提取与降维算法。其基本思想是利用词在文档库的重要性,通过搜索算法将最大重要性的词从高维文档库中提取出来构成低维文档库,达到特征提取与降维的目的。在此基础上,提出利用模拟退火算法改进的K-means聚类算法对降维得到的文本进行聚类分析,实验结果表明该方法可以有效地提高聚类精度。
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾。
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。
随着专利数据量的激增和新技术领域的交错重叠,迫切需要在专利信息分析中深化到内容层次,内容挖掘是其中的重要途径和必要手段。借鉴文本内容挖掘的思想和技术,提出基于内容挖掘的专利信息分析的方法体系,分别阐述方法体系中包含的专利文本信息预处理、专利信息内容分析和专利信息知识处理过程的主要步骤及其涉及到的各种技术和算法。最后,以混合动力汽车领域专利信息的内容挖掘为例进行实证研究。
按照项目研发的规划,在线专利分析软件分成三个子系统开发。前期基于特征项和指标项的子系统的研发初步完成,为了检验软件应用效果并为后续研究提供依据,选择以中兴通讯的专利分析为例,利用自主研发的软件,从自身实力、行业环境、竞争对手三个方面进行专利信息研究,并通过在线专利分析软件的应用达到考察企业技术创新性和竞争性的目的。
在对文档聚类的含义、作用和一般过程的阐述基础上,分析一种基于“最小最大”原则初始质心优选的改进K-means聚类的基本思想,并重点设计相关的聚类算法,实现聚类系统,基于系统对300篇学术文档及其相关特征词语进行聚类实验。实验结果表明,本文所设计和实现的改进K-means的聚类算法表现出较好的性能。
分析利用本体来构建学科知识组织体系的研究现状,探讨利用本体构建学科知识组织体系的一般流程,以情报检索学科领域的知识为背景,构建情报检索学科知识组织体系,利用Protégé工具对知识本体进行编辑,利用Ontoviz工具实现知识本体可视化。
通过分析图书清点工作的主要流程及目前实践操作方法的优点与不足,提出综合解决方案,即通过一个条码扫描过程就可查检出无馆藏数据的图书品种(“有书无数据”)、和无对应图书实物的冗余数据(“有数据无书”),介绍从财产登录账册中核查出“既无图书又无数据”之登录号的方法。
读者荐书服务日益成为图书馆采访工作的重点。通过对港台地区大学图书馆先进荐书模式的透彻分析和对INNOPAC书目管理系统工作流程的详细测试,清华大学图书馆总结出完整全面的读者荐书工作模式,并于2008年5月份正式向读者提供新流程的荐书服务。
针对图书馆开架借阅服务模式下读者借书寻架不便的问题,设计实现一个基于Flash、ASP和数据库等技术的图书馆书架定位系统,通过生动直观的图形动画手段实现对图书的书架定位。以温州医学院图书馆为例,给出本系统与OPAC检索系统的集成方法,进一步提高系统的易用性。
根据校园图书馆资源整合的需求,设计一个异构数据库整合系统,以提高读者对信息资源的获取效率。详细介绍该系统如何以馆藏书目系统(Melinets OPAC)为主体,将书目与异构平台上的超星、书生及时代圣典电子图书中相对应的全文信息加以链接的实现技术。