总结国外对于数字图书馆可用性评价的总体研究概况,数字图书馆可用性评价的理论研究和数字图书馆可用性测试的报告,以及数字图书馆可用性评价研究中的几个热点问题;对数字图书馆可用性评价方法进行归类;提出国外数字图书馆可用性评价的特点和对我国相关研究的启示。
以汕头大学数字图书馆为例,论述数字图书馆门户网站内容管理系统的设计思路和体系结构,并讨论在实现系统过程中需要重点解决的6个问题:建立合理的文件目录结构、选择与配置身份验证模式、配置受限访问资源的访问规则、保护用户密码、实现用户身份验证和实现动态信息栏目管理等。
简单介绍电子教学参考资料管理系统,分析电子教学参考资料的特征,根据元数据设计的通用原则,采用都柏林核心教育元数据DC Education描述简单对象,元数据编码及转换标准METS描述复杂对象,实现电子教学参考资料管理系统中资源的元数据方案的设计和基于XML的编码,在此基础上基于OAI-PMH协议与CALIS的高校教参系统连接,实现资源的互操作和资源的共建共享。
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。
运用本体理论对计算机学科领域中的数据结构进行本体描述,探讨其本体库的构建过程,并在此基础上设计和实现基于本体的试验性论文检索系统,提高系统的检索性能。
从信息构建基本理论出发,探讨如何通过信息流引导用户信息理解过程的问题,通过构造网站信息构建系统的模型,并结合信息生态学和软件工程理论建立了网站从需求分析到信息建模再到信息构建四大系统设计和组配的整个信息构建流程,以建设结构清晰、高扩展性和灵活性的网站及其他信息系统提供一种新的建设理念和应用方法。
总结段落检索及其涉及的段落划分和相关算法,讨论文本分割和段落抽取的差别,介绍并比较几种常用的段落划分方法以及几类段落检索算法,在此基础上对段落检索的研究方向进行展望。
针对信息检索中存在的词语排除关系问题,给出排除词的定义并说明排除词在信息检索中的作用。指出排除词实质上是最大准交集型歧义切分字段的伪歧义切分所导致的,描述排除词的识别方法,并给出识别的结果,并在实际的信息检索平台上对排除词词库进行应用测评。
提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链接分别识别出来,然后利用其在标签树上的位置信息分别构造Wrapper。实验结论及与已有方法的比较表明,该方法简单可行且高效。
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并得出实验结果和评价。
在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。但是,常用的层次分类法容易产生“阻滞”的问题。为了解决该问题,提出一种改进型层次分类方法,即限制投票法,并运用Rocchio分类器在基础教育学科资源环境下进行了实验。结果表明,该方法能够降低阻滞,具有较好的分类效果。
在分析知识可视化与信息可视化之间关系的基础上,指出概念图、语义图、思维图、视觉隐喻等知识可视化技术能够有效地表示隐性知识,进而根据隐性知识转换的需要,构建基于知识可视化的隐性知识转换模型。并以想法鱼池为例,探讨应用该模型过程中所涉及的主要环节和问题。
以“美国专利数据库 ( USPTO )检索系统”为例,采用信息可视化技术建立一个专利文献引用关联可视化系统雏形,为企业或专利文献检索单位开发建构未来系统时提供参考。
从“数据整理和概念分组”、“列表或直方图”、“比较矩阵”、“有结构数据聚类”、“无结构数据聚类”、“文档聚类地图”、“引文分析”以及“SAO”8个方面介绍当前国外主要的专利分析工具的功能及特色,并进行比较研究,为专利分析人员选取适当的工具以及软件公司改进专利分析工具提供参考。
针对国防科技信息安全性与可用性的要求,运用基于角色的访问控制技术,通过建立信息资源的数据体系模型、用户层次模型和访问控制规则模型,实现对国防科技信息的细粒度访问控制。
针对电子政务留言反馈系统中公众留言信息的管理,设计留言信息管理的流程和算法,并结合实例从公众留言页面和留言管理页面两个层面描述公众留言信息管理的实现过程。
参照纸本资源管理方式,对电子资源的生命周期及各个阶段的工作内容进行分析和归纳,并在此基础上提出电子资源管理系统的模块设计和流程设计。最后,就电子资源管理系统的接口设计进行讨论并提出接口设计的原则和思路。
设计一个由医学影像、病案和医学文献三大体系构成的实用医学知识分类系统,该系统以病案为中心,关联医学影像资源、医学文献、患者信息、医务人员和治疗方案。对各类数字对象的特性进行详细分解,并将这些特性应用于实用医学分类系统和元数据设立中,实现建设和利用的同步和协调。最后详细论述医学影像资源的永久保存方法。
根据P2P网络的拓扑结构进行分类研究,着重针对中心化拓扑、全分布式非结构化拓扑、半分布式拓扑和全分布式拓扑4种结构及其检索机制进行概述、综合分析和比较研究,并提出P2P系统目前面临的主要问题及其发展趋势。