简要介绍ISO 15511-ISIL标准编码规则、ISO/FDIS 28560标准的多个馆标识数据项。探讨ISO 15511-ISIL架构下编制的中国版ISIL,对其注册管理体系、在ISO/DIS 28560-图书馆RFID编码标准数据项中的ISIL编码压缩应用提出建议。
以概念格理论为基础,用形式概念分析的方法通过对数字图书馆用户使用方法的关联规则挖掘,建立灵活的规则挖掘机制,并依据提取的关联规则对数字图书馆用户进行用法细分,对在更大程度上满足更多用户的个性化需求进行尝试。
提出一种基于概念格的数字图书馆用户检索行为序列模式挖掘方法。该方法采用“基于概念格的自顶向下与分治相结合”的挖掘思想,通过自顶向下的概念格迭代,利用概念格的复用性和提取频繁项集的优势,获得数字图书馆用户检索行为的序列模式。该方法不需要遍历原始用户信息数据库,能够大大压缩挖掘时间,有助于数字图书馆提高用户检索速度、改进个性化服务。
在数字图书馆系统集成应用的框架下,提出基于Nutch的专题网页资源采集服务系统设计方案。该方案引入信息过滤模块、基于计算机通信领域专业词典的中文分词模块、GUI信息定制模块、词典和关键词管理模块等,保证采集和获取过程中资源的专题性和系统的可管理性以及易用性。重点对文本解析过滤、Plugin插件开发以及搜索结果的层次化自动聚类等相关技术进行深入研究。通过基于Webservice的服务接口,实现其在数字图书馆资源层的集成应用。
以网络协作标注中的标签为研究对象,调研标签消歧方法,并将其划分为基于数据挖掘方法消歧、基于统计分析方法消歧、利用相关知识组织工具消歧、引入控制机制消歧和开发可视化组件消歧5类。比较这5类消歧方法在用户参与度、消歧时机、消歧性质、实验与应用情况和发展前景5个方面存在的区别和联系。
基于关联数据的基本原则和发布方法,分析介绍DBpedia的实现技术:通过对WikiText格式数据进行语法解析和流程控制,实现对自由文本进行的结构化数据抽取和RDF表达,并基于URI参引、SPARQL查询和RDF文件转存等多种方法,实现多样化的Web数据获取;采用基于属性和基于模式的自动关联算法,与众多数据集之间实现关联。
针对Ontology与FCA在知识建模中的融合问题,对比Ontology和FCA之间的异同,从哲学视角、代数结构视角、知识处理与知识管理视角分析Ontology和FCA融合的条件,剖析二者在知识建模过程中的融合机理,最终得出Ontology和FCA在知识建模过程中融合的8个具体方向,为Ontology和FCA在知识建模领域中的融合研究提供启发。
针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对于特定资源的主题特征具有比较好的效果。
从Ajax链接元素的识别、页面状态标识、页面状态可控性转换、页面状态内容动态获取和状态重复检测5个方面介绍Ajax数据采集所取得的最新研究进展,总结系统的整体处理流程和支撑技术,探讨新的发展趋势,推动Ajax数据采集问题展开更为深入的研究。
对技术成熟度的概念和起源进行简介,区分其与技术生命周期等相近的概念;重点研究美国国家航空航天局制定的技术成熟度体系,介绍其特征描述、研究框架并讨论应用价值、评估工具和应用局限性;最后简要探讨浅语义分析和共词分析两种方法在识别技术成熟度方面的可能性。
为解决小屏幕的手持式数字设备有效显示大量文献信息时的局限性,尝试利用缩略语转换的方式来压缩在手机上展示的文献信息以方便用户使用,并为此设计缩略语转换系统。从系统的运行时间和不同领域文章的压缩效果进行对比实验。
分析西太平洋地区生物医学期刊分布现状,制定生物医学期刊题录信息的采集策略,并采用基于概念的赋词方法为题录信息建立索引,利用空间向量模型设计基于MeSH的生物医学题录数据扩展检索算法。最后将该算法运用到WPRIM系统的设计与开发中,实验证明能够提高系统检索的召回率。
详细介绍信息抽取开源软件Web-Harvest,并在其基础之上进行功能扩展和改进,设计一个通用性强的Web信息抽取系统,重点阐述开发系统的设计思想和系统流程,并简单介绍系统的数据库表设计。最后,介绍该Web信息抽取系统的应用。
研究数字文本资料修复模型,提出基于投影预分割和基于字符连通性二次分割组合的方法,实现对英文数字文档中基本英文字符的准确分割,并通过实验验证该方法的有效性和实用性。该方法具有很强的可扩展性,也可用于中文单字的分割。
介绍基于Conduit开发图书馆工具条的过程和方法,较好地实现用户常用网络功能和图书馆服务的最小最优化整合,以期更多图书馆利用Conduit将图书馆的资源和服务集成到用户现有的浏览习惯和信息检索的工作流程中。
主要介绍监控系统的设计和实施方案,重点描述监控系统整体方案的设计思路和框架结构。介绍利用C/C++技术、AIX操作系统管理技术等实现监控系统的监控信息采集、信息分析和实时报警等功能的方法。