主要探讨内容管理的基本概念,分析目前Web内容管理系统的类型和功能组成,对几个主要的开源Web内容管理系统的特点进行介绍和对比,并对如何选择合适的开源内容管理系统提出建议。
采用语义分析、系统开发等方法,论述构建领域本体的复杂性,提出利用本体中概念具有的“领域属性”来表示和构建领域本体的观点。并举实例说明在基于农业初级本体的文献检索系统中利用概念的领域属性达到了排除岐义的效果。
以古籍描述元数据著录规则为基础,提出一种基于本体语义的古籍知识库建设方案,给出知识库的结构框架,并以语义网为工具对方案作了简要的实现。
选择基于Medline的医学数据挖掘系统中应用效果较好,具有普遍特性的3个系统进行分析,探讨系统的研究背景,在具体实现上所采取的技术思路和方法,总结其在设计和实现中普遍性和规律性的特点,供实践参考。
讨论如何将元数据获取软件OAIHarvester2.0集成于数字资产管理系统DSpace1.4,为DSpace系统提供开放元数据获取功能。
采取自行建设网站进行分组实验和问卷调查的方法,对电子商务网站界面中的口碑信息对于顾客感知风险与信息搜寻行为的影响进行研究和分析,并提出产品信息呈现-感知风险-信息搜寻关系模型。最后提出产品信息呈现-感知风险-信息搜寻关系模型的修正模型。
研究语音信息内容分析的特点,对比文本信息分析处理的异同,对语音信息的内容分析技术进行综述并给出内容分析技术的体系框架,并对语音识别、情感信息的识别、语音识别分类等重难点技术进行研究。
基于RSS/Atom的信息聚合服务是当前互联网上一种重要的服务模式。首先从服务、技术、商业模式上简要介绍信息聚合服务的发展情况,然后论述信息聚合的服务模式、相关技术,并提出今后信息聚合服务的发展趋势。
提出一个结合本体论及通用个人资料的个性化推荐模式。首先以网络分类服务作为本体论来解释用户的网络浏览行为,以此挖掘用户的偏好;其次,利用Web使用挖掘技术过滤多余的浏览记录,增强个性化的准确度;最后,利用本体论的层次结构特点,从用户偏好类别中挖掘其潜在偏好,产生符合用户特征的通用个人资料。
二部图法分析模型是将Web页的内容信息和超链接信息相结合给出的一种基于分类方法的算法,利用二部图可以求出网页的最大匹配与完全匹配,挖掘出隐含的知识社群,能更准确地实现对用户的合理定位。
研究并实现三种文档倾向性识别的方法:基于情感词加权的方法、基于语义模式分析的方法和基于文本分类的方法。第一种方法利用特征词汇的情感语义倾向性。第二种方法对自然语言的句法结构进行简化,以获取合适粒度的倾向性语义模式。第三种方法则直接利用传统的基于文本分类的方法。通过在网络舆情分析系统中的具体实现,探讨这三种方法各自的不足和优势。
为了减少或根除新闻网站中大量非主题信息的干扰,提出一种新闻网页抽取方法,采用基于熵的计算和DOM树的知识,从新闻网页中抽取主题文档和相关链接。
分析现有分词算法存在的不足,在此基础上提出一种新的分词词典,通过为分词词典建立首字Hash表和词索引表两级索引,使得该分词词典支持全二分最大匹配分词算法,利用该分词算法进行自动分词,其时间复杂度实现了大的改善。
基于RSS的Web新闻主题聚合是信息处理领域内的一个新兴且有实用价值的方向。分析Web新闻主题聚合的基本问题,提出难点以及相关的解决方案,并在此基础上设计Web新闻主题聚合系统。
阐述Plone内容管理系统的基本特征,并介绍在学位论文管理工作中如何利用Plone内容管理系统搭建虚拟工作平台,实践表明对内容合理组织和分类、设计有效的工作流以及合理配置用户权限是虚拟工作平台构建的关键。
介绍J2EE性能管理的一些方法,包括性能监控、瓶颈定位、性能调优等方面内容,并以运维NSTL网络服务系统的实践经验,介绍NSTL性能监控和调优的方法及效果。
对计量分析研究中的统计按照统计结果进行详细分类,对这些统计进行归纳分析,发现各种统计的关键技术,只是对基础统计的依赖程度和输出结果的表现形式有所不同。在不支持SQL语句的Excel里用VBA进行统计,通过本项研究,希望推动文献计量分析论文的自动生成与深入正文字段的内容分析。
提出一种改进的KNN算法,并将其用于垃圾邮件的过滤问题。经实验证明,改进的算法能够降低K值和训练文本的分布对过滤效果的影响,减少垃圾邮件的误判和漏判,具有较好的过滤性能。
详细介绍服务器虚拟化技术及虚拟化软件,以及如何利用虚拟化软件VMware Server来部署和整合福州大学图书馆的数字化应用。
结合武汉大学“图书馆设备管理系统”的研发工作实践,论述设备管理系统的功能、运行环境、动态流程和用户权限的细分,并对使用Lotus技术对系统具体实现过程中出现的主要技术问题进行探讨,给出解决方案。
根据曲谱类图书的管理与利用情况,结合本馆实际介绍民乐曲谱数据库建设的实施方案、总体设计和功能实现。该系统采用数据库方式存储曲谱图像,将图像的属性与图像数据分别存于不同的数据表中,从而提高了数据库的灵活性和安全性。