主要讨论信息可视化原型系统的理论方法和实现技术。具体探讨可视化模型的构建策略、原型系统的环境配置、功能模块和操作方法;文本信息、语音(音频)信息、图像信息可视化模型的构建、数据准备与数据规模、操作界面与运行结果。该原型系统的研究不仅是通用信息资源管理可视化模型的有益尝试,而且在中文信息可视化方面也取得一定的经验。
从态势感知理论出发,分析可视化与态势感知之间的关系,构建可视化感知模型,该模型包括态势感知需求分析、数据与知识提取、态势可视化与视图交互、态势感知、决策制定与执行5个阶段,最后探讨可视化感知模型中的关键问题。
针对实际需要,提出一种将经过适度简化的Chernoff脸谱图应用于多维度战略数据分析的方法,在脸谱图的指标变量分配方面提出基于熵权的最重要指标分配法。以此Chernoff脸谱图为可视化工具,对珠江三角洲地区惠州、中山、江门三个地级市2008年度的主要经济战略指标数据进行实证对比分析,验证该方法的有效性与实用性。
以一个通信公司为研究对象,在eTOM框架下讨论主题数据模型的可视化挖掘方法。探讨企业信息化所面临的新理论和实施方法问题。在实施过程中,通过采用可视化工具Pajek和TreeMap实现业务流程分析与梳理、可视化挖掘,并以人力资源主题数据模型为例,具体讨论可视化挖掘的实施方案。
介绍数字图书馆信息安全的相关概念,概述国内外学术界的相关研究成果。在对国内30家已经建设数字图书馆的公共图书馆和高校图书馆进行调研的基础上,分析、总结国内数字图书馆信息安全的现状与问题。
依据ISO27000系列标准,提出数字图书馆信息安全风险评估的方法。在对数字图书馆资产、威胁和脆弱性进行识别与估值的基础上,分析和计算数字图书馆信息安全风险,提出风险等级划分方法,形成数字图书馆信息安全风险评估的模板。
根据数字图书馆自身的特点和现实需要,以ISO27002的通用准则为标准,总结适合于数字图书馆信息安全管理的控制措施,筛选出数字图书馆信息安全核心控制要素与参考控制要素,从组织控制和技术控制两个方面对数字图书馆进行风险控制。
在全面了解用户主导、用户驱动、以用户为中心的数字图书馆的基础上,系统地介绍用户模型指导系统功能、流程、交互方式等设计的多项细节。提出“用户心理与行为-数字服务-信息系统-市场调查-改进系统”的方式,优化数字图书馆服务系统。
在对当前术语语义相似度计算进行分析研究的基础上,将科技术语相似度计算归纳为基于语料文集的相似度计算和基于开放知识资源的相似度计算,对相似度指标的集成算法进行综述。并对科技术语语义相似度计算在自然语言处理和知识挖掘方面的应用进行总结,对其未来研究发展进行展望,为进一步构建高效的术语相似度计算系统提供良好借鉴。
研究超大型中文叙词表本体检索和推理的网络化实现方法,运用其成功实现“中国分类主题词表本体”(CCT1_OntoThesaurus)的共建共享系统(CCT1_OTCSS),且时效性已达到实用要求。提出基于RDF三元组思想的Lucene索引结构构造方法, 以CCT1_OntoThesaurus (基于CCT一版的纯文本电子版建立)为例,构建Lucene索引,在此基础上实现高效的本体检索和一致性检测推理,并进一步实现CCT1_OTCSS的各项功能。该解决方案对于我国现有的几部应用最为广泛的超大型中文叙词表快速实现本体化升级、网络化共建共享和动态完善具有良好的应用前景,对于国内外其他采用XML、RDF或OWL表示的大型知识组织系统(叙词表、本体等)实现网络化检索与推理也具有参考价值。
为解决知识组织系统手工为主构建过程中存在的专业人员不足、构建工作繁琐、一致性不易保证等问题,提出基于科技术语定义的知识组织系统自动丰富,并对定义抽取、定义解析、定义知识转换等关键技术进行初步探索。通过研究,发现基于术语定义的科技知识组织系统自动丰富具有一定的应用价值,相关关键技术将为进一步加快和扩大科技领域知识组织系统建设及更新提供技术支撑。
通过比较不同知识表示方式之间的优缺点,着重介绍本体在知识表示和知识推理方面的优势,并通过构建历史领域本体库,进一步阐明本体在专家系统等知识系统中的应用优势。
基于条件随机场对介宾结构进行自动识别的研究。为有效地识别介宾结构,基于清华树库统计介宾结构的外部和内部语言学特征。基于条件随机场,结合介宾结构的语言学特征,使用复杂特征模板对无嵌套介宾结构和有嵌套介宾结构进行自动识别。在开放测试中,F值最高分别达到90.29%和89.99%。
介绍专利分析系统中分析核心技术、核心申请人或发明人的现状,分析布拉德福定律用于确定核心技术、核心申请人或发明人的可行性,最后使用两个具体的实例进行验证。
针对K-means的缺陷,运用SD和PSO算法提出一种改进聚类算法,并通过Java编程实现。以上海某证券公司一个营业部的客户交易数据为例,将数据库中的数据分析、变换和标准化成适合挖掘的形式,将结合的聚类算法应用于细分模型进行聚类,并对聚类结果进行评价和分析。结果表明,利用改进的聚类算法能够得到更高质量的聚类结果。
采用通用搜索引擎与垂直搜索引擎相结合的互联网主题信息采集策略,提出多种防屏蔽技术相结合的网络采集防屏蔽解决方案,改进一种基于文本密度的网页正文抽取方法,利用基于分词的向量空间模型和余弦夹角公式实现基于内容的标题去重,并设计一个面向侨情的互联网主题信息采集系统。
对开源环境下的本地数字资源系统进行框架和流程设计,在此基础上详细分析相关开源技术和服务实现。设计本地数字资源的统一处理模式,实现基于Lucene的本地各类资源的统一检索服务、基于Web Service与门户系统统一检索的集成服务。
针对国家科技图书文献中心文献检索系统,提出关于二次文献的文献相似度计算方法,设计并实现实时相关文献推荐子系统。最后,从理论上提出对推荐结果进行定量评价的指标,并进行效果评测,验证所设计的相关文献推荐子系统能进一步提高NSTL文献检索系统的服务质量。
针对中小馆普遍存在的中文图书学科主题标引问题,采用关联规则挖掘的FP-growth算法进行学科主题字段的数据挖掘,得出分类学科主题词表,为中小馆制定中文图书机读数据主题标引规则和细则提供参考依据,同时为标引中文图书提供参照。
以TRS全文检索系统为平台,利用TRS Java应用开发接口以及JFreeChart、POI等开源插件技术开发基于B/S模式的三大索引收录西北工业大学论文数据管理系统,实现三大索引数据管理业务的网络运行,具有网上信息检索、数据维护、图表统计、报表生成等功能。
完善基于一卡通的图书馆电子阅览室管理系统,研究其扣费模式的特征和缺陷,并对扣费模式进行改进。改进的模式能解决用户在注销一卡通时出现的逃费问题。