[目的] 了解国内科研人员对IR的认知和向IR呈缴科研成果的态度、条件与期望。[方法] 聚焦“存缴者”用户群体,以国内教育与科研机构科研人员为对象,通过定额抽样方法,从60多家单位的1 500余名科研人员获取调查数据。采用SPSS分析调查数据的信度和效度,并进行数据分析。[结果] 掌握了此次调查范围内国内科研与教育人员对IR的认知和向IR存缴学术成果的态度、条件和期望;基于调查数据,发现专业研究机构和高校两类机构的科研人员在存缴态度、方式和条件等方面存在部分差异。[局限] 总体调查规模有限,特别是高校用户样本较少。调查结论基于所获得的调查数据,未必适用于更广泛的用户群体。[结论] 调查基本达到预期成效,针对调查结果,提出推进中国IR实践、提升IR成果应用的思考。
[目的] 在对IR+、Zentity、Islandora、Hydra等几个典型新型开源机构知识库软件调研的基础上,探讨各软件的特点与不足。[方法] 通过查阅相关资料,并对开源机构知识库软件在本地进行实际的安装测试。[结果] 发现各开源机构知识库软件在系统功能和服务特性、系统架构、可扩展性等方面表现各异。[局限] 由于篇幅所限,未能全面涉及开源机构知识库软件,仅对几个典型的新型开源机构知识库软件进行对比分析。[结论] 本研究有利于学习一些机构知识库开源软件的优秀设计理念;同时,也为机构知识库建设如何选择适合自身需求的开源机构知识库软件提供参考。
[目的] 分析描述科研数据知识库及其服务的现状和未来发展方向。[方法] 利用Databib开放注册数据,分析科研数据知识库的国别、建立时间、学科领域、隶属机构类型、开放度等分布,并利用GenBank、Dryad、Figshare三个典型数据知识库分析对比科学数据库的服务特色。[结果] 科研数据知识库无论在开放趋势还是在服务模式都呈现积极上升和丰富化态势,但在标准化集成化管理和多样化服务模式方面仍有重要发展潜力。[结论] 科研数据知识库已有良好的发展基础,但应在基于科研活动全生命周期的科研数据规范化管理和开放科研数据应用机制方面加大研究和发展力度。
[目的] 旨在分析基于信息觅食理论构建的Web导航模型的特征。[方法] 在对比动物觅食行为与Web导航行为相似性的基础上,探究基于信息觅食理论的Web导航模型的理论基础,分析以SNIF-ACT系列模型为代表的Web导航模型的主要运作机制。[结果] 发现基于信息觅食理论的Web导航模型描述的是用户的认知特征及有限理性假设和次最优决策行为,此类模型具有量化计算用户导航行为的优点。[结论] 提出基于信息觅食理论构建Web导航模型的改进思路,促进此系列模型能更好地应用于解释和预测用户Web导航行为。
[目的] 基于模糊相似性的协同过滤预测和多样性选择算法对基于内容的推荐方法进行改进,提高推荐质量。[应用背景] 基于内容过滤的推荐系统(CB-RS)目前已经有比较成功的应用。但是,推荐的多样性、项目特征的表示、用户偏好的建模仍然是基于内容推荐的关键。[方法] 对用户特征提出采用一种新的模糊化表示方法,并根据此特征表示进行用户的相似性计算,在此基础上整合协同过滤的多样性预测,对基于内容的推荐方法进行改进。[结果] 通过实验,该推荐方法在平均绝对误差、覆盖率以及多样性三方面明显优于当前流行的三种解决方案。[结论] 推荐方案在一定程度上能够提高推荐质量,同时增强推荐的多样性。
[目的] 通过引入社会网络分析理论,解决知识推送服务中隐性知识推送不足的问题。[应用背景在数字图书馆数据库的访问日志的环境下,选取24小时内登录用户的知识偏好为实验数据开展研究。[方法] 通过引入“n-团子群”与“点度中心性”概念分析目标用户群,将相似用户的隐性知识需求显性化共现并对相关知识实体加以推送。[结果] 发现推送隐性知识的广度与精准度直接受n-团子群的参数n值影响,将其值设置为2能够保证推送的隐性知识更具颗粒性。[结论] 解决知识推送服务中数据极端稀缺、用户隐含的知识需求获取力度差的问题,促进隐性知识交流。
[目的] 揭示知识库与数据库之间的对应关系,并以此为基础将数据库、知识库统一在知识获取的过程中,提高知识库获取知识的速度、精度和认知自主性。[方法] 针对面向知识服务的双库协同知识库框架,研究框架结构的启发型协调器与中断型协调器各自算法及协同合作的作用。[结果] 提出双库协同知识库框架结构模型,研究知识库与数据库各自结构的关联及映射关系,从而实现双库协同的架构,并给出协同工作的过程模型。[局限] 双库协同的各类数据源均考虑在同构的条件下,而在大数据环境下各类异构、多维数据未能全面涉及。[结论] 为知识服务提供“全”且“准”的知识,给出的框架结构在实现减小搜索空间、提高挖掘效率方面起到重要的支撑作用。
[目的] 对在线产品评论垃圾识别的研究工作进行梳理,总结研究现状,明确发展方向。[文献范围] 从CNKI及Google Scholar中以“评论垃圾”、“review/opinion spam” 等为检索词筛选获得国内外近50篇相关文献。[方法] 采用文献分析法。界定产品评论垃圾的概念,明晰评论垃圾所属的研究范畴;总结产品评论垃圾识别研究中的关键问题及研究进展。[结果] 产品评论垃圾指故意过分吹捧或贬低某种产品的不真实评论以及不包含任何有益成分的非相关在线网络评论。研究中存在虚假评论标注集难获取的问题,强调评论人行为特征的分析,提出融合评论人特征来解决评论垃圾识别的研究思路。[局限] 应结合产品评论垃圾的识别对用户评论可信度进行更深入的分析。[结论] 评论垃圾识别是评论可信性研究的应用体现。辩识评论内容的真伪要充分挖掘评论内容、评论人等多个维度的识别特征。同时,考虑到众多特征的相互独立性,应挖掘有显著影响作用的特征因素。
[目的] 通过研究新浪网“中菲黄岩岛争端” 专题内容,探究中菲黄岩岛争端事件的舆情变化过程及舆情驱动机制。[应用背景] 随着互联网的快速发展,网络成为反映社会热点的主要载体,2012年“中菲黄岩岛争端”事件是一个典型的网络舆论事件。有效合理地研究该事件的网络舆情,有助于全面认识争端事件的变化情况。[方法] 采用网络爬虫工具获取新闻数据,使用中文分词软件获取研究所需的新闻要素,建立新闻信息数据库和新闻要素数据库,并借助数理统计、Gephi软件等手段进行数据分析。[结果] 中菲黄岩岛争端事件发展过程可分为5个阶段,符合网络突发事件的生命周期曲线;黄岩岛争端事件中,中菲双方争端的焦点相近,但采取的措施各有侧重。[结论] 有利于展现中菲黄岩岛争端事件的整体发展过程,直观地表现中菲双方在争端事件中的措施与立场。
[目的] 提高超级科技词表中规范概念协同构建过程中用户权限与任务管理的灵活性。[方法] 通过增加直接设置权限以及引入资源的工作状态,改进基于角色访问控制(RBAC)模型,从而支持用户、角色和其权限之间的灵活配置,以及任务的自动流转。[结果] 改进RBAC模型,将任务分为任务创建、任务分发、概念加工、任务审核、任务结束等5大环节,以任务贯穿整个业务过程,从而规范工作流程。[结论] 运行结果表明规范概念协同工作平台能快速、有效地进行概念分配、加工和审核,实现了流程的灵活控制与协同工作的完成。
[目的] 根据中国科学院国家科学图书馆标准情报研究工作的实际需求,设计基于分面搜索引擎Solr的在线标准信息管理与分析平台。[应用背景] 采用网络化平台管理与分析数据,是提高标准情报研究工作效率的发展方向。[方法] 基于MVC多层结构设计系统总体框架,根据信息分析需求设计索引字段,利用Solr的快速索引和分面搜索功能实现标准信息的检索和计算分析。[结果] 平台可以实现大量标准数据的有效管理、分析和可视化展示。[结论] 系统已在国家科学图书馆标准情报研究团队中实际应用,能够显著提高工作效率。