期刊首页 在线期刊 推荐文章

推荐文章

Please wait a minute...
  • 全选
    |
  • 专题
    贺国秀, 任佳渝, 李宗耀, 林晨曦, 蔚海燕
    数据分析与知识发现. 2024, 8(4): 1-13. https://doi.org/10.11925/infotech.2096-3467.2023.0684
    摘要 (337) PDF全文 (196) HTML (119)   可视化   收藏

    【目的】 探究基于内容的深度谣言检测模型能否真正识别谣言的关键语义。【方法】 基于谣言检测任务的中英文基准数据集,本文分别利用基于局部代理模型的可解释工具LIME和基于合作博弈论的可解释工具SHAP,分析BERT模型所识别出的关键特征,并判断其是否能反映谣言特性。【结果】 可解释工具在不同模型与数据集上计算得出的关键特征差异性较大,无法辨别模型识别的重要特征和谣言之间的语义关系。【局限】 本文验证的数据集和模型数量都十分有限。【结论】 基于深度学习的谣言检测模型仅拟合了训练集的特征,面向多样的真实场景缺少足够的泛化性和可解释性。

  • 研究论文
    齐小英, 李晗语, 杨海平
    数据分析与知识发现. 2024, 8(4): 76-87. https://doi.org/10.11925/infotech.2096-3467.2023.0081
    摘要 (188) PDF全文 (261) HTML (64)   可视化   收藏

    【目的】 实现地图的多重语义分类,满足地图精准检索与情报分析的需求。【方法】 设计地图类目体系,提出地图多标签分类策略,基于AlexNet卷积神经网络分类模型实现南海地图多标签自动分类。【结果】 南海地图多标签自动分类模型的F1值为0.979,模型能够有效实现南海地图的多标签自动分类。【局限】 多标签标注数据集的深层次类目有待补充。【结论】 研究内容为基于语义的地图科学分类、精准检索与跨类关联提供了参考。

  • 研究论文
    黄泰峰, 马静
    数据分析与知识发现. 2024, 8(3): 77-84. https://doi.org/10.11925/infotech.2096-3467.2023.0004
    摘要 (443) PDF全文 (342) HTML (124)   可视化   收藏

    【目的】解决在样本量不足的情况下,使用预训练模型进行情感分类准确率偏低的问题。【方法】提出一种基于提示学习增强的情感分类模型Pe-RoBERTa,以RoBERTa模型为基础,使用不同于传统微调方法的集成提示方法,通过提示帮助模型进一步理解下游任务,改善模型对文本情感特征的提取能力。【结果】在多个公开的中英文情感分类数据集上的实验表明,少样本场景下模型的平均情感分类准确率为93.2%,相较于传统微调和离散型提示,准确率分别提升13.8%和8.1%个百分点。【局限】处理的数据模态仅限于文本形式,目标任务主要为情感二分类任务,没有做细粒度更高的情感分类任务。【结论】Pe-RoBERTa模型能够有效地进行文本情感特征的提取,在多个情感分类任务中取得较高的准确率。

  • 综述评介
    李雪思, 张智雄, 王宇飞, 刘熠
    数据分析与知识发现. 2024, 8(1): 1-15. https://doi.org/10.11925/infotech.2096-3467.2023.1280
    摘要 (381) PDF全文 (1767) HTML (57)   可视化   收藏

    【目的】 领域知识演化分析是图书情报学界长期关注的一个重要研究问题。本文对国内外有关领域知识演化分析方法的研究进行总结梳理,为后续的相关研究提供参考。【文献范围】 利用领域知识演化的关键词在CNKI和Web of Science中检索,并对检索结果进行人工判读和分析,选取与领域知识演化分析方法密切相关的84篇重点文献进行综述。【方法】 通过回顾研究文献,对领域知识演化的相关概念进行辨析,在此基础上将现有的领域知识演化分析方法分为基于引用、基于结构和基于内容的三类。在对每类分析方法梳理过程中,首先辨析该类方法的理论依据,然后阐述该类方法的基本分析思路并介绍相关进展,最后对现有的领域知识演化分析方法进行总结和展望。【结果】 现有的三类领域知识演化分析方法依托于各自的科学理论,借助技术的进步和数据资源的完善,不断深化改进演化分析的思路框架;虽然取得了丰富的研究成果,但并没有在知识演化分析的研究角度上产生突破,无法根本性地解决当前研究视角下的局限性。【局限】 基于筛选后的文献进行综述分析,可能未全面覆盖相关的研究工作。【结论】 领域知识演化分析的未来研究中有以下两个方向值得重点关注:一是尝试拓展新的领域知识演化分析切入点,二是尝试交叉融合已有的研究方法以改善现有分析方法下的局限。

  • 研究论文
    付芸, 朱丽雅, 李丹, 孙蒙鸽, 张建锋, 刘细文
    数据分析与知识发现. 2024, 8(1): 30-39. https://doi.org/10.11925/infotech.2096-3467.2023.0867
    摘要 (229) PDF全文 (2119) HTML (33)   可视化   收藏

    【目的】 面对智能科研与科学机器人对高质量实验规程数据的需求,解决合成实验规程中的实验操作词统一表示问题。【方法】 综合利用数据和专家知识协同驱动的方式,从合成相关的论文与专利文本中识别并标准化实验操作词。实验操作词识别主要选用较为先进的开源大模型ChatGLM2-6B,实验操作词标准化则混合应用Wu-Palmer和余弦相似度,辅以专家经验知识判别分类的准确性。【结果】 分别获取149个无机合成实验操作词和141个有机合成实验操作词,两者交集124个词。经判定在两类合成实验中分别出现的操作词中多数并不具备鲜明的类别特色,因此可取两类合成实验操作词的并集,共计166个,用于统一表示有机、无机及其杂化合成实验操作。【局限】 仅使用基础的提示工程来激发大模型识别实验操作词,准确率有待提升;所用的数据主要源于当前免费公开的数据集,不够全面、丰富;仅关注合成、工程和基础步骤中涉及的操作词,未涉及动态、分析与命名反应中的操作词。【结论】 本文构建一套表示合成实验操作的统一语言,用于表示有机、无机及其杂化合成反应中的实验操作,不同类型的合成实验操作词在表示上差异不大,在使用频次和倾向上确有不同,今后可据此优先选择研制科学机器人相应的实验操作功能。

  • 研究论文
    鲍彤, 章成志
    数据分析与知识发现. 2023, 7(9): 1-11. https://doi.org/10.11925/infotech.2096-3467.2023.0473
    摘要 (1649) PDF全文 (1001) HTML (203)   可视化   收藏

    【目的】评估ChatGPT在中文命名实体识别、关系抽取以及事件抽取等典型中文信息抽取任务中的性能,分析不同任务和领域ChatGPT的表现差异,给出ChatGPT中文场景下的使用建议。【方法】采用Prompt提示的方式,分别依据精确匹配和宽松匹配两种方式,测评ChatGPT在三个典型信息抽取任务、共7个数据集上的性能:在MSRA、Weibo、Resume和CCKS2019数据集评估ChatGPT的命名实体识别效果,并与GlyceBERT和ERNIE3.0模型对比;在FinRE和SanWen数据集测试ChatGPT与ERNIE3.0 Titan的关系抽取效果;在CCKS2020数据集测试ChatGPT与ERNIE3.0的事件抽取效果。【结果】ChatGPT在命名实体识别任务中的表现不及GlyceBERT和ERNIE3.0模型。在关系抽取任务中,ERNIE3.0 Titan优于ChatGPT。在事件抽取任务中,ChatGPT在宽松匹配下的表现优于ERNIE3.0。【局限】以Prompt提示的方式评估ChatGPT的性能表现存在主观性,不同的Prompt会产生效果差异。【结论】ChatGPT在典型的中文信息抽取任务上的表现还有很大改进空间,用户在使用过程中需选择合适的Prompt和问题。

  • 研究论文
    朱鹏, 赵笑笑, 伍薇
    数据分析与知识发现. 2017, 1(3): 1-9. https://doi.org/10.11925/infotech.2096-3467.2017.03.01
    摘要 (1987) PDF全文 (1180) HTML (48)   可视化   收藏

    目的】探究消费者动机风格、产品类型以及营销策略类型三个因素以及因素之间的交互作用对移动电子商务消费者购买决策偏好的影响。【方法】采用情景设计与问卷采集相结合的实验方法开展相关实证研究。【结果】产品类型与营销策略的交互作用对不同动机风格的移动电子商务消费者决策偏好存在显著差异性影响。【局限】未能引入其他影响因素(如产品卷入度、个体认知需求、感知风险等)进行研究。【结论】从移动电子商务消费者类型区分、产品类型及营销策略的选择三方面对移动产品供应商提出相关的对策建议。

  • 综述评介
    叶光辉, 夏立新
    数据分析与知识发现. 2017, 1(2): 1-10. https://doi.org/10.11925/infotech.2096-3467.2017.02.01
    摘要 (2738) PDF全文 (858) HTML (50)   可视化   收藏

    目的】对已有专家检索与专家排名方法进行评述, 为后续研究提供理论基础。【文献范围】从Web of Science (WOS)、CNKI等数据库中分别以“专家检索(Expert Retrieval)”、“专家排名(Expert Ranking)”、“排名融合(Ranking Fusion)”等为检索词搜集获得相关文献65篇。【方法】针对专家检索覆盖面不足及专家特征计算量大两方面问题, 从专家检索评测和排名融合两个角度梳理并评析现有的研究进展。【结果】融合关系属性是目前专家检索方法的主流, 检索结果可信度研究主要依据用户满意度和文档可信度开展; 专家排名采用友邻推荐模型、PageRank、D-S理论、社交网络与复杂网络分析等实现排名及排名融合, 融合结果总体优于基准排名。【局限】不同排名融合方法间的横向对比研究较少。【结论】相关研究可为构建信息融合视角下的专家会诊平台提供参考, 具体体现在专家信息组织、专家遴选和专家意见融合环节。

  • 卷首语
    张晓林
    现代图书情报技术. 2016, 32(1): 1-2. https://doi.org/10.11925/infotech.1003-3513.2016.01.01
    摘要 (264) PDF全文 (2327) HTML (101)   可视化   收藏
  • 综述评介
    刘峰, 张晓林
    现代图书情报技术. 2016, 32(1): 11-16. https://doi.org/10.11925/infotech.1003-3513.2016.01.03
    摘要 (380) PDF全文 (347) HTML (90)   可视化   收藏
    【目的】提出一套科学数据管理计划的细化构成规范; 并依此从可操作角度构建数据监护模型。【方法】对国际上主要科研管理机构的数据管理计划规范进行调研和统计; 并结合当前科研数据管理的需求与特点进行补充。【结果】形成8大基本构成要素和39个子要素的数据管理计划细化构成规范, 并构建出一种以数据管理计划为核心驱动的数据监护模型。【结论】数据管理计划细化构成规范可以完整、准确规范和指导科研数据的管理活动, 在操作层面上也可以有效地控制和约束科研全生命周期的数据监护过程。
  • 研究论文
    丁恒, 陆伟
    现代图书情报技术. 2016, 32(1): 17-23. https://doi.org/10.11925/infotech.1003-3513.2016.01.04
    摘要 (469) PDF全文 (1891) HTML (104)   可视化   收藏
    【目的】梳理基于相关性的跨模态信息检索中的基本策略和核心问题, 从提升检索效果的角度探讨偏最小二乘法用于特征子空间投影的优劣。【方法】在Wikipedia跨模态信息检索数据集上, 分别采用LDA和BOW模型作为文本和图像资源的特征表达方式, 以余弦距离作为相似度度量方法, 利用最小二乘法替代典型相关性分析法学习特征子空间投影函数。【结果】从P@K、MAP和NDCG三个检索评价指标上, 对比分析典型相关性分析、偏最小二乘回归、偏最小二乘相关三种特征子空间投影法对跨模态信息检索结果的影响, 结果表明偏最小二乘相关法具有最佳效果。【局限】 偏最小二乘法在处理数据时假设数据之间的关系是线性的, 数据基向量之间是正交关系, 因而无法解决非线性、非正交问题。【结论】使用偏最小二乘相关法学习的特征子空间投影与原始空间信息的一致性更强, 跨模态信息检索结果更稳定。
  • 专题
    周宁 何坚
    现代图书情报技术. 2010, 26(7/8): 3-8. https://doi.org/10.11925/infotech.1003-3513.2010.07-08.02
    摘要 (1197) PDF全文 (725) HTML (9)   可视化   收藏

    主要讨论信息可视化原型系统的理论方法和实现技术。具体探讨可视化模型的构建策略、原型系统的环境配置、功能模块和操作方法;文本信息、语音(音频)信息、图像信息可视化模型的构建、数据准备与数据规模、操作界面与运行结果。该原型系统的研究不仅是通用信息资源管理可视化模型的有益尝试,而且在中文信息可视化方面也取得一定的经验。

  • 专题
    吴佳鑫 王健海
    现代图书情报技术. 2010, 26(7/8): 9-14. https://doi.org/10.11925/infotech.1003-3513.2010.07-08.03
    摘要 (1751) PDF全文 (1964) HTML (17)   可视化   收藏

    从态势感知理论出发,分析可视化与态势感知之间的关系,构建可视化感知模型,该模型包括态势感知需求分析、数据与知识提取、态势可视化与视图交互、态势感知、决策制定与执行5个阶段,最后探讨可视化感知模型中的关键问题。

  • 知识组织与知识管理
    徐健 张智雄 肖卓 邓昭俊
    现代图书情报技术. 2010, 26(7/8): 51-57. https://doi.org/10.11925/infotech.1003-3513.2010.07-08.10
    摘要 (1358) PDF全文 (1106) HTML (8)   可视化   收藏

    在对当前术语语义相似度计算进行分析研究的基础上,将科技术语相似度计算归纳为基于语料文集的相似度计算和基于开放知识资源的相似度计算,对相似度指标的集成算法进行综述。并对科技术语语义相似度计算在自然语言处理和知识挖掘方面的应用进行总结,对其未来研究发展进行展望,为进一步构建高效的术语相似度计算系统提供良好借鉴。

  • 知识组织与知识管理
    曾新红 黄华军 林伟明
    现代图书情报技术. 2010, 26(7/8): 58-65. https://doi.org/10.11925/infotech.1003-3513.2010.07-08.11
    摘要 (1359) PDF全文 (807) HTML (9)   可视化   收藏

    研究超大型中文叙词表本体检索和推理的网络化实现方法,运用其成功实现“中国分类主题词表本体”(CCT1_OntoThesaurus)的共建共享系统(CCT1_OTCSS),且时效性已达到实用要求。提出基于RDF三元组思想的Lucene索引结构构造方法, 以CCT1_OntoThesaurus (基于CCT一版的纯文本电子版建立)为例,构建Lucene索引,在此基础上实现高效的本体检索和一致性检测推理,并进一步实现CCT1_OTCSS的各项功能。该解决方案对于我国现有的几部应用最为广泛的超大型中文叙词表快速实现本体化升级、网络化共建共享和动态完善具有良好的应用前景,对于国内外其他采用XML、RDF或OWL表示的大型知识组织系统(叙词表、本体等)实现网络化检索与推理也具有参考价值。

  • 数字图书馆
    董曦京
    现代图书情报技术. 2010, 26(3): 1-7. https://doi.org/10.11925/infotech.1003-3513.2010.03.01
    摘要 (1192) PDF全文 (855) HTML (5)   可视化   收藏

    简要介绍ISO 15511-ISIL标准编码规则、ISO/FDIS 28560标准的多个馆标识数据项。探讨ISO 15511-ISIL架构下编制的中国版ISIL,对其注册管理体系、在ISO/DIS 28560-图书馆RFID编码标准数据项中的ISIL编码压缩应用提出建议。

  • 数字图书馆
    滕广青,毕强
    现代图书情报技术. 2010, 26(3): 8-12. https://doi.org/10.11925/infotech.1003-3513.2010.03.02
    摘要 (1266) PDF全文 (614) HTML (7)   可视化   收藏

    以概念格理论为基础,用形式概念分析的方法通过对数字图书馆用户使用方法的关联规则挖掘,建立灵活的规则挖掘机制,并依据提取的关联规则对数字图书馆用户进行用法细分,对在更大程度上满足更多用户的个性化需求进行尝试。

  • 数字图书馆
    常智荣,马自卫,李高虎
    现代图书情报技术. 2010, 26(3): 19-26. https://doi.org/10.11925/infotech.1003-3513.2010.03.04
    摘要 (1418) PDF全文 (741) HTML (6)   可视化   收藏

    在数字图书馆系统集成应用的框架下,提出基于Nutch的专题网页资源采集服务系统设计方案。该方案引入信息过滤模块、基于计算机通信领域专业词典的中文分词模块、GUI信息定制模块、词典和关键词管理模块等,保证采集和获取过程中资源的专题性和系统的可管理性以及易用性。重点对文本解析过滤、Plugin插件开发以及搜索结果的层次化自动聚类等相关技术进行深入研究。通过基于Webservice的服务接口,实现其在数字图书馆资源层的集成应用。

  • 知识组织与知识管理
    窦玉萌
    现代图书情报技术. 2010, 26(3): 27-32. https://doi.org/10.11925/infotech.1003-3513.2010.03.05
    摘要 (1181) PDF全文 (695) HTML (7)   可视化   收藏

    以网络协作标注中的标签为研究对象,调研标签消歧方法,并将其划分为基于数据挖掘方法消歧、基于统计分析方法消歧、利用相关知识组织工具消歧、引入控制机制消歧和开发可视化组件消歧5类。比较这5类消歧方法在用户参与度、消歧时机、消歧性质、实验与应用情况和发展前景5个方面存在的区别和联系。

  • 知识组织与知识管理
    白海燕
    现代图书情报技术. 2010, 26(3): 33-39. https://doi.org/10.11925/infotech.1003-3513.2010.03.06
    摘要 (1683) PDF全文 (1507) HTML (3)   可视化   收藏

    基于关联数据的基本原则和发布方法,分析介绍DBpedia的实现技术:通过对WikiText格式数据进行语法解析和流程控制,实现对自由文本进行的结构化数据抽取和RDF表达,并基于URI参引、SPARQL查询和RDF文件转存等多种方法,实现多样化的Web数据获取;采用基于属性和基于模式的自动关联算法,与众多数据集之间实现关联。

  • 数字图书馆
    郭文丽,张晓林
    现代图书情报技术. 2010, 26(2): 1-6. https://doi.org/10.11925/infotech.1003-3513.2010.02.01
    摘要 (1337) PDF全文 (646) HTML (11)   可视化   收藏

    针对用户来自不同角度及不同层次的本体需求,提出建立基于粒度的本体模块描述方法,以便帮助用户从现有的大型本体中抽取出所需模块。将粒度计算方法与分面分类理论结合起来,定义并论证本体的粒度属性,并在此基础上给出本体粒度划分的相关定义与语义解释。

  • 数字图书馆
    滕广青,毕强
    现代图书情报技术. 2010, 26(2): 7-11. https://doi.org/10.11925/infotech.1003-3513.2010.02.02
    摘要 (1709) PDF全文 (671) HTML (13)   可视化   收藏

    以概念格理论为基础,借助营销学中市场细分的变量,通过概念聚类,用形式概念分析的方法对数字图书馆用户进行市场细分。对在数字图书馆用户细分中突破传统统计口径、建立可伸缩的细分机制进行探索。

  • 数字图书馆
    姚飞,姜爱蓉
    现代图书情报技术. 2010, 26(2): 12-16. https://doi.org/10.11925/infotech.1003-3513.2010.02.03
    摘要 (1316) PDF全文 (533) HTML (10)   可视化   收藏

    简要介绍Planets项目的基本概况,详细描述其在保存计划、内容特征化、保存行为、互操作框架、试验平台等方面的技术实施。Planets项目能够提供长期保存过程中所需的多种工具和服务,推进数字资源长期保存的发展,其很多方面值得借鉴。

  • 数字图书馆
    张云中,徐宝祥
    现代图书情报技术. 2010, 26(2): 17-23. https://doi.org/10.11925/infotech.1003-3513.2010.02.04
    摘要 (1406) PDF全文 (597) HTML (10)   可视化   收藏

    针对如何运用FCA完善信息系统建模理论的问题,明确信息系统建模要解决的核心问题和利用FCA在解决上述问题的优势,指出FCA在信息系统建模中的应用方向,提出一套基于FCA的信息系统建模理论,并结合实例详细阐述应用FCA进行子系统划分的方法和构建静态模型、动态模型和功能模型的原理。

  • 知识组织与知识管理
    白海燕,朱礼军
    现代图书情报技术. 2010, 26(2): 44-49. https://doi.org/10.11925/infotech.1003-3513.2010.02.08
    摘要 (1472) PDF全文 (1342) HTML (8)   可视化   收藏

    介绍三种自动关联构建的方法——基于实体的文本映射、基于图相似度的映射和基于规则的关联构建。基于实体的文本映射是实现自动关联的基本方法,图映射是对单一三元组比较方法的扩展,这两种方法都具有很强的通用性,但创建的关系类型却非常有限。而基于规则的关联构建能够创建较为丰富和复杂的关系,但依赖于特定的数据模型和相关规则。

  • 22届机检会专题
    章成志
    现代图书情报技术. 2009, 3(2): 1-8. https://doi.org/10.11925/infotech.1003-3513.2009.02.01
    摘要 (1894) PDF全文 (1750) HTML (10)   可视化   收藏

    首先对文本聚类结果描述的研究背景和相关的研究情况进行说明,分析自动标引、自动文摘、概念聚类与文本聚类结果描述的关系,定位文本聚类结果描述的研究内容;然后根据文本聚类结果描述的具体要求,对该问题进行形式化;最后给出文本聚类结果描述的评价方法。

  • 22届机检会专题
    窦玉萌,赵丹群
    现代图书情报技术. 2009, 3(2): 9-17. https://doi.org/10.11925/infotech.1003-3513.2009.02.02
    摘要 (2096) PDF全文 (1223) HTML (13)   可视化   收藏

    以协作标注系统为研究对象,从理论研究、实证研究和试验与应用研究三个层面对此领域的研究文献进行综述。最后,对本文工作进行总结,对协作标注系统的未来研究发展进行展望。

  • 22届机检会专题
    卢胜军,李法勇,钱建军,真溱
    现代图书情报技术. 2009, 3(2): 18-22. https://doi.org/10.11925/infotech.1003-3513.2009.02.03
    摘要 (1768) PDF全文 (950) HTML (9)   可视化   收藏

    提出一种本体集成方法WCONS+,将本体集成过程分为准备、映射、集成和检测4个阶段,并通过集成军用飞机本体和电子对抗装备本体对这一方法进行了实验,结果初步证明该方法的有效性。

  • 22届机检会专题
    姜彩红,乔晓东,朱礼军
    现代图书情报技术. 2009, 3(2): 23-28. https://doi.org/10.11925/infotech.1003-3513.2009.02.04
    摘要 (1842) PDF全文 (1069) HTML (13)   可视化   收藏

    采用知识工程的方法,对“新能源汽车”中文专利摘要进行研究分析,提出了一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则,并利用这些规则对专利摘要进行知识抽取结果,抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库的进行尝试,验证了基于本体对专利摘要进行知识抽取的可行性。

  • 专题
    李华,吴振新,郭家义,向菁
    现代图书情报技术. 2009, 3(1): 2-9. https://doi.org/10.11925/infotech.1003-3513.2009.01.02
    摘要 (1581) PDF全文 (1143) HTML (14)   可视化   收藏

    回顾网络信息资源保存的发展历史,分析网络信息资源保存在初始实验、应用部署和长远发展这三个阶段中的不同进展和特点,通过总结网络信息资源保存的研究历程和近年来国内外实践,初步预见未来趋势展望网络信息资源保存发展趋势,以期对我国网络信息资源保存起到参考作用。

  • 专题
    刘兰,吴振新,张智雄,徐麒
    现代图书情报技术. 2009, 3(1): 10-15. https://doi.org/10.11925/infotech.1003-3513.2009.01.03
    摘要 (1380) PDF全文 (763) HTML (14)   可视化   收藏

    通过总结目前国际上Web Archive中常用的三种采集策略:完整性采集、选择性采集和混合型采集,对比分析各种采集策略的特点、关键问题和代表性的项目,最后分析选择采集策略需要考虑的关键因素,并提出一般性的建议。

  • 专题
    吴振新,张智雄,孙志茹
    现代图书情报技术. 2009, 3(1): 28-33. https://doi.org/10.11925/infotech.1003-3513.2009.01.06
    摘要 (1442) PDF全文 (743) HTML (14)   可视化   收藏

    介绍Web archive资源应用的基本情况,从数据挖掘的角度,对Web archive资源的深层次应用进行总结和分析。

  • 数字图书馆
    李峰,李春旺
    现代图书情报技术. 2009, 3(1): 44-49. https://doi.org/10.11925/infotech.1003-3513.2009.01.07
    摘要 (1718) PDF全文 (2383) HTML (11)   可视化   收藏

    分析Mashup的三层体系架构,并从资源获取技术、表示层组件技术、服务器技术、融汇组织技术几个方面归纳并详细论述Mashup相关技术。资源获取技术从Web Feed方式、公共接口API方式、REST协议方式和屏幕抓取4个方面介绍;表示层组件分为Portlet与Widget两类;服务器技术以Kapow Mashup Server为例;融汇组织技术方面侧重融汇模式和编程语言及工具。最后指出目前存在的问题及未来的研究方向。

  • 数字图书馆
    曾苏,马建霞,汤天波,韩珂
    现代图书情报技术. 2009, 3(1): 50-57. https://doi.org/10.11925/infotech.1003-3513.2009.01.08
    摘要 (1556) PDF全文 (941) HTML (15)   可视化   收藏

    以中国科学院部分研究所、国内部分高校的科研人员、图书信息人员、决策管理人员为调查对象,分析不同角色人员对IR的认知和需求差异,揭示国内IR规划实施过程中存在的问题,以期为国内科研机构、高校IR的规划实施提供借鉴。

  • 专题
    徐健,张智雄
    现代图书情报技术. 2009, 25(4): 1-6. https://doi.org/10.11925/infotech.1003-3513.2009.04.01
    摘要 (1840) PDF全文 (1681) HTML (3)   可视化   收藏

    在对目前具有代表性的开源网络抓取软件Nutch、Heritrix、WCT、Web-Harvest进行比较分析的基础上,提出基于Nutch的Web网站定向采集系统,并对种子站点的选取、抓取过程管理、网页去噪、新种子站点的发现等关键问题进行重点探讨。

  • 专题
    白海燕,姜波
    现代图书情报技术. 2009, 25(4): 7-13. https://doi.org/10.11925/infotech.1003-3513.2009.04.02
    摘要 (2144) PDF全文 (983) HTML (3)   可视化   收藏

    分析数字图书馆知识组织体系构建的层次与结构,围绕知识组织系统的构建与管理、知识组织系统的互操作、知识组织系统的存储与管理、语义元数据的生成系统4个组成部分,选取相关的开源软件,对每一结构在数字图书馆知识组织过程中的功能和作用进行说明,并对数字图书馆的知识组织体系的构建提出最佳实践和应用说明。

  • 数字图书馆
    马建霞
    现代图书情报技术. 2009, 25(4): 33-39. https://doi.org/10.11925/infotech.1003-3513.2009.04.07
    摘要 (1447) PDF全文 (624) HTML (4)   可视化   收藏

    介绍复合数字对象相关的几个标准:METS、MPEG-21 DIDL和OAI-ORE,分析它们的基本数据模型、应用情况及特点,并重点对它们对数字处理方式进行对比。

  • 知识组织与知识管理
    赖茂生,屈鹏
    现代图书情报技术. 2009, 25(4): 50-56. https://doi.org/10.11925/infotech.1003-3513.2009.04.10
    摘要 (2087) PDF全文 (1043) HTML (3)   可视化   收藏

    利用搜狗(Sogou)2007年3月的查询日志,使用词性标注方法,得出高频词性标注结果的分布特征。发现用户在查询中以使用名词为主,动词为辅,鲜有其它词类出现在高频词性标注结果中。以“的”为代表的虚词较少地出现在高频词性标注结果中。网络搜索的查询式与自然语言在句法上存在一定差异,但也有相通之处。用户主要使用名词进行概念性检索,关键词仍为用户进行检索的主要手段。高频词性标注结果部分符合Zipf定律。

  • 专题
    李广建
    现代图书情报技术. 2009, 25(6): 2-7. https://doi.org/10.11925/infotech.1003-3513.2009.06.02
    摘要 (1603) PDF全文 (642) HTML (7)   可视化   收藏

    介绍面向信息机构的嵌入式NSTL资源集成服务系统的相关背景,给出系统的设计方案、体系结构及主要功能,并从资源整合、服务整合以及分布式知识库管理三个方面概述系统的关键实现技术,最后简要说明系统在试点单位的应用情况。

  • 专题
    齐惠颖,牟秋江,李亚子
    现代图书情报技术. 2009, 25(6): 8-13. https://doi.org/10.11925/infotech.1003-3513.2009.06.03
    摘要 (1529) PDF全文 (717) HTML (7)   可视化   收藏

    结合面向信息机构的嵌入式NSTL资源集成服务系统的实践,讨论整合过程中系统互操作和结果融合的方法,并对相关实现技术进行了说明,最后给出了系统性能测试的结果,验证了所提方法的可行性。