期刊首页 在线期刊 最新录用

最新录用


说明:最新录用文章, 内容和格式将与印刷版一致(除了页码), 您可以通过doi直接引用。

Please wait a minute...
  • 全选
    |
  • 马玮璐, 孙坦, 赵瑞雪, 鲜国建
    预出版日期: 2025-07-08

    [目的]简化科技文献摘要撰写过程,生成更直观的图谱式摘要以辅助科研。[方法]选取PMC数据库的水稻育种相关论文,构建4276条“全文-摘要”问答对,通过实验遴选最优的提示词和温度系数,基于有监督数据集对Qwen2.5-7B-Instruct大模型微调,并在GraphRAG框架中接入微调后的模型以生成每篇论文的图谱式摘要,后使用优选提示词在GraphRAG中进行全局查询,获得论文的文本摘要。[结果]本研究方法在ROUGE-1、ROUGE-2和ROUGE-L的F1值上,相比基线模型分别提高了44.16%、61.36%和54.87%,在5分制人工评测中,本研究方法相比基线模型平均提高了1.78分,生成的图谱式摘要效果更加直观。[局限]本研究受限于基础硬件条件,选取的大模型参数量较小,模型生成能力还需加强,此外本研究选用的GraphRAG技术框架,在索引构建阶段耗时较长,在实际应用中还需配套高效的推理加速框架。[结论]基于图谱对大模型的检索增强生成技术能够深入捕捉论文中的远距离隐藏信息,生成更加全面且准确的论文摘要和层次清晰的图谱式摘要,便于提高科研人员的阅读效率,助力科研生产工作。

  • 姚元璋, 徐健
    预出版日期: 2025-07-04

    [目的]分析跨学科领域的术语词在不同学科间存在的语义差异现象,挖掘语义差异现象的原因。[方法]使用预训练深度学习模型实现自动化地识别和量化术语的语义差异,设计构建语义差异程度指标定量衡量语义差异程度,并对术语所涉及学科进行共现分析。[结果]基于预训练模型的语义差异现象识别准确率达到0.8193,所构建度量指标能够对语义差异进行有效量化。[局限]研究局限于中文术语的语义差异,选取术语学科跨度范围有限。[结论]挖掘出跨学科术语存在语义差异现象的原因主要有:学科专业化和知识分化、语言及语境的差异、概念的层次化和抽象化、认知侧重层面的差异以及跨学科交叉与融合影响等,为探究术语差异背后的原因及其与学科之间的关联提供了新的视角和方法论。

  • 邓航宇, 唐川, 蒲云强, 敖丽娟, 王婉婧
    预出版日期: 2025-07-04

    [目的]针对美国国会听证会文本数量大、涉及范围广、口语化表达多等特点,本文提出一个智能化识别中国科技安全风险的方法流程。[方法]本研究从听证会数据特征与情报分析人员实际需求出发,利用大语言模型等技术实现文本过滤、摘要生成以及智能问答等模块并将其有机结合在一起,从而达成高质量的智能化识别。[结果]本研究以第118届国会听证会文本为对象验证关键模块的有效性。文本过滤的F1值、摘要生成的ROUGE-Lsum值、智能问答风险点召回率分别达到0.7751、0.6032以及0.7636,显著优于基线方法。[局限]该方法主要针对美国国会听证会文本设计,未来还需要用更多类型的语料加以验证,以便将其泛化并扩展成通用方法。[结论]本文提出的方法能辅助研究者深入挖掘美国国会科技情报,为我国制定有效的科技安全应对策略提供显著支持。

  • 张双宝, 成全, 曾艳
    预出版日期: 2025-07-04

    [目的]为充分挖掘中文文档之间的语义关联信息,实现基于交互式语义增强的文档级事件抽取效果的提升。[方法]本研究提出了一种交互式语义增强的中文文档级事件抽取模型CSDEE,利用注意力机制构建跨文档的交互式语义网络,增强实体识别性能,再经由文档编码与事件抽取信息解码完成事件抽取任务。[结果]实验结果表明,CSDEE模型在事件抽取的精确率、召回率和F1值上分别达到80.7%、84.1%和82.3%,优于现有基线模型。同时,通过对模型开展消融实验及在公开数据集ChFinAnn和DuEE-fin上的泛化实验,验证了模型在中文文档级事件抽取任务中的有效性。[局限]目前模型仅针对文档级事件抽取的性能提升作出了相应改进,暂未涉及重叠事件类型的多分类任务。[结论]充分挖掘与关联文档数据之间的相似语义信息能够有效促进文档级事件抽取任务的性能与效果。

  • 谢威, 夏鸿斌, 刘渊
    预出版日期: 2025-07-04

    [目的]运用深度学习与对比学习方法解决目前零样本关系抽取任务中完整实体信息与关系信息交互不够充分的问题。[方法]提出了一种基于对比学习的联合实体关系信息的零样本关系抽取模型(JCL)。首先,使用数据增强技术对原始的输入文本进行处理,增加模型得到的有效信息。其次,通过增强交叉注意力模块将实体对深度融合与关系联合处理,提取实体与实体间的交互信息和实体与关系语义间的交互信息,放大不同关系在嵌入空间内的细微差异。最后,使用交叉熵损失函数联合对比损失优化模型。[结果]与基线模型相比,在FewRel数据集不可见关系m = 5情况下,F1提升了3.12%;m = 10情况下,提升了5.19%;m = 15情况下,提升了1.99%。在Wiki-ZSL数据集m=5时,提升了7.05%;m=10时,提升了3.42%;m=15时,提升了8.08%。[局限]本文的研究领域数据集的语言较为单一,数量较少。[结论]本文提出的基于对比学习的联合实体关系信息模型针对零样本关系抽取任务在三个公开的数据集上的效果达到先进水平。

  • 周胜利, 徐睿, 陈庭贵, 汪邵杰
    预出版日期: 2025-07-04

    【目的】为解决AI换脸诈骗过程中多模态特征表征不足的问题,提出面向AI换脸诈骗的受骗风险识别模型FSFRI,有效融合多模态特征提升受骗风险识别效果。【方法】FSFRI综合欺诈信息的生成和传播过程,从中提取伪造人脸视频帧特征、流量描述特征、流量负载数据特征和流量时序特征,再通过特征融合模块实现跨模态特征的互补融合,最后通过风险识别模块实现受骗风险的识别。【结果】在模拟实验生成的数据集中,FSFRI取得了较好的识别效果,F1值达到0.92;同时在低噪声环境中(加噪比例为0-0.2)展现出较强的鲁棒性,在0.2的加噪比例下F1值仅下降0.019。【局限】FSFRI中的多模态特征产生了较高的计算复杂度,且在高噪声环境中的风险识别效果有待进一步提升。【结论】FSFRI能有效提取并融合AI换脸诈骗过程中产生的多模态特征,并实现受骗风险准确识别。

  • 马莹雪, 甘明鑫, 胡磊
    预出版日期: 2025-07-04

    【目的】为解决深度学习推荐方法缺乏对用户兴趣分布特征建模,不能充分刻画用户偏好的问题,提出一种基于用户兴趣聚集性和层次性分布特征建模的序列推荐方法。【方法】利用注意力网络和LSTM从行为序列获得用户和项目的向量表示,学习用户兴趣分布的位置中心和边界半径,通过双半径刻画兴趣分布的层次性和聚集性;通过拟合候选项目特征与用户兴趣分布中心的距离与交互概率预测用户偏好;融合基于神经网络的行为预测和基于兴趣模型的偏好估计生成推荐。【结果】在Amazon数据集上的实验结果表明,相比于表现最优的对比方法,本文方法在准确率、召回率、F值、覆盖率等评价指标上的性能达到最优,性能提升达到10个百分点以上。【局限】未考虑除行为序列外的用户生成内容,后续研究可以结合用户评论等信息完善兴趣建模。【结论】本文方法能准确刻画用户兴趣的分布特征,提高推荐准确度,优化推荐结果的综合质量。

  • 孙蒙鸽, 王燕鹏, 付芸, 刘细文
    预出版日期: 2025-07-04

    [目的] 本文以科技情报短文本为实验数据,研究大语言模型在多领域科技知识实体抽取任务中提示工程的构建方法,旨在解决短文本语义不足和领域多样性对科技实体抽取的挑战。[方法] 针对科技情报短文本语义浓缩导致的上下文信息不足、知识实体领域跨度大、以及实体边界模糊等问题,本文提出一种基于知识提示学习的Scientific Prompt知识实体抽取策略。该策略结合BERTopic方法,将领域知识动态引入提示词策略中,以提升大语言模型在多领域知识实体识别中的语义理解和感知能力,增强抽取的精确性和泛化能力。[结果] 实验结果显示,在Scientific Prompt策略加持下,QWEN2.5-7B、QWEN2.5-7B(微调)与GPT-4o的F1-Value分别为0.6526、0.7407、0.7878;而Zero-Shot下对应模型的F1-Value分别为0.5534、0.6165、0.6822。对比发现,在短文本-多领域实体抽取任务中,Scientific Prompt策略加持下的开源模型可远超对其微调的效果(0.6526 vs 0.6165);甚至该策略加持下的微调QWEN2.5-7B模型表现略优于仅使用GPT-4o的效果(0.7407 vs 0.6822)。[局限]本文仅测试了该策略在中文科技情报短文本上的表现情况,未测试其在英文文本的适用性。[结论]实验证明,与微调方式相比,Scientific Prompt策略无需更新模型参数即可显著提升大语言模型在短文本-多领域知识实体抽取任务中的性能。实验还验证了Scientific Prompt策略在大规模无监督科技短文本中的表现,通过精确抽取科技实体可有效感知科技态势。本文的研究为通用型中文科技短文本知识实体抽取任务提供了重要的技术路径参考。

  • 张晓娟, 吉如意
    预出版日期: 2025-07-04

    [目的] 提出一种基于静态与动态异构图嵌入的全局引文推荐框架,以期提高引文推荐的准确度。[方法] 本文首先分别构建静态加权异构网络与时序异构网络。在静态异构网络中,利用混合随机游走和skip-gram模型生成能捕捉网络局部与全局信息的节点嵌入;基于所构建的时序异构网络,首先利用基于元路径的随机游走获得元路径实例,再建模异构图中的时态演化特征,以此获得图中节点的嵌入式表示。然后利用联合训练与独立训练两类方法整合获得图中论文节点的最终嵌入表示;最后通过计算相似度为输入论文生成候选引文推荐列表。[结果] 实验结果表明:本文提出方法的实验性能均优于只考虑动态或者静态的方法;其中独立训练方法在几乎所有召回率指标(除了Recall@40之外)上表现最佳;自适应任务不确定性加权方法在MRR与MAP指标上表现最佳,分别达到0.308与0.297。[局限]未在多个数据集中验证新提出的模型的性能;模型算法的运行效率尚需优化提升。[结论]综合考虑网络静态和动态性能有效提升全局引文推荐的性能。

  • 徐建民, 王力, 张雄涛
    预出版日期: 2025-07-04

    [目的]现有社会化序列推荐研究容易引入与用户兴趣不相似的好友信息,且未能考虑不同用户受社交影响的程度存在差异,致使推荐性能受限。为弥补现有研究不足,提出一种基于图注意力网络的自适应社会化序列推荐方法。[方法]首先,利用自注意力机制对用户行为序列建模,获取用户动态兴趣表示。其次,设计一种正则化限制的图注意力网络聚合好友特征,以准确建模用户社交兴趣表示。最后,提出一种基于注意力的自适应融合方法,准确融合动态兴趣与社交兴趣,生成推荐结果。[结果]与主流基线模型相比,所提方法在HR@10上最高提升10.8%,在NDCG@10上最高提升5.3%。[局限]所提方法对于社交网络结构的依赖性较高,当社交关系数据稀疏时,性能提升不明显。[结论]本文方法可以更充分地利用社交信息,有效预测用户行为,提高推荐性能。

  • 向博文, 柴梦丹, 向卓元
    预出版日期: 2025-07-04

    [目的]鉴于司法裁判文书摘要要求与原文在案件事实、法律适用等要素保持一致,提出嵌入司法要素事实一致性评测的中文司法裁判文书摘要生成方法。[方法]首先定义司法裁判文书摘要事实一致性判定的原则和方法;其次,确定数据增加、事实一致性纠错和测评等预处理流程;然后,分别构建分段抽取模型和引入司法要素知识图的生成式摘要模型,并在CAIL2020数据集上进行实验。[结果] FC-JDSM模型生成的摘要在指标ROUGE-N(N=1、2、L),SRO,EM-FCJS上分别为67.98%、55.40%、64.14%、78.5%、90.01%,均优于比较模型。消融实验证实了分块抽取和事实信息引入的有效性。[局限] EM- FCJS中的数据增强方案得到的数据与真实数据存在着一定偏差。[结论] 将司法要素融入一致性评测和摘要生成过程中,提高了中文司法判断文书摘要一致性,有利于司法工作的公正性。

  • 冉从敬, 丁群哲, 宋永辉, 王福新
    预出版日期: 2025-07-04

    [目的] 针对专利转让数据中难以区分发生实质性专利交易问题,提出一种系统性方法,通过融合多种基于莱文斯坦距离算法,较为准确地识别出发生实质性交易的专利行为,并探讨其技术特征差异。[方法] 针对不同专利转让场景,提出了一套筛选流程方法。其关键步骤之一是利用基于编辑距离算法的多种文本相似度方法,计算交易双方姓名和地址的相似度分值,并结合设定阈值剔除内部资源重新配置的非市场化交易记录。同时,通过实证研究验证方法准确性,并利用统计分析比较发生实质性交易与未发生实质性交易行为的专利在技术指标上的差异。[结果] 实验结果表明,该方法在准确率上达到81.27%,能够有效识别发生实质性交易的专利行为。发生实质性交易的专利在独立权利要求数量、同族专利数及被引次数等技术指标上显著高于未发生实质性交易的专利(p < 0.05)。[局限] 实验数据时间跨度有限,且文本相似度算法在复杂地址特征处理上的适应性需进一步优化。[结论] 本研究为专利交易行为的精准识别提供了有效方法和思路,并为技术转移与专利市场化领域的研究提供了可靠数据支持。

  • 李翼鸿, 余燕芳, 余奇伟, 李苏娟, 张少龙, 叶军军
    预出版日期: 2025-07-04

    [目的]大语言生成模型为中文开放关系抽取任务带来了新思路,但如何优化模型生成的关系抽取结果质量成为一个重要问题。[方法]本文提出一种低成本的基于多维度自我反思学习的大模型微调方法(SRLearn方法),自动引导模型进行多维度的自我反思学习,从而优化模型的中文关系抽取生成质量。[结果]相比LoRA+DPO偏好微调方法,SRLearn方法在WikiRE1.0数据集上提高了15个百分点,在DuIE2.0数据集上提高了6.5个百分点,验证了该方法的有效性。[局限]SRLearn方法未来还需要考虑覆盖更多的生成质量问题。[结论]基于多维度自我反思学习增强的大模型微调方法能够大幅度提高中文关系抽取生成质量。

  • 苏妍嫄, 董宵宇, 韩翠娟, 张亚明
    预出版日期: 2025-07-04

    [目的]设计嵌入双通道注意力卷积的联邦学习框架,破解因隐私保护导致的跨社交网络特征提取难题,精准识别社交机器人。[方法]首先,采用联邦学习框架实现跨社交网络数据集成。其次,在本地模型模块嵌入双通道注意力卷积以全面挖掘数据特征。再次,借助基础卷积和区块链在联邦聚合模块对各本地模型参数进行集成处理,以获取和安全保存最优模型参数。[结果]TwiBot-20&Weibo-bot数据集上的实验结果表明,FL-DCACNN模型的准确率、精确率、召回率和F1值分别达到91.63%、97.10%、97.14%和96.88%,且呈现较强的泛化能力。[局限]在多模态特征提取时仅考虑了结构化数据、文本数据及图片数据,未涉及视频、音频数据。[结论]FL-DCACNN模型可有效破解特征提取不足、数据来源单一等因素造成的社交机器人识别效果不佳问题,提高了模型识别性能,实现了社交机器人的精准识别。

  • 钟明, 钱庆, 周伟, 吴思竹
    预出版日期: 2025-07-04

    [目的] 面向国家人口健康科学数据中心数据集中存储、数据安全风险、计算资源有限、用户分析利用需求迫切等特点,研究适合国家人口健康科学数据中心数据飞地的建设思路,为用户提供更高效、安全和灵活的数据处理与分析环境。[方法] 归纳数据飞地的类型、特点、实现机制和不同场景的适用性,结合国家人口健康科学数据中心数据应用特点,基于融合安全增强、微隔离和人工智能等技术的虚拟数据飞地方式,构建国家人口健康科学数据中心大数据分析平台。[结果] 构建的大数据分析平台支持国家人口健康科学数据中心数据审核、数据加工、数据分析挖掘、用户发表论文关联数据同行评议等服务,累计完成2800余个项目3.2万个数据集的审核任务、1万余项数据分析任务和5000余项数据加工任务,数据泄露事件发生率为0,资源利用率达80%。[局限] 无法实现跨机构分散存储的数据共享,还需结合数据中心发展探索基于多方安全计算和联邦学习等隐私保护技术的数据飞地研究。[结论] 有效解决人口健康数据集中方式的安全共享与协作分析需求,对国家人口健康科学数据的安全保障和共享利用具有重要意义。

  • 伊豪涵, 王昊, 周抒, 郑旭辉, 周正达
    预出版日期: 2025-07-04

    [目的] 解决古籍文本因语言复杂性、多样性及标注数据缺乏而带来的命名实体识别难题。[方法] 本文构建了一种融合古籍知识库和AI-Search的RAG框架,结合LATS框架的生成、搜索、反思与修正机制,优化大语言模型在古籍领域的零样本命名实体识别性能。[结果] 在CHisIEC公共数据集上的实验表明,与古籍领域微调模型Xunzi-Qwen1.5-7B_chat 相比,本文方法的Micro F1值提升了14.44 个百分点,与Qwen1.5-7B_chat相比提升了16.99个百分点。

    [局限] Prompt构造方法有进一步优化空间;LATS框架计算复杂度较高,可能影响大规模数据场景的效率。[结论] 检索增强生成有效增强了大语言模型的领域知识,LATS框架优化了大语言模型输出的准确性与条理性,显著提升了大语言模型在古籍领域零样本命名实体识别任务的性能。

  • 李洪敏, 杨文豪, 马宏阳, 王建州
    预出版日期: 2025-07-04

    [目的]综合考虑城市碳排放信息的非完整性、特征的多元性以及排放规律的复杂性,全面刻画碳排放的复杂动态过程对预测精度的提升至关重要。[方法]提出了一种融合关键信息粒度的多源异构时域卷积碳排放预测HOSVD-TCN模型。首先使用自动提取技术抓取原始粒度信息,其次运用自然语言处理社交媒体的实体文本,形成关键信息粒度的情感值。通过高阶奇异值分解和重构异质信息,生成高质量的张量表示,并将重构后的碳排放量作为预测模型的输入。最后使用时域卷积模型TCN预测碳排放量。[结果]实验结果表明,所提出模型三个城市的平均MAPE值仅为6.96%,预测性能优于其他主流的对比模型。[局限]多模态数据处理的复杂度较高,预测效果受限于现有数据集的规模。[结论]HOSVD-TCN充分结合了HOSVD的特征提取能力和TCN的时空捕捉能力,实现了对城市碳排放的准确预测,为城市规划和管理提供了有力的技术支持和科学依据。

  • 张贞港, 余传明
    预出版日期: 2025-07-04

    [目的] 在将论文及其属性数据(如作者、发表场所等)建模为知识图谱的基础上,细粒度聚合论文属性数据的时序演化信息以提升模型在新发表论文引用数量预测任务中的性能。[方法] 提出一种基于时序演化与细粒度信息聚合的引用数量预测模型,该模型由图邻域特征聚合模块、时序演化表示模块、细粒度信息聚合模块和预测模块组成。图邻域特征聚合模块获取知识图谱中学术实体的特征表示;时序演化表示模块获取论文属性数据的时序演化特征;细粒度信息聚合模块通过多头注意力机制聚合不同属性数据对论文的影响;预测模块输出引用数量预测结果。将所提模型应用到DBLP数据集,开展实证研究。[结果] 本文模型在DBLP数据集的MALE、RMSLE和R2指标分别为0.5141、0.7098和0.3470,显著优于现有最先进方法。[局限] 由于篇幅限制,本文仅使用DBLP数据集验证模型效果,未来将在更多数据集上进一步验证模型的泛化能力。[结论] 本文模型在DBLP数据集上的性能优于目前最先进的方法,研究揭示了如何利用论文属性信息的时序演化特征以及细粒度信息聚合来提高对新发表论文的引用数量预测性能。

  • 赵广宇, 段永康, 耿骞, 闫妍, 靳健
    预出版日期: 2025-07-04

    [目的]现有预训练模型在处理政务问题时存在各向异性和领域泛化能力不足的局限,使得政务问题检索面临“搜不到、搜不全、搜不准、体验差”等挑战。为提高政务检索的效果和效率,本文提出了细粒度的政务问题语义检索模型GovSQR。[方法]GovSQR模型首先通过结构化的提示工程和少样本示例引导大模型生成任务适配的正负样本数据集,随后基于生成的三元组数据采用有监督SimCSE框架微调RoBERTa模型,同时设计了动态加权掩码机制和去偏对比损失函数以降低假负样本对语义表征的干扰。[结果]在深圳市政务问题数据集上的实验结果表明,GovSQR模型在P@1、R@3和MRR指标上分别达到了0.9660、0.9811和0.9729,均优于InfoCSE、DiffCSE等主流对比学习模型。[局限]数据生成过程易受幻觉干扰,人工核验成本较高,且针对语义复杂、表述模糊问题的有效性需要进一步验证。[结论]GovSQR模型通过数据增强和假负样本去偏,使模型学到更具判别性和均匀性的嵌入表示,显著提升了政务相似问题检索的准确性,为政务服务智能化提供了有力支撑。

  • 王星, 袁卫华, 孟广婷, 陈宇, 宗臣
    预出版日期: 2025-07-04

    [目的]为了在捆绑推荐中解纠缠用户多样化意图以捕获丰富的节点信息,本文提出解纠缠感知双通道对比学习的捆绑推荐模型。[方法]局部多视图意图解纠缠模块将节点表示映射至潜在空间,获取解纠缠节点表示;全局超图统一学习模块整合多类型数据,捕捉高阶相关性;双通道协同学习模块运用对比学习实现两者的协同学习。[结果]在公开数据集上,D2CBR展现出了显著的性能优势,相较于最先进的基线,平均性能提升了2.87%,最高可达6.43%。[局限]超图运算,如关联矩阵,往往与图中节点数量相关,处理超大规模数据集时会导致较大的内存和计算开销,在计算资源有限的场景下应用可能受限。[结论]本文通过图变分自编码器有效区分用户多样化意图,利用超图整合多类型数据,提升了推荐性能。在公开数据集上超越最先进的基线,证明了模型的有效性和鲁棒性。

  • 仝鑫, 林智, 袁立宁, 王靖亚, 金波
    预出版日期: 2025-07-04

    [目的] 提出一种智能体框架,提升大语言模型风险指令挖掘任务的准确性与可解释性。[方法] 该框架集成语言对齐模块实现多语言输入的统一映射,层级检测模块实现多阶段风险分析,双通道解释模块提供分析决策依据,一致性验证模块提升处理复杂样本时的可靠性。[结果] 基于三个风险指令数据集的实验表明,该方法最高可将现有工具的分析准确率由54.75%提升至93.75%,在仅使用开源小模型作为内核的情况下,准确率增幅也能超过20%。[局限] 框架推理效率有待提高,同时部分轻量级模型生成的结构化输出稳定性不足。[结论]该方法能够有效为大语言模型风险指令挖掘提供通用、可解释且跨语言的增强方案。

  • 孙冉, 安璐, 谢子霖
    预出版日期: 2025-07-04

    [目的] 细粒度挖掘不确定环境下社交媒体用户观点立场转移有助于全面了解舆情发展态势。[方法] 本文以持续参与疫苗话题讨论的推特用户为实验对象,基于预训练语言模型和神经网络模型构建用户立场检测模型,将用户观点转移路径划分为六种类型。基于不确定减少理论,构建不确定环境下用户观点立场转移预测的特征体系。基于XGBoost模型构建观点立场转移预测模型,采用SHAP解释方法对特征重要性进行分析。[结果] 研究结果表明,46.76%的用户并未改变其疫苗观点立场,而且用户观点扭转型占比较少。基于XGBoost构建的用户观点转移预测模型F1值达到了0.8209,交互用户立场相似度的特征重要性最高。此外,不同观点转移路径上特征的重要性排序有所不同。[局限] 用户观点立场转移可能会受到重大外生事件等多重因素影响,未来可进一步探究重大外生事件等因素对用户观点转移的影响。[结论] 结合预训练语言模型和神经网络模型能更好地检测用户立场,揭示不确定环境影响用户观点转移的因素,为社交媒体用户观点在线监测的进一步工作提供帮助。

  • 向姝璇, 毛进, 李纲
    预出版日期: 2025-07-03

    [目的]就现有方法替代指标选取、特征体系构建、模型结构设计上对专利商业化潜力与专利策略关联利用不足的问题提出一个新的专利商业化潜力预测方法。[方法]将专利实际维持时间是否超过设定阈值作为判断商业化潜力的标准,提出由特征处理模块与多任务并行预测模块构成的LSTM+MTNN模型。特征处理模块拼接数值特征与Bert+SimCSE及LSTM模型生成的文本连续特征形成多任务并行预测模块的输入。多任务并行(MT)预测模块基于专利商业化潜力与法律事件的关联构建,包括人工神经网络(NN)实现的共性特征捕捉层、法律事件预测层与商业化潜力预测层,输出为辅助任务法律事件预测与主任务商业化潜力预测的结果。[结果]专利策略视角下专利数值特征体系具备合理性;LSTM+MTNN模型在专利商业化潜力预测上较对比模型表现更佳,尤其在较小数据集上优势明显。[局限]专利文本信息利用方式有待深入研究;复杂技术环境中的专利商业化潜力的表示与预测方法有待探索。[结论]预测模型输入在专利数值特征基础上增加权利要求文本特征使其得到了有效充实;预测模型结构上增加法律事件预测的辅助模块实现了任务间信息共享;二者对专利商业化潜力预测起“减熵”作用,能够帮助模型作出判断。

  • 马捷, 孙文晶, 郝志远
    预出版日期: 2025-07-03

    [目的]本研究旨在构建具有可解释性的高质量疾病预测模型,通过识别影响疾病形成的关键诱因,并进一步分析诱因对于疾病的作用方式,从而为辅助诊断和精准医疗赋能助力。[方法]以肥胖症为研究对象,首先,利用随机森林模型在疾病数据的多维特征中筛选出最具代表性的特征子集;其次,通过构建增强型麻雀搜索算法实现支持向量机核参数与惩罚系数的自适应获取;然后,同步应用优化后的支持向量机模型对数据样本进行预测分析,并将该模型与8种基线方法展开对比;最后,借助SHAP解释框架对疾病诱因与疾病形成的作用关系进行量化分析。[结果]本文所提模型的预测准确率能达到85.5%,其获得的准确率、特异度与马修斯相关系数三种指标值均高于其他8组被试模型,证明了该模型的有效性,此外,家族史、蔬菜摄入频率、每日正餐数量、身高、性别、交通工具使用情况与高热量食物摄入情况是影响肥胖症形成的关键因素。[局限]针对肥胖症展开的实证研究无法有效验证模型的泛化性;未对特征变量之间的交互作用进行分析。[结论]本文所提模型不仅具有较高的预测准确率,还能够分析不同诱因对疾病形成的影响程度和作用方向,所得结论可为医疗机构提供决策支持。

  • 倪渊, 李翔宇, 张健, 董飞星
    预出版日期: 2025-07-03

    [目的]构建可解释集成学习模型,为预测电影IP衍生品的开发效果提供新的决策方式。[方法]基于价值链理论解析电影IP衍生品开发过程,构建预测指标体系。基于KLLB模型对影响因素进行提取筛选、构建预测标签。提出基于AWStacking的开发效果预测模型。 [结果]以XGBoost、CatBoost、RF为基学习器,LR为元学习器的AWStacking算法预测效果最好,宏平均精确率为0.8699,宏平均召回率0.7889,宏平均F1值为0.8216。[局限]由于受目前数据可得性的限制,关于电影IP衍生品开发效果衡量指标可以进一步优化,提升指标测量的细粒度。[结论]所构建的模型为电影IP衍生品开发效果的预测提供了依据,有助于推动电影IP衍生品市场的健康发展。

  • 李广, 吴新年, 宁宝英
    预出版日期: 2025-07-03

    [目的] 设计基于多源数据间主题时序扩散网络模型,进行动态计量数据源权重的研究前沿探测。[方法] 通过分析前沿主题的时间、扩散和网络特征,提出基于主题时序扩散网络的研究前沿探测方法体系、指标体系和立体判别坐标图,最后在人工智能领域进行实证分析。[结果] 动态计量出多源数据权重(战略规划0.301、科技报告0.234、基金项目0.124、专利文献0.122、会议论文0.113、期刊论文0.105),探测出8个新兴型、3个生长型研究前沿主题。[局限]不同学科领域的发展演化周期存在差别,需要进行更多学科领域的效果验证。[结论]本文提出的基于多源数据间主题时序扩散网络的方法,能够有效地识别领域研究前沿。

  • 段永康, 赵广宇, 耿骞, 曹涵维, 靳健
    预出版日期: 2025-07-03

    [目的]现有政策分析方法依赖大量人工标注和对齐比较,导致效率低下且易出错。本研究旨在通过构建结构化政策知识库,提升政策信息检索效率,实现政策智能分析与对比,为政策制定提供精准决策支持。[方法]本研究以惠企政策为例,提出了一种基于大语言模型的框架,用于高效比较相关政策。该框架包括以下步骤:1)知识库构建;2)检索与存储;3)答案生成。[结果]通过对国家、北京、上海、深圳四地惠企政策数据集验证,本文提出的框架自动整合多条政策,并可以分析政策语义实现数据库的构建,并帮助完成政策匹配与分析。本研究的Chroma-RAG模型展示出显著优势,在Hit@1指标达到60%、Hit@3指标达到了76%,MRR指标达到了71.13%。在检索方法对比中,本研究模型表现优于传统的Tf-idf、Word2Vec、USE、BERT、SBERT、DPR、SimCSE等模型,凸显了本文方法的优越性。通过在Hit@1、Hit@3和MRR等评估指标上进行对比实验,本研究提出的框架与检索方法具有显著优势。[局限]研究主要基于截面数据,无法全面反映政策实施过程中的动态变化,限制了对政策效果的深入分析。[结论]基于大语言模型的知识库构建与政策比较能够有效提升政策文本的智能化分析与比较效果,特别是在政策知识库的构建和政策比较支持方面为政策制定者提供了显著的决策支持效果。

  • 李婕, 张智雄
    预出版日期: 2025-07-03

    [目的]深度综合关联挖掘图像聚类方法DCCM局限于基于样本语义特征进行聚类,无法充分利用类簇结构特征中蕴含的具有高判别性的类间结构关系,制约了DCCM聚类性能的进一步提升。[方法]本文提出融合类簇结构特征的改进模型Improved-DCCM。首先,以DCCM作为基础聚类模型,引入基于高斯分布的文本数据增强策略,继承DCCM的样本语义特征挖掘能力。在此基础上,通过样本变量与类簇变量之间的互信息损失和DCCM原始损失的加权和,联合学习样本语义特征和类簇结构特征。[结果]在公开标准数据集和科技论文摘要数据集上的实验验证了改进IDCCM模型的优越性。在公开数据集20NewsGroups和Reuters-60k数据集上改进模型的聚类准确率相较基准模型分别提升了9.8%和7.32%。[局限]需要预先指定类簇数量,然而在实际应用中往往很难确定原始数据的最优类簇数量,应当根据具体数据情况适当调整。[结论]IDCCM模型能够挖掘利用类簇结构特征,提升了DCCM模型聚类效果。

  • 周洁, 王东毅, 代沁泉, 夏苏迪
    预出版日期: 2025-07-03

    [目的]本研究旨在探索普适的生成式AI有效提示词策略,以提升用户的交互技能和优化使用体验。[方法]采用Q方法,邀请用户根据其在通用场景、跨任务及跨模型的生成式AI使用经验,对不同提示词策略的有效性进行排序,从而识别出具有普适性的有效提示词策略类型。[结果]研究发现,最有效的提示词策略包括明确问题、明确目标和提供背景信息。普适性有效提示词策略可分为三类:明确需求与精确指引型、清晰解释与逻辑排序型、拆解任务与多样化表达型。[局限]数据来源于中国用户,未来研究可扩展至更多文化背景以验证结果的广泛适用性;本文侧重于整体情境分析,未来可进一步探讨提示词策略在具体场景、任务类型和模型条件下的差异性。[结论]本文为优化生成式AI和提升用户交互技能提供了有价值的参考。

  • 徐梦瑶, 孙斌, 江涛, 崔家豪
    预出版日期: 2025-07-03

    [目的]针对谣言抑制中对节点位置与社区重叠特性考虑不足的问题,提出一种谣言抑制框架RSM-OC。[方法]该框架创新地提出使用信任中心值来精准识别关键节点,结合重叠节点构成候选种子集,最后利用遗传算法优化正种子节点集,并采用单向状态转换的线性阈值模型模拟谣言与真相的博弈。[结果]在四个真实数据集上的实验显示,RSM-OC方法相较于基线算法的谣言抑制率平均提升23.3%,真相传播范围平均扩大两倍,特别在稠密和中等规模网络中表现尤为优异。[局限]RSM-OC方法在大规模网络中的计算成本较高,可能存在性能瓶颈。[结论]RSM-OC方法在抑制谣言和扩大真相传播范围两方面均具有良好的有效性。

  • 布文茹, 王昊, 周抒, 石斌, 赵萌
    预出版日期: 2025-07-03

    [目的]通过提出一种基于叙事型文本重构的多维人格计算与分析方案,探索并验证数字技术在提升文学作品人物分析深度和广度上的潜力。[方法]研究过程包括文本重构、人格量化、模型构建和人格分析。首先通过机器翻译、指代消解等技术抽取文本信息;其次利用大语言模型获取人物人格描述,构建人格数据集;接着采用深度学习框架LBA构建人格检测模型;最后,完成多维人格的数值计算与分析。[结果]本文提出的自动化抽取方案在文本重构中,主体人物抽取效果显示准确率均超过89%,f1值均超过74%,文本内容拆解效果显示Rouge-L在各类文本的均值达到73.01%。构建的人格检测模型MPNDM的MSE指标比两个对比模型分别降低29.08%、8.72%。通过对《三国演义》全人物及代表性人物的人格分析,揭示了人物群体与个体在人格上的差异与变化。[局限]关于人物人格测度的理论与模型较为多样化,引入不同的理论模型可能得到不同的效果。[结论]本研究不仅验证了方案的有效性,也为数字人文在文学领域的应用开辟了新路径。

  • 赵一鸣, 刘顺生, 吕璐成
    预出版日期: 2025-07-02

    [目的]通过分析关键技术领域下的专利数据,对具备高颠覆性潜力的技术专利进行早期识别。[方法]基于技术生命周期理论搭建颠覆性技术早期识别指标体系,以智慧芽专利数据库中量子计算领域的专利数据作为研究对象,搭建集成学习模型对该领域具有高颠覆性潜力的技术专利进行早期识别。[结果]通过BERTopic主题建模框架发现五个相关颠覆性研究方向:量子加密技术、量子处理器、超导量子比特、半导体技术与量子神经网络,验证了本文方法的有效性与可行性。[局限]实证分析仅围绕量子计算领域展开,未能全面涉及不同的关键技术领域;框架构建与指标提取仅依赖专利数据,可拓展支撑数据的来源种类。[结论]本研究有助于早期识别出高颠覆性潜力的技术专利,进而分析主要的颠覆性研究方向,为国家重大科技战略的制定实行提供研判依据。

  • 冯岭, 潘云涛
    预出版日期: 2025-07-02

    [目的]识别数据集中的学科交叉文献,以准确地把握学科交叉的前沿动态。[方法]提出了一种基于图神经网络的学科交叉文献识别方法,通过选取的代表性文献,训练基于图神经网络的多标签分类模型,以用于学科交叉文献的识别。[结果]在仅标注了5%的文献作为代表性文献的条件下,所提出方法在整个数据集上的学科交叉文献识别的AUC值最高达到了0.843。[局限]对于多学科交叉文献的识别问题,还需要对提出的方法进行改进;在较大学科领域粒度和大规模数据集上的学科交叉文献识别效果还有待进一步验证。[结论]提出的方法不仅具有较好的学科交叉文献识别效果,还有效地解决了有标注的训练数据集稀缺的难题。

  • 曹银妮, 韩虎, 黄明伟, 刘金德
    预出版日期: 2025-07-02

    [目的]为减小跨模态语义鸿沟,并增强与方面相关的图像特征提取,本文从全局与局部视角获取细粒度的跨模态情感表达,提出一种多视角融合表示的多模态方面级情感分析模型。[方法]首先,从全局视角出发对文本与图像描述进行联合编码,并结合多头自注意力机制捕捉跨模态全局语义特征。其次,从局部视角出发构建两个图结构挖掘文本和图像的细粒度情感信息。通过文本图结构引入语法依赖图增强文本语法特征提取。在融合图结构中,采用空洞卷积扩大感受野提取图像块中的关键信息并加强跨块的特征关联,利用多头交叉注意力指导模型关注与方面词相关的图像特征。最后,结合全局和局部细粒度情感信息进行方面级情感分析。[结果]本文模型在Twitter-2015和Twitter-2017数据集上的准确率和F1值均高于基线模型。与次优模型相比,在Twitter-2015数据集上,Acc和F1值分别提高了0.44%和1.51%。在Twitter-2017数据集上,Acc和F1值分别提高了0.54%和0.72%。[局限]未能在更多的数据集上验证本文模型的泛化性。[结论]本文所提模型能够有效减少模态间的语义差距,并充分提取与方面词相关的图像特征,提升了情感分类的效果。

  • 张冬瑜, 庄沐霖, 靳森源, 刘馨月
    预出版日期: 2025-07-02

    [目的] 针对目前大量心理疾病检测研究未能充分考虑到隐喻性信息在疾病识别过程中的关键作用,提出一种基于隐喻信息和指令调优的心理疾病监测方法。[方法] 该方法的核心在于通过隐喻识别技术引入隐喻信息,这包括对隐喻的使用频率和隐喻中的实体间关联性进行分析。此外,利用大语言模型捕捉症状和情绪信息,并整合这些特征,构建了指令集,对模型进行有效训练。[结果] 本文模型在Twitter-Depression和MVSA数据集上,模型分别取得了85.82%和75.47%的F1值,比基线高出2.01%和1.49%。[局限] 基于大语言模型提取的各项信息可能受模型幻觉影响,具有不准确性,需要更准确的提取方法。[结论]证实了隐喻信息在心理疾病检测中的重要性,能为心理疾病检测模型提供丰富的信息。

  • 温晓波, 化柏林
    预出版日期: 2025-07-02

    [目的]对人工智能专利中所涉及到的应用领域进行识别。[方法]在度量学习的框架下,使用基于BERT的双编码器分别对专利文本与应用领域标注文本进行编码并联合优化,获取能表征人工智能专利应用领域的编码结果以完成识别任务。[结果]在人工智能专利应用领域多分类测试中达到了0.947的准确度,在人工智能专利应用识别中获得了轮廓系数为0.36的多层级聚类体系。[局限]尽管质量中等的标注数据可以通过大语言模型获取,然而更高质量的标注数据则不易获得,同时使用的度量学习框架与编码器存在较大优化空间。[结论]度量学习能够用于有针对性地识别人工智能专利的应用领域,并可启发无监督主题识别的优化。

  • 白宇, 王连吉, 刘翔, 袁金福, 张桂平
    预出版日期: 2025-07-02

    [目的]为提高多模态命名实体识别的效果,本文通过计算实体锚文本与图像区域的语义相关性来过滤不相关视觉区域,达到消除视觉噪声的目的。[方法]使用提示词代替类别词作为实体锚文本对视觉区域进行语义相关性评估,通过降低无关视觉区域的权重来消除无关视觉区域对实体识别的影响,采用多层交互式Transformer进行文本-视觉的模态融合,并通过CRF层实现实体识别。[结果]在公开数据基准上的实验结果表明,本文方法在Twitter15和Twitter17上的F1值达到76.97%和88.88%,相较于主流方法分别提升了0.48%和1.17%。[局限]本文方法基于有监督学习范式,模型效果受标注数据的质量和数量的影响,研究仅基于公开基准数据的实体识别任务,下一步将对模型的可迁移性开展研究。[结论]通过消除视觉噪声,可以有效提高多模态命名实体识别的效果;对不相关视觉区域的过滤可以通过计算实体锚文本与图像区域的语义相关性来实现。

  • 吴亦凡, 马崧捷, 李树青
    预出版日期: 2025-07-02

    [目的]感知用户个人及其好友对流行度处于某一阶段的商品产生的偏好,实现更准确的推荐。[方法]首先计算融合贡献度和影响力的项目流行度,使用注意力机制和循环神经网络捕捉个人的流行度偏好表征,并使用卷积网络和图注意力机制获得好友的长短期流行度偏好。[结果]在Douban数据集、Deliciouse数据集、Yelp数据集上进行了对比实验,本模型的评价指标均优于次优模型DGRec。Recall@20最高提升13.03%,NDCG最高提升11.69%;本文提出的流行度计算方法相比于传统的计算方法Recall@20最高提升11.53%,NDCG最高提升10.29%。[局限]本模型在处理短序列时性能较差。[结论]本模型增加了用户流行度偏好表征和用户社交流行度偏好表征,增强了对每次交互权重的表达能力,为长尾项目提供了一定的曝光率。代码见:

    https://github.com/msj1010/SPPSRec_Pytorch。

  • 于玉海, 邢志琦, 孟佳娜, 高临霖, 王博林
    预出版日期: 2025-07-02

    [目的]在互联网迅速普及的时代,人们可以在数字平台上以多种形式表达自己的情感,多模态情感分析已成为研究热点,其研究结果将为情感分析提供有力支持。[方法]首先提取单模态的特有特征和多模态的共有特征,然后使用跨模态桥连接实现多模态融合,最后引入多头自注意力机制进行多标签预测,有效捕捉不同情绪标签之间的共现关系。[结果]在CMU-MOSEI数据集上的实验结果表明,本文模型在不同参数和对比实验中,相比于基线模型提高了准确率,消融实验结果验证了各模块的有效性。同时,相较于基于单一文本、图像和音频模态的方法,模型准确率分别提升了 11.4%、19.9%、26.8%,说明本文方法能够有效的融合多模态信息。[局限]对于系统性能方面,当前的方法还无法准确捕捉到情感的细微差别。且当前数据集无法涵盖到所有可能的情感表达和文化背景,需要考虑更多样化的数据。[结论]实验结果表明,本文所提出的模型实现了有效的模态融合,在情感分析上取得了较好的结果。

  • 张强, 高颖, 任豆豆, 马志远, 周洪, 陶皖
    预出版日期: 2025-07-02

    [目的]知识图谱内蕴含海量的元组数据,且蕴含时态信息的知识图谱可将随时间变化的事实进行有效保留及使用。探究时态知识图谱补全任务对图谱内动态数据的完备性及其下游应用的发展有着重要意义。[方法]针对当前多数方法将时态知识图谱视为离散数据,无法准确反应事物与时间信息的关系,忽略了局部图结构演化与形成过程,以及全局图结构演化所代表的图谱连续形成模式。本文设计了如下流程:针对局部结构捕获,提出基于表示强化的邻域信息学习过程,有侧重地抓取局部图结构形成流程;对于全局结构演化,提出基于注意力机制的时态事实推理流程,抓取图谱内不同时间对应事实的动态交互区间,学习其变化的潜在模式,模拟时态事实演化行为。[结果]基于公开数据集进行充分实验并与基线模型进行对比,本文模型取得了与先进模型相似的性能表现,在Hits@1和Hits@3指标上分别提升0.9和1.1个百分点,消融实验验证了本文方法改进的有效性,有效完成了时态知识图谱补全任务。[局限]目前的知识图谱补全模型高度依赖特定格式与质量的数据,数据预处理成本高且在数据条件不佳时性能易受影响。[结论]本文提出的综合时态信息和图结构动态演化的知识图谱补全框架,通过表示强化和注意力机制可增强模型的时态理解和推理能力。