期刊首页 在线期刊 最新录用

最新录用


说明:最新录用文章, 内容和格式将与印刷版一致(除了页码), 您可以通过doi直接引用。

Please wait a minute...
  • 全选
    |
  • 丁晟春, 公婧泽, 秦天允
    预出版日期: 2025-12-31

    [目的]针对认知战场景下认知主体类型多样、交互行为复杂且难以精准复现的问题,引入大语言模型技术,构建基于真实数据的智能体建模与仿真方法,为情报策略定向投送提供实验支撑。[方法]基于阿赫利医院爆炸事件数据,采用深度学习方法提取九类典型认知主体的属性分布与行为概率特征,借助大语言模型生成10,000个具有个体异质性的智能体实例,并集成至NetLogo平台开展交互行为仿真,从属性分布一致性、行为模式差异性维度校验模型有效性。[结果]该模型准确刻画了各阶层认知主体影响力差异,仿真中涌现出符合正态分布的差异化交互,有效克服传统仿真规则僵化、样本代表性不足的缺陷。[局限]模型当前侧重行为概率的拟合复现,尚未实现仿真中基于实时语义交互的动态认知演化,对深层次语义对抗效果的评估能力不足。[结论]本研究构建的认知主体智能体模型可有效复现信息接收后的行为反应,验证了LLM生成智能体与NetLogo仿真相结合的技术路线的可行性,为认知空间作战行动提供可量化、可复现的实验支撑,具备重要战略价值。

  • 沈志宏, 朱小杰, 朱国亮
    预出版日期: 2025-12-31

    [目的]本文围绕AI场景下科学数据的共享与利用问题,针对现有FAIR原则不足以指导科学数据满足AI就绪的现状,构建面向AI就绪的科学数据共享与利用原则框架。[方法]通过系统梳理传统机器学习、大模型预训练、大模型微调、检索增强生成及智能体等五类典型AI任务的数据需求,在传统FAIR“四可”维度的基础上,提出面向AI就绪(即For AI Ready)的科学数据共享与利用原则框架FAIR×FAIR,并进而提出与框架相适应的层次化技术栈。[结果]FAIR×FAIR框架明确了13项科学数据满足AI就绪的技术要求,为弥合AI任务与科学数据之间的语义鸿沟提供了系统化方案。[局限]本研究提出的原则框架其实施效果仍需通过后续领域应用案例进一步验证。[结论]FAIR×FAIR框架为AI时代的科学数据共享与高效利用提供了理论依据和实践路径,对推动数据驱动型科研范式的演进具有重要意义。

  • 陈格非, 刘清
    预出版日期: 2025-12-31

    [目的] 阈值设置是科学知识图谱的重要环节,本文旨在提出一种客观、可解释性更强的阈值设置方法,以提高文献数据挖掘的质量和效率。[方法] 通过引入节点度分布、同配性和巨分支规模占比等三种网络结构特性,揭示阈值设置和科学知识图谱性能间的关系。在此基础上提出阈值设置方法,并通过实验验证。[结果] 在实验数据集中,本文方法生成图谱的重要节点、聚类和时序特征提取的平均准确率相比经验方法提升10%,平均完整度提升7%。[局限] 需要在更多领域验证方法有效性。[结论] 在文献网络中,阈值设置与节点度分布、同配性和巨分支规模占比之间存在普适性关系。依据网络结构特性设置阈值能够提升科学知识图谱数据挖掘的质量。

  • 吕婷钰, 李晓瑛, 邓盼盼, 李军莲
    预出版日期: 2025-12-31

    [目的] 为解决非结构化文本中联合用药信息的抽取挖掘与形式化表示,提出一种融合深度学习与大语言模型的联合用药知识发现与自动评估方法。[方法] 基于文献知识发现(Literature based discovery, LBD)理论构建多层级联合用药知识发现框架,融合优化深度学习模型以完成药物和疾病实体识别、药物-疾病治疗关系和药物-药物组合应用关系提取,结合目标信息特征自动挖掘大规模文本数据中的联合用药知识,并利用定制化设计的“角色+内容”少样本提示词引导大语言模型完成前述结果的评估验证;多层级的双重策略不仅有助于提高联合用药知识发现结果的准确性和可靠性,而且避免了耗时费力的人工参与。[结果] 在自建的PubMed文献数据集上,本联合用药知识发现方法获得94.29%的准确率,经过gpt-4.1大语言模型自动评估后的结果与人工标注一致率达到95.71%。[局限] 仅收集公开发表的科技文献开展了定量分析,缺少电子病历、药物不良反应报告等多类型数据的实验验证。[结论]融合深度学习与大语言模型的多层级架构,能够高效识别生物医学文献中的联合用药知识,满足下游任务对于大规模、结构化数据的高精需求,为精准医学中药物组合决策等应用提供了技术路径。

  • 王浩宇, 周裕林, 黄瑞章, 秦永彬
    预出版日期: 2025-12-31

    [目的]针对现有刑期预测模型在多被告人案件中法律知识整合不足、判决合规性差的问题,提出一种融合法律约束与知识驱动的刑期预测框架(KASP)。[方法]提出KASP框架,利用大语言模型拆解案件事实;解析罪名与法条,提取基础刑期区间作为结构化法律先验;通过一致性融合机制将先验融入轻量级预测模型训练过程,实现知识驱动的协同优化。[结果]实验结果表明,在CMDL-small数据集上,KASP相较于最优基线DeepSeek-R1-14B在准确率和F1值上分别提升了5.44%和4.18%,且在多被告复杂场景下表现更稳定。[局限]本文实验主要聚焦于从法理约束和裁量因子中提取基础刑期区间的知识建模,未涉及多罪并罚、跨法条竞合等更复杂的量刑规则处理。[结论]通过引入结构化法律先验知识,提升刑期预测模型在复杂案件中的性能与法律合规性。

  • 孙晓玲, 沈桐
    预出版日期: 2025-12-31

    [目的] 从知识元细粒度层面探索AI跨领域知识组合特征,融合多维特征提升组合预测效果。[方法] 提出一种基于图神经网络的跨视图对比学习模型GCN_Contrast,通过图对比学习和基于注意力机制的特征融合方法将多维特征有效结合,对潜在的跨领域知识组合进行预测。[结果] 以医学信息学领域为例,通过对比实验发现GCN_Contrast比传统GCN模型在p@500、p@100以及p@50指标中准确率分别提升了8.4%、16%以及20%,AUC值提高了3%。[局限] 目前知识元的特征选择较有限,知识元之间的关系还可以从引文网络角度进行挖掘。[结论] GCN_Contrast模型可以更精确地预测出AI跨领域研究中的知识元组合, 为推动AI与基础和前沿科学研究的深度融合提供决策依据。

  • 张可维, 尹静, 温福铨, 安小米
    预出版日期: 2025-12-31

    [目的] 面对AI-native领域技术快速迭代和应用场景多元化的带来的认知挑战,本文旨在通过国际标准化视角构建一个概念体系与成熟度演进框架,为理解 AI-native 的发展、评估其作为数据智能主体的行为质量及制定差异化监管策略提供理论依据。[方法] 采用文本内容分析法,对ITU-T SG13发布的34份国际标准文件进行分析。依据ISO 704:2022原则,构建基于“活动—结果”特征映射的成熟度演进框架;并选取协同智能体与垂直行业典型用例,分析其数据角色与行为评价模式。[结果] 研究识别了包含五类特征对象和两类特征的概念体系。建立了从“AI 辅助级”到“完全 AI 原生级”的三级成熟度演进框架。用例分析揭示了针对不同风险场景需匹配人机协同或AI 原生监管等差异化治理策略。[局限] 本文局限于标准化视角下的概念体系和成熟度演进框架构建。[结论] 本文构建的概念体系为理解 AI-native 的动态演进提供了标准化共识基础。研究表明,治理重心宜从性能效率转向语义准确性和伦理质量评价。建议采用分级监管策略,针对不同成熟度与风险等级的场景,采取差异化的监管手段。

  • 张競元, 杨磊, 刘寨义
    预出版日期: 2025-12-30

    [目的] 针对基于Transformer的模型计算复杂度高、多尺度特征提取能力有限,难以兼顾局部细节与全局上下文的问题,提出了一种多尺度轻量级注意力抑郁症识别网络(MLA-Net)。[方法] MLA-Net采用轻量级Transformer架构,结合全局双池化注意力机制提取视频特征以保留全局信息,再通过注意力机制建模时空长距离依赖,结合多尺度特征提取捕捉不同尺度信息,最后用交叉融合策略强化特征表达。[结果] 在真实世界抑郁症数据集上的实验结果显示,本方法平均绝对误差为4.90,均方根误差为6.88,优于现有方法,充分证明了其有效性与合理性。[局限] 目前的研究仅针对面部表情这一单一模态进行分析,没有结合语音、文本以及生理信号等模态。[结论] MLA-Net通过全局双池化注意力、多尺度特征提取和交叉特征融合的协同作用显著提升了模型性能。

  • 王楠, 王娟, 刘耀文, 潘杰, 夏一雪, 冼婷玉
    预出版日期: 2025-12-30

    [目的]针对现有AIGC图像溯源方法依赖单一视觉伪影且抗干扰鲁棒性不足的问题,设计了一种语义引导的多模态溯源方式。[方法]设计一种语义引导的主动式多模态融合方式。为解决多模态特征语义鸿沟问题,设计了从量化指纹到自然语言的语义映射机制。在此基础上,通过调整交叉注意力层的交互逻辑,以语义文本为主动查询,引导模型在深层特征空间中动态聚焦于关键伪影证据。[结果]在WILD和DRAGON数据集上F1分数分别达98.4%和69.6%。定量分析表明,相较于单模态视觉基线,该模型F1分数分别提升了5.9%和11.3%;相较于简单特征拼接基线,在复杂场景下的F1分数分别提升了3.1%和6.4%。[局限]规则化语义生成限制了自适应推理能力;对技术架构高度相似的同源模型区分度仍有待提升。[结论]语义引导的主动式多模态融合策略能有效整合正交证据,是提升复杂场景下AIGC溯源鲁棒性的有效路径。

  • 杜先进, 许彧祥, 付红
    预出版日期: 2025-12-26

    [目的]为提高企业技术创新合作伙伴识别的准确性和时效性,提出融合多模态特征动态图卷积网络的链路预测方法。[方法]提出基于注意力机制的专利合作网络节点拓扑、领域与语义特征融合模型,设计GCN-LSTM架构与滑动时间窗口策略捕捉网络动态演化规律,开展链路预测识别技术创新合作伙伴。[结果]基于我国新能源汽车2015-2024年专利数据集开展实证研究,本文方法各项指标均显著优于基线模型。其中AUC较次优模型EvolveGCN提升了5.0个百分点,达到0.858;F1值较次优模型DySAT提升了3.5个百分点,达到0.807。[局限]未能充分挖掘专利的引用关系、专利价值等特征;未结合企业的研发投入、市场表现等非专利的多源异构信息。[结论]本文方法有效捕捉专利合作网络的动态演化规律,并综合利用专利的多模态特征,能够为企业进行合作创新提供更精准、前瞻性的数据驱动决策支持。

  • 马亚坤, 孙颖, 胡广伟, 刘云
    预出版日期: 2025-12-26

    [目的] 面向个体化需求识别不足与居家慢病管理适配性有限的问题,探索构建融合多源健康数据与领域知识的慢病知识服务框架。[方法] 首先,结合用户生理数据,实现用户健康状态的动态评估与预警;其次,设计轻量化的用户需求预解析机制,通过对用户输入进行语义分析与结构化重构,结合健康标签与生理数据,提升大语言模型对个体化需求的理解与适配能力;最后,借助慢病知识库与图谱检索增强技术,部署面向特定疾病场景的领域模型,以提升模型的垂直化适配能力。[结果] 以糖尿病为例的实验表明,模型在诊断相关性、术语命中率及规范性评分的各项指标上均取得了更高的量化得分,为促进居家社区主动健康服务的智能化与精准化提供有益参考。[局限] 当前知识服务的内容主要是文本,未来考虑多模态数据以增强知识服务的全面性。[结论] 融合预解析与图谱检索增强的慢病知识服务框架能有效提升知识服务的准确性与规范性,为智能慢病管理提供了可扩展的技术路径。

  • 胡鑫欣, 邱芹军, 黄泽华, 鲁谢春, 崔倩娜, 马凯
    预出版日期: 2025-12-26

    [目的]针对现有的实体对齐方法依旧存在对知识图谱的结构信息和语义信息利用不充分而导致实体对齐效果不佳的问题,提出一种基于嵌入增强和实体-关系感知的实体对齐模型MuEmbedNet。[方法] MuEmbedNet模型通过为实体生成不同的嵌入表示,并利用注意力机制和双层改进的GCN网络实现实体的嵌入增强,进一步利用实体与关系的相互映射将图结构数据的关系特征融合到实体特征中以获取增强的实体嵌入表示。[结果]结果表明,MuEmbedNet模型在三个公开跨语言数据集上的平均Hits@1值、Hits@10值和MRR值分别达到89.3%、97.2%和92.1%,高于所有基线模型。相比于基线模型中平均最优表现,Hits@1值、Hits@10值和MRR分别提高了6.1%、0.5%和5%。[局限]模型在两个相同语种的实体对齐任务中表现较好,而在不同语言体系的实体对齐任务中存在局限性。[结论]通过嵌入增强和实体-关系感知网络能够充分学习实体的语义信息特征和结构信息,进而有效提升实体对齐任务的效果。

  • 张嘉程, 刘哲理, 肖光文, 聂力海, 王永昌, 史良, 金美宏
    预出版日期: 2025-12-26

    [目的]针对大语言模型价值观对齐评测体系碎片化、中国特色价值覆盖不足、深度评测数据稀缺及评测方法滞后等问题,构建面向大语言模型的价值观对齐评测方法与技术。[方法]提出价值规则、评测数据、智能技术三位一体的融合方法体系。在此框架下,设计“能力—任务—指标”三维评测体系,进行数据采集、增广与标注,构建深度评测数据集。最终结合预训练模型、指令微调与专家反馈,训练出价值观评测模型。[结果]构建的评测模型准确率为98.57%,实现了对大语言模型价值观对齐水平的自动化评测。实证结果表明,国产模型总体对齐度高于国外模型,但仍普遍存在红色文化语料不足、事实性与幻觉性虚假信息、意识形态淡化、过度审查及动态适应性弱等问题。[局限]研究主要面向文本型大语言模型,对多模态模型的适用性不足;同时,评测结果以高、中、低呈现,可解释性有待提升。[结论]本研究有助于健全具有中国特色的价值观对齐治理体系,保障大语言模型在安全、可信和可控的框架内健康发展,同时也为推动我国主流价值观在经济发展和社会治理中的有效落实提供技术支撑。

  • 薛增灿, 张晓冉, 陈佳锐, 刘海, 谭俊
    预出版日期: 2025-12-26

    [目的] 总结国内外知识图谱补全技术的研究现状,为促进知识图谱补全技术深入研究提供理论基础。[文献范围] 以“Knowledge Graph Completion”“Link Prediction”“知识图谱补全”“链接预测”等为关键词,在Web of Science、Google Scholar和中国知网等权威数据库中检索,筛选出代表性文献130篇。[方法] 基于文献调研与归纳总结方法,分别从推荐模型、结果评价、未来展望三方面对相关研究进行综述与评价。[结果] 基于关系语义的知识图谱补全模型可以划分为面向复杂关系语义建模、面向连接关系语义建模和面向隐含、异质、稀疏关系语义建模的知识图谱补全模型。针对MRR指标,面向稀疏关系语义建模的SimKGC模型在WN18RR数据集上提高了4.9%(0.666 vs 0.617),面向连接关系语义建模的DaBR模型在FB15k-237数据集上提高了3.4%(0.510 vs 0.476)。[局限] 部分新兴技术缺乏大规模基准试验,由于研究领域广泛,文献众多,未能涵盖所有相关研究。[结论] 相比传统方法,前沿技术具有更好的图谱补全性能,但是模型可解释性、可扩展性不足,多模态和时序数据融合困难,大语言模型存在幻觉风险,这也是未来研究要解决的问题。

  • 陈先来, 许安明, 李陈鹏, 朱泽林
    预出版日期: 2025-12-26

    【目的】解决医学影像报告中临床描述和医学影像中病灶对象之间的语义对齐问题,从而提高两者之间的对应关联性。【方法】提出了一种基于解剖信息增强的医学视觉定位方法(AEMVG),通过解剖先验知识指导模块(APKG)和正常特征增强病灶定位模块(NELG)来提高医学视觉定位能力。APKG为训练样本生成引导标签,使模型能够更准确地理解解剖结构信息,从而在全局范围内缩小定位搜索空间,降低全局定位不确定性。NELG将正常解剖特征作为负样本来提升模型识别病灶的能力,缓解局部定位不确定性。【结果】MS-CXR数据集上的实验显示,AEMVG的ACC和mIoU分别为0.7246和0.6079,相对于基线模型分别提高了3.7%和4.1%,且可视化分析显示其解剖定位与病灶识别更符合临床诊断逻辑思维。【局限】本方法仅在X光影像上进行了验证,对于CT、MRI等类型的医学影像还有待测试。【结论】AEMVG可有效增强医学视觉定位模型在解剖认知和病灶区分方面的能力,提高临床描述与病灶对象之间的关联性能。

  • 彭明阳, 高岩, 赖宇乔
    预出版日期: 2025-12-26

    【目的】针对恶性模因检测中标准分类损失忽略类别间有害程度递进关系、对称惩罚机制与内容审核实际需求相悖的问题,提出序数感知层次化融合网络(OAFHN)。【方法】首先设计序数感知与误报惩罚损失函数(OPP-Loss),将分类问题重构为序数回归并对误报施加非对称惩罚;其次构建层次化多路径融合网络,利用视觉语言模型生成语义释义作为知识输入,通过粗粒度融合、语义调制注意力和低秩双线性池化实现多粒度特征建模。【结果】在Harm-C和Harm-P数据集上,OAFHN的F1分数达到83.46%和88.39%,较现有方法分别提升0.66和0.13个百分点。消融实验验证了OPP-Loss和层次化融合架构的有效性,其中OPP-Loss贡献最为显著,F1分数提升超过8个百分点。【局限】误报惩罚因子需人工调优,序数映射为静态设定,未充分刻画“部分有害”类别的内部异质性。【结论】从优化目标层面直面任务挑战,结合多粒度特征融合与外部知识注入,可有效提升恶性模因检测的鲁棒性与准确性。

  • 邓君, 叶东宇, 邢艺丹, 张琪
    预出版日期: 2025-12-26

    [目的]为提高方面级情感分析(Aspect-Based Sentiment Analysis, ABSA)模型的可解释性和隐性情感分析能力,提出一种基于有监督微调和强化学习的可解释ABSA方法。[方法]首先,基于DeepSeek R1模型构建了推理数据集;其次,对LLMs进行有监督微调以提高模型的格式化输出和情感分析能力;最后,使用强化学习优化模型推理过程并提高ABSA准确率。[结果]所提方法在公共数据集SemEval 2014上F1值较SOTA模型提高1.26%,隐性情感分类准确率提高3.18%。[局限]仅对方面级情感分类任务进行了实验,尚未扩展到更为复杂的情感信息抽取等任务。[讨论]强化学习能有效优化模型的推理解释过程,且提高了模型的隐性情感分析能力;合理的复合奖励函数对于模型优化至关重要;所提方法在中英文数据集上具有良好稳健性。

  • 马延周, 罗云, 吴圣意, 朱琪
    预出版日期: 2025-12-26

    [目的]针对中文社交媒体面向话题的讽刺识别任务,现有大语言模型存在易将强硬立场或负面情绪误判为讽刺的过度敏感问题。[方法]本文设计了一个双路径推理框架,归纳路径通过检索附带理论解释的相似案例。演绎路径引入基于不礼貌理论的分层判断框架,设计了从情感筛选到意图分析的分层判断提示。最终通过决策融合模块综合双路径证据生成判断。[结果]在公开基准数据集ToSarcasm上的对比实验显示:以DEEPSEEK-V3.1为基础模型,本文方法的F1值为83.25%,较最优传统基线模型提升10.44个百分点;宏F1值为76.45%,较最优传统基线模型提升14.63个百分点。[局限]研究主要在中文语境下进行,跨语言通用性有待验证。演绎推理框架虽提升可解释性,但其决策仍依赖于模型的内部机制。[结论]所提出的理论指导下的双路径推理框架,能有效提升大语言模型识别话题讽刺的鲁棒性与均衡性,为解决复杂语用推理任务提供新方法。

  • 宋文杰, 王亮, 许潮, 郑智帅, 朱欣娟
    预出版日期: 2025-12-26

    [目的]为促进博物馆文物及历史文化知识的传播与传承,提出一种结合知识图谱(KG)与检索增强生成(RAG)的文化史料知识问答系统构建方法。[方法]首先针对文化史料语料库文本包含大量生僻字和文言文的特点,研发了生僻字词典和文言文对照辞典,构建文言文翻译工具,减少大语言模型(LLM)处理历史文献时的错误信息生成;其次提出了一种基于提示学习融合文本矢量化相似性检索和知识图谱检索的有效方法,精心设计了不同任务的提示模版,实现高效的知识推理和用户交互;以秦文化史料为例,构建了秦文化知识问答系统(ChatQDC)。[结果]实验表明,ChatQDC相比于ChatGPT-4、ChatGLM3-6B和DeepSeek-R1-8B,问题回答的准确度分别提高了约8%、20%和31%。

    [局限]当前系统主要面向包含史料知识的文本构建,未来需进一步拓展涉及图片、表格等多模态历史资料数据的检索及问答处理方法。[结论]相比传统的专业数据微调方法,该系统LLM无需重新训练即可部署,实现了低成本低功耗的垂直领域应用。

  • 俞超, 梁旭栋, 张彤阳, 徐健
    预出版日期: 2025-12-26

    [目的]突破学科壁垒,挖掘学科间共性知识以搭建跨领域对话桥梁。[方法]剖析现有跨学科共性知识案例的引文语境,提炼出共被引模式,从海量引文内容数据集中提取模式并结合共通性、跨学科性、新颖性指标识别潜在价值共性知识。[结果]从5300万条引文记录中确定1044对候选跨学科知识对,对7个跨学科性、共通性和新颖性得分高的案例展开分析,挖掘学科问题在基础方法论层面的交叉点。[局限]目前运用的句法模式数量有待扩充,跨学科共性知识实例的获取仍有拓展空间。[结论]构建的基于引文语境分析的方法为学科间共性连接提供新路径范式与方法论。

  • 张云秋, 殷策
    预出版日期: 2025-12-26

    [目的]解决MoE(Mixture-of-Experts)大语言模型在参数突变问题中因知识固化与推理线性化导致的性能瓶颈。[方法]提出融合动态知识验证与多智能体协同的优化框架,构建基于知识验证的智能体博弈机制,结合注意力引导的拓扑重组与弹性资源分配策略,优化模型非线性推理能力。以DeepSeek-R1-8B为基线模型,采用渐进式知识蒸馏方法,在医用物理学与材料科学领域的参数突变问题集上进行实验验证。[结果]优优化后的模型在测试集上平均得分为87.18分,较原始8B模型提升11.12分,整体性能优于仅依赖Prompt提示的671B模型。[局限]训练数据集中于特定领域,模型对跨领域参数突变问题的泛化能力仍有限。[结论]本研究提出的框架通过智能体博弈实现MoE架构大模型的动态知识验证,有效提升了模型在复杂参数突变场景下的推理能力,为相关研究提供了可借鉴的技术路径。

  • 敖宇轩, 王昊, 周抒, 布文茹
    预出版日期: 2025-12-26

    [目的]面向诗歌语义抽象与艺术性不足的问题,提出兼顾语义对齐与美学表现的诗歌到图像生成方案。[方法]构建“深度语义理解-多模态意象空间-多阶段协同生成”框架,以预训练语言模型+多任务学习抽取情感、意境、修辞并与视觉对齐,最终以三阶段条件扩散完成生成。[结果]在自建的 Poetic Visions 数据集(3124 首诗、4212 幅图像)上,与GPT-4o + DALL·E 2等基线相比,本方法在 IS(26.87 vs 25.32)、FID(14.98 vs 15.75)、CLIP Score(0.72 vs 0.68)与人工得分(3.7 vs 3.3)上相对最佳基线平均提升约6%。[局限]多阶段流程对早期构图输出存在依赖,偏差可能向后传导;对长篇或高度抽象诗歌的细粒度控制与稳定性仍具挑战。[结论]语义引导与协同生成机制有效提升诗—图语义对齐与艺术表达,具备在数字人文与创作场景的应用价值。

  • 韩明星, 林立涛, 欧石燕, 许莉薇
    预出版日期: 2025-12-26

    [目的] 为解决现有研究忽视内容特征的细微差别以及未能构建有效的多源特征融合框架。[方法] 通过LLM2Vec嵌入用户生成内容以捕捉细微差别;构建六类特征体系(用户、好友、时间、内容、情感、AI)并利用混合专家系统的路由网络分配特征至对应专家网络,最终由特征融合层整合多源输出。[结果] 在Twibot-20和Twibot-22数据集上,本文的模型在精度上比其他模型分别至少高了1.70%和4.45%,具有一定的优越性。[局限] 未考虑潜在的对抗攻击;未考虑对社交机器人误判的道德伦理问题。[结论] 本研究为维护健康的网络生态提供了有力的技术支持。

  • 裘靖文, 王昊, 杨思敏, 姚天辰, 谭玉瑶
    预出版日期: 2025-12-26

    [目的] 历史人物是历史舞台上的重要角色,更是历史的缩影,全面客观地还原历史人物形象,对于把握历史事件关联,理解历史发展趋势具有重要意义。[方法] 本文提出了一种融合事件情感分析的历史人物画像生成框架,主要包括历史人物事件集构建、历史事件多标签分类与历史人物事件情感识别,在此基础上,本文从事件分类情况、事件情感与评价情感匹配情况,以及事件情感演化趋势三个方面对历史人物进行了分析。[结果] 本文提出的人物行为单元识别模式ISSI-RM平均1句话可以识别得到3组左右FBU,且能够有效解决实体指代不明、实体指代错误的问题;提出的ABG-MLC 模型在事件多标签分类任务中,F1值达0.8,超出基线模型0.14;在完成历史事件抽取与分类后再通过提示学习的方法进行事件情感识别,识别效果最佳,证明了本文识别流程的有效性。研究发现,多标签事件中“政治能力+军事能力”复合标签占比最高,本纪中此类复合标签多集中于定鼎帝王,列传中则多集中于谋士人物;本纪与列传人物事件情感和评价情感匹配度差异显著,但高度重叠中均以积极情感为主导类型;人物事件情感时序轨迹可聚类为四类典型模式。[局限] 后续可进一步扩充语料,开展跨时域人物对比分析。[结论] 本文借助数字技术将事件情感分析融入历史人物画像生成,解决了传统历史人物研究在规模化与客观性方面的难题,为历史人物研究提供了全新视角,也为史籍文献的深度挖掘与文化资源转化提供了实践参考。

  • 迟富源, 严豫, 刘忠轶
    预出版日期: 2025-12-26

    [目的]针对现有多模态大模型在识别有害模因时存在注意力偏移与推理误判问题,本文提出一种融合情绪感知与注意力校准的多模态大模型优化方法。[方法]该方法基于Plutchik情绪轮模型构建多情绪视角,通过多步推理机制注入文化背景和特征增强,借助模糊测试生成多样化解释路径,并引入多轮推理机制以结构化精炼解释内容。同时,设计对齐网络校正因情绪放大导致的误判,并结合小模型加权投票机制形成最终判断。[结果]实验结果表明,在中文公开数据集ToxiCN-MM上,该方法在精确率、召回率和F1值上较基线大模型分别提升1.90%、7.36%和4.75%;在英文公开数据集FHM上的跨语言验证中,本方法的准确率和AUC指标较基线模型提升3.0%和5.0%,结果显示其在跨语言场景下具备较为稳定的泛化性能。[局限]该研究主要基于现有公开数据集进行验证,在实际复杂场景中的表现仍需进一步测试,且模型优化依赖于情绪轮模型和文化背景的准确性,对于跨文化或新兴文化语境的适应性可能有限。[结论]本文提出的优化方法有效提升了多模态大模型对有害模因的识别能力,为防范有害模因传播提供了新的技术手段,也为多模态模型的情绪感知和注意力校准研究提供了有益参考。

  • 陈可嘉, 赵晓锋, 周修考
    预出版日期: 2025-12-26

    [目的]针对多模态情感分析中模态内存在虚假相关性,且模态间的情感歧义会阻碍虚假相关性缓解的问题,本文提出了一种基于因果感知增强与歧义感知融合的多模态情感分析模型。[方法]为了缓解模态内的虚假相关性,首先重构多模态情感分析的因果图,并基于前门调整方法设计了一个多层的双分支Transformer架构。该架构结合自注意力和交叉注意力机制,以消除特征与标签的虚假相关性,并生成去偏表示。其次,为了有效利用多模态互补性来缓解虚假相关性,采用变分自编码器和KL散度来量化模态间的歧义,从而减少模态冲突。最后,通过联合任务损失和辅助损失对模型进行优化,以提高情感预测的准确性和鲁棒性。[结果]本文提出的模型在CMU-MOSI和CMU-MOSEI数据集上的实验结果均优于所有对比模型。与次优模型相比,Acc-2分别提高1.36%和1.23%,F1值提高1.27%和1.21%。此外,在CMU-MOSEI-OOD(分布外)上较次优模型Acc-2和F1提高5.41%和5.46%。[局限]模型对文本特征的依赖性较强,在文本信息不足时,情感预测的准确性可能受到影响。[结论]本文模型通过因果增强和动态融合有效消除虚假相关性与情感歧义,显著提升情感分析性能,在分布外数据集上表现出色。

  • 仵轩, 李广建, 潘佳立, 王楚涵
    预出版日期: 2025-12-26

    [目的]针对现有研究在应对美国出口管制时存在的靶向性、关联精度与研判维度不足等问题,本文探索一种面向美国出口管制的中美关键核心技术竞争态势研判方法。[方法]整合战略技术清单、出口管制清单及专利等多源数据,运用大模型完成“战略技术-管制物项-专利”的自动化关联,并设计基于T-GCP模型的指标体系研判关键核心技术的中美竞争态势。[结果]以中美两国量子技术领域为例开展实证,实现了该领域量子计算、通信、传感三大方向下13项ECCN物项与专利数据的精准关联,并依托技术竞争风险矩阵完成了态势研判与风险分区。[局限]当前研判指标体系尚待进一步拓展与丰富,对潜在管制领域的预见性分析仍显不足。[结论]本文所提出的方法能够系统研判关键核心技术领域的中美竞争态势与技术风险层级,为应对技术管制与制定突破策略提供了可资借鉴的决策参考工具。

  • 王永, 黑旭盛, 王永东, 邓江洲
    预出版日期: 2025-12-26

    [目的]针对现有扩散推荐模型在兼顾数据采样效率和生成质量方面的问题,本文提出一种改进的扩散推荐方法,以提升模型的推荐性能与训练效率。[方法]通过设计协同正态先验映射方法,结合矩阵分解和Box-Cox技术将交互数据转换为近似高斯分布来减少扩散模型前向噪声累积。在后向推理阶段引入双层评分感知掩蔽机制聚焦重要交互信息。此外,在损失函数中融合高斯平滑约束来增强生成数据的正态性,从而提高模型的收敛速度与生成质量。[结果]实验在三个公开数据集上显示,当推荐列表长度为5时,相对于传统的扩散推荐模型,本文方法在Recall和NDCG指标上分别增长4.3和7.0个百分点。[局限]模型在动态用户偏好建模和长尾推荐等方面有一定局限性。[结论]本文模型能有效地平衡数据采样效率与生成质量间的关系,展现出良好的应用潜力。

  • 楼雯, 汤文婷, 张灵欣, 高明珠
    预出版日期: 2025-12-25

    摘 要  [目的] 本研究旨在提出一种学科研究热点识别方法,以增强对科学论文的语义理解,提升研究热点识别的客观性与准确性。[方法] 该方法基于论文摘要构建复杂依存句法网络,并使用基于灰色关联分析的复杂网络节点重要性综合评价方法来评估节点重要性,从而识别热点研究主题。以PudMed平台2015-2024年30万篇传染病学领域的文献摘要数据进行了验证与分析。 [结果]研究发现该领域的知识增长呈现出明显的分层特征,在保持核心研究主题稳定的同时,不断衍生出新的研究分支;每年平均识别出约8个热点主题,相比于LDA,模型在主题聚类清晰度和主题演化趋势识别上更加具体。 [局限] 对于极短文本中句法结构不完整的摘要处理能力有限,且对语法解析质量依赖较高,可能影响网络构建精度。 [结论] 本研究提出的方法相较于传统方法,它更能捕捉研究主题间的语义关联,有助于更全面、深入地理解学科研究动态。

  • 杨洋, 吴俊
    预出版日期: 2025-12-25

    [目的]针对当前技术融合二元关系预测范式的低维表征局限,本研究从异质交互视角设计多元技术融合创新机会发现方法,为企业战略性研发布局提供支持。[方法]构建以知识、专利和企业为节点的企业技术融合创新异质超图网络,设计双模-异质超图注意力神经网络模型(DM-HHGAT),使用超图模式层和异质模式层映射该网络结构信息,融合注意力机制学习多维特征表示,实现多元技术融合创新机会发现。[结果]以人工智能领域22万多条授权专利数据进行实证研究,结果表明该方法的准确率达到94.96%,召回率和F1分别为97.67%和95.08%,实验对比表明本模型优于其他相关基线模型。[局限]仅使用人工智能领域的上市公司数据,未来可拓展多源数据以深化技术融合创新机会发现。[结论]双模-异质超图注意力神经网络模型能高质量地刻画多元技术融合创新的高阶异质交互信息,更精准、细粒度地发现技术融合创新机会。

  • 程铁军, 李坤泽, 冯兰萍, 韩普
    预出版日期: 2025-12-25

    [目的]针对现有突发事件舆情情感分析中忽视图文特征数据量不匹配、图文交互影响关系缺少充分考量问题,提出一种基于自适应跨模态融合注意力的突发事件舆情情感分析模型。[方法]首先,采用图像增强技术对突发事件舆情图像特征进行增强,达到图文数据对齐;其次,引入两阶段跨模态交互注意力,充分衡量突发事件舆情中图像与文本模态之间的深层关联,增强模态间的互补信息表达,进一步引入自适应注意力,根据不同模态在情感识别任务中的贡献动态分配权重,实现跨模态特征的有效融合;最后,引入残差连接对跨模态融合特征进行处理,提高模型的泛化能力。

    [结果]将模型应用于三起突发事件的舆情情感分析,三组对比实验验证模型平均准确率达到94.37%,平均召回率达到90.79%。[局限]本文提出的模型与方法是基于图文两种模态数据的交互影响关系的探索,未来可以融入视频数据,考虑更多元模态。[结论]本文所提模型充分衡量了突发事件舆情图文特征之间的交互影响关系,实现了跨模态特征的动态融合,优化模型梯度传播和信息流传递,使模型在深层网络中仍能保持较高的性能,提高了突发事件舆情多模态情感分析的准确性。

  • 李奇, 杨婉霞, 杨森, 何亮, 张娣
    预出版日期: 2025-12-25

    【目的】针对当前种植业农事活动数据稀疏、农事知识跨领域多类型的特点,以及现有事件抽取方法在农事领域泛化能力不足的问题,基于通用模型设计农事知识抽取策略,以提高低资源场景下的抽取精度和跨领域适应能力。【方法】提出基于小样本学习的种植业农事知识抽取方法AgriEvent-UIE。通过定义种植业农事活动分类体系、设计领域适配的prompt机制和schema模板,利用少量标注数据微调UIE模型,实现跨领域、多类型农事知识的精准抽取。通过在自建农事数据集和中文农业公共数据集上的对比实验,验证了本文方法的有效性。【结果】AgriEvent-UIE在自建农事数据集上的触发词抽取和论元抽取F1值分别达到91.1%和82.4%,其相应的F1值相较于经典事件抽取模型CasEE分别提升15.8%和27.2%,表明本文方法的优越性。进一步,实验了本文方法在中文农业公共数据集上的触发词抽取和论元抽取的F1值分别达到89.3%和81.3%,验证了其泛化能力。【局限】模型抽取性能高度依赖schema模板的设计质量,对于模板未包含的内容,抽取可能面临一些挑战。【结论】AgriEvent-UIE能够有效解决多类型种植业农事知识抽取中的低资源挑战,为农业智能化提供数据和知识支撑。

  • 林楠铠, 阮博文, 王连喜
    预出版日期: 2025-12-25

    【目的】通过改进多语言预训练语言模型的多语言知识共享和对齐能力,以提升其在多语言短文本情感分类任务上的性能。【方法】提出一种基于上下文学习的多语言短文本情感分类方法。首先,利用基于最大-最小语种相似度的样本选择模块从训练集中筛选最具代表性的上下文学习示例;然后,通过输入模板构建与填充模块引导模型输出预测结果;最后,构建多语言自洽性输出模块,集成多个不同语言的模板并利用高效微调策略提升模型的输出稳定性。【结果】在包含12种非洲语言的多语言短文本情感分类数据集AfriSenti-SemEval上的实验表明,采用本文提出的方法后,LLAMA3和InternLM2模型的加权平均F1值分别比其原始基线提升了2.15%和2.71%。【局限】本方法仅在短文本情感分类任务上进行了探究,且所用数据集主要集中在非洲语言,对于其他文本类型和语系上的泛化性和鲁棒性有待进一步验证。【结论】提出的ICL-S2MSO方法能有效提升多语言预训练模型在多语言短文本情感分类任务上的性能,为低资源语言情感分析提供了可行解决方案。

  • 刘明帅, 李欣, 彭奕杰, 薛迪
    预出版日期: 2025-12-25

    [目的]针对中文仇恨言论检测中隐晦表达识别困难、对抗性攻击泛化能力不足等问题,本文提出一种基于LLM提示的多模态编码方法。[方法]设计对抗性数据增强框架生成高质量对抗样本,构建六维细粒度情感特征标签,融合汉字字形、拼音及字符特征进行多模态编码,通过层级注意力机制实现异构特征动态融合,应用SoftMax函数输出分类预测。[结果]在COLDataset和CHSD数据集上,本文方法精确率分别达86.83%和87.22%,召回率分别达87.94%和88.15%,F1值分别达87.35%和87.64%,较现有方法提升显著。消融实验显示,本文提出的多维情感特征和字形-拼音编码等方法对检测结果均有提升。[局限]本文方法依赖LLM生成的对抗样本和情感特征标签质量,且多模态编码的计算复杂度较高,对现实世界中数据非均衡问题方面仍需验证。[结论]本文方法基于LLM进行对抗提示与多模态编码,显著提升中文仇恨言论检测的鲁棒性与准确性,为复杂网络环境下的内容治理提供技术支撑。

  • 周胜利, 徐睿.顾益军, 鲍李晨恺, 汪邵杰
    预出版日期: 2025-12-25

    【目的】为解决当前电信网络诈骗风险宣防管控中非结构化数据利用率低、多源信息时空特征割裂的问题,提出一种基于大模型微调与Agent协同的时空知识图谱构建方法。【方法】以某省近五年42万余条案件数据为基础,首先构建公安领域专业术语库,并采用LoRA技术对DeepSeek模型进行多任务微调,提升模型对电信网络诈骗案件要素的提取能力;然后设计多Agent协同框架,包括预处理、要素提取、冲突检测和整合Agent,通过动态提示模板与逻辑规则引擎实现非结构化文本的解析;最终构建异构特征耦合的电信网络诈骗风险宣防管控时空知识图谱。【结果】实验表明,微调大模型的BLEU-4指标达49.718,要素提取任务中平均F1值达0.896,并且基于不同类型电信网络诈骗案件文本数据构建的时空知识图谱覆盖率达0.979。【局限】受限于网络行为核心要素的非结构化、语义碎片化特征,当前微调大模型表现出一定的收敛阈值,对网络行为的识别能力有待进一步提升。【结论】基于大模型的电信网络诈骗风险宣防管控时空知识图谱构建方法以结构化方式整合了多类案件核心要素,能够有效还原犯罪路径,为犯罪模式挖掘和精准宣防提供坚实的数据支撑。

  • 沈丽宁, 王悦晗, 陈思思, 沈文轩
    预出版日期: 2025-12-25

    [目的]构建基于多模态语义理解的分面检索框架,解决现有在线医疗问答社区在信息查准和多模态数据利用方面的不足,优化皮肤病问答社区的信息组织。[方法]利用LDA主题模型进行文本聚类,BERT-BiLSTM-CRF模型进行实体识别,通过ResNet-50提取图像特征,结合跨模态对齐技术实现图文语义关联,构建多模态知识图谱。结合健康信念模型设计三级框架,构建“主题-分面-亚面-类目”四级分面体系。最后以有来医生网白癜风为例开发分面检索原型系统,并与其他网站对比分析检索效果。[结果]构建的皮肤病多模态知识图谱涵盖12类实体和15种语义关系,包含4591个实体节点和8086条关系;分面体系包含3个主题、9个分面和11个亚面,覆盖所有实体节点并分类。原型系统检索结果在页面呈现、信息组织方式、结果相关度三个维度更好满足用户需求。[局限]在实证对比分析中,研究采用的分面检索评价指标较为单一,主要从定性分析角度开展对比。[结论]通过自下而上主题聚合与自上而下需求分析,构建分面分类多层级知识体系,验证了该方法在缓解皮肤病问答社区信息过载、提升检索精准度及多模态数据利用能力的有效性。

  • 邓娜, 但文俊, 陈旭, 刘树栋, 焦尧毅
    预出版日期: 2025-12-25

    [目的]解决现有链路预测方法中依赖局部图特征同时忽略专利技术网络中异质信息的问题,提高链路预测的准确性,以识别和预测中药技术机会。[方法]本研究提出一种中药专利链路预测方法EDGCL:使用MC-BERT进行主题建模挖掘中药专利技术的核心主题;设计专利显隐双性关联评估机制,从显性和隐性角度捕捉中药专利技术主题的时间动态、技术特性及引用关系等异质信息,以构建中药专利技术多元关联网络;利用图Transformer 捕捉专利技术间长距离依赖关系,提高预测的准确性;结合图对比学习以增强模型的鲁棒性,进一步优化链路预测效果。[结果]在中药专利数据集上的实验结果表明,该方法在单跳链路预测任务的AUC-ROC值和AUC-PR值上分别提升至少2.52%和2.53%,在多跳链路预测任务的AUC-ROC值和AUC-PR值上分别提升至少0.56%和0.40%。[局限]该方法在中药领域知识结构的表达上仍有提升空间。[结论]该方法提高了链路预测的准确性,能有效捕捉中药专利技术主题之间的潜在复杂关联,为专利推荐、技术机会预测和创新决策提供可靠的支持。

  • 吴天骏, 闵超, 韩韬
    预出版日期: 2025-12-25

    [目的] 旨在缓解基于大语言模型术语提取方法中的幻觉问题与可解释性难题,构建高质量人工智能术语集合。[方法] 提出一种基于多智能体协作与混合指标测度的术语提取方法。通过异质智能体提取候选人工智能术语,并建立基于多智能体协作的指标测度体系以对术语划分质量层次。[结果] 基于专家评分结果,各层次术语呈现出显著组间差异,在领域相关性与词汇专一性两个维度上的H值分别达到了98.1与94.3(P-value<0.001)。消融实验显示,保留智能体协作相关指标的相关系数比剔除后平均高出约17个百分点。

    [局限] 未采用高性能版本的大模型,且方法未覆盖全部语料,可能忽略了某些术语特征。[结论] 混合指标测度能够区分术语的质量层级,从而筛除低质量术语。多智能体协作机制在术语提取任务中展现出独特作用。

  • 丁学君, 孙佩佩, 吴昊, 田勇
    预出版日期: 2025-12-25

    [目的]针对社交网络中网络谣言的广泛传播问题,基于建立的考虑社区结构的社交网络谣言传播模型(IC Model Considering Community Structure,CSIC模型),提出了基于最大影响树的谣言链接阻断算法,以有效遏制谣言扩散。[方法]为了更真实地刻画谣言传播规律,将社交网络中的节点划分为多个社区,建立了一个基于节点影响力和节点属性相似度的社交网络谣言传播模型。基于此,通过引入最大影响树,并调整节点影响阈值,提出了全局路径分离(Path Separation Blocking Algorithm for Global Networks,PSG)、全局路径合并(Path Merging Blocking Algorithm for Global Networks,PMG)及社区路径合并(Path Merging Blocking Algorithm in Community,PMC)三种谣言链接阻断算法。最后,实验验证了算法在不同规模社交网络中的阻断效果。[结果]PSG和PMG算法的运行时间随着节点区域影响阈值的增大而减少,但算法的有效性略有下降。在大规模网络中,PMG算法的阻断效果优于PSG算法;从种子节点出发的效果优于非种子节点;针对具有明显属性特征的谣言,PMC算法能快速识别并有效阻断相关社区。[局限]由于谣言属性信息获取困难,需要进一步探索如何更好衡量社区成员对特定谣言的兴趣与传播倾向,以提升阻断算法性能。[结论]本文提出的考虑社区结构的谣言链接阻断策略,能够有效提升社交网络中谣言传播的抑制效果,并为社交网络谣言治理提供了新的思路。

  • 杨曼玉, 赵华, 徐凯欧, 张希文
    预出版日期: 2025-12-25

    [目的]本文针对语义理解不充分和跨模态对齐不精准问题,提出了一种基于跨模态语义增强的联合多模态方面级情感分析模型,旨在提升多模态方面-情感对抽取效果。[方法]通过引入文本方面-情感抽取和跨模态对齐融合两个子任务实现语义增强。一方面,利用大语言模型的文本理解能力,并结合提示工程引导其进行方面-情感对抽取,以提升文本语义理解;另一方面,引入深度嵌入聚类对文本和图像特征进行聚类,并利用聚类标签嵌入优化多头交叉注意力的计算,以增强跨模态对齐。最后,将融合特征输入到条件随机场中进行序列标签预测,并在多任务学习框架下联合优化任务损失,以提升模型整体性能。[结果]相较于基线模型,本文提出的模型在Twitter-15和Twitter-17数据集上的F1值分别高达69.4%和70.6%,证明了该方法在多模态方面-情感对抽取任务中的有效性。[局限]聚类中心个数的设定采用静态设定方式,可能导致聚类效果受参数选择的影响。此外,大语言模型生成的标注结果可能存在噪声和不稳定性。[结论]本文所提模型通过有效的语义增强,提升了多模态方面-情感对抽取任务的性能,验证了语义增强在联合多模态方面级情感分析中的有效性。