期刊首页 在线期刊 最新录用

最新录用


说明:最新录用文章, 内容和格式将与印刷版一致(除了页码), 您可以通过doi直接引用。

Please wait a minute...
  • 全选
    |
  • 刘甜甜, 彭放, 朱天佑, 杨超
    预出版日期: 2026-01-19

    [目的]为解决自然语言转SQL模型在落地场景中因真实数据库信息缺失导致生成SQL语句逻辑和执行准确率低的问题,本文探索将检索增强技术深度融入SQL语句生甘草过程的有效性,旨在构建能精准理解用户意图、自动对齐库表结构并生成可执行SQL语句的模型。[方法]本文提出了SQLGPT大模型,用以将用户的自然语言查询高效转化为SQL语句。模型首先通过语义相似度计算从数据库中检索出与用户查询相关的表结构信息,然后结合检索到的表结构信息与上下文学习示例,动态生成提示词,引导大语言模型生成 SQL 语句。[结果]在WikiSQL 数据集上的实验结果显示,SQLGPT 逻辑形式准确率 86.5%、执行准确率 92.6%,分别领先当前最优的 BRIDGE 模型 0.4 与 0.8 个百分点,同时支持多轮对话,优势显著。

    [局限] SQLGPT 虽在 WikiSQL 数据集表现优异,但依赖单一通用数据集,在表结构命名不规范、复杂多轮对话及行业专属查询场景下鲁棒性与泛化能力未充分验证。[结论]创新性地将语义相似度检索与动态提示词相结合,为自然语言转SQL任务提供了一种高效且准确的解决方案,有望降低非技术背景用户使用数据库的门槛。

  • 郭海湘, 邹宇哲, 赵甜甜, 张文凯
    预出版日期: 2026-01-19

    【目的】由于突发事件失真信息的误导性、多样性、即时性与动态性,传统模型在语义理解、数据覆盖与知识更新方面存在挑战,大语言模型幻觉问题也制约着其在多学科领域的应用与发展。【方法】本文面向公开数据集构建了突发事件失真信息数据集,基于样本嵌入与链式思考提示策略设计两阶段大模型以限制幻觉发生,结合XLNet-BiLSTM模型以缓解幻觉后果,提出了一种可信任可理解的突发事件失真信息识别框架。【结果】本文框架在突发事件失真信息识别中准确性达到85.02%,领先于框架各单元消融组合的识别结果。【局限】对于本地部署与线上调用大模型的对比讨论较不充分。【结论】本文框架确保了识别结果与生成解释的一致性与可理解性,凸显了在不同类型突发事件中信息识别的可迁移性。

  • 邱含琪, 陈伟
    预出版日期: 2026-01-19

    [目的]提出一种集成技术生命周期分析、多维测度体系与语义增强超网络节点表征的研究框架,旨在系统量化技术融合演化特征,克服文本信息利用不足,全面揭示技术融合趋势。[方法]通过技术生命周期划分发展阶段,基于超网络结构构建时序技术融合超网络;设计涵盖整体、超边与节点三个层次的融合测度体系,系统分析融合演化特征;并提出基于语义增强的超网络节点表征方法(SHNE),以挖掘技术潜在融合关系。[结果]以全固态电池领域为例,研究表明该领域技术融合呈现从材料探索、性能优化到产业应用的阶段性演进,并识别出电池温度管理、高镍正极界面改性等高价值潜在融合方向,为突破技术瓶颈提供了科学参考。[局限]仅基于IPC共现构建超网络,未纳入专利引证等关系,细粒度技术要素挖掘不足。[结论]该框架能够揭示技术领域融合演化特征与潜在融合方向,为技术融合研究提供新视角。

  • 闫强, 冷基栋, 易兰丽, 姜李丹
    预出版日期: 2026-01-16

    [目的] 揭示颠覆性技术传播过程中公众认知与情绪的反应机制,阐释其被社会接受的内在逻辑。[方法] 构建“技术感知-情绪表达-态度立场”三阶段反应模型,以“萝卜快跑”议题为研究案例,选取哔哩哔哩、抖音和小红书三个平台共6万余条用户评论为样本,运用语义分析、情绪识别与立场判别方法,比较分析公众感知、情绪与态度在不同平台的差异特征。[结果] 研究表明,公众的技术感知呈现多元结构,情绪表达具有显著的平台异质性,技术支持与制度忧虑的态度立场存在明显分化。平台通过影响情绪生成与表达方式,在公众态度形成中发挥关键调节作用。[局限] 案例分析主要基于中文社交媒体语境,研究结论在其他语言与文化环境中的适用性仍有待进一步验证。[结论] 本研究论证了颠覆性技术扩散中感知、情绪和态度的联动机制,为公众技术接受模型建构提供新思路,同时为AI驱动的舆情分析与场景决策提供方法参考。

  • 赵春玉, 章丹丹, 王希骅, 陈希, 林传文
    预出版日期: 2026-01-16

    [目的]系统梳理数据蒸馏技术研究进展,明确核心挑战与未来方向。[文献范围]以“数据蒸馏”、“Dataset Distillation”等为关键词,检索中国知网、Web of Science、谷歌学术等数据库,筛选2021-2025年相关文献88篇展开综述。[方法]系统剖析基于元学习与数据匹配的基础算法及其代表性工作,并结合多领域应用场景分析数据蒸馏的技术特性与实施挑战。[结果]数据蒸馏在计算机视觉、智慧医疗、推荐系统、自然语言处理和图学习领域表现优异,但存在基础理论不完善、合成数据质量待提升、隐私保护需加强等问题。[局限]侧重现有研究梳理与应用分析,对算法原理深层推导及复杂场景适配验证不足。[结论]数据蒸馏是一项具有广泛应用前景的技术,未来需从理论建模、质量优化、技术融合等方面推动数据蒸馏技术实用化。

  • 吴大伟, 赵宇翔, 汤健, 朱庆华
    预出版日期: 2026-01-16

    [目的]:探索人智交互情境下适老化设计可供性的类别及其与老年人需求的映射机理。[方法]:融合需求-可供性-功能特征框架和可供性实现视角,基于元人种志方法归纳可供性类别。随后,在智能手表情境下采用卡片分类实验探索产品功能特征、可供性和需求之间的映射关系,明确可供性的实现过程。[结果]:研究归纳了理解可供性、具身可供性、共情可供性等9类适老化设计的可供性,构建了功能特征-可供性-实现过程-结果映射机制的整合模型。[局限]:研究仅依赖文献数据归纳可供性,对可供性实现过程的揭示具有情境局限性。[结论]:研究丰富了人智交互中适老化设计可供性理论体系,能够为政府和企业开展以人为本的适老化设计提供实践启示。

  • 田雪灿, 李昌旺, 刘晨, 邓泽宇, 毛进
    预出版日期: 2026-01-16

    [目的]刻画前沿技术领域的创新活动在国际竞争背景下展现出的异常波动差异,为识别技术体系中的脆弱环节提供参考。[方法]基于专利申请量长时序数据,采用多模型时序建模与异常检测量化技术领域的异常表现,并利用EScore评估其前沿性,通过交叉分析构建前沿技术领域异常画像。[结果]不同模型在不同技术领域的优异性存在差异。整体上,我国技术体系呈现“整体稳态、局部异常”,多数异常为负向且突变常滞后2~3年。前沿性与异常程度总体呈负相关,前沿技术领域更易出现负向波动,但物联网、计算化学等领域展现较高韧性。[局限]创新活动仅以申请量衡量,且前沿性评价依赖单指标,未来可引入更多指标体系。[结论]基于双维度构建前沿技术领域的异常画像,能够有效揭示国际竞争背景下技术创新的脆弱环节与潜在突破方向。

  • 刘秀敏, 胡懋地, 宋东桓, 孙曦, 邹东, 袁智翔
    预出版日期: 2026-01-16

    [目的]为了提升大语言模型在科技专利中抽取知识对象的效果,本文针对少样本学习方法泛化能力不足、示例与目标任务适配性有限等问题,提出了一种基于任务感知的动态示例选择方法。[方法]将示例选择问题形式化为示例引导增益预测任务,基于待抽取语句和候选示例的深度语义交互,构建任务感知的交叉编码器排序模型,通过检索-重排两阶段框架对引导增益较高的示例进行动态筛选。[结果]在基因组学中文专利数据集上实验结果表明,动态示例选择模型在知识对象抽取上的F1值为64.60%,优于基线模型。实验验证了示例引导增益模型在提升动态示例质量的有效性。[局限]本实验基于基因组学中文专利类型文本数据,模型在其他领域及文本类型上的适用性需进一步研究。[结论]通过基于基因组学专利的实验验证,本文提出的任务感知动态示例选择方法能够增强示例适配性,提升大语言模型在科技专利知识对象抽取任务中的性能。

  • 钱旦敏, 张铠, 张继海, 刘乘瑜, 马野青
    预出版日期: 2026-01-16

    [目的] 在多模态情感分析中,提出多尺度时序感知与自适应权重融合方法。[方法] 本文设计多尺度时序感知模块以捕获多层次时序信息,并提出自适应权重融合架构,集成交叉注意力、模态重要性学习与特征门控,最终通过加权融合完成情感分类。[结果] 在两个基准数据集上的实验表明,本方法性能显著优于基线模型,在CMU-MOSI上准确率与F1值分别提升2.15%和2.26%,在CH-SIMS上分别提升3.14%和2.67%。[局限] 本研究局限性包括对复杂模糊情感表达的判别能力有待提升,以及对模态缺失与噪声干扰的鲁棒性不足。未来将重点优化模型在上述场景下的性能。[结论] 本方法融合时序与跨模态信息,通过自适应权重提升情感识别性能,具应用潜力。

  • 余厚强, 来昕, 张洋
    预出版日期: 2026-01-15

    [目的]本文旨在把握智能信息计量发展机遇,揭示智能信息计量的形成过程,为后续学者研究提供方法参考。[文献范围]针对AI在信息计量领域的应用这一主题制定检索式,在Web of Science和CNKI数据库中进行检索,经数据精炼和延伸阅读,最终确定中英文文献共326篇。[方法]通过系统检索和文献精读,本文详细梳理和阐述了最近10年国内外AI技术在信息计量领域识别、预测和分类方面应用的前沿进展。[结果]识别应用方面,AI主要应用于论文识别和细粒度实体识别;在预测应用方面,AI主要应用于论文影响预测、学者影响预测和研究趋势预测;在分类应用方面,AI主要应用于论文学科分类、论文内容分类和情感及动机分类。针对每个方向的AI应用原理和过程均做了细致的归纳和解读。[结论]应用AI技术赋能解决信息计量领域的复杂问题已成为必然趋势,智能信息计量时代即将到来,熟练掌握AI技术的应用已成为信息计量领域专业人才不可或缺的一项关键能力。

  • 袁伟康, 张予捷, 包易云, 蒋卓人
    预出版日期: 2026-01-15

    [目的]针对社交媒体中隐晦性仇恨言论语义复杂性高、人工标注成本高且传统检测方法可解释性不足的局限性,本文提出一种基于大语言模型自学习推理增强的仇恨言论检测方法——STR4HSD。[方法]首先,基于Qwen-Max模型构建“生成-验证-反思-过滤”的自学习推理增强模块,生成包含推理路径的高质量思维链数据集。其次,通过微调Qwen2.5-7B-Instruct模型,提升其在中文语境下的仇恨言论识别的准确性并增强其决策过程的透明性。最终,融入先验毒性词典引导的领域知识,提升模型对仇恨言论的隐晦表达语义理解能力。[结果]在中文隐晦性表达仇恨言论识别数据集TOXICN和具有伪装扰动的仇恨言论数据集TOXICLOAKCN上的实验表明,本方法取得显著提升:在TOXICN和TOXICLOAKCN上F1分数分别为84.2%和84.7%,相比现有方法F1分数分别提高超过2%和4%。[局限]当前方法主要针对单语种文本场景,尚未解决多模态信息融合与跨语言迁移中的语义对齐问题。[结论] STR4HSD在降低人工标注成本的同时,实现了对隐晦仇恨言论的高精度检测与可解释分析,为社交平台内容治理提供了新的技术路径。

  • 王荣磊, 马跃峰, 李士建, 梁循, 宋扬
    预出版日期: 2026-01-15

    [目的]针对现有网络暴力检测研究中忽视用户行为与社交关系异步演化及群体情感极化联合分析的问题,提出一种融合社交网络结构差分与群体情感极化特征的检测模型。[方法]构建用户行为交互图与社交关注图两种离散时间动态图,利用双向图卷积网络获取双图嵌入并生成特征差分序列;结合情感置信过滤机制得到正负向群体情感极化序列,最终通过改进的时序信号融合模型实现分类检测。[结果]在真实社交媒体数据集上的实验表明,该方法准确率为89.5%,F1值为87.0%,较代表性基线模型提升2%–7%。[局限]本研究仅基于特定社交媒体数据集,未来可引入更多平台数据并在真实环境中验证,评估模型的泛化能力和鲁棒性。[结论]基于群体极化视角的融合社交网络结构差分与群体情感极化模型能够显著提升网络暴力检测效果。

  • 李金昊, 赵宇翔, 赵延柯, 朱庆华
    预出版日期: 2026-01-15

    [目的]基于在线评论探索怀旧视频中用户怀旧情绪的特征及其诱因。 [方法]选取哔哩哔哩视频网站中40条怀旧题材的20000余则用户评论进行计算扎根分析,结合Qwen大语言模型和提示词工程进行模式识别、完善和确认。[结果]从视频的用户评论中析取出“人物”“事件”“时间”“地域”“物件”五种主要怀旧元素,提炼出感官处理、推荐机制、社交互动三类引发怀旧的影响因素以及两类社会文化属性。[局限]本研究基于计算扎根方法获得的发现可能由于无监督分类的偏差而忽略用户评论中的洞见,未来研究需进一步结合用户访谈和网络民族志等质性研究方法。[结论]深化了社交媒体怀旧内容创作的核心维度并为怀旧视频的用户体验设计提供参考。

  • 操玮, 张逸丛, 汪文隽
    预出版日期: 2026-01-15

    [目的]整合跨国、跨市场及多模态异构信息,解决单一数据源局限,提升我国新能源股指预测精度。[方法]构建深度耦合长短期记忆网络注意力模型(DC-LSTM-Attention-LLM)。利用ChatGPT与结构化零样本提示(Structured Zero-shot Prompting)量化文本模态的投资者情绪;设计LSTM集群并行挖掘跨国、跨市场及多模态数据的深层特征;引入多头注意力机制(Multi-Head Attention)捕捉异构信息间的交互依赖;通过共享层特征融合与ReLU实现新能源股指预测。[结果]中美新能源指数的实证分析表明,DC-LSTM-Attention-LLM模型在三组评价指标上均全面优于九个基准模型。具体而言,该模型相较于LSTM模型实现了平均12.83%的性能提升,验证了其在复杂金融时间序列预测中的优越性。[局限]零样本提示在复杂金融语义中的情绪识别精度受到限制,未来将引入高阶提示工程以增强模型的鲁棒性。[结论] 融合跨国、跨市场及多模态数据的深度建模方法,能有效捕捉复杂市场特征,显著提升我国新能源股票市场的预测精度。

  • 杨仁彪, 曹高辉
    预出版日期: 2026-01-15

    [目的]本文聚焦虚假信息群体免疫的实现路径问题,探究虚假信息传播治理的有效方法。[方法]构建了基于免疫接种与自然感染两种演化机制的RP-MHIM模型。通过引入多维干预变量(接种频次、接种时机、接种强度等),系统模拟与分析不同路径下的免疫效果。[结果]从免疫速度来看,免疫接种在第 t=150轮左右达成群体免疫,而自然感染约为200轮;从路径稳健性来看,免疫接种的抗干扰能力显著高于自然感染。[局限]模型在个体行为、平台机制与网络结构等方面仍存在简化假设,且策略效果未通过真实数据进行实证检验。[结论]免疫接种路径在多个维度上均优于自然感染路径,展现出更高效的干预能力和更快速的免疫形成过程。

  • 王笑辰, 李世娟, 黄文胜, 赵红梅, 张润彤
    预出版日期: 2026-01-15

    [目的]针对临床误诊难以实现前瞻性识别与早期干预的问题,提出一种融合先验知识与多源异构数据的误诊风险预测与特征识别方法,以提升误诊发现的及时性与可操作性。[方法]结合专家经验与临床规则提取先验误诊知识,用于辅助判定误诊事件并进行知识驱动的标签构建;基于电子病历构建混合机器学习模型,并引入可解释学习识别关键风险特征。使用中国国家人口健康数据中心19,256例患者数据完成模型开发,并在北京大学人民医院2,153例独立验证队列上进行外部评估与临床试点。[结果]在独立验证中,模型准确率为92%,AUROC=0.90,AUPRC=0.67;临床试点显示,模型部署后试点约登指数由84.50%提升至92.65%。[局限]本研究的误诊标签依赖规则与专家知识,且试点样本量与周期有限,通用性与稳健性仍待多中心与更长随访验证。[结论]本研究在误诊风险预测与关键特征识别方面取得较好效果,能够在真实诊疗中提升早期干预能力与决策支持价值,为构建临床误诊智能防控体系提供了一条可行技术路径。

  • 丁晟春, 公婧泽, 秦天允
    预出版日期: 2025-12-31

    [目的]针对认知战场景下认知主体类型多样、交互行为复杂且难以精准复现的问题,引入大语言模型技术,构建基于真实数据的智能体建模与仿真方法,为情报策略定向投送提供实验支撑。[方法]基于阿赫利医院爆炸事件数据,采用深度学习方法提取九类典型认知主体的属性分布与行为概率特征,借助大语言模型生成10,000个具有个体异质性的智能体实例,并集成至NetLogo平台开展交互行为仿真,从属性分布一致性、行为模式差异性维度校验模型有效性。[结果]该模型准确刻画了各阶层认知主体影响力差异,仿真中涌现出符合正态分布的差异化交互,有效克服传统仿真规则僵化、样本代表性不足的缺陷。[局限]模型当前侧重行为概率的拟合复现,尚未实现仿真中基于实时语义交互的动态认知演化,对深层次语义对抗效果的评估能力不足。[结论]本研究构建的认知主体智能体模型可有效复现信息接收后的行为反应,验证了LLM生成智能体与NetLogo仿真相结合的技术路线的可行性,为认知空间作战行动提供可量化、可复现的实验支撑,具备重要战略价值。

  • 沈志宏, 朱小杰, 朱国亮
    预出版日期: 2025-12-31

    [目的]本文围绕AI场景下科学数据的共享与利用问题,针对现有FAIR原则不足以指导科学数据满足AI就绪的现状,构建面向AI就绪的科学数据共享与利用原则框架。[方法]通过系统梳理传统机器学习、大模型预训练、大模型微调、检索增强生成及智能体等五类典型AI任务的数据需求,在传统FAIR“四可”维度的基础上,提出面向AI就绪(即For AI Ready)的科学数据共享与利用原则框架FAIR×FAIR,并进而提出与框架相适应的层次化技术栈。[结果]FAIR×FAIR框架明确了13项科学数据满足AI就绪的技术要求,为弥合AI任务与科学数据之间的语义鸿沟提供了系统化方案。[局限]本研究提出的原则框架其实施效果仍需通过后续领域应用案例进一步验证。[结论]FAIR×FAIR框架为AI时代的科学数据共享与高效利用提供了理论依据和实践路径,对推动数据驱动型科研范式的演进具有重要意义。

  • 陈格非, 刘清
    预出版日期: 2025-12-31

    [目的] 阈值设置是科学知识图谱的重要环节,本文旨在提出一种客观、可解释性更强的阈值设置方法,以提高文献数据挖掘的质量和效率。[方法] 通过引入节点度分布、同配性和巨分支规模占比等三种网络结构特性,揭示阈值设置和科学知识图谱性能间的关系。在此基础上提出阈值设置方法,并通过实验验证。[结果] 在实验数据集中,本文方法生成图谱的重要节点、聚类和时序特征提取的平均准确率相比经验方法提升10%,平均完整度提升7%。[局限] 需要在更多领域验证方法有效性。[结论] 在文献网络中,阈值设置与节点度分布、同配性和巨分支规模占比之间存在普适性关系。依据网络结构特性设置阈值能够提升科学知识图谱数据挖掘的质量。

  • 吕婷钰, 李晓瑛, 邓盼盼, 李军莲
    预出版日期: 2025-12-31

    [目的] 为解决非结构化文本中联合用药信息的抽取挖掘与形式化表示,提出一种融合深度学习与大语言模型的联合用药知识发现与自动评估方法。[方法] 基于文献知识发现(Literature based discovery, LBD)理论构建多层级联合用药知识发现框架,融合优化深度学习模型以完成药物和疾病实体识别、药物-疾病治疗关系和药物-药物组合应用关系提取,结合目标信息特征自动挖掘大规模文本数据中的联合用药知识,并利用定制化设计的“角色+内容”少样本提示词引导大语言模型完成前述结果的评估验证;多层级的双重策略不仅有助于提高联合用药知识发现结果的准确性和可靠性,而且避免了耗时费力的人工参与。[结果] 在自建的PubMed文献数据集上,本联合用药知识发现方法获得94.29%的准确率,经过gpt-4.1大语言模型自动评估后的结果与人工标注一致率达到95.71%。[局限] 仅收集公开发表的科技文献开展了定量分析,缺少电子病历、药物不良反应报告等多类型数据的实验验证。[结论]融合深度学习与大语言模型的多层级架构,能够高效识别生物医学文献中的联合用药知识,满足下游任务对于大规模、结构化数据的高精需求,为精准医学中药物组合决策等应用提供了技术路径。

  • 王浩宇, 周裕林, 黄瑞章, 秦永彬
    预出版日期: 2025-12-31

    [目的]针对现有刑期预测模型在多被告人案件中法律知识整合不足、判决合规性差的问题,提出一种融合法律约束与知识驱动的刑期预测框架(KASP)。[方法]提出KASP框架,利用大语言模型拆解案件事实;解析罪名与法条,提取基础刑期区间作为结构化法律先验;通过一致性融合机制将先验融入轻量级预测模型训练过程,实现知识驱动的协同优化。[结果]实验结果表明,在CMDL-small数据集上,KASP相较于最优基线DeepSeek-R1-14B在准确率和F1值上分别提升了5.44%和4.18%,且在多被告复杂场景下表现更稳定。[局限]本文实验主要聚焦于从法理约束和裁量因子中提取基础刑期区间的知识建模,未涉及多罪并罚、跨法条竞合等更复杂的量刑规则处理。[结论]通过引入结构化法律先验知识,提升刑期预测模型在复杂案件中的性能与法律合规性。

  • 孙晓玲, 沈桐
    预出版日期: 2025-12-31

    [目的] 从知识元细粒度层面探索AI跨领域知识组合特征,融合多维特征提升组合预测效果。[方法] 提出一种基于图神经网络的跨视图对比学习模型GCN_Contrast,通过图对比学习和基于注意力机制的特征融合方法将多维特征有效结合,对潜在的跨领域知识组合进行预测。[结果] 以医学信息学领域为例,通过对比实验发现GCN_Contrast比传统GCN模型在p@500、p@100以及p@50指标中准确率分别提升了8.4%、16%以及20%,AUC值提高了3%。[局限] 目前知识元的特征选择较有限,知识元之间的关系还可以从引文网络角度进行挖掘。[结论] GCN_Contrast模型可以更精确地预测出AI跨领域研究中的知识元组合, 为推动AI与基础和前沿科学研究的深度融合提供决策依据。

  • 张可维, 尹静, 温福铨, 安小米
    预出版日期: 2025-12-31

    [目的] 面对AI-native领域技术快速迭代和应用场景多元化的带来的认知挑战,本文旨在通过国际标准化视角构建一个概念体系与成熟度演进框架,为理解 AI-native 的发展、评估其作为数据智能主体的行为质量及制定差异化监管策略提供理论依据。[方法] 采用文本内容分析法,对ITU-T SG13发布的34份国际标准文件进行分析。依据ISO 704:2022原则,构建基于“活动—结果”特征映射的成熟度演进框架;并选取协同智能体与垂直行业典型用例,分析其数据角色与行为评价模式。[结果] 研究识别了包含五类特征对象和两类特征的概念体系。建立了从“AI 辅助级”到“完全 AI 原生级”的三级成熟度演进框架。用例分析揭示了针对不同风险场景需匹配人机协同或AI 原生监管等差异化治理策略。[局限] 本文局限于标准化视角下的概念体系和成熟度演进框架构建。[结论] 本文构建的概念体系为理解 AI-native 的动态演进提供了标准化共识基础。研究表明,治理重心宜从性能效率转向语义准确性和伦理质量评价。建议采用分级监管策略,针对不同成熟度与风险等级的场景,采取差异化的监管手段。

  • 张競元, 杨磊, 刘寨义
    预出版日期: 2025-12-30

    [目的] 针对基于Transformer的模型计算复杂度高、多尺度特征提取能力有限,难以兼顾局部细节与全局上下文的问题,提出了一种多尺度轻量级注意力抑郁症识别网络(MLA-Net)。[方法] MLA-Net采用轻量级Transformer架构,结合全局双池化注意力机制提取视频特征以保留全局信息,再通过注意力机制建模时空长距离依赖,结合多尺度特征提取捕捉不同尺度信息,最后用交叉融合策略强化特征表达。[结果] 在真实世界抑郁症数据集上的实验结果显示,本方法平均绝对误差为4.90,均方根误差为6.88,优于现有方法,充分证明了其有效性与合理性。[局限] 目前的研究仅针对面部表情这一单一模态进行分析,没有结合语音、文本以及生理信号等模态。[结论] MLA-Net通过全局双池化注意力、多尺度特征提取和交叉特征融合的协同作用显著提升了模型性能。

  • 王楠, 王娟, 刘耀文, 潘杰, 夏一雪, 冼婷玉
    预出版日期: 2025-12-30

    [目的]针对现有AIGC图像溯源方法依赖单一视觉伪影且抗干扰鲁棒性不足的问题,设计了一种语义引导的多模态溯源方式。[方法]设计一种语义引导的主动式多模态融合方式。为解决多模态特征语义鸿沟问题,设计了从量化指纹到自然语言的语义映射机制。在此基础上,通过调整交叉注意力层的交互逻辑,以语义文本为主动查询,引导模型在深层特征空间中动态聚焦于关键伪影证据。[结果]在WILD和DRAGON数据集上F1分数分别达98.4%和69.6%。定量分析表明,相较于单模态视觉基线,该模型F1分数分别提升了5.9%和11.3%;相较于简单特征拼接基线,在复杂场景下的F1分数分别提升了3.1%和6.4%。[局限]规则化语义生成限制了自适应推理能力;对技术架构高度相似的同源模型区分度仍有待提升。[结论]语义引导的主动式多模态融合策略能有效整合正交证据,是提升复杂场景下AIGC溯源鲁棒性的有效路径。

  • 杜先进, 许彧祥, 付红
    预出版日期: 2025-12-26

    [目的]为提高企业技术创新合作伙伴识别的准确性和时效性,提出融合多模态特征动态图卷积网络的链路预测方法。[方法]提出基于注意力机制的专利合作网络节点拓扑、领域与语义特征融合模型,设计GCN-LSTM架构与滑动时间窗口策略捕捉网络动态演化规律,开展链路预测识别技术创新合作伙伴。[结果]基于我国新能源汽车2015-2024年专利数据集开展实证研究,本文方法各项指标均显著优于基线模型。其中AUC较次优模型EvolveGCN提升了5.0个百分点,达到0.858;F1值较次优模型DySAT提升了3.5个百分点,达到0.807。[局限]未能充分挖掘专利的引用关系、专利价值等特征;未结合企业的研发投入、市场表现等非专利的多源异构信息。[结论]本文方法有效捕捉专利合作网络的动态演化规律,并综合利用专利的多模态特征,能够为企业进行合作创新提供更精准、前瞻性的数据驱动决策支持。

  • 马亚坤, 孙颖, 胡广伟, 刘云
    预出版日期: 2025-12-26

    [目的] 面向个体化需求识别不足与居家慢病管理适配性有限的问题,探索构建融合多源健康数据与领域知识的慢病知识服务框架。[方法] 首先,结合用户生理数据,实现用户健康状态的动态评估与预警;其次,设计轻量化的用户需求预解析机制,通过对用户输入进行语义分析与结构化重构,结合健康标签与生理数据,提升大语言模型对个体化需求的理解与适配能力;最后,借助慢病知识库与图谱检索增强技术,部署面向特定疾病场景的领域模型,以提升模型的垂直化适配能力。[结果] 以糖尿病为例的实验表明,模型在诊断相关性、术语命中率及规范性评分的各项指标上均取得了更高的量化得分,为促进居家社区主动健康服务的智能化与精准化提供有益参考。[局限] 当前知识服务的内容主要是文本,未来考虑多模态数据以增强知识服务的全面性。[结论] 融合预解析与图谱检索增强的慢病知识服务框架能有效提升知识服务的准确性与规范性,为智能慢病管理提供了可扩展的技术路径。

  • 胡鑫欣, 邱芹军, 黄泽华, 鲁谢春, 崔倩娜, 马凯
    预出版日期: 2025-12-26

    [目的]针对现有的实体对齐方法依旧存在对知识图谱的结构信息和语义信息利用不充分而导致实体对齐效果不佳的问题,提出一种基于嵌入增强和实体-关系感知的实体对齐模型MuEmbedNet。[方法] MuEmbedNet模型通过为实体生成不同的嵌入表示,并利用注意力机制和双层改进的GCN网络实现实体的嵌入增强,进一步利用实体与关系的相互映射将图结构数据的关系特征融合到实体特征中以获取增强的实体嵌入表示。[结果]结果表明,MuEmbedNet模型在三个公开跨语言数据集上的平均Hits@1值、Hits@10值和MRR值分别达到89.3%、97.2%和92.1%,高于所有基线模型。相比于基线模型中平均最优表现,Hits@1值、Hits@10值和MRR分别提高了6.1%、0.5%和5%。[局限]模型在两个相同语种的实体对齐任务中表现较好,而在不同语言体系的实体对齐任务中存在局限性。[结论]通过嵌入增强和实体-关系感知网络能够充分学习实体的语义信息特征和结构信息,进而有效提升实体对齐任务的效果。

  • 张嘉程, 刘哲理, 肖光文, 聂力海, 王永昌, 史良, 金美宏
    预出版日期: 2025-12-26

    [目的]针对大语言模型价值观对齐评测体系碎片化、中国特色价值覆盖不足、深度评测数据稀缺及评测方法滞后等问题,构建面向大语言模型的价值观对齐评测方法与技术。[方法]提出价值规则、评测数据、智能技术三位一体的融合方法体系。在此框架下,设计“能力—任务—指标”三维评测体系,进行数据采集、增广与标注,构建深度评测数据集。最终结合预训练模型、指令微调与专家反馈,训练出价值观评测模型。[结果]构建的评测模型准确率为98.57%,实现了对大语言模型价值观对齐水平的自动化评测。实证结果表明,国产模型总体对齐度高于国外模型,但仍普遍存在红色文化语料不足、事实性与幻觉性虚假信息、意识形态淡化、过度审查及动态适应性弱等问题。[局限]研究主要面向文本型大语言模型,对多模态模型的适用性不足;同时,评测结果以高、中、低呈现,可解释性有待提升。[结论]本研究有助于健全具有中国特色的价值观对齐治理体系,保障大语言模型在安全、可信和可控的框架内健康发展,同时也为推动我国主流价值观在经济发展和社会治理中的有效落实提供技术支撑。

  • 薛增灿, 张晓冉, 陈佳锐, 刘海, 谭俊
    预出版日期: 2025-12-26

    [目的] 总结国内外知识图谱补全技术的研究现状,为促进知识图谱补全技术深入研究提供理论基础。[文献范围] 以“Knowledge Graph Completion”“Link Prediction”“知识图谱补全”“链接预测”等为关键词,在Web of Science、Google Scholar和中国知网等权威数据库中检索,筛选出代表性文献130篇。[方法] 基于文献调研与归纳总结方法,分别从推荐模型、结果评价、未来展望三方面对相关研究进行综述与评价。[结果] 基于关系语义的知识图谱补全模型可以划分为面向复杂关系语义建模、面向连接关系语义建模和面向隐含、异质、稀疏关系语义建模的知识图谱补全模型。针对MRR指标,面向稀疏关系语义建模的SimKGC模型在WN18RR数据集上提高了4.9%(0.666 vs 0.617),面向连接关系语义建模的DaBR模型在FB15k-237数据集上提高了3.4%(0.510 vs 0.476)。[局限] 部分新兴技术缺乏大规模基准试验,由于研究领域广泛,文献众多,未能涵盖所有相关研究。[结论] 相比传统方法,前沿技术具有更好的图谱补全性能,但是模型可解释性、可扩展性不足,多模态和时序数据融合困难,大语言模型存在幻觉风险,这也是未来研究要解决的问题。

  • 陈先来, 许安明, 李陈鹏, 朱泽林
    预出版日期: 2025-12-26

    【目的】解决医学影像报告中临床描述和医学影像中病灶对象之间的语义对齐问题,从而提高两者之间的对应关联性。【方法】提出了一种基于解剖信息增强的医学视觉定位方法(AEMVG),通过解剖先验知识指导模块(APKG)和正常特征增强病灶定位模块(NELG)来提高医学视觉定位能力。APKG为训练样本生成引导标签,使模型能够更准确地理解解剖结构信息,从而在全局范围内缩小定位搜索空间,降低全局定位不确定性。NELG将正常解剖特征作为负样本来提升模型识别病灶的能力,缓解局部定位不确定性。【结果】MS-CXR数据集上的实验显示,AEMVG的ACC和mIoU分别为0.7246和0.6079,相对于基线模型分别提高了3.7%和4.1%,且可视化分析显示其解剖定位与病灶识别更符合临床诊断逻辑思维。【局限】本方法仅在X光影像上进行了验证,对于CT、MRI等类型的医学影像还有待测试。【结论】AEMVG可有效增强医学视觉定位模型在解剖认知和病灶区分方面的能力,提高临床描述与病灶对象之间的关联性能。

  • 彭明阳, 高岩, 赖宇乔
    预出版日期: 2025-12-26

    【目的】针对恶性模因检测中标准分类损失忽略类别间有害程度递进关系、对称惩罚机制与内容审核实际需求相悖的问题,提出序数感知层次化融合网络(OAFHN)。【方法】首先设计序数感知与误报惩罚损失函数(OPP-Loss),将分类问题重构为序数回归并对误报施加非对称惩罚;其次构建层次化多路径融合网络,利用视觉语言模型生成语义释义作为知识输入,通过粗粒度融合、语义调制注意力和低秩双线性池化实现多粒度特征建模。【结果】在Harm-C和Harm-P数据集上,OAFHN的F1分数达到83.46%和88.39%,较现有方法分别提升0.66和0.13个百分点。消融实验验证了OPP-Loss和层次化融合架构的有效性,其中OPP-Loss贡献最为显著,F1分数提升超过8个百分点。【局限】误报惩罚因子需人工调优,序数映射为静态设定,未充分刻画“部分有害”类别的内部异质性。【结论】从优化目标层面直面任务挑战,结合多粒度特征融合与外部知识注入,可有效提升恶性模因检测的鲁棒性与准确性。

  • 邓君, 叶东宇, 邢艺丹, 张琪
    预出版日期: 2025-12-26

    [目的]为提高方面级情感分析(Aspect-Based Sentiment Analysis, ABSA)模型的可解释性和隐性情感分析能力,提出一种基于有监督微调和强化学习的可解释ABSA方法。[方法]首先,基于DeepSeek R1模型构建了推理数据集;其次,对LLMs进行有监督微调以提高模型的格式化输出和情感分析能力;最后,使用强化学习优化模型推理过程并提高ABSA准确率。[结果]所提方法在公共数据集SemEval 2014上F1值较SOTA模型提高1.26%,隐性情感分类准确率提高3.18%。[局限]仅对方面级情感分类任务进行了实验,尚未扩展到更为复杂的情感信息抽取等任务。[讨论]强化学习能有效优化模型的推理解释过程,且提高了模型的隐性情感分析能力;合理的复合奖励函数对于模型优化至关重要;所提方法在中英文数据集上具有良好稳健性。

  • 马延周, 罗云, 吴圣意, 朱琪
    预出版日期: 2025-12-26

    [目的]针对中文社交媒体面向话题的讽刺识别任务,现有大语言模型存在易将强硬立场或负面情绪误判为讽刺的过度敏感问题。[方法]本文设计了一个双路径推理框架,归纳路径通过检索附带理论解释的相似案例。演绎路径引入基于不礼貌理论的分层判断框架,设计了从情感筛选到意图分析的分层判断提示。最终通过决策融合模块综合双路径证据生成判断。[结果]在公开基准数据集ToSarcasm上的对比实验显示:以DEEPSEEK-V3.1为基础模型,本文方法的F1值为83.25%,较最优传统基线模型提升10.44个百分点;宏F1值为76.45%,较最优传统基线模型提升14.63个百分点。[局限]研究主要在中文语境下进行,跨语言通用性有待验证。演绎推理框架虽提升可解释性,但其决策仍依赖于模型的内部机制。[结论]所提出的理论指导下的双路径推理框架,能有效提升大语言模型识别话题讽刺的鲁棒性与均衡性,为解决复杂语用推理任务提供新方法。

  • 宋文杰, 王亮, 许潮, 郑智帅, 朱欣娟
    预出版日期: 2025-12-26

    [目的]为促进博物馆文物及历史文化知识的传播与传承,提出一种结合知识图谱(KG)与检索增强生成(RAG)的文化史料知识问答系统构建方法。[方法]首先针对文化史料语料库文本包含大量生僻字和文言文的特点,研发了生僻字词典和文言文对照辞典,构建文言文翻译工具,减少大语言模型(LLM)处理历史文献时的错误信息生成;其次提出了一种基于提示学习融合文本矢量化相似性检索和知识图谱检索的有效方法,精心设计了不同任务的提示模版,实现高效的知识推理和用户交互;以秦文化史料为例,构建了秦文化知识问答系统(ChatQDC)。[结果]实验表明,ChatQDC相比于ChatGPT-4、ChatGLM3-6B和DeepSeek-R1-8B,问题回答的准确度分别提高了约8%、20%和31%。

    [局限]当前系统主要面向包含史料知识的文本构建,未来需进一步拓展涉及图片、表格等多模态历史资料数据的检索及问答处理方法。[结论]相比传统的专业数据微调方法,该系统LLM无需重新训练即可部署,实现了低成本低功耗的垂直领域应用。

  • 俞超, 梁旭栋, 张彤阳, 徐健
    预出版日期: 2025-12-26

    [目的]突破学科壁垒,挖掘学科间共性知识以搭建跨领域对话桥梁。[方法]剖析现有跨学科共性知识案例的引文语境,提炼出共被引模式,从海量引文内容数据集中提取模式并结合共通性、跨学科性、新颖性指标识别潜在价值共性知识。[结果]从5300万条引文记录中确定1044对候选跨学科知识对,对7个跨学科性、共通性和新颖性得分高的案例展开分析,挖掘学科问题在基础方法论层面的交叉点。[局限]目前运用的句法模式数量有待扩充,跨学科共性知识实例的获取仍有拓展空间。[结论]构建的基于引文语境分析的方法为学科间共性连接提供新路径范式与方法论。

  • 张云秋, 殷策
    预出版日期: 2025-12-26

    [目的]解决MoE(Mixture-of-Experts)大语言模型在参数突变问题中因知识固化与推理线性化导致的性能瓶颈。[方法]提出融合动态知识验证与多智能体协同的优化框架,构建基于知识验证的智能体博弈机制,结合注意力引导的拓扑重组与弹性资源分配策略,优化模型非线性推理能力。以DeepSeek-R1-8B为基线模型,采用渐进式知识蒸馏方法,在医用物理学与材料科学领域的参数突变问题集上进行实验验证。[结果]优优化后的模型在测试集上平均得分为87.18分,较原始8B模型提升11.12分,整体性能优于仅依赖Prompt提示的671B模型。[局限]训练数据集中于特定领域,模型对跨领域参数突变问题的泛化能力仍有限。[结论]本研究提出的框架通过智能体博弈实现MoE架构大模型的动态知识验证,有效提升了模型在复杂参数突变场景下的推理能力,为相关研究提供了可借鉴的技术路径。

  • 敖宇轩, 王昊, 周抒, 布文茹
    预出版日期: 2025-12-26

    [目的]面向诗歌语义抽象与艺术性不足的问题,提出兼顾语义对齐与美学表现的诗歌到图像生成方案。[方法]构建“深度语义理解-多模态意象空间-多阶段协同生成”框架,以预训练语言模型+多任务学习抽取情感、意境、修辞并与视觉对齐,最终以三阶段条件扩散完成生成。[结果]在自建的 Poetic Visions 数据集(3124 首诗、4212 幅图像)上,与GPT-4o + DALL·E 2等基线相比,本方法在 IS(26.87 vs 25.32)、FID(14.98 vs 15.75)、CLIP Score(0.72 vs 0.68)与人工得分(3.7 vs 3.3)上相对最佳基线平均提升约6%。[局限]多阶段流程对早期构图输出存在依赖,偏差可能向后传导;对长篇或高度抽象诗歌的细粒度控制与稳定性仍具挑战。[结论]语义引导与协同生成机制有效提升诗—图语义对齐与艺术表达,具备在数字人文与创作场景的应用价值。

  • 韩明星, 林立涛, 欧石燕, 许莉薇
    预出版日期: 2025-12-26

    [目的] 为解决现有研究忽视内容特征的细微差别以及未能构建有效的多源特征融合框架。[方法] 通过LLM2Vec嵌入用户生成内容以捕捉细微差别;构建六类特征体系(用户、好友、时间、内容、情感、AI)并利用混合专家系统的路由网络分配特征至对应专家网络,最终由特征融合层整合多源输出。[结果] 在Twibot-20和Twibot-22数据集上,本文的模型在精度上比其他模型分别至少高了1.70%和4.45%,具有一定的优越性。[局限] 未考虑潜在的对抗攻击;未考虑对社交机器人误判的道德伦理问题。[结论] 本研究为维护健康的网络生态提供了有力的技术支持。

  • 裘靖文, 王昊, 杨思敏, 姚天辰, 谭玉瑶
    预出版日期: 2025-12-26

    [目的] 历史人物是历史舞台上的重要角色,更是历史的缩影,全面客观地还原历史人物形象,对于把握历史事件关联,理解历史发展趋势具有重要意义。[方法] 本文提出了一种融合事件情感分析的历史人物画像生成框架,主要包括历史人物事件集构建、历史事件多标签分类与历史人物事件情感识别,在此基础上,本文从事件分类情况、事件情感与评价情感匹配情况,以及事件情感演化趋势三个方面对历史人物进行了分析。[结果] 本文提出的人物行为单元识别模式ISSI-RM平均1句话可以识别得到3组左右FBU,且能够有效解决实体指代不明、实体指代错误的问题;提出的ABG-MLC 模型在事件多标签分类任务中,F1值达0.8,超出基线模型0.14;在完成历史事件抽取与分类后再通过提示学习的方法进行事件情感识别,识别效果最佳,证明了本文识别流程的有效性。研究发现,多标签事件中“政治能力+军事能力”复合标签占比最高,本纪中此类复合标签多集中于定鼎帝王,列传中则多集中于谋士人物;本纪与列传人物事件情感和评价情感匹配度差异显著,但高度重叠中均以积极情感为主导类型;人物事件情感时序轨迹可聚类为四类典型模式。[局限] 后续可进一步扩充语料,开展跨时域人物对比分析。[结论] 本文借助数字技术将事件情感分析融入历史人物画像生成,解决了传统历史人物研究在规模化与客观性方面的难题,为历史人物研究提供了全新视角,也为史籍文献的深度挖掘与文化资源转化提供了实践参考。