期刊首页 在线期刊 最新录用

最新录用


说明:最新录用文章, 内容和格式将与印刷版一致(除了页码), 您可以通过doi直接引用。

Please wait a minute...
  • 全选
    |
  • 肖奎, 王自明, 郑乐乐, 张淼, 李志飞, 张䶮, 陈昊, 王时绘
    预出版日期: 2025-09-25

    [目的]现有的认知诊断方法过于依赖知识概念之间的先决关系与相似关系,导致认知诊断模型在教育领域中面临自动化建模困难、关系稀疏及评估标准缺失等挑战。为解决这些问题,本研究提出了一种基于知识概念共现关系的多层图对比认知诊断模型。[方法]首先,本研究基于概念共现关系和相关共现关系构建知识概念双图谱;其次,采用多层图对比学习方法实现跨图概念节点嵌入的迭代增强;最后,将增强概念嵌入与学生-习题交互特征融合输入诊断函数中生成诊断结果。[结果]在ASSISTments09、MAT2016和EdNet-1三个真实教育数据集上的实验表明,该模型构建的CO-IRT、CO-SCD的准确率分别达到72.05%、70.70%,与其基线模型相比提升达到3.5%、1.1%,在CO-NCD中AUC达到76.40%,较其基线方法提升1.5%,且可解释性均优于基线模型。[局限]当前方法在处理试题结构相对简单、仅涉及单一知识点的场景时,可能无法充分发挥共现关系建模的优势。[结论]基于概念共现关系的多层图对比认知诊断模型通过知识概念关系图构建与自适应的对比增强机制,有效捕获知识点间复杂的关联特性,实验结果证明了模型显著提升了知识状态预测的准确性。

  • 肖克江, 陈亮, 方铄, 庞世燕, 邱杰凡, 董亚宁, 杨文齐, 郭山锋
    预出版日期: 2025-09-23

    [目的]针对在线课程推荐存在数据稀疏、冷启动和特征利用不充分的问题,本文提出了一种融合课程知识图谱与图注意力网络的推荐模型(CKGAT)。[方法]CKGAT的学习者模块通过特征交叉层和全连接层分别提升学习者特征的记忆和泛化能力,课程模块基于图注意力网络挖掘课程实体间的高阶语义特征。本文对两个模块的输出向量进行点积计算后,得到推荐结果。[结果]在基于MoocCubeX数据集的对比实验中,CKGAT在ACC、F1和AUC指标上相较于最好的基线模型分别提升了1.28%、1.62%和1.00%。[局限]本文的课程知识图谱略显单薄,模型的计算复杂度可进一步优化。[结论]本文提出的CKGAT取得了较好的推荐结果,有助于提升在线课程推荐效果。

  • 朱侯, 谭雅文, 吴子帅
    预出版日期: 2025-09-23

    [目的] 本研究旨在建立基于自然语言处理技术的隐私协议违规检测方法和体系,实现自动化、智能化识别违规内容及其法规语义解释。[方法] 梳理《GB/T 35273-2020 信息安全技术个人信息安全规范》,提炼19项隐私协议核心内容及 32 项具体要求,基于文本分类、命名实体识别和 QLora 微调大语言模型技术,搭建并训练隐私协议核心内容识别抽取与违规检测模型。[结果] 实验结果显示,微调后的Gemma-2b模型在违规检测任务中表现优异,在数据集一表现最佳,显著优于ChatGLM2-6b模型(F1值0.7647 VS 0.3735)。同时,Gemma-2b模型在生成合规性解释方面,BERTScore评估得分也优于ChatGLM2-6b(F1值0.8054 VS 0.7440),表明其解释质量更优。[局限] 标准通用性导致特定场景检测颗粒度不足,且模型输入长度限制影响上下文语义完整性。[结论] 本研究提出的技术框架能够快速识别隐私协议的核心内容并进行可解释的违规检测,增强了对隐私协议中相关法律法规落实情况的监督和监测能力。

  • 傅柱, 邱畅唱, 刘鹏
    预出版日期: 2025-09-23

    [目的]为数据稀缺的垂直领域实体识别提供新的解决方案。[方法]采用大模型多轮提示方法,整合实体定义、核心示例、知识增强、错误修正四轮提示;以中文船舶故障领域为例,选取5种主流大模型在自建语料和CCKS2017数据集上进行实验。[结果]在自建语料和CCKS2017数据集上DeepSeek的实体识别性能均最优,F1值分别达到90.62%和90.36%。[局限]自建语料规模较小,人工提示可能存在主观偏差。[结论]不同大模型实体识别效果差异较大;核心示例相比随机示例对模型增益效果更强;每轮提示均有一定增益效果,多轮提示增益效果最大;所提方法具有较好性能和稳健性。

  • 吴红, 张力, 万思涵
    预出版日期: 2025-09-23

    [目的] 探讨影响在线医疗团队绩效的多种条件因素如何通过不同组合实现高或非高绩效。[方法] 以好大夫在线平台为研究背景,首先利用NCA方法检验单个条件变量对结果变量的非必要性,其次通过fsQCA方法对高在线医疗团队绩效和非高在线医疗团队绩效分别进行组态分析,最后通过动态fsQCA方法探究高在线医疗团队绩效组态的动态演变规律。[结果] 8个条件变量均不构成单独影响高或非高在线医疗团队绩效的必要条件,同时存在4种导致高在线医疗团队绩效产生的组态模式及3种导致非高在线医疗团队绩效产生的组态模式,而高在线医疗团队绩效的组态模式在不同时间阶段具有差异。[局限] 仅获取了单个在线医疗平台的二手数据,一定程度影响了研究结论的可推广性,未来研究可以考虑在其他在线医疗平台和互联网医院开展。[结论] 高或非高在线医疗团队绩效的组态验证了复杂性理论的4个原则。研究结果有助于平台决策优化资源配置,为在线医疗团队组建和运营提供理论依据和实践指导。

  • 段宇锋, 谢佳宏, 柏萍, 龚天阳
    预出版日期: 2025-09-23

    [目的]探讨在具有较高专业性和领域特色的中文医学文本实体关系抽取任务中,大模型提示工程方法能否替代经典深度学习模型。[方法]本研究使用GLM-4、ERNIE-4-Turbo、DeepSeek-R1三种大模型和CBLUE、CasRel、GPLinker三种经典深度学习模型,通过改变需要抽取的关系类型数量、大模型Prompt中的示例数量,以及经典深度学习模型的训练数据规模,系统比较基于提示工程的大模型与经典深度学习模型的性能差异。使用bert-base和roberta作为经典深度学习模型的编码器。[结果]在CMeIE-V2数据集上的实验结果表明:(1)roberta-CBLUE和roberta-GPLinker的抽取效果最好,在抽取1种关系类型时F1值达到0.5826和0.5853,抽取10种关系类型时F1值为0.5112和0.4934;(2)大模型不擅长同时抽取多种关系。GLM-4、ERNIE-4-Turbo和DeepSeek-R1抽取2种关系类型的F1值比抽取1种关系类型时分别下降0.1182、0.0885、0.1310;(3)在Prompt中添加示例可以提高大模型的抽取效果,但示例数量并不是越多越好。[局限]本研究仅在单一数据集上进行实验,未来可拓展至更多领域的数据集。[结论]大模型提示工程方法目前难以替代经典深度学习模型,仅能够在标注样本较少时作为备选项。

  • 刘耀, 吴雅妮, 肖正
    预出版日期: 2025-09-23

    [目的]针对医疗数据碎片化、知识关联弱及传统知识库泛化不足问题,利用认知图谱技术实现医疗知识整合与结构化表达,构建动态推理向量知识库,提升临床决策精准性。[方法]提出一种医疗领域认知图谱构建及向量知识库生成方法。先基于多元异构数据设计联合抽取模型,构建多层次医疗概念知识网络,再提出融合蒙特卡洛树搜索与对抗学习的向量知识库生成框架,动态优化诊疗路径决策以捕捉实体间复杂关系。[结果]实验表明,命名实体识别任务中Bart模型的F1-score达0.9974;对抗学习过程中推理准确率从67%提升至99%,验证了模型的推理增强能力。[局限]本研究的实验验证主要基于皮肤病数据,且训练数据以中文医疗文本为主,对多语言医疗数据及极少数最新医学术语的适应性有待提升。[结论]本研究解决了传统知识库关联弱、泛化能力不足的问题,为临床诊疗提供了精准的知识支持。

  • 杨亮亮, 姚双, 李跃艳, 杨玉香
    预出版日期: 2025-09-23

    [目的]通过节点多维属性嵌入与边自表示增强,提升链路预测精度,精准识别领域技术机会。[方法]提出一种基于GCN两阶段特征构造的链路预测模型识别潜在技术机会,第一阶段学习节点嵌入表示,第二阶段强化边的表征;利用市场需求、技术竞争与政策导向匹配技术适用场景。[结果]所提链路预测模型相比第一阶段仅凭GCN节点嵌入特征F1分数提升约30%,较第二阶段仅依赖相似性特征提升约10%;结合三维评价模型,共识别出4类、34对技术机会;敏感性分析锁定5种机会的应用场景,增强新能源汽车领域技术机会识别的适应性与可信度。[局限]仅聚焦于新能源汽车技术领域,普适性和迁移性有待提升;技术机会识别侧重单一主题对,缺乏多主题复杂组合建模;亟需结合国际数据与跨领域研究进一步验证方法的通用性。[结论]结合链路预测与多维指标评价方法,能够更精准、细粒度的识别技术机会。

  • 窦路遥, 王泽昊, 曲景辰, 周志刚, 戴隆政
    预出版日期: 2025-09-23

    [目的] 解决多机构在数据融合层面上的数据利用效率和隐私保护问题,提升多机构间数据融合的实用性和安全性。[方法] 提出一种融合云边协作和联邦学习的多机构数据融合模型(CEFDFM-MI)。在云边协作流程中,设计了云边预算分配机制和信息增益值评估机制来确保多机构数据融合的高效性,结合联邦学习中分布式技术特点保障多机构间数据融合的安全性。在MNIST、CIFAR-10与CIFAR-100数据集上设置独立同分布场景和低、中、高异质性的非独立同分布场景,测试模型在各种复杂场景下的表现。[结果] 在独立同分布场景中,CEFDFM-MI模型的准确率最高可达94.52%,在非独立同分布低、中、高场景中该模型的F1值最高可达73.71%、74.51%、73.45%;面对边缘端模型的异构性,CEFDFM-MI模型的准确率较之各边缘端独立训练平均提升约6%-8%。[局限] 尚未考虑云端与边缘端模型目标不一致的情况,模型的应用场景复杂度有待提升。[结论] 在多机构数据融合场景中,CEFDFM-MI模型较之FedAvg、FedProx等基线更具全局优势;该模型具备较强的模型异构性处理能力。

  • 孟佳娜, 马腾飞, 赵迪, 刘爽, 王博林
    预出版日期: 2025-09-23

    [目的]旨在解决现有多模态谣言检测中模态间关系挖掘不足问题并自适应地聚合单模态和多模态特征。[方法]提出了一种基于多模态自适应特征融合的谣言检测模型。首先分别利用预训练的BERT和EfficientNet模型来提取文本和图像特征;然后使用多模态协同增强网络生成模态间的互补增强信息;接着通过跨模态相似性学习网络自适应地聚合单模态特征和多模态融合特征;最后将聚合后的特征输入谣言检测网络进行检测;同时使用领域判别网络学习不同事件的通用表示。[结果]实验结果表明,在Twitter和微博两个公开数据集上,本文所提方法的准确率分别达到了91.4%和90.3%,优于所对比的基线模型。[局限]模型仅使用文本和图像数据进行谣言检测,未能融合帖子中可能附加的视频或音频等信息。[结论]本文模型可以充分挖掘模态间的关系并自适应地聚合单模态和多模态特征,从而提高检测的准确性。

  • 宋鋆, 何凡, 保智杰, 赵玲君, 魏忠钰
    预出版日期: 2025-09-23

    [目的]本研究旨在通过推理链蒸馏方法,训练具备联合任务深度思考能力的大语言模型,用于司法审判中的罪名预测任务。[方法]本方法首先利用具备深度思考能力的教师模型构建推理链蒸馏数据集,并通过大模型推理流程对推理链进行校正与优化。随后,训练学生模型学习罪名的推理过程与预测结果。[结果]在Criminal-S罪名预测数据集上,本模型性能超过当前最优基线,且仅以7B参数量超越了671B教师模型,在罪名预测和罪名属性预测任务中的F1值分别提升0.2%和18.3%。[局限]该模型尚未考虑案件中可能存在的多个被告和多种罪名的复杂情况。[结论]本模型在罪名推理能力上优于现有方法,在罪名结果预测任务中表现出较好的准确性和可解释性。

  • 卢新元, 徐安琪, 张进澳
    预出版日期: 2025-09-23

    [目的]探寻可解释性和解释精度与用户信息行为的作用关系,优化多场景适用的可解释设计。[方法]通过两个不同情境的平行实验,研究分析了人工智能可解释性、解释内容关联度对个体信息采纳的影响,以及进一步探讨了不同任务信息需求情境下人工智能“解释奇点”的变化规律。[结果]人工智能的可解释性对个体信息采纳具有显著影响,其具体的影响关系受制于内容关联度的制约;“解释奇点”是可解释设计作用信息采纳行为的转折点,不同任务情境下“解释奇点”存在一定变化。该发现不仅拓展了解释合理性与人类偏好对齐的研究视角,也揭示了解释关系与内容关联度在驱动用户信息采纳中的关键作用,强调其对用户信息采纳行为的边际影响。[局限]未能考虑虚假信息的存在,对XAI与个体信息采纳“效果”的揭示较为有限。[结论]多情境视角下揭示AIGC解释信息采纳机制差异,挖掘了“解释奇点”的变化规律。

  • 韩明星, 许莉薇, 李佳轩
    预出版日期: 2025-09-23

    [目的] 针对现有多模态虚假信息检测研究在前景-背景特征和外部特征的自适应调整机制等方面的不足,本研究提出了基于对比驱动特征增强的多模态虚假信息检测模型。[方法] 采用语义解耦模块分离新闻图片的前景主体表征与背景上下文信息,用于指导多级特征融合和关键特征增强;使用熵权法结合新闻评论中的人群反馈特征,实现外部特征权重的自适应调整机制。[结果] 所提出的模型在私有和公开数据集上的精确度分别提升了1.21%和1.58%,具有一定优越性。[局限] 对比驱动特征融合使得模型的复杂度与硬件要求显著上升;性能表现依赖人群反馈特征的质量;未考虑视频、语音等其他模态信息。[结论] 模型可以为社交媒体平台和政府监管部门在检测虚假信息方面提供技术支持。

  • 香前, 才藏太, 李措, 马登豪
    预出版日期: 2025-09-12

    [目的]本研究旨在解决传统Transformer模型在藏文新闻生成任务中面临的局部特征提取不足和解码冗余等问题,以提升藏文新闻文本的生成质量、细节表达能力和语义连贯性。[方法]利用标题和提示词作为关键输入,增强对文本主题的理解;在编码器中,Transformer捕捉标题全局特征,CNN提取提示词局部特征,通过加权融合形成精细的文本表示;解码器采用混合策略和自回归机制,逐步生成与输入紧密相关的新闻内容,减少冗余并提升文本的自然度和连贯性。[结果]在自建的藏文新闻生成数据集上BLEU、ROUGE和Distinct指标分别达到了38.9%、35.8%和47.2%的效果,相对于对比模型有显著提升。[局限]本研究目前主要针对藏文新闻生成任务,尚未验证其在其他藏文文本生成场景(如文学创作、技术文档)中的适用性。此外,模型的计算效率和资源消耗仍需进一步优化。[结论]通过创新性地结合全局与局部特征提取以及混合解码策略,显著提升了藏文新闻生成的质量和细节表达能力,为藏文自然语言处理领域提供了一种创新性解决方案。

  • 姚建军, 庄自聪, 李瑞生, 杨敦舜, 张家铭
    预出版日期: 2025-09-12

    [目的]实现中文司法领域裁判文书高质量实体关系联合抽取任务,提升三元组抽取准确性。[方法]提出了基于CasRel实体特征敏感注意力机制的联合抽取模型S-CasRel-MF。模型引入LERT中文编码器增强对中文裁判文书复杂的语义建模能力,结合自注意力机制与BiLSTM提升实体在上下文交互特征的捕获能力,通过联合领域特征词典和多头注意力机制解决主客体抽取误差传播问题,利用Focal Loss损失函数缓解解码中样本不平衡问题。[结果]实验结果表明,S-CasRel-MF模型在涉毒类和盗窃类两类数据集中的F1值分别达到83.51%和83.40%。相较于CasRel,F1值分别提高了9.77%和8.73%;相较于其它类型的抽取模型,F1分别平均提高了16.59%和15.70%。[局限]本文模型的时间复杂度较高,且外部法律实体特征词典在跨领域迁移时面临词典覆盖不足,影响模型效果。[结论]S-CasRel-MF模型能更好捕捉裁判文书中实体间的复杂关系,在实体关系的联合抽取任务中有显著性能优势。

  • 武晖栋, 苏秋丹, 吴登生
    预出版日期: 2025-09-12

    [目的] 有效整合带有并列排名的期刊评级结果,反映学术界对出版物质量的总体评价。[方法] 提出了一种基于线性伪布尔优化模型的期刊评级聚合方法(LPBO),将不同的原始评级结果转换为期刊间的成对比较,利用广义Kendall-τ距离构建线性伪布尔优化模型,在保证期刊评级唯一性和传递性的约束下,实现评级结果的聚合。[结果] 通过对信息科学与图书馆学领域期刊的实证研究发现,LPBO聚合结果与原始评级的相关系数较原始评级自身之间的相关系数提升13.7%,并保留了并列排名信息。该模型在处理不同尺度、不完整的数据以及期刊和评级数量不同时均表现出良好的稳健性。[局限] 在处理大型数据集时可能会面临效率低下的问题。[结论] LPBO方法避免了严格排序所带来的人为误差,为期刊质量与影响力评价提供了一种公平且稳健的解决方案,具有重要的理论与实践价值。

  • 王贤文, 尹逸贤, 耿屿, 余芊芊, 张光耀
    预出版日期: 2025-09-12

    [目的] 以专利-论文引用关系为视角,探究科学论文的颠覆性与其技术影响之间的关系,丰富科学知识流向技术领域的影响因素研究。[方法] 基于人工智能领域发表的68万余篇科学论文,结合专利引用数据,构建了大型的数据集,应用Probit等回归模型,从可能性、重要性、广泛性、持续性和时滞性5个维度开展分析。[结果] 研究发现,论文的颠覆性程度与其被专利引用的可能性存在正向关联,说明颠覆性更高的科学知识更容易产生技术影响。同时,颠覆性更高的科学成果能够产生更重要、更广泛和更持续的技术影响,以及具有更短的技术影响时滞。[局限] 未考虑引用的动机与类型,未对引用论文的专利特征进行分析。[结论] 本文证实了科学论文的颠覆性与技术影响之间的正相关关系,为促进科学知识的技术转化的政策制定提供了一定的理论依据。

  • 杨睿, 朱学芳, 王震宇
    预出版日期: 2025-09-12

    [目的] 基于思维链提示探究大语言模型在多模态实体消歧任务中的可用性及有效性。[方法] 构建基于思维链提示的大语言模型提示模板,将先验知识与多模态信息输入大语言模型中,辅助模型从候选实体集中判断出提及准确指代的实体。[结果] 实验表明,在Wiki-MEL、Twitter-MEL和Weibo-MEL三个数据集中,与当前最先进的模型相比,PLMED模型的准确率分别提升了15.1%、11.5%和4.1%。[局限] 实验未详细探究不同提示词构造方法下大语言模型在多模态实体消歧任务中的性能变化。[结论] 基于思维链提示的大语言模型能够更好地适应于不同情景下的多模态实体消歧任务,大语言模型在多模态实体消歧任务中具有巨大的应用潜力。

  • 王震宇, 朱学芳, 张君冬, 杨睿, 刘崧印
    预出版日期: 2025-09-12

    [目的] 为满足图书检索场景下用户日益多元化与个性化的信息需求,提升问答系统的性能与用户体验。[方法] 本文构建了一种面向书目检索的对话式问答系统(BSCQA)。该系统采用模型上下文协议实现大语言模型与外部数据库的集成。为提升Text-to-SQL生成的准确性,本文设计并集成了一种基于对比学习的示例选择策略,以增强模型对专业领域查询意图的理解。[结果] 在本文构建的书目搜索语义解析数据集上的实验结果表明,相较于零样本场景,采用本文方案的DeepSeek-V3模型在5-shot场景下将执行准确率提高了18.5个百分点。[局限] 由于实验数据集覆盖范围的局限性,系统在跨领域应用中的适应性仍需进一步提升。[结论] 本文构建的BSCQA系统展示了大语言模型在书目智能检索这一图书情报领域典型应用场景中的潜力与应用价值,为其他垂直领域对话问答系统的研究与应用提供了参考。

  • 王震宇, 朱学芳, 张君冬, 杨睿, 刘崧印
    预出版日期: 2025-09-12

    [目的] 为满足图书检索场景下用户日益多元化与个性化的信息需求,提升问答系统的性能与用户体验。[方法] 本文构建了一种面向书目检索的对话式问答系统(BSCQA)。该系统采用模型上下文协议实现大语言模型与外部数据库的集成。为提升Text-to-SQL生成的准确性,本文设计并集成了一种基于对比学习的示例选择策略,以增强模型对专业领域查询意图的理解。[结果] 在本文构建的书目搜索语义解析数据集上的实验结果表明,相较于零样本场景,采用本文方案的DeepSeek-V3模型在5-shot场景下将执行准确率提高了18.5个百分点。[局限] 由于实验数据集覆盖范围的局限性,系统在跨领域应用中的适应性仍需进一步提升。[结论] 本文构建的BSCQA系统展示了大语言模型在书目智能检索这一图书情报领域典型应用场景中的潜力与应用价值,为其他垂直领域对话问答系统的研究与应用提供了参考。

  • 蔡谋熙, 孙海春
    预出版日期: 2025-09-12

    [目的]通过增加外部知识以及优化大语言模型(LLM)提示方法,解决视觉问答(VQA)任务多步推理准确率低的问题。[方法]提出一种新的知识型视觉问答模型,通过引入PromptCap字幕模型生成图像字幕帮助LLM理解图像区域信息,融合开源与图片语义知识检索增加推理来源。同时,提出了新的问题分解方案降低推理难度,构建了相关上下文示例并集成多个推理答案以提升准确性。[结果]本文模型在OK-VQA和A-OKVQA数据集上分别达到了67.2%和64.8%的准确率,优于当前SOTA模型。消融实验也验证了模型中各个模块的有效性。[局限]本文模型更适用于需要多步推理VQA场景。原因是模型中的问题分解模块会增加计算和时间开销,导致解决简单VQA问题的效率较低。[结论]模型通过借助LLM优化KB-VQA框架,为多步推理的知识型视觉问答提供了一种有效的新思路。

  • 陈丹蕾, 化柏林
    预出版日期: 2025-09-12

    [目的]探索研究空缺句的“句法形式-修辞功能”映射关系,融合多层次语言学特征,扩展学术文本句子级知识抽取新思路。[方法]依据有效性、冗余性和互补性集成句法复杂度指标体系,采用方差分析与线性回归刻画不同类型研究空缺句的句法复杂度差异。微调科学语言模型提取文本语义特征,通过门控机制自适应融合句法与语义信息进行研究空缺句自动分类,引入动态加权交叉熵与Dice Loss的混合损失函数,提升模型对少数类样本的识别能力。[结果]在句法复杂度概念的不同表征维度下研究空缺句类间差异显著。基于门控机制的句法与语义融合分类模型在F1值指标上相较于先进基线方法至少提升1.44%,消融实验结果表明该模型中关键组件的必要性和合理性。[局限]仅挖掘人工智能领域代表性会议论文的研究空缺句,尚未突破学科限制;未探讨研究空缺类型与创新性或影响力测度指标的关联。[结论]本研究提出的门控融合模型能够在低资源环境下准确分类学术文本的细粒度修辞功能,有益于补充不同层次语言学特征的差异内容,兼顾稳定性、鲁棒性与可扩展性。

  • 代伟, 朱行策, 宋阳, 杨晓, 耿学妤, 马敬东
    预出版日期: 2025-09-12

    [目的]比较不同大语言模型推理方法在突发公共卫生事件政策智能问答中的效果差异。[方法]以DeepSeek-R1为例,分别实现了检索增强生成、知识图谱协同、微调、联网搜索及不使用外部数据的推理,并以人工标注的问答为基准,对所有推理方法的优劣进行了比较;其中,不使用外部数据的推理对照了Qwen-QwQ和GPT-4o模型的表现。[结果]自动评估中,基于检索增强生成、知识图谱协同和微调的组合方案BLEU-4和ROUGE-L分别为0.259和0.494,优于其他方法;联网搜索次之(BLEU-4为0.225,ROUGE-L为0.465)。人工评估中,组合方案在内容准确性得分最高(3.560);不使用外部数据的大参数模型在语句流畅性、答案完整性、答案可用性和答案信任度维度表现更优。[局限]实验数据来自网络公开政策文本,未涵盖实际封闭场景中的本地数据;同时不包括多媒体格式,无法验证多模态场景下的推理效果。[结论]在本地数据支持下,不同推理方法在政策智能问答领域可显著降低幻觉、提高准确性,尤其在突发公共卫生事件等垂直领域具有较好适用性。以外部数据为支持能提高模型生成内容的准确性,而不使用外部数据推理的生成内容更加完整和可信。

  • 王振宇, 平一方, 肖桐, 王建民
    预出版日期: 2025-09-12

    [目的] 为提升在线教育中学习行为检测的准确性,推动教育智能化由结果导向迈向过程可解释的新范式,本文提出一种大语言模型驱动的学习行为检测模型。[方法] 该模型集成大语言模型、检索增强生成与可解释人工智能技术,构建融合学习行为特征与情感特征的文本-时间序列数据。文本数据由BERT模型提取并转为时间序列数据,采用LightGBM模型进行训练,并结合SHAP方法量化各特征对模型预测的边际贡献,实现预测过程的可解释性。[结果] 所提模型在学习行为检测任务中表现优异,准确率达到99.90%,召回率为99.78%,F1值为97.69%,均显著优于所有基线模型。与性能最低的逻辑回归模型相比,三项指标分别提升20.84%、24.34%和21.94%,充分验证了模型在复杂特征识别中的优势。[局限] 数据来源于单一在线学习平台,样本粒度较粗,存在一定的外部泛化局限。[结论] 本研究通过融合可解释性人工智能与多模态特征,有效提升了模型的准确率与可解释性,为高校在线教育平台提供决策支持。

  • 姚天辰, 王昊, 李佩琪, 布文茹, 袁瑞阳
    预出版日期: 2025-09-12

    [目的]本研究旨在解决中华诗酒文化中“物象-意蕴”语义结构关系难以构建的问题,推动传统文化的结构化表达与自动化识别,为文化资源的智能化理解与传播提供技术支持。[方法]提出UOCIP模型,设计涵盖语料构建、物象抽取、意蕴识别、图谱构建四阶段流程,并引入对抗训练机制与AIGC数据增强策略,以提升模型在低资源场景下的表现。[结果]实验结果表明,物象抽取模型的Macro-F1从56.2%提升至58.6%;意蕴识别模型在多模态注意力机制支持下达到83.4%的Macro-F1;构建的意蕴图谱覆盖五类术语体系,具备一定的未登录术语识别能力。[局限]尽管取得初步成效,但当前模型在处理非典型诗风文本及进行图谱边界语义控制方面仍存在挑战,泛化能力与边界规范性有待进一步提升。[结论]本研究在冷启动条件下初步实现了中华诗酒文化语义建模的有效范式,验证了UOCIP模型在传统文化智能处理中的可行性与推广价值,为后续相关研究提供了理论基础与方法参考。

  • 宋宇昕, 柳林, 王海龙, 刘静
    预出版日期: 2025-09-12

    [目的]综述检索增强生成(Retrieval-Augmented Generation, RAG)技术中检索粒度对系统性能的影响,探讨不同粒度在上下文完整性与信息精确度之间的权衡及优化。[文献范围]使用“Retrieval-Augmented Generation”“检索增强生成”“Retrieval Granularity”“检索粒度”等中英文关键词,在谷歌学术、ACM Digital Library、中国知网等数据库中检索了2020至2025年间的相关论文,筛选出106篇代表性文献进行分析。[方法]以检索粒度为主线,从技术路径、核心机制、创新与不足等维度,对比分析了现有RAG方法。[结果]构建了“粗粒度-细粒度-混合粒度”的研究框架,粗粒度保障上下文但易引入噪声;细粒度提升精度却导致语义碎片化;混合粒度虽旨在融合优势,但其融合与调度机制是当前的挑战。[局限]侧重于文本型RAG研究方法综述,未全面覆盖涉及多模态(如图像、音视频)的RAG研究方法。[结论]RAG技术的发展依赖于粒度选择的智能化和信息融合的精细化。未来可深入探索命题级检索粒度、动态粒度选择、自适应机制以及结构化与非结构化知识协同。

  • 周渝皓, 王杰, 张顺香, 李嘉伟, 张咏琪, 杨珺旎
    预出版日期: 2025-09-12

    [目的] 为解决面向话题的讽刺识别中存在的实体重叠和关系复杂问题,本文提出一种融合外部知识感知注意力的提示学习模型,以提升面向话题的讽刺识别准确率。[方法] 首先,根据话题和评论文本总结了一个面向话题的提示学习模板。其次,识别话题和评论文本中的实体并将其与知识图谱中的实体对齐,实体及其上下文被用作外部知识来提供补充信息。然后,设计了外部知识感知注意力来衡量知识的重要性。最后,通过Veralizer模块指定映射词并对掩码进行预测。[结果] 在公开的ToSarcasm数据集上的实验表明,本文模型优于对比的先进模型,准确率达到了72.25%,F1值达到了77.16%。[局限] 本研究未采用可学习的软提示方式构建提示模板,提示设计及映射词的选取仍有进一步优化的空间,同时仅使用了ToSarcasm数据集进行模型训练,模型的泛化能力有待提高。[结论] 外部知识的引入能够有效解决实体重叠问题,提示学习能够有效解决关系复杂问题,模型能够有效提升面向话题的讽刺识别的准确率。

  • 孙青琳, 王小梅, 陈挺, 宋心玉
    预出版日期: 2025-09-12

    [目的]为了更好地把握科学发展脉络,提出一种通用的论文研究阶段自动分类方法,以精准划分研究阶段,揭示学科演进趋势,助力科研规划、资源优化及成果高效转化。[方法]在Boyack等人研究基础上,构建了多学科适用的研究阶段分类框架,通过标注数据对大语言模型进行监督微调,结合深度语义分析与提示工程技术,实现研究阶段的自动化划分,并以科学结构图谱验证其效果。[结果]本方法在研究阶段分类任务中取得F1分数85.45%和准确率85.50%,显著优于多项逻辑回归模型的62.71%和62.00%,且在科学结构图谱中呈现更清晰的阶段特征。[局限]受计算资源限制,未能开展多模型对比实验。[结论]基于监督微调的大语言模型在研究阶段分类中展现出较好准确性与鲁棒性,优化提示设计可进一步提升性能,为加速科技成果转化与学科发展提供有力支持。

  • 马玮璐, 孙坦, 赵瑞雪, 鲜国建
    预出版日期: 2025-07-08

    [目的]简化科技文献摘要撰写过程,生成更直观的图谱式摘要以辅助科研。[方法]选取PMC数据库的水稻育种相关论文,构建4276条“全文-摘要”问答对,通过实验遴选最优的提示词和温度系数,基于有监督数据集对Qwen2.5-7B-Instruct大模型微调,并在GraphRAG框架中接入微调后的模型以生成每篇论文的图谱式摘要,后使用优选提示词在GraphRAG中进行全局查询,获得论文的文本摘要。[结果]本研究方法在ROUGE-1、ROUGE-2和ROUGE-L的F1值上,相比基线模型分别提高了44.16%、61.36%和54.87%,在5分制人工评测中,本研究方法相比基线模型平均提高了1.78分,生成的图谱式摘要效果更加直观。[局限]本研究受限于基础硬件条件,选取的大模型参数量较小,模型生成能力还需加强,此外本研究选用的GraphRAG技术框架,在索引构建阶段耗时较长,在实际应用中还需配套高效的推理加速框架。[结论]基于图谱对大模型的检索增强生成技术能够深入捕捉论文中的远距离隐藏信息,生成更加全面且准确的论文摘要和层次清晰的图谱式摘要,便于提高科研人员的阅读效率,助力科研生产工作。

  • 姚元璋, 徐健
    预出版日期: 2025-07-04

    [目的]分析跨学科领域的术语词在不同学科间存在的语义差异现象,挖掘语义差异现象的原因。[方法]使用预训练深度学习模型实现自动化地识别和量化术语的语义差异,设计构建语义差异程度指标定量衡量语义差异程度,并对术语所涉及学科进行共现分析。[结果]基于预训练模型的语义差异现象识别准确率达到0.8193,所构建度量指标能够对语义差异进行有效量化。[局限]研究局限于中文术语的语义差异,选取术语学科跨度范围有限。[结论]挖掘出跨学科术语存在语义差异现象的原因主要有:学科专业化和知识分化、语言及语境的差异、概念的层次化和抽象化、认知侧重层面的差异以及跨学科交叉与融合影响等,为探究术语差异背后的原因及其与学科之间的关联提供了新的视角和方法论。

  • 邓航宇, 唐川, 蒲云强, 敖丽娟, 王婉婧
    预出版日期: 2025-07-04

    [目的]针对美国国会听证会文本数量大、涉及范围广、口语化表达多等特点,本文提出一个智能化识别中国科技安全风险的方法流程。[方法]本研究从听证会数据特征与情报分析人员实际需求出发,利用大语言模型等技术实现文本过滤、摘要生成以及智能问答等模块并将其有机结合在一起,从而达成高质量的智能化识别。[结果]本研究以第118届国会听证会文本为对象验证关键模块的有效性。文本过滤的F1值、摘要生成的ROUGE-Lsum值、智能问答风险点召回率分别达到0.7751、0.6032以及0.7636,显著优于基线方法。[局限]该方法主要针对美国国会听证会文本设计,未来还需要用更多类型的语料加以验证,以便将其泛化并扩展成通用方法。[结论]本文提出的方法能辅助研究者深入挖掘美国国会科技情报,为我国制定有效的科技安全应对策略提供显著支持。

  • 张双宝, 成全, 曾艳
    预出版日期: 2025-07-04

    [目的]为充分挖掘中文文档之间的语义关联信息,实现基于交互式语义增强的文档级事件抽取效果的提升。[方法]本研究提出了一种交互式语义增强的中文文档级事件抽取模型CSDEE,利用注意力机制构建跨文档的交互式语义网络,增强实体识别性能,再经由文档编码与事件抽取信息解码完成事件抽取任务。[结果]实验结果表明,CSDEE模型在事件抽取的精确率、召回率和F1值上分别达到80.7%、84.1%和82.3%,优于现有基线模型。同时,通过对模型开展消融实验及在公开数据集ChFinAnn和DuEE-fin上的泛化实验,验证了模型在中文文档级事件抽取任务中的有效性。[局限]目前模型仅针对文档级事件抽取的性能提升作出了相应改进,暂未涉及重叠事件类型的多分类任务。[结论]充分挖掘与关联文档数据之间的相似语义信息能够有效促进文档级事件抽取任务的性能与效果。

  • 谢威, 夏鸿斌, 刘渊
    预出版日期: 2025-07-04

    [目的]运用深度学习与对比学习方法解决目前零样本关系抽取任务中完整实体信息与关系信息交互不够充分的问题。[方法]提出了一种基于对比学习的联合实体关系信息的零样本关系抽取模型(JCL)。首先,使用数据增强技术对原始的输入文本进行处理,增加模型得到的有效信息。其次,通过增强交叉注意力模块将实体对深度融合与关系联合处理,提取实体与实体间的交互信息和实体与关系语义间的交互信息,放大不同关系在嵌入空间内的细微差异。最后,使用交叉熵损失函数联合对比损失优化模型。[结果]与基线模型相比,在FewRel数据集不可见关系m = 5情况下,F1提升了3.12%;m = 10情况下,提升了5.19%;m = 15情况下,提升了1.99%。在Wiki-ZSL数据集m=5时,提升了7.05%;m=10时,提升了3.42%;m=15时,提升了8.08%。[局限]本文的研究领域数据集的语言较为单一,数量较少。[结论]本文提出的基于对比学习的联合实体关系信息模型针对零样本关系抽取任务在三个公开的数据集上的效果达到先进水平。

  • 周胜利, 徐睿, 陈庭贵, 汪邵杰
    预出版日期: 2025-07-04

    【目的】为解决AI换脸诈骗过程中多模态特征表征不足的问题,提出面向AI换脸诈骗的受骗风险识别模型FSFRI,有效融合多模态特征提升受骗风险识别效果。【方法】FSFRI综合欺诈信息的生成和传播过程,从中提取伪造人脸视频帧特征、流量描述特征、流量负载数据特征和流量时序特征,再通过特征融合模块实现跨模态特征的互补融合,最后通过风险识别模块实现受骗风险的识别。【结果】在模拟实验生成的数据集中,FSFRI取得了较好的识别效果,F1值达到0.92;同时在低噪声环境中(加噪比例为0-0.2)展现出较强的鲁棒性,在0.2的加噪比例下F1值仅下降0.019。【局限】FSFRI中的多模态特征产生了较高的计算复杂度,且在高噪声环境中的风险识别效果有待进一步提升。【结论】FSFRI能有效提取并融合AI换脸诈骗过程中产生的多模态特征,并实现受骗风险准确识别。

  • 马莹雪, 甘明鑫, 胡磊
    预出版日期: 2025-07-04

    【目的】为解决深度学习推荐方法缺乏对用户兴趣分布特征建模,不能充分刻画用户偏好的问题,提出一种基于用户兴趣聚集性和层次性分布特征建模的序列推荐方法。【方法】利用注意力网络和LSTM从行为序列获得用户和项目的向量表示,学习用户兴趣分布的位置中心和边界半径,通过双半径刻画兴趣分布的层次性和聚集性;通过拟合候选项目特征与用户兴趣分布中心的距离与交互概率预测用户偏好;融合基于神经网络的行为预测和基于兴趣模型的偏好估计生成推荐。【结果】在Amazon数据集上的实验结果表明,相比于表现最优的对比方法,本文方法在准确率、召回率、F值、覆盖率等评价指标上的性能达到最优,性能提升达到10个百分点以上。【局限】未考虑除行为序列外的用户生成内容,后续研究可以结合用户评论等信息完善兴趣建模。【结论】本文方法能准确刻画用户兴趣的分布特征,提高推荐准确度,优化推荐结果的综合质量。

  • 孙蒙鸽, 王燕鹏, 付芸, 刘细文
    预出版日期: 2025-07-04

    [目的] 本文以科技情报短文本为实验数据,研究大语言模型在多领域科技知识实体抽取任务中提示工程的构建方法,旨在解决短文本语义不足和领域多样性对科技实体抽取的挑战。[方法] 针对科技情报短文本语义浓缩导致的上下文信息不足、知识实体领域跨度大、以及实体边界模糊等问题,本文提出一种基于知识提示学习的Scientific Prompt知识实体抽取策略。该策略结合BERTopic方法,将领域知识动态引入提示词策略中,以提升大语言模型在多领域知识实体识别中的语义理解和感知能力,增强抽取的精确性和泛化能力。[结果] 实验结果显示,在Scientific Prompt策略加持下,QWEN2.5-7B、QWEN2.5-7B(微调)与GPT-4o的F1-Value分别为0.6526、0.7407、0.7878;而Zero-Shot下对应模型的F1-Value分别为0.5534、0.6165、0.6822。对比发现,在短文本-多领域实体抽取任务中,Scientific Prompt策略加持下的开源模型可远超对其微调的效果(0.6526 vs 0.6165);甚至该策略加持下的微调QWEN2.5-7B模型表现略优于仅使用GPT-4o的效果(0.7407 vs 0.6822)。[局限]本文仅测试了该策略在中文科技情报短文本上的表现情况,未测试其在英文文本的适用性。[结论]实验证明,与微调方式相比,Scientific Prompt策略无需更新模型参数即可显著提升大语言模型在短文本-多领域知识实体抽取任务中的性能。实验还验证了Scientific Prompt策略在大规模无监督科技短文本中的表现,通过精确抽取科技实体可有效感知科技态势。本文的研究为通用型中文科技短文本知识实体抽取任务提供了重要的技术路径参考。

  • 张晓娟, 吉如意
    预出版日期: 2025-07-04

    [目的] 提出一种基于静态与动态异构图嵌入的全局引文推荐框架,以期提高引文推荐的准确度。[方法] 本文首先分别构建静态加权异构网络与时序异构网络。在静态异构网络中,利用混合随机游走和skip-gram模型生成能捕捉网络局部与全局信息的节点嵌入;基于所构建的时序异构网络,首先利用基于元路径的随机游走获得元路径实例,再建模异构图中的时态演化特征,以此获得图中节点的嵌入式表示。然后利用联合训练与独立训练两类方法整合获得图中论文节点的最终嵌入表示;最后通过计算相似度为输入论文生成候选引文推荐列表。[结果] 实验结果表明:本文提出方法的实验性能均优于只考虑动态或者静态的方法;其中独立训练方法在几乎所有召回率指标(除了Recall@40之外)上表现最佳;自适应任务不确定性加权方法在MRR与MAP指标上表现最佳,分别达到0.308与0.297。[局限]未在多个数据集中验证新提出的模型的性能;模型算法的运行效率尚需优化提升。[结论]综合考虑网络静态和动态性能有效提升全局引文推荐的性能。

  • 冉从敬, 丁群哲, 宋永辉, 王福新
    预出版日期: 2025-07-04

    [目的] 针对专利转让数据中难以区分发生实质性专利交易问题,提出一种系统性方法,通过融合多种基于莱文斯坦距离算法,较为准确地识别出发生实质性交易的专利行为,并探讨其技术特征差异。[方法] 针对不同专利转让场景,提出了一套筛选流程方法。其关键步骤之一是利用基于编辑距离算法的多种文本相似度方法,计算交易双方姓名和地址的相似度分值,并结合设定阈值剔除内部资源重新配置的非市场化交易记录。同时,通过实证研究验证方法准确性,并利用统计分析比较发生实质性交易与未发生实质性交易行为的专利在技术指标上的差异。[结果] 实验结果表明,该方法在准确率上达到81.27%,能够有效识别发生实质性交易的专利行为。发生实质性交易的专利在独立权利要求数量、同族专利数及被引次数等技术指标上显著高于未发生实质性交易的专利(p < 0.05)。[局限] 实验数据时间跨度有限,且文本相似度算法在复杂地址特征处理上的适应性需进一步优化。[结论] 本研究为专利交易行为的精准识别提供了有效方法和思路,并为技术转移与专利市场化领域的研究提供了可靠数据支持。

  • 李翼鸿, 余燕芳, 余奇伟, 李苏娟, 张少龙, 叶军军
    预出版日期: 2025-07-04

    [目的]大语言生成模型为中文开放关系抽取任务带来了新思路,但如何优化模型生成的关系抽取结果质量成为一个重要问题。[方法]本文提出一种低成本的基于多维度自我反思学习的大模型微调方法(SRLearn方法),自动引导模型进行多维度的自我反思学习,从而优化模型的中文关系抽取生成质量。[结果]相比LoRA+DPO偏好微调方法,SRLearn方法在WikiRE1.0数据集上提高了15个百分点,在DuIE2.0数据集上提高了6.5个百分点,验证了该方法的有效性。[局限]SRLearn方法未来还需要考虑覆盖更多的生成质量问题。[结论]基于多维度自我反思学习增强的大模型微调方法能够大幅度提高中文关系抽取生成质量。

  • 苏妍嫄, 董宵宇, 韩翠娟, 张亚明
    预出版日期: 2025-07-04

    [目的]设计嵌入双通道注意力卷积的联邦学习框架,破解因隐私保护导致的跨社交网络特征提取难题,精准识别社交机器人。[方法]首先,采用联邦学习框架实现跨社交网络数据集成。其次,在本地模型模块嵌入双通道注意力卷积以全面挖掘数据特征。再次,借助基础卷积和区块链在联邦聚合模块对各本地模型参数进行集成处理,以获取和安全保存最优模型参数。[结果]TwiBot-20&Weibo-bot数据集上的实验结果表明,FL-DCACNN模型的准确率、精确率、召回率和F1值分别达到91.63%、97.10%、97.14%和96.88%,且呈现较强的泛化能力。[局限]在多模态特征提取时仅考虑了结构化数据、文本数据及图片数据,未涉及视频、音频数据。[结论]FL-DCACNN模型可有效破解特征提取不足、数据来源单一等因素造成的社交机器人识别效果不佳问题,提高了模型识别性能,实现了社交机器人的精准识别。