期刊首页 在线期刊 最新录用

最新录用


说明:最新录用文章, 内容和格式将与印刷版一致(除了页码), 您可以通过doi直接引用。

Please wait a minute...
  • 全选
    |
  • 但志平, 李琳, 余肖生, 鲁雨洁, 李碧涛
    预出版日期: 2025-02-12

    [目的]针对无法有效识别中文文本中存在的不包含明显恶意词汇的仇恨言论问题,提出了一种融合多维情感特征的中文仇恨言论检测方法——RMSF。[方法]首先,使用RoBERTa提取输入文本的字符及句子级特征,并使用情感词典等工具提取文本的多维度情感特征;其次,将字符特征及情感特征进行拼接后输入到BiLSTM网络中,学习更深层次的上下文语义信息;最后,将BiLSTM的输出和RoBERTa提取的句子特征拼接,输入MLP层进行处理,并应用SoftMax函数进行类别预测。为了解决数据类别不平衡问题,采用焦点损失函数优化模型,从而提升判别输入文本是否为仇恨言论的准确率。[结果]RMSF在TOXICN数据集中精确率为82.63%,召回率为82.41%,F1 值达到82.45%;在COLDataset数据集中精确率为82.94%,召回率为82.96%,F1 值达到82.85%,与现有方法相比,F1值分别提高了1.85%和1.09%。[局限]融合多维情感特征的仇恨言论检测方法需要依赖情感词典等工具,情感特征的提取受到词典内容的制约。[结论]在中文仇恨言论检测模型中结合多维度情感特征能够有效提高检测的效果,且实验结果也证明本文融合多维度情感特征的方法是有效的。

  • 杨颖, 张凌峰
    预出版日期: 2025-02-11

    [目的]现有关于多模态评论有用性的研究大多关注图片和文本模态的简单融合,本文拟探讨产品领域知识以及图文动态交互对评论有用性的影响,提升多模态评论有用性识别的性能。[方法]本文提出了一种领域知识增强的多模态评论有用性识别方法,首先是基于评论的隐含主题信息识别领域关键词,并利用主题注意力机制获得评论的领域知识特征表示;接着设计了一个知识增强的图文动态交互模块,通过知识增强模态内自注意力机制获得知识与文本和图片进行动态交互后的特征表示,通过知识增强模态间协同注意力机制获得知识增强的文本与图片进行动态交互后的特征表示。[结果]在亚马逊数据集上检测的F1值得达到89.57%,比最优基线模型提高了0.9%。[局限]本文仅在英文数据集上进行实验,在中文数据集上的性能有待进一步研究。[结论]本文利用领域知识对模型进行增强,不仅能有效提升评论有用性识别的性能,还能很好地提取图片和文本中的关键信息,增加了模型的可解释性。

  • 海佳丽, 汪润, 袁良志, 张凯睿, 邓文萍, 肖勇, 周涛, 常凯
    预出版日期: 2025-02-11

    [目的]构建基于检索增强的中医药标准知识问答系统,将高质量的中医药标准化知识和实践经验精准有效地传递给中医药行业从业者和普通民众,提升中医药标准化研究和应用水平。[方法]通过对比已有的大语言模型(如BaiChuan、Gemma、通义千问等)的性能表现,选择GPT 3.5模型作为基础模型,结合数据优化和检索增强生成等技术手段,开发出具有语义分析、上下文关联和生成能力的中医药标准知识问答系统。[结果]基于检索增强的中医药标准知识问答系统的答案相关性在中医文献问题生成数据集上的精确率、召回率和F1值分别为87.9%、83.9%、85.7%,在中医药标准问答数据集上的精确率、召回率和F1值分别为87.1%、83.6%、85.3%,上下文相关性在中医文献问题生成数据集上的精确率、召回率和F1值分别为83.8%、86.9%、85.3%,各项指标优于对比模型,表明本系统相较于其他模型能更好回答中医药标准相关的问题,具有较高的准确性。[局限]当前系统的意图识别模块仍需进一步优化,中医药标准知识库规模有待进一步扩充和更细粒度完善。[结论]本研究针对中医药知识服务的现实需求,探讨构建了基于检索增强的中医药标准知识问答系统,该系统能够回答用户关于中医药诊疗指南、中药标准、信息标准等各类问题,包括治疗原则、病证分类、治疗方法、中医药标准内容技术要求等,展示了较高的实用性和可行性。

  • 唐朝, 陈波, 谭泽霖, 赵小兵
    预出版日期: 2025-02-11

    [目的] 通过知识蒸馏将外部的来源于无监督数据的额外知识以训练数据的形式注入学生实体抽取模型,缓解古籍实体抽取任务有监督数据稀缺的问题。[方法] 使用大语言模型作为生成式知识教师模型,在无监督语料上进行知识蒸馏;基于《左传》和GuNer的有监督数据构造词典知识教师模型蒸馏词典知识,共同构建半监督古籍实体抽取数据集,并将古籍实体抽取任务转换为序列到序列任务,再微调mT5、UIE等预训练模型。[结果] 在《左传》和GuNer数据集上四类实体的F1指标分别达到了89.15%和95.47%,与使用古籍语料增量微调的基线模型SikuBERT和SikuRoBERTa相比,F1指标分别提升了8.15和9.27个百分点。[局限] 未加入实体额外信息;受限于大模型生成的数据质量。[结论] 该方法在低资源情境下,利用预训练大语言模型和词典资源的知识优势,将知识有效地蒸馏到学生模型,显著提升了古籍实体抽取的效果。

  • 曾闻, 王曰芬
    预出版日期: 2025-02-11

    [目的] 本文旨在通过研究专利技术转移类型分布特点与演化规律,为科技创新活动提供决策参考。[方法]根据专利转让的输入与输出构建专利技术转移信息数据库,划分时间阶段并构建网络,选取专利特征值构建转移范围和转移深度指标并基于战略坐标图界定技术转移类型,结合Markov链方法分析不同时段的类型分布与演化趋向。[结果] 我国AI专利技术转移类型中Ⅲ型最为普遍,Ⅰ型高度聚集于长、珠三角地区,多数省市遵循由Ⅲ型到Ⅱ型到Ⅰ型的发展规律,技术转移类型随时间推移维持概率高,尤其Ⅰ型维持概率达100%,类型间跨级跃迁减少。[局限] 仅选取两个维度指标研究技术转移类型,未来可采用多维度指标进行分析。[结论] 研究得出的技术转移特征及类型演化规律可为政府与企业制定有针对性的专利转移转化政策与策略提供参考。

  • 高原, 李重阳, 曲博婷, 焦梦云
    预出版日期: 2025-02-11

    [目的]为优化城市旅游流挖掘研究,克服现有基于游记文本的游客行程重构方法中存在的景点识别不准确、景点游览顺序失真的问题。[方法]本文提出了一种基于大语言模型的游客行程重构方法,并结合社会网络分析方法探索了城市旅游流网络结构特征。[结果]本文所提游客行程重构方法的景点识别查准率达94.00%、查全率达87.78%,明显优于基于统计的条件随机场方法,重构的游客行程与真实行程相似度达到了83.81%。[局限]游客行程重构效果一定程度上依赖于大语言模型的提示词(Prompt)的训练效果。[结论]以西安市为例,将本文得出的结论与公众认知及现有研究成果进行对比,表明本文所提出的游客行程重构方法具有较高的准确性与通用性,有效支撑了旅游流网络结构挖掘研究。

  • 何多魁, 唐中君, 陈倩倩, 王怡然, 胡锋
    预出版日期: 2025-02-11

    [目的] 提出一种微调大语言模型驱动的能保证主题识别准确度且能揭示主题演化规律的短文本动态主题建模方法。[方法] 该方法结合指令微调、检索增强生成(RAG)和聚类技术,以提升主题识别准确度;基于主题映射关系,依时间顺序对主题进行全面统计,以便揭示主题演化规律。[结果] 通过对四个短文本数据集的验证,本研究提出的动态主题建模方法在主题一致性(TC)和主题多样性(TD)得分上分别比次优模型平均高出6.15和7.71个百分点。消融实验进一步分析了微调、RAG和聚类技术对主题识别性能的影响。此外,研究还揭示了不同数据集中的主题演化规律,包括“M型”和“L型”等模式。[局限] 后续研究可结合知识图谱优化 RAG 提升主题识别能力,并选取多个领域的短文本验证模型的普适性。[结论] 实验证明,本文所提方法在主题识别和主题演化方面具有明显优势。

  • 刘艳, 詹雅兰, 江梓恒, 李锦亮, 颜志军, 贺超城
    预出版日期: 2025-02-11

    [目的] 针对已有文献对谣言语言风格特征和部分真实的双面健康信息关注较少的研究不足,提出了一个考虑语言风格特征的多模态在线健康谣言检测框架(A multimodal wide and deep approach for online health rumor detection considering language style,MWDLS)。[方法] MWDLS利用亚里士多德修辞理论来提取诉诸情感、诉诸逻辑和诉诸人格的说服语言风格特征,然后基于双向跨模态交互融合策略和门控机制来实现浅层语言风格特征和深层语言内容特征的联合表征学习和分类预测。[结果] 基于一个微博场景真实数据集的一系列对比实验与消融实验发现,MWDLS的平均F1值在目标任务上比基线模型提高了1.75% ~ 11.98%,表明了MWDLS在健康谣言检测任务上的优越性。[局限] 随着大语言模型性能的不断增强,未来可将本文算法框架与大语言模型进行结合,以探索新的性能提升方向。[结论] 本文提出了一个融合语言风格特征和语言内容特征的多模态健康谣言检测框架,并基于真实社交媒体数据集验证了该模型在健康谣言检测任务上的有效性,具有重要的理论与实践意义。

  • 张新生, 李江, 王明虎
    预出版日期: 2025-02-11

    [目的]实体抽取过程中可能遇到实体边界属性模糊、语料数据稀疏、手工标注限制等问题。本文将传统技艺文化与命名实体标注相结合,提出一种融合边界特征和注意力序列结构的实体识别模型ER-BFAS,对文本语料进行技艺实体标签的识别预测。[方法]将实体边界属性特征融入到文本标签联合嵌入层,通过注意力机制生成特征向量。同时,利用双向LSTM捕捉技艺类实体标签关联信息,增强模型对不同标签的识别能力。最后通过CRF层预测技艺实体标签,选择条件概率最大的标签作为预测结果。[结果]与其他序列标注模型相比,ER-BFAS模型在传统技艺数据集的F1分数达到85%,不同标签精确率超过90%。在DGRE数据集上精确率达到75%,进一步验证模型的泛化能力。[局限]实验数据类型有限、未处理复杂实体关系。[结论]ER-BFAS模型在处理传统技艺和通用数据集方面,能有效识别出实体边界信息,显著提高非遗传统技艺领域的实体识别能力。

  • 孙辛欣, 孙亚楠, 赵宇翔, 姜斌
    预出版日期: 2025-02-11

    [目的] 基于CASA范式及刻板印象模型,探索AI医疗语音助手的声音特征对老年人感知可信度的影响机制。[方法] 本研究开展3(声音性别:女性/男性/非二元音)×2(沟通风格:专家型/伙伴型)的被试间实验,以考察AI医疗语音助手的声音性别和沟通风格对老年人感知可信度和使用意愿的影响,以及在感知温暖和感知专业的刻板印象维度上的作用机制。[结果] 结果表明,老年人对男性专家型和女性伙伴型的AI医疗语音助手具有较高感知可信程度,同时沟通风格通过感知专业维度影响老年人对声音性别的感知可信度,感知可信度被验证能够正向影响和预测老年人对AI医疗语音助手的使用意图。[局限] 基于中国医疗体系智慧化建设状况,研究结论的全球普适性有待探讨。[结论] 声音特征与刻板印象的匹配对老年人感知可信度产生积极影响,在AI医疗语音助手的设计应用中,应考虑声音多种因素间的相互作用及场景适用性。

  • 张乐, 陈岩松, 张雷瀚
    预出版日期: 2025-02-11

    [目的]多模态情感分析中存在不同模态之间情感表达不一致的现象,抑制了多种模态协同决策情感的效果。针对该问题,提出一种大模型特征增强与多层次交叉融合的多模态情感分析方法。[方法]为了缓解各模态之间的冲突情感信息,提高共性情感特征的表达,借助多模态大语言模型提取模态内部辅助性情感信息。利用层次化交叉注意力机制学习模态间的共性情感特征并挖掘模态内的辅助性情感特征,以提高共性情感语义的表达。在融合阶段,提出一种模态注意力的加权融合方法,有效平衡共性情感特征与辅助性情感特征的贡献,并引入融合多模态与单模态的损失函数用于解决情感语义不一致问题。[结果]相对于已有方法,本文提出的模型在公开数据集CH-SIMS和CMU-MOSI上的效果均优于对比模型,在CH-SIMS上二分类准确率和F1值分别提升了1.77和1.63个百分点,在CMU-MOSI上二分类准确率和F1值分别提升了0.43和0.41个百分点,在CH-SIMS情感不一致数据上二分类准确率和F1值分别提升了1.80和1.72个百分点,可以有效解决不同模态间的情感语义不一致问题。[局限]视频中人物具有个性化信息,未考虑到人物的个性化信息所带来的影响。[结论]本文利用层次化交叉注意力机制有效融合各模态特征,提高共性语义的表达,可以有效解决不同模态间的情感语义不一致问题。

  • 段宇锋, 柏萍
    预出版日期: 2025-02-11

    [目的] 为了实现谣言的早期识别,探索基于文本内容的谣言识别模型和方法。[方法] 提出一种大模型知识增强的多尺度图神经网络中文健康谣言识别模型。该模型首先为单条文本构建文本图,捕捉句子中的隐藏信息;然后通过提示工程抽取文本中的实体信息进行知识增强;最后采用多尺度图神经网络模型,结合特征分解,进行谣言识别。[结果] 本研究所提模型在CHECKED和LTCR两个数据集上的准确性分别达到了95.21%和87.39%,优于所选基准模型。[局限] 本研究所提模型仅基于文本信息进行谣言识别,未使用图像、视频等多模态信息。[结论]利用大模型进行知识增强既能更加快速便捷的抽取实体还能够提高句子的语义信息,利用具有特征分解的多尺度图神经网络能够在捕捉多尺度特征的基础上保持计算的稳定性,对单条语料构建文本图更加灵活便捷,本研究利用上述步骤在中文健康谣言识别中表现良好。

  • 王松, 焦海燕, 刘新民
    预出版日期: 2025-02-11

    [目的]深入挖掘价值性用户生成内容的主题结构与动态变化,旨在有效提炼与分析共创知识,促进多模态知识的高效归集与利用。[方法]综合考量多模态用户生成内容的文本语义与图像特征,基于“模型驱动+知识增强”的研究范式实现知识聚合与主题挖掘。首先,综合BERT、Doc2Vec、ResNet和K-BERT模型以捕捉多层次文本和图像的深层向量表示并完成知识增强;其次,构建距离矩阵以刻画多模态内容间的内在关联;最后,借助谱聚类与DTM模型深入剖析知识主题的动态演变。[结果]利用典型在线虚拟社区数据进行验证,实验结果表明:综合“长短文本+图像+外部知识”的多模态模型能够更加有效地提升知识聚合效果,CH指数为62.25,优于其他组合模型,多模态深度聚类下的分析可以厘清核心知识主题的演化过程。[局限]主要基于文本和图像数据的融合应用,缺乏对音频、视频等富媒体内容的探究。[结论]所构建的深度学习融合模型有助于提升对多模态价值性内容的主题识别能力和演化分析效果,可以提高共创知识的管理质量和利用效率。

  • 刘启刚, 王尹凡, 牟立峰, 徐伟, 孙向阳
    预出版日期: 2025-02-11

    【目的】解决传统文献分析工具不适合开展文献内容细粒度分析、不能进行文献研究问题与研究方法体系构建的问题。【方法】提出构建一种面向“问题与方法”体系生成的细粒度学术图谱,提出了针对问题体系与方法体系表征的本体设计和融合上下文信息的多关系联合抽取方法,创新了大语言模型在信息抽取和图谱问答任务中的应用方式。【结果】本文提出的三元组抽取及增强方法可以分别将实体分类和关系抽取的F1值提升9.18%和8.07%; “问题与方法”图谱可以有效支撑研究热点分析与文献关联分析,在大语言模型的加持下还可以实现高质量的图谱问答。【局限】本文学术图谱的本体设计不够完善,不能满足对文献内容的全方位分析;基于GPT-4o大模型的三元组抽取运行效率比较低,不能满足大规模图谱构建需求。【结论】“问题与方法”学术图谱能够有效辅助学者开展领域研究现状分析及问题与方法维度下的文献关联分析;大语言模型能够在学术图谱构建及应用中发挥重大作用。

  • 景浩, 吴新年, 李慧佳, 祝忠明
    预出版日期: 2025-02-11

    【目的】为领域科学文献的多标签分类任务提供一种高效且精确的解决方案,同时为大模型知识蒸馏技术在其他任务上的潜在应用提供参考。【方法】利用大模型生成的标签对领域科学文献进行预标注,并通过知识蒸馏技术将大模型的知识迁移至小模型,从而训练多标签自动分类的轻量化模型。同时在摩擦学领域数据集上对模型进行评估,比较了使用知识蒸馏技术训练的模型与人工标注标签训练的监督模型在准确性、F1分数上的表现。【结果】实验结果表明,使用大模型生成的标签训练的轻量化分类模型在多项性能指标上表现出色,准确率和F1分数分别超过了0.96和0.86,且显著降低了时间和成本的花费。【局限】本研究在数据集的多样性、框架的鲁棒性以及标签质量的优化方面仍有改进空间,同时在应用场景的扩展上有待进一步探索。【结论】本研究证明了知识蒸馏技术在领域科学文献多标签分类中的应用价值,展示出高效率、低成本的优势。未来可进一步优化蒸馏过程,扩展其适用场景,为更多任务的高效处理提供支持。

  • 郑碧丽, 侯剑华
    预出版日期: 2025-02-11

    [目的]研究精英科研人员与普通科研人员的知识创造节律差异,揭示学术生涯的本质特征。[方法]通过知识创造能力矩阵,分析19个学科领域的科研人员,关注知识来源与扩散,计算活跃期与沉寂期的节律特征。

    [结果]精英科研人员的活跃期个数显著多于普通科研人员,且持续时间更长;中期进入活跃期的概率较高;发文量、引文量与合作关系与活跃期显著正相关。[局限]研究未充分考量学科间潜在的复杂互动及不同文化背景对科研节律的影响。[结论]知识创造能力视角揭示科研节律差异,为理解学术生涯发展及决策提供理论依据。

  • 张云秋, 殷策
    预出版日期: 2025-01-07

    [目的]:基于大模型技术,选用Llama3-8b作为基底模型,应用于中文电子病历命名实体识别任务以提高中文电子病历命名实体识别效果,促进中文医疗领域的智能化应用。[方法]:首先利用huatuo226K中文医学问答语料集,增强模型在医学领域的知识理解能力。随后采用Easy Data Augmentation (EDA)方法对CCKS2019电子病历数据集进行数据增强,并通过LoRa方法对Llama3-8b模型进行微调,最终形成专门用于中文电子病历命名实体识别的模型。[结果]:微调后的Llama3模型在CCKS2019中文电子病历数据集上表现出显著提升,总体精确率达到0.8889,召回率为0.8660,F1值为0.8773,较原始模型的F1值提高了0.1611。[局限]:对实体重叠现象的研究不够深入,且不同实体类别的识别精确度存在一定差距。[结论]:本研究提出的基于大模型的中文电子病历命名实体识别框架,验证了大模型技术在中文医疗领域的应用潜力,为中文电子病历命名实体识别通用性模型的建立提供了基础。未来研究将聚焦于实体类别不平衡、重叠及嵌套实体的识别方法,以进一步完善相关技术。

  • 沈思, 冯暑阳, 吴娜, 赵志枭
    预出版日期: 2025-01-07

    [目的]为提高政务信息资源的利用效率及推动政府服务智能化转型,本文探索融合大语言模型的政策文本检索增强生成技术的有效性,并为政策文本的挖掘和利用、政策制定和决策提供支持。[方法]基于政策大模型ChpoGPT,本文提出一种检索增强方案,将政策文档知识库与用户提问进行语义相似度匹配检索,并将检索结果与ChpoGPT相结合以增强模型下游任务能力。[结果]实验结果表明,该框架在事实一致性、答案相关性和语义相似性等指标上均优于现有模型,其中ChpoGPT模型在事实一致性指标上效果达到近90%;在答案相关性指标上达到80.2%,高于Gemini-1.0-pro模型2.1%;在答案语义相似性指标上达到56.4%,相较于ernie-4.0模型和Gemini-1.0-pro模型分别提升了4.1%和2.8%。该框架能够有效地提高政策文本生成的质量和准确性。[局限]通过对相应实验结果的分析,本文发现语言模型在回答输出上仍存在一定不可控性。[结论]融合大语言模型的政策文本检索增强生成在政府服务智能化转型中具有一定的应用参考价值,但仍需要进一步改进和优化。

  • 任明仑, 龚宁然
    预出版日期: 2025-01-07

    【目的】解决知识图谱中由于关系稀疏性和隐藏关系难以利用而导致的认知局限问题。【方法】提出一种基于图注意力网络的全局邻域感知知识图谱推理模型(GAGAT),通过引入介数中心性作为隐式结构信息,结合关系语义信息,构建层次注意力机制以增强链路预测的准确率和可解释性。【结果】GAGAT模型在FB15K-237、WN18RR数据集上,在Hits@3指标上,相比于ComplEx有26.5%和5%的提升;相比于CompGCN有15%和1.6%的提升;相比于SD-GAT有1%和1%的提升,证明了其在捕获隐式关系和复杂语义上的优势。【局限】本文仅考虑介数中心性作为隐式结构信息和关系语义信息的融合,未探讨其他结构特征在推理中的作用,尚需进一步研究和验证。【结论】GAGAT模型通过融合隐式结构信息和关系语义信息,进一步挖掘了知识图谱中的隐藏关系,有效提升了知识图谱链路预测的准确性和可解释性,为智能系统的认知能力提供了有力支持。

  • 周宁, 马莉, 徐轲
    预出版日期: 2025-01-07

    [目的]解决传统LDA模型在短文本,尤其是中医药论文摘要中专业术语较多,主题术语的可解释性较差的问题,提出一种融合粗糙数据推理改进的LDA模型(I-LDA)。[方法]使用融合粗糙数据推理的TextRank算法,提取出最具代表性的关键词。通过构建特定领域的字典,提高领域词汇权重。结合粗糙数据推理扩大主题词选词范围。[结果]在主题连贯性和主题间距离方面,I-LDA 模型相比传统的 LDA、HCA、HDP 等模型提升了约 25%。[局限]由于中医科研论文摘要文本中的中医专业词汇较多,实验中预设的词典可能无法全面覆盖所有相关术语,可能对模型的主题建模效果产生影响。[结论]实验结果表明,I-LDA模型在中医药科研论文摘要的主题建模中表现优异,且识别的主题更具代表性和专业性。

  • 张力, 胡经璇, 刘细文, 陆伟
    预出版日期: 2025-01-07

    [目的]现有的文献作者消歧研究缺乏对中英文联合作者消歧的关注,本文聚焦于该研究问题,为其创建基础研究材料。[方法]本文提出了一种利用互联网开放资源自动构建作者消歧数据集的方法,并利用该方法为中英文联合作者消歧研究构建了一个大型有标签数据集CHEN-AND;基于该数据集,本文继而构建并评测了多个基础的中英文联合作者消歧方法。[结果]评测结果显示,表现较好的消歧方法取得的P-F1和B3-F1分别为79.86%和84.25%,明显低于目前主流的英文作者消歧方法的准确率。[局限]CHEN-AND较为关注理工科领域的研究人员,这与大规模文献数据库中的作者群体分布存在一定差异,主要原因是构建该数据集使用的中文文献数据库CSCD是一个面向理工科领域的科学引文数据库。[结论]本文公开了CHEN-AND数据集等基础研究材料,以便后续研究探索更加高效的跨语种作者消歧方法和构建以我国科研人员为中心的国家高端学术信息交流平台。

  • 田雪灿, 王丽
    预出版日期: 2025-01-07

    [目的]针对科技前沿弱信号探测过程自动化程度有限、经验依赖性强等问题,提出了一种融合信号放大和去噪两种信号处理策略的探测方法。[方法]通过模拟信号处理流程,首先利用RE对信号进行预处理;接着采用N-gram模型和TF-IDF算法对弱信号进行放大;随后利用迭代阈值收缩算法算法(ISTA)测度弱信号的未来增长趋势并进一步过滤噪声;最后,利用Word2vec模型增强的K-means++算法整合增长性信号。[结果]信号放大和信号过滤作为两种核心的处理策略,有效避免了噪声对弱信号的淹没现象,提高了科技前沿弱信号探测的准确性和聚焦度。[局限]目前的探测效果评估仍然依赖专业知识,更为客观的结果评估方法有待进一步探索;以单一数据源为对象进行弱信号探测,未来工作有待进一步拓展数据源。[结论]本文提出的自动化探测框架在一定程度上降低了对人为经验的依赖,并取得了有效且准确的探测结果。

  • 宋梦鹏, 白海燕
    预出版日期: 2025-01-07

    [目的]自动生成带参考文献的结构化综述,辅助科研用户快速了解某一领域科研知识。[方法]选取NSTL平台7万篇论文,对摘要进行语步识别,构建语料库。通过大模型生成与人工修改构建3千条综述数据,对GLM3-6B模型微调训练。通过将语料库转换成高维向量、利用索引存储向量、再向量检索实现LangChain外挂知识库。为弥补专有名词检索不佳,再混合BM25检索并重排序,提高检索精度。[结果]通过微调训练模型和混合检索框架构建综述生成系统,BLEU和ROUGE得分提高了109.63%和40.21%,人工评估真实性得分提高62.17%。[局限]受计算资源限制,本地模型参数规模较小,生成能力有待继续提高。[结论]利用检索增强生成技术发挥大模型的优势,不仅可以生成高质量的文献综述,也为生成内容提供循证溯源,辅助科研人员智能阅读。

  • 刘御, 曾子明, 孙守强
    预出版日期: 2025-01-07

    [目的]为解决方面级情感分析中多方面语句中的语义偏移问题和隐性情感分析问题。本文提出了一种基于大语言模型情感增强和图卷积神经网络的方面级情感分析模型。[方法]该模型利用提示学习引导大语言模型生成方面语义的情感知识增强表示,然后构建方面语义的情感知识增强图。此外,本文提出了情感-目标位置赋权算法,过滤句法依赖图中无关信息,同时引入方面掩码与门控过滤机制以充分融合语义间信息,精确识别每个方面的情感倾向。[结果]本模型在实验数据集上的性能只有Restaurant数据集的准确率表现略低于其他两个基线模型,但其F1值仍高达81.60。具体来说,在Laptop、Twitter和MAMS数据集F1值均表现出显著提升,分别比最优基线模型提升了1.79%,0.97%,3.02%。[局限]未考虑视觉信息对方面级情感分析的作用,且仅针对英文数据集进行实验。[结论]利用提示学习引导大语言模型生成情感表示词与图神经网络结合,提供了一种有效且高效的方面级情感分析解决方案,显著提高了文本方面级情感分析的准确性。

  • 孟序阳, 王昊, 李远清, 李跃艳, 邓三鸿
    预出版日期: 2025-01-07

    [目的]中医古籍的古代文法与线性内容呈现方式为人们获取中医知识造成了障碍,而大语言模型与知识图谱的结合能够让人们更便捷地获取到可靠的中医知识。[方法]围绕《伤寒论》构建了中医古籍细粒度知识图谱,并运用检索增强生成模型,将知识图谱以提示学习方式融入大语言模型构建了问答系统。[结果]与基线模型和经过专业数据微调的模型相比,在主观评估中该系统满意率的总体均值分别高出14.67%和1.33%,在客观评估中该系统的总体正确率分别高出20%和略低2%。[局限]系统目前仅实现了在《伤寒论》相关中医领域的应用,此外在系统效果的验证上还缺少评估系统专业能力的标准。[结论]该方法不仅能增强大语言模型回答的准确性与可解释性,同时还节省了大量资源。

  • 徐春, 苏明钰, 马欢, 吉双焱, 王萌萌
    预出版日期: 2025-01-07

    [目的]针对旅游领域知识分散、标注数据有限,导致微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。[方法]基于大模型GLM(generative language model)进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系预测和特定关系下的实体识别,抽取关系三元组。[结果]在自建旅游数据集和百度DuIE数据集上进行实验,该模型的F1值分别为90.51%和89.45%,相较传统关系抽取模型分别提升2.37和0.16个百分点。[局限]提示学习仅应用于旅游领域和特定编码器,在应用场景方面还有拓展空间。[结论]本文方法能够更好地对旅游文本进行实体关系联合抽取,提示学习和大语言模型编码器能够缓解小样本场景下模型训练效果不佳的问题,有效提高实体关系抽取的准确率。

  • 张益嘉, 尹伟鸣, 林鸿飞
    预出版日期: 2025-01-07

    【目的】解决谣言数据信息量有限和关联常识信息缺乏的问题,提高谣言识别的准确性。【方法】提出一种多分支图卷积推理网络(Multi-branch Graph Convolutional Inference Networks,MGCIN),以双向图卷积网络为基础,加入常识推理模块COMET。COMET既负责生成融合了常识推理信息的特征表示,同时作为辅助模块独立产生分类标签,在最终阶段辅助决策。【结果】在Twitter15、Twitter16和PHEME三个公开数据集上进行实验,结果显示所提方法优于多数基线模型,该模型的准确率分别达到0.878、0.898和0.776,并具有优秀的谣言早期检测性能。【局限】 谣言数据相关的背景和常识信息的多模态化仍需深入研究。【结论】本文提出的模型能够较好地模拟人类的思维过程,有效融合了文本特征、传播特征和常识信息,为谣言检测研究提供了新的思路和方法。

  • 陈静, 曹智勋
    预出版日期: 2025-01-07

    [目的]本文旨在以中医知识问答领域为例,分析以知识库资源为例的非结构化知识和以知识图谱资源为例的结构化知识在提升大语言模型对抗幻觉效果上的差异性,并基于此进一步探讨大语言模型在垂直领域对抗幻觉能力的提升策略。[方法]设计实验利用外部知识配合提示工程的方法,在中医知识问答领域进行知识库资源和知识图谱资源在提示效果上的差异性分析,并探讨动态三元组策略和融合微调策略等进行大语言模型对抗幻觉优化的优越性。[结果]实验结果表明与知识库非结构化知识提示相比,知识图谱结构化知识提示在准确率、召回率和F1值方面表现更佳,分别比知识库提示高出1.9%、2.42%和2.2%,为71.44%、60.76%和65.31%;基于此进行了进一步优化策略分析后发现,动态三元组策略融合微调后在对抗幻觉上效果最佳,准确率、召回率和F1值分别达到了72.47%、65.87%、68.62%。[局限]本文的研究领域单一,目前只在中医问答领域进行了测试,尚需在广泛科研领域验证其泛化能力。[结论]本研究证明了在中医领域,知识图谱结构化知识在减少幻觉现象和提升模型回复准确性方面优于传统非结构化知识,揭示了结构化知识在增强模型理解能力中的关键作用;微调策略和知识资源的融合使用为大语言模型提供了一种有效的性能提升路径。本文为大语言模型融合外部知识以提升知识服务提供了理论依据和方法支持。

  • 江钰哲, 成全
    预出版日期: 2025-01-07

    [目的]对患者的时序数据和体征数据进行挖掘分析,为患者提供准确安全的用药方案参考,为医生提供有效的用药决策支持。[方法]提出了一个融合时序与体征数据的药物组合推荐模型。首先,利用Transformer模型、卷积神经网络和时间感知方法分别挖掘患者的时序数据;其次,利用知识图谱和图卷积神经网络技术挖掘患者的体征数据;最后,将不良药物的相互作用信息融入到推荐过程中,为患者推荐安全有效的用药方案。[结果]以MIMIC-III数据集中的多次入院患者作为对象开展实证研究。本研究设计的推荐模型较GRAM、G-BERT、TAHDNet等模型在Jaccard指标上分别提升了13.9%、6.6%、3.7%;F1值分别提升了9.3%、3.2%、1.2%;在DDI rate指标上达到最低。[局限]模型在学习患者体征数据时,虽然考虑了患者的异常体征,但并未考虑患者异常体征的具体数值。[结论]通过融合分析患者时序数据和体征数据有利于药物推荐模型更加准确地学习患者病情特征,有助于为患者推荐更加准确的用药方案。在推荐中考虑不良药物相互作用信息有助于为患者推荐更加安全的用药方案。

  • 丁晟春, 龙翔, 叶子
    预出版日期: 2025-01-07

    [目的]通过构建面向企业应急决策的企业突发事件态势感知模型,以提高企业面对突发事件的态势感知能力和应急决策能力。[方法]本文从察觉与理解两个维度建立企业突发事件态势感知模型。通过知识图谱和深度学习完成事件知识抽取,并基于共生理论和Logistic种群生长模型构建企业突发事件共生系统。在实证环节,以“土坑酸菜”事件为例进行模型构建。[结果]针对“土坑酸菜事件”构建态势感知模型,进行态势发展阶段分析和态势要素关系分析,并基于分析结果并给出态势研判建议。[局限]研究的实验数据质量可进一步提高;图谱的本体结构可进一步扩展。[结论]研究证明本文提出的企业突发事件态势感知模型可以帮助企业提取态势要素、识别参与主体间关系,提高企业应急决策能力。

  • 叶光辉, 王豫洁, 娄培琳, 周兴华, 刘述岩
    预出版日期: 2025-01-07

    [目的] 随着线上线下边界快速融合,突发事件舆情传播复杂程度大大增高,跟踪和观测突发事件舆情流转特征,可以辅助实现舆情导控和共景治理。[方法]利用案例研究法,提出突发事件舆情宏观流转域框架;利用社会网络分析法,辅以实证研究和自然语言处理技术深入分析微观视角下舆情在主体、客体、载体各维度间的流转规律,结合突发公共卫生事件数据做验证性分析。[结果]从宏观角度看,舆情在网络空间、物理空间和心理空间中流转,为理解和量化公众行为和反应提供跨学科的分析框架;从微观角度看,舆情在多元群体、多元媒体、多元事件、多元平台层面流转,分别呈现出同质化扩散与异质化穿越效应、场域共鸣与场域逸散效应、共时性和历时性效应、放大共振与回响差异效应。[局限]未考虑社会网络情感的动态变化。[结论]从宏观和微观两种视角总结舆情跨域流转规律,结合“鼠头鸭脖”事件进行实证研究,为舆情传播研究提供新的思路。

  • 任刚, 程玲凤, 贾子垚, 王安宁
    预出版日期: 2025-01-07

    [目的]:本文利用图片和文本的多模态信息,基于图文匹配技术提出ITRHP多模态评论有用性预测模型。[方法]:首先,采用Faster R-CNN和Bi-GRU模型分别提取图像和文本特征;其次,通过协同注意力机制捕捉文本和图片之间相互匹配的区域以提高特征表达的一致性;然后,引入正负注意力机制获取匹配单词区域对和不匹配单词区域对的共享语义信息,并采用了一个自适应的匹配阈值学习模块,使其能够更好地识别相似度最大的单词区域对;最后,将语义信息传递给全连接层获取最终的分类结果。

    [结果]:实验结果表明,ITRHP模型在Yelp数据集和Amazon数据集上的准确率分别达到了80.17%和80.27%,F1值分别达到了79.38%和89.01%。与基准模型相比,模型的准确率在两个数据集上分别最高提升了2.8%和2.42%,F1值分别最高提升了2.70%和7.48%。[局限]:本研究将进一步考虑融合更多评论特征(如评论情感、评论者特征信息),构建更为全面且有效的多模态评论有用性融合机制,从而进一步提高模型性能。[结论]:本研究提出的ITRHP模型使用图文匹配技术能够有效利用多模态信息,解决多模态评论有用性预测模型分类准确性低的问题。

  • 钱玲飞, 马子宜, 董嘉嘉, 朱鹏宇, 高德荃
    预出版日期: 2025-01-07

    [目的]为了提升电力通信系统故障文本的关系抽取性能,针对领域特点,提出一种考虑本体信息的多层次图卷积文档级关系抽取方法。[方法] 首先,使用字级别嵌入对故障文本进行编码;其次,构造句级别和实体级文档图,通过卷积聚合实体级、句子级与文档级的语义信息;最后,根据本体概念模型设计“本体——本体”边构造方法,加入“预测实体对是否符合本体约束”的辅助任务来提升模型性能。[结果]在自建的电力通信网故障文本数据集上进行消融和对比试验,结果表明,所提方法表现最优,F1、Ign F1、AUC值分别达到97.22%、95.17%以及97.97%。[局限]需进一步验证模型的泛化能力。[结论]所提方法适用于电力通信网故障知识图谱的关系抽取任务,较现有方法具有更好的抽取效果。

  • 段宇锋, 谢佳宏
    预出版日期: 2025-01-07

    [目的]研究国内现有大语言模型抽取中文医学文本实体关系的性能差异,分析示例数量和关系类型数量对模型抽取效果的影响。[方法]本文基于提示工程方法,使用API方式调用9种主流大语言模型,从示例数量和关系类型数量两个角度修改提示模板,使用CMeIE-V2数据集进行实验并比较抽取效果。[结果](1)glm-4-0520的综合抽取能力居于首位,在抽取“临床表现”、“药物治疗”、“病因”3种关系类型时F1值分别达到0.4422、0.3869、0.3874;(2)改变提示中的示例数量,F1值开始时随的增加而上升,在时达到最大值0.4742,但后F1值下降;(3)增加需要抽取的关系类型数量后,F1值下降明显,时F1值较时下降0.1182,至时F1值仅有0.2949。[局限]现有的公开数据集较少,实验结果仅通过单个数据集得到;由于医学垂直领域的大语言模型目前难以通过API调用,本文使用的模型均来自通用领域。[结论]不同大模型的抽取效果差别较大;合适数量的示例能够提高模型的抽取效果,但示例并非越多越好;大模型不擅长同时抽取多种关系类型。

  • 余池, 陈亮, 许海云, 牟琳, 夏春姊, 贤信
    预出版日期: 2025-01-07

    [目的] 在少标注样本的条件下对专利文本中的关键技术信息进行命名实体识别。[方法] 利用大语言模型具备丰富的通用知识和强大的语义理解能力的特点,提出一套利用提示模板从专利文本中识别命名实体的方法框架。

    [结果]本文以硬盘驱动器磁头专利标注数据集TFH-2020为例展开实证分析,实验结果显示,在大语言模型的少样本学习能力下,命名实体的识别效果达到69%(F1值),当使用有监督微调方法时,其识别效果则下降至54%(F1值),这与大语言模型在通用文本上的命名实体识别表现正好相反。[局限] 本方法虽然极大降低了数据标注成本,但和利用大量标注数据的当前最佳深度学习方法相比,在性能上还存在一定差距,同时提示模板的设计和优化方法、大批量指令集的快速生成技术等还有待进一步提升。

    [结论]相比使用随机样本选择策略,使用相似度样本选择策略的大语言模型的命名实体识别效果从29%提升至69%(以F1值测度),这显示出样本选择策略在专利命名实体识别任务中对大语言模型的性能影响极大,提示模板处于该任务的核心地位,它不仅决定着识别效果的优劣,也决定着优化方法的选择。

  • 李万斌, 沈思
    预出版日期: 2025-01-07

    [目的]为了有效识别非结构化学术文献中有价值的实体,本研究建立了一个统一的实体识别框架以此来解决不同类型的实体识别任务。[方法]利用BIO标注体系和Json体系对数据集进行标注,并基于统一处理的嵌套实体识别模型Global Pointer对嵌套和非嵌套数据进行识别,从不同角度对模型的性能进行评价并辅以模型CRF、GPT-4和BERT进行对比实验。[结果]Global Pointer在不同类型的数据集上,准确率、召回率、F1均有不错的表现,在非嵌套数据集的平均调和平均值上分别达到了95.38%和79.81%,而在嵌套数据集平均值分别至少可以达到66.91%和61.47%,且总体性能在不需要人工制定特征模版的基础上优于CRF、GPT-4和BERT。[局限]对于整体的嵌套实体识别性能来说,Global Pointer为了能够从应用的角度高效而精准地识别相应的实体,仍需要进一步的优化和改进。[结论]以“全局统一”思想为基础的Global Pointer在实体统一识别中可以有效利用实体的位置特征,从而对于复杂的嵌套实体不仅能提高识别的准确度同时还能兼顾识别的便捷性。

  • 陈万志, 侯悦
    预出版日期: 2025-01-07

    [目的]针对多模态情感分析中存在的多模态特征提取不充分,模态间语义特征差异性和交互性不足等问题,提出一种融合多层次注意力和情感尺度向量的时序多模态情感分析模型。[方法]首先,引入标量长短期记忆网络,并结合多头注意力机制,构建多模态深度时序特征建模网络,以提取文本、音频和视觉模态的丰富上下文时序特征。其次,利用文本引导的双层跨模态注意力机制和改进的自注意力机制,实现模态间的深层信息交流,生成用于分析情感强度和情感积极、消极或中性状态的两种情感尺度向量。最后,将情感强度向量的L1范数与情感极性向量归一化后相乘,得到强度和极性的综合表达实现精准预测。[结果]CMU-MOSI和CMU-MOSEI数据集上的实验结果表明,所提模型在CMU-MOSI上的对比和消融实验均取得较好效果,Acc7、Corr较次优模型提升1.2%和2.3%,在CMU-MOSEI上对比实验各项指标均优于基准模型,Acc2和F1值达到86.0%、86.1%。

    [局限]情感表达具有高度的情境依赖性,不同场景下的情感线索来源可能不同。在文本信息不足的情况下,可能表现不佳。[结论]本文模型能够有效提取各模态的上下文时序特征,利用文本模态丰富的情感信息进行不同模态间的深层次交互,提升情感预测的准确性。

  • 斯彬洲, 孙海春, 吴越
    预出版日期: 2025-01-07

    [目的]为揭示电信诈骗发生过程以及发现关键风险因素,提出基于大语言模型和事件融合的电信诈骗事件风险分析研究框架。[方法]通过构建电诈领域两阶段层次化提示指令,抽取诈骗案例相关风险事件和事件论元,结合语义依存分析和模板匹配方法得到诈骗事件链条;同时考虑到事件表述的多样性,基于BERTopic模型进行句向量表示,采用聚类算法进行事件融合。[结果]在电信诈骗案例事件抽取和论元抽取F1值达到67.41%和73.12%,事件聚类得到10类主题风险事件,“提供个人信息”行为风险最高。展示冒充公检法诈骗的一般演化过程,并通过刘女士被骗案进行举例论证。[局限]基于警情数据粒度比较粗,支撑预警能力不够强大。[结论]采用大语言模型和事件融合聚类方法,能够完成事件演化链路的自动构建,分析事件的风险值,对电信诈骗的预警和劝阻有支撑作用。

  • 卢嘉悦, 陈小莉, 王学昭
    预出版日期: 2025-01-07

    [目的] 从研究内容视角探究国际科研合作的模式和主体行为特征。[方法] 引入大语言模型方法和科学模因概念衡量研究内容同质性;基于研究内容同质性和合作频次划分合作模式,并从合作伙伴和合作内容角度量化分析合作主体的特征。[结果] 在脑机接口领域开展实证。在模式上,核心国家以同质性和异质性合作模式为主,自由合作主要由新兴领域的探索性合作和依附性小国合作构成;在特征上,多数国家倾向于国际合作而非国内独立合作,且合作主导国和依附性小国在多边和单边合作中合作伙伴同质性高;中、英等国倾向于基于本国研究内容的国际合作,而美、德等国则偏好合作研究新内容。[局限] 仅考察了研究内容的同质性,未将不同因素的同质性结合、对比,缺乏全面性。[结论] 丰富了国际科研合作模式分析的方法工具,为理解国际科研合作提供了新视角。

  • 张云秋, 黄麒霏
    预出版日期: 2025-01-07

    [目的] 研究同时从科研平台和社交媒体两个维度展开,提出一种既融合了多源知识单元价值与重要性语义特征,又对中低词频知识单元关系探测敏感的知识组合发现方法。[方法]首先从科研成果和社交媒体两个角度出发,设计并计算影响知识单元价值与重要性的语义特征:知识单元贡献度、所属文献影响力和社会可见度;然后构建热传导模型融合上述多重语义,挖掘知识单元和文献之间的潜在关联;最后基于新的知识单元—文献网络计算知识单元间的加权Jaccard系数,实现知识组合发现。[结果] 选取情报学CSSCI文献数据库和百度百科平台作为数据来源进行可视化和文献回溯实证。针对P@50、P@100、P@500、P@1000和P@2000指标,融合了知识单元价值与重要性的知识组合发现方法的相比于不融合分别提升了0.3、0.23、0.184、0.183和0.278。未得到文献验证的组合如“政务信息资源—产业智库联盟”“微博评论—隐喻识别”“社会影响理论—随机共振”等也有较高的组合潜力和应用可解释性。[局限]未对挖掘出的知识组合做进一步评价分析;其次,知识单元之间细粒度的语义关系挖掘仍是待解决问题。 [结论]本研究提出的知识组合发现方法具有一定的可靠性和优越性,可以为未来的知识组合相关研究提供参考,发现出的知识组合可以为学术创新及学科发展提供决策性建议。