[目的]本研究旨在解决传统Transformer模型在藏文新闻生成任务中面临的局部特征提取不足和解码冗余等问题,以提升藏文新闻文本的生成质量、细节表达能力和语义连贯性。[方法]利用标题和提示词作为关键输入,增强对文本主题的理解;在编码器中,Transformer捕捉标题全局特征,CNN提取提示词局部特征,通过加权融合形成精细的文本表示;解码器采用混合策略和自回归机制,逐步生成与输入紧密相关的新闻内容,减少冗余并提升文本的自然度和连贯性。[结果]在自建的藏文新闻生成数据集上BLEU、ROUGE和Distinct指标分别达到了38.9%、35.8%和47.2%的效果,相对于对比模型有显著提升。[局限]本研究目前主要针对藏文新闻生成任务,尚未验证其在其他藏文文本生成场景(如文学创作、技术文档)中的适用性。此外,模型的计算效率和资源消耗仍需进一步优化。[结论]通过创新性地结合全局与局部特征提取以及混合解码策略,显著提升了藏文新闻生成的质量和细节表达能力,为藏文自然语言处理领域提供了一种创新性解决方案。
[目的]实现中文司法领域裁判文书高质量实体关系联合抽取任务,提升三元组抽取准确性。[方法]提出了基于CasRel实体特征敏感注意力机制的联合抽取模型S-CasRel-MF。模型引入LERT中文编码器增强对中文裁判文书复杂的语义建模能力,结合自注意力机制与BiLSTM提升实体在上下文交互特征的捕获能力,通过联合领域特征词典和多头注意力机制解决主客体抽取误差传播问题,利用Focal Loss损失函数缓解解码中样本不平衡问题。[结果]实验结果表明,S-CasRel-MF模型在涉毒类和盗窃类两类数据集中的F1值分别达到83.51%和83.40%。相较于CasRel,F1值分别提高了9.77%和8.73%;相较于其它类型的抽取模型,F1分别平均提高了16.59%和15.70%。[局限]本文模型的时间复杂度较高,且外部法律实体特征词典在跨领域迁移时面临词典覆盖不足,影响模型效果。[结论]S-CasRel-MF模型能更好捕捉裁判文书中实体间的复杂关系,在实体关系的联合抽取任务中有显著性能优势。
[目的] 有效整合带有并列排名的期刊评级结果,反映学术界对出版物质量的总体评价。[方法] 提出了一种基于线性伪布尔优化模型的期刊评级聚合方法(LPBO),将不同的原始评级结果转换为期刊间的成对比较,利用广义Kendall-τ距离构建线性伪布尔优化模型,在保证期刊评级唯一性和传递性的约束下,实现评级结果的聚合。[结果] 通过对信息科学与图书馆学领域期刊的实证研究发现,LPBO聚合结果与原始评级的相关系数较原始评级自身之间的相关系数提升13.7%,并保留了并列排名信息。该模型在处理不同尺度、不完整的数据以及期刊和评级数量不同时均表现出良好的稳健性。[局限] 在处理大型数据集时可能会面临效率低下的问题。[结论] LPBO方法避免了严格排序所带来的人为误差,为期刊质量与影响力评价提供了一种公平且稳健的解决方案,具有重要的理论与实践价值。
[目的] 以专利-论文引用关系为视角,探究科学论文的颠覆性与其技术影响之间的关系,丰富科学知识流向技术领域的影响因素研究。[方法] 基于人工智能领域发表的68万余篇科学论文,结合专利引用数据,构建了大型的数据集,应用Probit等回归模型,从可能性、重要性、广泛性、持续性和时滞性5个维度开展分析。[结果] 研究发现,论文的颠覆性程度与其被专利引用的可能性存在正向关联,说明颠覆性更高的科学知识更容易产生技术影响。同时,颠覆性更高的科学成果能够产生更重要、更广泛和更持续的技术影响,以及具有更短的技术影响时滞。[局限] 未考虑引用的动机与类型,未对引用论文的专利特征进行分析。[结论] 本文证实了科学论文的颠覆性与技术影响之间的正相关关系,为促进科学知识的技术转化的政策制定提供了一定的理论依据。
[目的] 基于思维链提示探究大语言模型在多模态实体消歧任务中的可用性及有效性。[方法] 构建基于思维链提示的大语言模型提示模板,将先验知识与多模态信息输入大语言模型中,辅助模型从候选实体集中判断出提及准确指代的实体。[结果] 实验表明,在Wiki-MEL、Twitter-MEL和Weibo-MEL三个数据集中,与当前最先进的模型相比,PLMED模型的准确率分别提升了15.1%、11.5%和4.1%。[局限] 实验未详细探究不同提示词构造方法下大语言模型在多模态实体消歧任务中的性能变化。[结论] 基于思维链提示的大语言模型能够更好地适应于不同情景下的多模态实体消歧任务,大语言模型在多模态实体消歧任务中具有巨大的应用潜力。
[目的] 为满足图书检索场景下用户日益多元化与个性化的信息需求,提升问答系统的性能与用户体验。[方法] 本文构建了一种面向书目检索的对话式问答系统(BSCQA)。该系统采用模型上下文协议实现大语言模型与外部数据库的集成。为提升Text-to-SQL生成的准确性,本文设计并集成了一种基于对比学习的示例选择策略,以增强模型对专业领域查询意图的理解。[结果] 在本文构建的书目搜索语义解析数据集上的实验结果表明,相较于零样本场景,采用本文方案的DeepSeek-V3模型在5-shot场景下将执行准确率提高了18.5个百分点。[局限] 由于实验数据集覆盖范围的局限性,系统在跨领域应用中的适应性仍需进一步提升。[结论] 本文构建的BSCQA系统展示了大语言模型在书目智能检索这一图书情报领域典型应用场景中的潜力与应用价值,为其他垂直领域对话问答系统的研究与应用提供了参考。
[目的]通过增加外部知识以及优化大语言模型(LLM)提示方法,解决视觉问答(VQA)任务多步推理准确率低的问题。[方法]提出一种新的知识型视觉问答模型,通过引入PromptCap字幕模型生成图像字幕帮助LLM理解图像区域信息,融合开源与图片语义知识检索增加推理来源。同时,提出了新的问题分解方案降低推理难度,构建了相关上下文示例并集成多个推理答案以提升准确性。[结果]本文模型在OK-VQA和A-OKVQA数据集上分别达到了67.2%和64.8%的准确率,优于当前SOTA模型。消融实验也验证了模型中各个模块的有效性。[局限]本文模型更适用于需要多步推理VQA场景。原因是模型中的问题分解模块会增加计算和时间开销,导致解决简单VQA问题的效率较低。[结论]模型通过借助LLM优化KB-VQA框架,为多步推理的知识型视觉问答提供了一种有效的新思路。
[目的]探索研究空缺句的“句法形式-修辞功能”映射关系,融合多层次语言学特征,扩展学术文本句子级知识抽取新思路。[方法]依据有效性、冗余性和互补性集成句法复杂度指标体系,采用方差分析与线性回归刻画不同类型研究空缺句的句法复杂度差异。微调科学语言模型提取文本语义特征,通过门控机制自适应融合句法与语义信息进行研究空缺句自动分类,引入动态加权交叉熵与Dice Loss的混合损失函数,提升模型对少数类样本的识别能力。[结果]在句法复杂度概念的不同表征维度下研究空缺句类间差异显著。基于门控机制的句法与语义融合分类模型在F1值指标上相较于先进基线方法至少提升1.44%,消融实验结果表明该模型中关键组件的必要性和合理性。[局限]仅挖掘人工智能领域代表性会议论文的研究空缺句,尚未突破学科限制;未探讨研究空缺类型与创新性或影响力测度指标的关联。[结论]本研究提出的门控融合模型能够在低资源环境下准确分类学术文本的细粒度修辞功能,有益于补充不同层次语言学特征的差异内容,兼顾稳定性、鲁棒性与可扩展性。
[目的]比较不同大语言模型推理方法在突发公共卫生事件政策智能问答中的效果差异。[方法]以DeepSeek-R1为例,分别实现了检索增强生成、知识图谱协同、微调、联网搜索及不使用外部数据的推理,并以人工标注的问答为基准,对所有推理方法的优劣进行了比较;其中,不使用外部数据的推理对照了Qwen-QwQ和GPT-4o模型的表现。[结果]自动评估中,基于检索增强生成、知识图谱协同和微调的组合方案BLEU-4和ROUGE-L分别为0.259和0.494,优于其他方法;联网搜索次之(BLEU-4为0.225,ROUGE-L为0.465)。人工评估中,组合方案在内容准确性得分最高(3.560);不使用外部数据的大参数模型在语句流畅性、答案完整性、答案可用性和答案信任度维度表现更优。[局限]实验数据来自网络公开政策文本,未涵盖实际封闭场景中的本地数据;同时不包括多媒体格式,无法验证多模态场景下的推理效果。[结论]在本地数据支持下,不同推理方法在政策智能问答领域可显著降低幻觉、提高准确性,尤其在突发公共卫生事件等垂直领域具有较好适用性。以外部数据为支持能提高模型生成内容的准确性,而不使用外部数据推理的生成内容更加完整和可信。
[目的] 为提升在线教育中学习行为检测的准确性,推动教育智能化由结果导向迈向过程可解释的新范式,本文提出一种大语言模型驱动的学习行为检测模型。[方法] 该模型集成大语言模型、检索增强生成与可解释人工智能技术,构建融合学习行为特征与情感特征的文本-时间序列数据。文本数据由BERT模型提取并转为时间序列数据,采用LightGBM模型进行训练,并结合SHAP方法量化各特征对模型预测的边际贡献,实现预测过程的可解释性。[结果] 所提模型在学习行为检测任务中表现优异,准确率达到99.90%,召回率为99.78%,F1值为97.69%,均显著优于所有基线模型。与性能最低的逻辑回归模型相比,三项指标分别提升20.84%、24.34%和21.94%,充分验证了模型在复杂特征识别中的优势。[局限] 数据来源于单一在线学习平台,样本粒度较粗,存在一定的外部泛化局限。[结论] 本研究通过融合可解释性人工智能与多模态特征,有效提升了模型的准确率与可解释性,为高校在线教育平台提供决策支持。
[目的]本研究旨在解决中华诗酒文化中“物象-意蕴”语义结构关系难以构建的问题,推动传统文化的结构化表达与自动化识别,为文化资源的智能化理解与传播提供技术支持。[方法]提出UOCIP模型,设计涵盖语料构建、物象抽取、意蕴识别、图谱构建四阶段流程,并引入对抗训练机制与AIGC数据增强策略,以提升模型在低资源场景下的表现。[结果]实验结果表明,物象抽取模型的Macro-F1从56.2%提升至58.6%;意蕴识别模型在多模态注意力机制支持下达到83.4%的Macro-F1;构建的意蕴图谱覆盖五类术语体系,具备一定的未登录术语识别能力。[局限]尽管取得初步成效,但当前模型在处理非典型诗风文本及进行图谱边界语义控制方面仍存在挑战,泛化能力与边界规范性有待进一步提升。[结论]本研究在冷启动条件下初步实现了中华诗酒文化语义建模的有效范式,验证了UOCIP模型在传统文化智能处理中的可行性与推广价值,为后续相关研究提供了理论基础与方法参考。
[目的]综述检索增强生成(Retrieval-Augmented Generation, RAG)技术中检索粒度对系统性能的影响,探讨不同粒度在上下文完整性与信息精确度之间的权衡及优化。[文献范围]使用“Retrieval-Augmented Generation”“检索增强生成”“Retrieval Granularity”“检索粒度”等中英文关键词,在谷歌学术、ACM Digital Library、中国知网等数据库中检索了2020至2025年间的相关论文,筛选出106篇代表性文献进行分析。[方法]以检索粒度为主线,从技术路径、核心机制、创新与不足等维度,对比分析了现有RAG方法。[结果]构建了“粗粒度-细粒度-混合粒度”的研究框架,粗粒度保障上下文但易引入噪声;细粒度提升精度却导致语义碎片化;混合粒度虽旨在融合优势,但其融合与调度机制是当前的挑战。[局限]侧重于文本型RAG研究方法综述,未全面覆盖涉及多模态(如图像、音视频)的RAG研究方法。[结论]RAG技术的发展依赖于粒度选择的智能化和信息融合的精细化。未来可深入探索命题级检索粒度、动态粒度选择、自适应机制以及结构化与非结构化知识协同。
[目的] 为解决面向话题的讽刺识别中存在的实体重叠和关系复杂问题,本文提出一种融合外部知识感知注意力的提示学习模型,以提升面向话题的讽刺识别准确率。[方法] 首先,根据话题和评论文本总结了一个面向话题的提示学习模板。其次,识别话题和评论文本中的实体并将其与知识图谱中的实体对齐,实体及其上下文被用作外部知识来提供补充信息。然后,设计了外部知识感知注意力来衡量知识的重要性。最后,通过Veralizer模块指定映射词并对掩码进行预测。[结果] 在公开的ToSarcasm数据集上的实验表明,本文模型优于对比的先进模型,准确率达到了72.25%,F1值达到了77.16%。[局限] 本研究未采用可学习的软提示方式构建提示模板,提示设计及映射词的选取仍有进一步优化的空间,同时仅使用了ToSarcasm数据集进行模型训练,模型的泛化能力有待提高。[结论] 外部知识的引入能够有效解决实体重叠问题,提示学习能够有效解决关系复杂问题,模型能够有效提升面向话题的讽刺识别的准确率。
[目的]为了更好地把握科学发展脉络,提出一种通用的论文研究阶段自动分类方法,以精准划分研究阶段,揭示学科演进趋势,助力科研规划、资源优化及成果高效转化。[方法]在Boyack等人研究基础上,构建了多学科适用的研究阶段分类框架,通过标注数据对大语言模型进行监督微调,结合深度语义分析与提示工程技术,实现研究阶段的自动化划分,并以科学结构图谱验证其效果。[结果]本方法在研究阶段分类任务中取得F1分数85.45%和准确率85.50%,显著优于多项逻辑回归模型的62.71%和62.00%,且在科学结构图谱中呈现更清晰的阶段特征。[局限]受计算资源限制,未能开展多模型对比实验。[结论]基于监督微调的大语言模型在研究阶段分类中展现出较好准确性与鲁棒性,优化提示设计可进一步提升性能,为加速科技成果转化与学科发展提供有力支持。
[目的]简化科技文献摘要撰写过程,生成更直观的图谱式摘要以辅助科研。[方法]选取PMC数据库的水稻育种相关论文,构建4276条“全文-摘要”问答对,通过实验遴选最优的提示词和温度系数,基于有监督数据集对Qwen2.5-7B-Instruct大模型微调,并在GraphRAG框架中接入微调后的模型以生成每篇论文的图谱式摘要,后使用优选提示词在GraphRAG中进行全局查询,获得论文的文本摘要。[结果]本研究方法在ROUGE-1、ROUGE-2和ROUGE-L的F1值上,相比基线模型分别提高了44.16%、61.36%和54.87%,在5分制人工评测中,本研究方法相比基线模型平均提高了1.78分,生成的图谱式摘要效果更加直观。[局限]本研究受限于基础硬件条件,选取的大模型参数量较小,模型生成能力还需加强,此外本研究选用的GraphRAG技术框架,在索引构建阶段耗时较长,在实际应用中还需配套高效的推理加速框架。[结论]基于图谱对大模型的检索增强生成技术能够深入捕捉论文中的远距离隐藏信息,生成更加全面且准确的论文摘要和层次清晰的图谱式摘要,便于提高科研人员的阅读效率,助力科研生产工作。
[目的]分析跨学科领域的术语词在不同学科间存在的语义差异现象,挖掘语义差异现象的原因。[方法]使用预训练深度学习模型实现自动化地识别和量化术语的语义差异,设计构建语义差异程度指标定量衡量语义差异程度,并对术语所涉及学科进行共现分析。[结果]基于预训练模型的语义差异现象识别准确率达到0.8193,所构建度量指标能够对语义差异进行有效量化。[局限]研究局限于中文术语的语义差异,选取术语学科跨度范围有限。[结论]挖掘出跨学科术语存在语义差异现象的原因主要有:学科专业化和知识分化、语言及语境的差异、概念的层次化和抽象化、认知侧重层面的差异以及跨学科交叉与融合影响等,为探究术语差异背后的原因及其与学科之间的关联提供了新的视角和方法论。
[目的]针对美国国会听证会文本数量大、涉及范围广、口语化表达多等特点,本文提出一个智能化识别中国科技安全风险的方法流程。[方法]本研究从听证会数据特征与情报分析人员实际需求出发,利用大语言模型等技术实现文本过滤、摘要生成以及智能问答等模块并将其有机结合在一起,从而达成高质量的智能化识别。[结果]本研究以第118届国会听证会文本为对象验证关键模块的有效性。文本过滤的F1值、摘要生成的ROUGE-Lsum值、智能问答风险点召回率分别达到0.7751、0.6032以及0.7636,显著优于基线方法。[局限]该方法主要针对美国国会听证会文本设计,未来还需要用更多类型的语料加以验证,以便将其泛化并扩展成通用方法。[结论]本文提出的方法能辅助研究者深入挖掘美国国会科技情报,为我国制定有效的科技安全应对策略提供显著支持。
[目的]为充分挖掘中文文档之间的语义关联信息,实现基于交互式语义增强的文档级事件抽取效果的提升。[方法]本研究提出了一种交互式语义增强的中文文档级事件抽取模型CSDEE,利用注意力机制构建跨文档的交互式语义网络,增强实体识别性能,再经由文档编码与事件抽取信息解码完成事件抽取任务。[结果]实验结果表明,CSDEE模型在事件抽取的精确率、召回率和F1值上分别达到80.7%、84.1%和82.3%,优于现有基线模型。同时,通过对模型开展消融实验及在公开数据集ChFinAnn和DuEE-fin上的泛化实验,验证了模型在中文文档级事件抽取任务中的有效性。[局限]目前模型仅针对文档级事件抽取的性能提升作出了相应改进,暂未涉及重叠事件类型的多分类任务。[结论]充分挖掘与关联文档数据之间的相似语义信息能够有效促进文档级事件抽取任务的性能与效果。
[目的]运用深度学习与对比学习方法解决目前零样本关系抽取任务中完整实体信息与关系信息交互不够充分的问题。[方法]提出了一种基于对比学习的联合实体关系信息的零样本关系抽取模型(JCL)。首先,使用数据增强技术对原始的输入文本进行处理,增加模型得到的有效信息。其次,通过增强交叉注意力模块将实体对深度融合与关系联合处理,提取实体与实体间的交互信息和实体与关系语义间的交互信息,放大不同关系在嵌入空间内的细微差异。最后,使用交叉熵损失函数联合对比损失优化模型。[结果]与基线模型相比,在FewRel数据集不可见关系m = 5情况下,F1提升了3.12%;m = 10情况下,提升了5.19%;m = 15情况下,提升了1.99%。在Wiki-ZSL数据集m=5时,提升了7.05%;m=10时,提升了3.42%;m=15时,提升了8.08%。[局限]本文的研究领域数据集的语言较为单一,数量较少。[结论]本文提出的基于对比学习的联合实体关系信息模型针对零样本关系抽取任务在三个公开的数据集上的效果达到先进水平。
【目的】为解决AI换脸诈骗过程中多模态特征表征不足的问题,提出面向AI换脸诈骗的受骗风险识别模型FSFRI,有效融合多模态特征提升受骗风险识别效果。【方法】FSFRI综合欺诈信息的生成和传播过程,从中提取伪造人脸视频帧特征、流量描述特征、流量负载数据特征和流量时序特征,再通过特征融合模块实现跨模态特征的互补融合,最后通过风险识别模块实现受骗风险的识别。【结果】在模拟实验生成的数据集中,FSFRI取得了较好的识别效果,F1值达到0.92;同时在低噪声环境中(加噪比例为0-0.2)展现出较强的鲁棒性,在0.2的加噪比例下F1值仅下降0.019。【局限】FSFRI中的多模态特征产生了较高的计算复杂度,且在高噪声环境中的风险识别效果有待进一步提升。【结论】FSFRI能有效提取并融合AI换脸诈骗过程中产生的多模态特征,并实现受骗风险准确识别。
【目的】为解决深度学习推荐方法缺乏对用户兴趣分布特征建模,不能充分刻画用户偏好的问题,提出一种基于用户兴趣聚集性和层次性分布特征建模的序列推荐方法。【方法】利用注意力网络和LSTM从行为序列获得用户和项目的向量表示,学习用户兴趣分布的位置中心和边界半径,通过双半径刻画兴趣分布的层次性和聚集性;通过拟合候选项目特征与用户兴趣分布中心的距离与交互概率预测用户偏好;融合基于神经网络的行为预测和基于兴趣模型的偏好估计生成推荐。【结果】在Amazon数据集上的实验结果表明,相比于表现最优的对比方法,本文方法在准确率、召回率、F值、覆盖率等评价指标上的性能达到最优,性能提升达到10个百分点以上。【局限】未考虑除行为序列外的用户生成内容,后续研究可以结合用户评论等信息完善兴趣建模。【结论】本文方法能准确刻画用户兴趣的分布特征,提高推荐准确度,优化推荐结果的综合质量。
[目的] 本文以科技情报短文本为实验数据,研究大语言模型在多领域科技知识实体抽取任务中提示工程的构建方法,旨在解决短文本语义不足和领域多样性对科技实体抽取的挑战。[方法] 针对科技情报短文本语义浓缩导致的上下文信息不足、知识实体领域跨度大、以及实体边界模糊等问题,本文提出一种基于知识提示学习的Scientific Prompt知识实体抽取策略。该策略结合BERTopic方法,将领域知识动态引入提示词策略中,以提升大语言模型在多领域知识实体识别中的语义理解和感知能力,增强抽取的精确性和泛化能力。[结果] 实验结果显示,在Scientific Prompt策略加持下,QWEN2.5-7B、QWEN2.5-7B(微调)与GPT-4o的F1-Value分别为0.6526、0.7407、0.7878;而Zero-Shot下对应模型的F1-Value分别为0.5534、0.6165、0.6822。对比发现,在短文本-多领域实体抽取任务中,Scientific Prompt策略加持下的开源模型可远超对其微调的效果(0.6526 vs 0.6165);甚至该策略加持下的微调QWEN2.5-7B模型表现略优于仅使用GPT-4o的效果(0.7407 vs 0.6822)。[局限]本文仅测试了该策略在中文科技情报短文本上的表现情况,未测试其在英文文本的适用性。[结论]实验证明,与微调方式相比,Scientific Prompt策略无需更新模型参数即可显著提升大语言模型在短文本-多领域知识实体抽取任务中的性能。实验还验证了Scientific Prompt策略在大规模无监督科技短文本中的表现,通过精确抽取科技实体可有效感知科技态势。本文的研究为通用型中文科技短文本知识实体抽取任务提供了重要的技术路径参考。
[目的] 提出一种基于静态与动态异构图嵌入的全局引文推荐框架,以期提高引文推荐的准确度。[方法] 本文首先分别构建静态加权异构网络与时序异构网络。在静态异构网络中,利用混合随机游走和skip-gram模型生成能捕捉网络局部与全局信息的节点嵌入;基于所构建的时序异构网络,首先利用基于元路径的随机游走获得元路径实例,再建模异构图中的时态演化特征,以此获得图中节点的嵌入式表示。然后利用联合训练与独立训练两类方法整合获得图中论文节点的最终嵌入表示;最后通过计算相似度为输入论文生成候选引文推荐列表。[结果] 实验结果表明:本文提出方法的实验性能均优于只考虑动态或者静态的方法;其中独立训练方法在几乎所有召回率指标(除了Recall@40之外)上表现最佳;自适应任务不确定性加权方法在MRR与MAP指标上表现最佳,分别达到0.308与0.297。[局限]未在多个数据集中验证新提出的模型的性能;模型算法的运行效率尚需优化提升。[结论]综合考虑网络静态和动态性能有效提升全局引文推荐的性能。
[目的]现有社会化序列推荐研究容易引入与用户兴趣不相似的好友信息,且未能考虑不同用户受社交影响的程度存在差异,致使推荐性能受限。为弥补现有研究不足,提出一种基于图注意力网络的自适应社会化序列推荐方法。[方法]首先,利用自注意力机制对用户行为序列建模,获取用户动态兴趣表示。其次,设计一种正则化限制的图注意力网络聚合好友特征,以准确建模用户社交兴趣表示。最后,提出一种基于注意力的自适应融合方法,准确融合动态兴趣与社交兴趣,生成推荐结果。[结果]与主流基线模型相比,所提方法在HR@10上最高提升10.8%,在NDCG@10上最高提升5.3%。[局限]所提方法对于社交网络结构的依赖性较高,当社交关系数据稀疏时,性能提升不明显。[结论]本文方法可以更充分地利用社交信息,有效预测用户行为,提高推荐性能。
[目的]鉴于司法裁判文书摘要要求与原文在案件事实、法律适用等要素保持一致,提出嵌入司法要素事实一致性评测的中文司法裁判文书摘要生成方法。[方法]首先定义司法裁判文书摘要事实一致性判定的原则和方法;其次,确定数据增加、事实一致性纠错和测评等预处理流程;然后,分别构建分段抽取模型和引入司法要素知识图的生成式摘要模型,并在CAIL2020数据集上进行实验。[结果] FC-JDSM模型生成的摘要在指标ROUGE-N(N=1、2、L),SRO,EM-FCJS上分别为67.98%、55.40%、64.14%、78.5%、90.01%,均优于比较模型。消融实验证实了分块抽取和事实信息引入的有效性。[局限] EM- FCJS中的数据增强方案得到的数据与真实数据存在着一定偏差。[结论] 将司法要素融入一致性评测和摘要生成过程中,提高了中文司法判断文书摘要一致性,有利于司法工作的公正性。
[目的] 针对专利转让数据中难以区分发生实质性专利交易问题,提出一种系统性方法,通过融合多种基于莱文斯坦距离算法,较为准确地识别出发生实质性交易的专利行为,并探讨其技术特征差异。[方法] 针对不同专利转让场景,提出了一套筛选流程方法。其关键步骤之一是利用基于编辑距离算法的多种文本相似度方法,计算交易双方姓名和地址的相似度分值,并结合设定阈值剔除内部资源重新配置的非市场化交易记录。同时,通过实证研究验证方法准确性,并利用统计分析比较发生实质性交易与未发生实质性交易行为的专利在技术指标上的差异。[结果] 实验结果表明,该方法在准确率上达到81.27%,能够有效识别发生实质性交易的专利行为。发生实质性交易的专利在独立权利要求数量、同族专利数及被引次数等技术指标上显著高于未发生实质性交易的专利(p < 0.05)。[局限] 实验数据时间跨度有限,且文本相似度算法在复杂地址特征处理上的适应性需进一步优化。[结论] 本研究为专利交易行为的精准识别提供了有效方法和思路,并为技术转移与专利市场化领域的研究提供了可靠数据支持。
[目的]大语言生成模型为中文开放关系抽取任务带来了新思路,但如何优化模型生成的关系抽取结果质量成为一个重要问题。[方法]本文提出一种低成本的基于多维度自我反思学习的大模型微调方法(SRLearn方法),自动引导模型进行多维度的自我反思学习,从而优化模型的中文关系抽取生成质量。[结果]相比LoRA+DPO偏好微调方法,SRLearn方法在WikiRE1.0数据集上提高了15个百分点,在DuIE2.0数据集上提高了6.5个百分点,验证了该方法的有效性。[局限]SRLearn方法未来还需要考虑覆盖更多的生成质量问题。[结论]基于多维度自我反思学习增强的大模型微调方法能够大幅度提高中文关系抽取生成质量。
[目的]设计嵌入双通道注意力卷积的联邦学习框架,破解因隐私保护导致的跨社交网络特征提取难题,精准识别社交机器人。[方法]首先,采用联邦学习框架实现跨社交网络数据集成。其次,在本地模型模块嵌入双通道注意力卷积以全面挖掘数据特征。再次,借助基础卷积和区块链在联邦聚合模块对各本地模型参数进行集成处理,以获取和安全保存最优模型参数。[结果]TwiBot-20&Weibo-bot数据集上的实验结果表明,FL-DCACNN模型的准确率、精确率、召回率和F1值分别达到91.63%、97.10%、97.14%和96.88%,且呈现较强的泛化能力。[局限]在多模态特征提取时仅考虑了结构化数据、文本数据及图片数据,未涉及视频、音频数据。[结论]FL-DCACNN模型可有效破解特征提取不足、数据来源单一等因素造成的社交机器人识别效果不佳问题,提高了模型识别性能,实现了社交机器人的精准识别。
[目的] 面向国家人口健康科学数据中心数据集中存储、数据安全风险、计算资源有限、用户分析利用需求迫切等特点,研究适合国家人口健康科学数据中心数据飞地的建设思路,为用户提供更高效、安全和灵活的数据处理与分析环境。[方法] 归纳数据飞地的类型、特点、实现机制和不同场景的适用性,结合国家人口健康科学数据中心数据应用特点,基于融合安全增强、微隔离和人工智能等技术的虚拟数据飞地方式,构建国家人口健康科学数据中心大数据分析平台。[结果] 构建的大数据分析平台支持国家人口健康科学数据中心数据审核、数据加工、数据分析挖掘、用户发表论文关联数据同行评议等服务,累计完成2800余个项目3.2万个数据集的审核任务、1万余项数据分析任务和5000余项数据加工任务,数据泄露事件发生率为0,资源利用率达80%。[局限] 无法实现跨机构分散存储的数据共享,还需结合数据中心发展探索基于多方安全计算和联邦学习等隐私保护技术的数据飞地研究。[结论] 有效解决人口健康数据集中方式的安全共享与协作分析需求,对国家人口健康科学数据的安全保障和共享利用具有重要意义。
[目的] 解决古籍文本因语言复杂性、多样性及标注数据缺乏而带来的命名实体识别难题。[方法] 本文构建了一种融合古籍知识库和AI-Search的RAG框架,结合LATS框架的生成、搜索、反思与修正机制,优化大语言模型在古籍领域的零样本命名实体识别性能。[结果] 在CHisIEC公共数据集上的实验表明,与古籍领域微调模型Xunzi-Qwen1.5-7B_chat 相比,本文方法的Micro F1值提升了14.44 个百分点,与Qwen1.5-7B_chat相比提升了16.99个百分点。
[局限] Prompt构造方法有进一步优化空间;LATS框架计算复杂度较高,可能影响大规模数据场景的效率。[结论] 检索增强生成有效增强了大语言模型的领域知识,LATS框架优化了大语言模型输出的准确性与条理性,显著提升了大语言模型在古籍领域零样本命名实体识别任务的性能。
[目的]综合考虑城市碳排放信息的非完整性、特征的多元性以及排放规律的复杂性,全面刻画碳排放的复杂动态过程对预测精度的提升至关重要。[方法]提出了一种融合关键信息粒度的多源异构时域卷积碳排放预测HOSVD-TCN模型。首先使用自动提取技术抓取原始粒度信息,其次运用自然语言处理社交媒体的实体文本,形成关键信息粒度的情感值。通过高阶奇异值分解和重构异质信息,生成高质量的张量表示,并将重构后的碳排放量作为预测模型的输入。最后使用时域卷积模型TCN预测碳排放量。[结果]实验结果表明,所提出模型三个城市的平均MAPE值仅为6.96%,预测性能优于其他主流的对比模型。[局限]多模态数据处理的复杂度较高,预测效果受限于现有数据集的规模。[结论]HOSVD-TCN充分结合了HOSVD的特征提取能力和TCN的时空捕捉能力,实现了对城市碳排放的准确预测,为城市规划和管理提供了有力的技术支持和科学依据。
[目的] 在将论文及其属性数据(如作者、发表场所等)建模为知识图谱的基础上,细粒度聚合论文属性数据的时序演化信息以提升模型在新发表论文引用数量预测任务中的性能。[方法] 提出一种基于时序演化与细粒度信息聚合的引用数量预测模型,该模型由图邻域特征聚合模块、时序演化表示模块、细粒度信息聚合模块和预测模块组成。图邻域特征聚合模块获取知识图谱中学术实体的特征表示;时序演化表示模块获取论文属性数据的时序演化特征;细粒度信息聚合模块通过多头注意力机制聚合不同属性数据对论文的影响;预测模块输出引用数量预测结果。将所提模型应用到DBLP数据集,开展实证研究。[结果] 本文模型在DBLP数据集的MALE、RMSLE和R2指标分别为0.5141、0.7098和0.3470,显著优于现有最先进方法。[局限] 由于篇幅限制,本文仅使用DBLP数据集验证模型效果,未来将在更多数据集上进一步验证模型的泛化能力。[结论] 本文模型在DBLP数据集上的性能优于目前最先进的方法,研究揭示了如何利用论文属性信息的时序演化特征以及细粒度信息聚合来提高对新发表论文的引用数量预测性能。
[目的]现有预训练模型在处理政务问题时存在各向异性和领域泛化能力不足的局限,使得政务问题检索面临“搜不到、搜不全、搜不准、体验差”等挑战。为提高政务检索的效果和效率,本文提出了细粒度的政务问题语义检索模型GovSQR。[方法]GovSQR模型首先通过结构化的提示工程和少样本示例引导大模型生成任务适配的正负样本数据集,随后基于生成的三元组数据采用有监督SimCSE框架微调RoBERTa模型,同时设计了动态加权掩码机制和去偏对比损失函数以降低假负样本对语义表征的干扰。[结果]在深圳市政务问题数据集上的实验结果表明,GovSQR模型在P@1、R@3和MRR指标上分别达到了0.9660、0.9811和0.9729,均优于InfoCSE、DiffCSE等主流对比学习模型。[局限]数据生成过程易受幻觉干扰,人工核验成本较高,且针对语义复杂、表述模糊问题的有效性需要进一步验证。[结论]GovSQR模型通过数据增强和假负样本去偏,使模型学到更具判别性和均匀性的嵌入表示,显著提升了政务相似问题检索的准确性,为政务服务智能化提供了有力支撑。
[目的]为了在捆绑推荐中解纠缠用户多样化意图以捕获丰富的节点信息,本文提出解纠缠感知双通道对比学习的捆绑推荐模型。[方法]局部多视图意图解纠缠模块将节点表示映射至潜在空间,获取解纠缠节点表示;全局超图统一学习模块整合多类型数据,捕捉高阶相关性;双通道协同学习模块运用对比学习实现两者的协同学习。[结果]在公开数据集上,D2CBR展现出了显著的性能优势,相较于最先进的基线,平均性能提升了2.87%,最高可达6.43%。[局限]超图运算,如关联矩阵,往往与图中节点数量相关,处理超大规模数据集时会导致较大的内存和计算开销,在计算资源有限的场景下应用可能受限。[结论]本文通过图变分自编码器有效区分用户多样化意图,利用超图整合多类型数据,提升了推荐性能。在公开数据集上超越最先进的基线,证明了模型的有效性和鲁棒性。
[目的] 提出一种智能体框架,提升大语言模型风险指令挖掘任务的准确性与可解释性。[方法] 该框架集成语言对齐模块实现多语言输入的统一映射,层级检测模块实现多阶段风险分析,双通道解释模块提供分析决策依据,一致性验证模块提升处理复杂样本时的可靠性。[结果] 基于三个风险指令数据集的实验表明,该方法最高可将现有工具的分析准确率由54.75%提升至93.75%,在仅使用开源小模型作为内核的情况下,准确率增幅也能超过20%。[局限] 框架推理效率有待提高,同时部分轻量级模型生成的结构化输出稳定性不足。[结论]该方法能够有效为大语言模型风险指令挖掘提供通用、可解释且跨语言的增强方案。
[目的] 细粒度挖掘不确定环境下社交媒体用户观点立场转移有助于全面了解舆情发展态势。[方法] 本文以持续参与疫苗话题讨论的推特用户为实验对象,基于预训练语言模型和神经网络模型构建用户立场检测模型,将用户观点转移路径划分为六种类型。基于不确定减少理论,构建不确定环境下用户观点立场转移预测的特征体系。基于XGBoost模型构建观点立场转移预测模型,采用SHAP解释方法对特征重要性进行分析。[结果] 研究结果表明,46.76%的用户并未改变其疫苗观点立场,而且用户观点扭转型占比较少。基于XGBoost构建的用户观点转移预测模型F1值达到了0.8209,交互用户立场相似度的特征重要性最高。此外,不同观点转移路径上特征的重要性排序有所不同。[局限] 用户观点立场转移可能会受到重大外生事件等多重因素影响,未来可进一步探究重大外生事件等因素对用户观点转移的影响。[结论] 结合预训练语言模型和神经网络模型能更好地检测用户立场,揭示不确定环境影响用户观点转移的因素,为社交媒体用户观点在线监测的进一步工作提供帮助。
[目的]就现有方法替代指标选取、特征体系构建、模型结构设计上对专利商业化潜力与专利策略关联利用不足的问题提出一个新的专利商业化潜力预测方法。[方法]将专利实际维持时间是否超过设定阈值作为判断商业化潜力的标准,提出由特征处理模块与多任务并行预测模块构成的LSTM+MTNN模型。特征处理模块拼接数值特征与Bert+SimCSE及LSTM模型生成的文本连续特征形成多任务并行预测模块的输入。多任务并行(MT)预测模块基于专利商业化潜力与法律事件的关联构建,包括人工神经网络(NN)实现的共性特征捕捉层、法律事件预测层与商业化潜力预测层,输出为辅助任务法律事件预测与主任务商业化潜力预测的结果。[结果]专利策略视角下专利数值特征体系具备合理性;LSTM+MTNN模型在专利商业化潜力预测上较对比模型表现更佳,尤其在较小数据集上优势明显。[局限]专利文本信息利用方式有待深入研究;复杂技术环境中的专利商业化潜力的表示与预测方法有待探索。[结论]预测模型输入在专利数值特征基础上增加权利要求文本特征使其得到了有效充实;预测模型结构上增加法律事件预测的辅助模块实现了任务间信息共享;二者对专利商业化潜力预测起“减熵”作用,能够帮助模型作出判断。
[目的]本研究旨在构建具有可解释性的高质量疾病预测模型,通过识别影响疾病形成的关键诱因,并进一步分析诱因对于疾病的作用方式,从而为辅助诊断和精准医疗赋能助力。[方法]以肥胖症为研究对象,首先,利用随机森林模型在疾病数据的多维特征中筛选出最具代表性的特征子集;其次,通过构建增强型麻雀搜索算法实现支持向量机核参数与惩罚系数的自适应获取;然后,同步应用优化后的支持向量机模型对数据样本进行预测分析,并将该模型与8种基线方法展开对比;最后,借助SHAP解释框架对疾病诱因与疾病形成的作用关系进行量化分析。[结果]本文所提模型的预测准确率能达到85.5%,其获得的准确率、特异度与马修斯相关系数三种指标值均高于其他8组被试模型,证明了该模型的有效性,此外,家族史、蔬菜摄入频率、每日正餐数量、身高、性别、交通工具使用情况与高热量食物摄入情况是影响肥胖症形成的关键因素。[局限]针对肥胖症展开的实证研究无法有效验证模型的泛化性;未对特征变量之间的交互作用进行分析。[结论]本文所提模型不仅具有较高的预测准确率,还能够分析不同诱因对疾病形成的影响程度和作用方向,所得结论可为医疗机构提供决策支持。
[目的]构建可解释集成学习模型,为预测电影IP衍生品的开发效果提供新的决策方式。[方法]基于价值链理论解析电影IP衍生品开发过程,构建预测指标体系。基于KLLB模型对影响因素进行提取筛选、构建预测标签。提出基于AWStacking的开发效果预测模型。 [结果]以XGBoost、CatBoost、RF为基学习器,LR为元学习器的AWStacking算法预测效果最好,宏平均精确率为0.8699,宏平均召回率0.7889,宏平均F1值为0.8216。[局限]由于受目前数据可得性的限制,关于电影IP衍生品开发效果衡量指标可以进一步优化,提升指标测量的细粒度。[结论]所构建的模型为电影IP衍生品开发效果的预测提供了依据,有助于推动电影IP衍生品市场的健康发展。