【目的】 解决手动睡眠分期方法耗时烦琐和现有自动睡眠分期模型训练时间长、识别效果不佳等问题,提升睡眠分期预测的准确性和鲁棒性。【方法】 设计基于离散小波和残差收缩网络的睡眠分期模型(WaveSleep)。首先,使用离散小波变换对原始脑电信号数据进行分解,然后通过两个不同尺寸的卷积神经网络进行多分辨率的特征提取。接着,使用深度残差收缩网络对特征在通道层面的相互依赖关系进行建模。最后将部署了多头注意力的时间上下文编码器用于有效捕捉特征中的时间依赖关系。【结果】 所提模型在三个公共睡眠数据集上的分类准确率分别达到85.4%、81.9%和84.4%,与最优基线模型相比分别提高1.0、0.6、0.2个百分点。【局限】 所提模型在类别不平衡的数据集上准确率提升有限。【结论】 WaveSleep模型能够有效提升睡眠分期预测的效率和准确性,并且具有显著的鲁棒性。
【目的】 从多标签的角度提高用户对于敦煌壁画的图像检索效率,设计面向敦煌壁画的多标签图像检索模型(DNHMIR)。【方法】 首先,搜集敦煌壁画图像并从主题和内容的角度进行多标签标注;其次,通过DenseNet提取图像特征,结合哈希进行压缩编码;然后,结合标签信息利用余弦相似度进行图像匹配,并按照相似度大小排序;最后,使用HyP2损失函数对模型哈希码生成进行评估与优化。【结果】 基于DenseNet哈希的多标签图像检索模型在构建的敦煌壁画多标签数据集上取得了较好的检索效果,mAP@7000达到0.884,相比于基线模型至少提高了0.044。【局限】 图像特征映射为哈希编码会导致部分图像信息丢失,且忽略了用户群体间的认知差异。【结论】 本文面向敦煌壁画构建的DNHMIR模型能够准确检索到多标签图像,降低了存储空间和检索时间,提高了敦煌壁画的检索效率。
【目的】 提出一种医学出版物推荐模型,运用跨模态信息提高推荐的准确率。【方法】 首先利用医学术语系统将标签内容标准化,将图文标签进行配对,再利用配对的语义标签通过对比学习将图像与文本之间的特征语义进行对齐,进而基于对齐的特征语义构建跨模态交叉注意力机制,并通过用户对不同模态兴趣权重预测用户对出版物的偏好。【结果】 在两个出版物数据集上与三种最新的多模态基线模型进行对比实验,模型的精确率平均为62.79%,F1值平均为53.62%,NDCG平均为61.17%,各指标结果总体优于基线模型。【局限】 对于仅包含单一模态的预训练数据可能需要额外的冷启动方法。【结论】 所提模型跨模态信息特征的融合能力强,可以有效缓解不同模态间语义鸿沟问题,提高医学出版物推荐的准确率。
【目的】 解决传统LDA模型在短文本,尤其是中医药论文摘要中专业术语较多,主题术语的可解释性较差的问题,提出一种融合粗糙数据推理改进的LDA模型(I-LDA)。【方法】 使用融合粗糙数据推理的TextRank算法,提取出最具代表性的关键词。通过构建特定领域的字典,提高领域词汇权重。结合粗糙数据推理扩大主题词选词范围。【结果】 I-LDA模型在主题连贯性和主题间距离方面,相较于传统LDA模型,分别提升了约5.6个百分点和1.8个百分点。【局限】 由于中医药论文摘要文本中的专业词汇较多,实验中预设的词典可能无法全面覆盖所有相关术语,从而影响模型在主题建模中的表现。【结论】 I-LDA模型在中医药论文摘要的主题建模中表现较优,且识别的主题更具代表性和专业性。
【目的】 针对难以准确捕捉学者研究兴趣的问题,提出一种融合论文内容与引用特征的学者研究兴趣发现方法,并据此构建基于学术知识图谱与随机游走算法的论文推荐模型。【方法】 使用预训练文本嵌入模型与引文网络学习已发表论文的向量表示,基于相似性理论挖掘学者研究兴趣;运用知识图谱嵌入、有偏随机游走与注意力机制等深度学习技术计算学者对论文感兴趣的概率,最后生成论文推荐列表。【结果】 在DBLPv14数据集上的实验结果表明,所提模型相较于基线模型在F1值与MRR指标上最多分别提升0.041和0.031,各指标结果总体优于基线模型。【局限】 所提模型未考虑到实体和关系上的属性对推荐性能的影响。【结论】 所提模型考虑了论文内容与引用特征,能够有效反映学者的研究兴趣,提高论文推荐准确性。
【目的】 利用影响因素挖掘生物医学文献中疾病与疾病之间的关系,为疾病关联分析提供新视角。【方法】 基于影响因素在共病管理上的重要作用,通过依存分析完成疾病-影响因素实体关系抽取,结合复杂网络分析技术进行疾病社区发现,构建基于影响因素的疾病关联模型,并使用中华医学期刊全文数据库的部分数据进行验证。【结果】 基于影响因素的疾病关联模型构建了105个疾病节点、453个影响因素节点和2 067条边的加权网络,发现影响因素介导的9个内部关联紧密的疾病社区,进而实现疾病关联分析。【局限】 复杂长句的疾病-影响因素获取效能较低,降低疾病关联的数量。【结论】 模型能够获取更细粒度的疾病-影响因素关系,具有更好的代表性和可解释性,可以为疾病关联分析和共病共管提供新的研究思路。
【目的】 充分挖掘ID特征中蕴含的深层信息,提出一种基于ID特征的深度交互与自注意力融合推荐模型DFM-ID。【方法】 提出一个ID特征深度学习框架,设计三种特征交互层与基于自注意力机制的融合模块,对ID特征进行低阶与高阶交互,并基于自注意力生成ID深层特征。【结果】 在三个公开数据集上进行实验,结果表明集成DFM-ID的模型在准确率、精确率、AUC和F1值评估指标上相较于基线模型,分别增长了16.03%、14.10%、20.97%和8.68%。【局限】 实验数据同质性较高,模型在一定程度上泛化能力不足。【结论】 所提模型能充分利用ID特征间的复杂关联和深层信息,有效提升推荐准确性。
【目的】 跟踪在线学习者的学习进度和知识状态,以便提供个性化的学习支持服务。【方法】 提出一种细粒度学习能力增强的可解释知识追踪模型,从知识和细粒度学习能力两方面进行学习者认知建模,通过添加失误率参数改进项目反应理论,进而完成学习者下一时刻答题结果的预测,并提供可解释性。【结果】 在三个公开数据集的实验表明,本文提出的知识追踪模型在AUC指标上相较于大部分基线方法,至少提升2%左右。【局限】 本文方法从增加学习因素的角度提升知识追踪模型的可解释性,但在提升基于深度学习的知识追踪模型可解释性方面需要进一步验证。【结论】 本文提出的知识追踪模型不仅在预测性能上有很大提升,而且能够从多个角度刻画学习者认知模型和预测过程,提高了知识追踪模型的可解释性。
【目的】 跟踪和观测突发事件舆情流转特征,辅助实现舆情导控和共景治理。【方法】 利用案例研究法,提出突发事件舆情宏观流转域框架;利用社会网络分析法,辅以实证研究和自然语言处理技术深入分析微观视角下舆情在主体、客体、载体各维度间的流转规律,结合突发公共卫生事件数据进行验证性分析。【结果】 从宏观角度看,舆情在网络空间、物理空间和心理空间流转,为理解和量化公众行为和反应提供跨学科的分析框架;从微观角度看,舆情在多元群体、多元媒体、多元事件、多元平台层面流转,分别呈现出同质化扩散与异质化穿越效应、场域共鸣与场域逸散效应、共时性和历时性效应、放大共振与回响差异效应。【局限】 未考虑社会网络情感的动态变化。【结论】 从宏观和微观两种视角总结舆情跨域流转规律,为舆情传播研究提供新的思路。
【目的】 解决谣言数据信息量有限和关联常识信息缺乏的问题,提高谣言识别的准确性。【方法】 提出一种多分支图卷积推理网络(MGCIN),将双向图卷积网络与常识推理模块相结合,二者通过独立产生分类标签实现共同决策。【结果】 在Twitter15、Twitter16和PHEME三个公开数据集上进行实验,结果显示所提模型优于多数基线模型,准确率分别达到87.8%、89.8%和77.6%,并具有优秀的谣言早期检测性能。【局限】 谣言数据相关的背景和常识信息的多模态化仍需深入研究。【结论】 本文模型能够较好地模拟人类的思维过程,有效融合了文本特征、传播特征和常识信息,为谣言检测研究提供了新的思路和方法。
【目的】 提高社交媒体网络谣言检测准确率,减少网络谣言对于社会稳定的潜在威胁。【方法】 提出一种融合动态传播和神经霍克斯过程的谣言检测模型。按照推文传播时间线划分传播子图并构建子图嵌入,将嵌入序列输入全局动态演化编码模块,叠加时间编码后形成加权序列,进而输入神经霍克斯过程模块计算连续条件强度函数,描述传播自激励现象,同时经平均池化后输入前馈神经网络进行谣言检测。此外,采用多任务学习模块计算两类输出的整体损失,指导模型训练。【结果】 模型在公开数据集Twitter15和Twitter16上的准确率分别达到85.6%和86.6%,优于其他主流基线模型,并具有较好的谣言早期检测性能。【局限】 仅使用文本数据和时间属性信息,未考虑推文图片、用户属性等特征。【结论】 编码推文传播的动态性信息和自激励现象有利于提升谣言检测效果。
【目的】 梳理文本数据增强的方法与体系,揭示其发展现状与趋势。【文献范围】 以“textual data augmentation”“text augmentation”“文本数据增强”和“文本增强”为关键词在Web of Science、Google Scholar和中国知网等数据库检索,筛选出代表性文献88篇。【方法】 从操作对象、实现方式、生成结果多样性等角度总结文本增强方法,在此基础上对各种方法的颗粒度、优缺点、适用场景等进行详细对比。【结果】 文本增强方法可以划分为基于文本空间和基于向量空间的增强方法,前者直观可解释,但可能会破坏文本的整体语义;后者能够直接操纵深层的语义特征,但计算复杂度更高。现有的增强方法往往需要依赖启发式规则和任务信息等外部支持,深度学习算法的引入能够提升生成数据的新颖性和多样性。【局限】 主要对已有方法的技术细节及性能特质进行结构化分析,未量化地统计平台工具的开发情况。基于筛选后的文献进行综述分析,尚未涵盖文本增强方法的全部应用场景。【结论】 未来应进一步探讨和完善文本数据增强方法的测评指标,通过提示工程提高增强方法在不同下游任务中的稳健性,利用检索增强生成和图神经网络应对长文本、低资源挑战,激发文本增强技术在自然语言处理领域的应用潜力。
【目的】 通过调研和梳理文献,总结考虑知识特征的序列推荐方法。【文献范围】 以“Sequential Recommendation*Knowledge”和“序列推荐*知识”作为高级检索词在Web of Science、DBLP、谷歌学术、中国知网等数据库中进行文献检索,最终筛选出97篇文献进行评述,在筛选过程中,还特别关注了具体章节的核心内容,确保所选文献满足研究需要。【方法】 利用文献调研的方法,从研究框架、现实应用与评价、未来研究趋势三个方面对知识特征的序列推荐方法进行归纳与梳理。【结果】 针对知识特征在序列推荐中的应用,构建“知识特征表达-时间知识增强-融合知识特征的序列推荐算法”的研究框架,从“数据集-评价指标-基线模型”三个方面深入分析现有评价资源的不足,并对未来研究进行展望。【局限】 鉴于知识特征在序列推荐领域的重要性日益凸显,本文评述了考虑知识特征的序列推荐方法的相关研究。但由于研究领域广泛、文献众多,未能涵盖所有相关研究。【结论】 考虑知识特征的序列推荐算法提高了推荐的准确性,多模态知识特征的融入有助于深入了解用户需求。
【目的】 优化城市旅游流挖掘研究,克服现有基于游记文本的游客行程重构方法中存在的景点识别不准确、景点游览顺序失真的问题。【方法】 提出一种基于大语言模型的游客行程重构方法,并结合社会网络分析方法探索城市旅游流网络结构特征。【结果】 所提游客行程重构方法的景点识别平均查准率达94.00%,平均查全率达87.78%,明显优于基于统计的条件随机场方法,重构的游客行程与真实行程相似度达到了83.81%。【局限】 游客行程重构效果一定程度上依赖于大语言模型的提示词(Prompt)的训练效果。【结论】 以西安市为例,将所得结论与公众认知及现有研究成果进行对比,表明所提游客行程重构方法具有较高的准确性与通用性,有效支撑了旅游流网络结构挖掘研究。
【目的】 提高医疗保险欺诈风险识别中团伙欺诈检测的准确率,增强医疗保障基金安全。【方法】 本文提出一种融合注意力机制和图神经网络的医疗保险团伙欺诈风险识别方法。首先,利用嵌入方法将索赔转化为高维向量,得到索赔静态特征,再通过注意力机制对重要欺诈因子赋予更大的权重,从而增强模型对索赔中关键欺诈因子的识别能力;然后,基于被保险人动态行为特征生成关系图,利用图神经网络捕获关系图中蕴含的邻接信息,并与索赔静态特征融合,在高维空间中挖掘由团伙欺诈引起的动态异常行为,最终输出索赔的欺诈概率。【结果】 在中国某医疗保险机构20 000名参保人员的183万条医疗索赔数据上的实验结果表明,所提方法召回率和准确率达到了91.08%和90.66%,F1均值为0.69,优于其他经典方法。【局限】 仅融合被保险人动态行为特征进行医疗保险欺诈风险识别,在后续研究中将考虑结合医生和药店等多主体因素,进一步提升模型的准确率。【结论】 融合被保险人动态行为可以补充索赔的静态特征信息,增加对医疗保险团伙欺诈行为的关注,提高模型识别的准确率。
【目的】 利用解耦技术缓解过度平滑并构建深度图网络学习文本隐藏特征,同时采用注意力扩散机制增强图网络的长距离交互能力,以提升法律文本细粒度分类效果。【方法】 提出基于深度注意力扩散图神经网络的法律文本细粒度分类模型FLGNN。首先使用预训练模型BERT作为嵌入层获取长距离语义特征,接着构建文本有向图通过深度图网络捕获文本全局图信息和隐藏特征,最后利用特征融合和节点级注意力机制优化文本特征并进行分类任务。【结果】 模型在来自北大法宝数据库的PKULawData数据集上Acc达94.85%,较BERT、DADGNN和RCNN等基线模型分别提升了1.15、3.44和1.72个百分点;在法律合同文本数据集JSCLawData上Acc达90.91%,较BERT、DADGNN和RCNN等基线模型分别提升了1.35、4.19和4.10个百分点。【局限】 模型在其他领域的适用性需要进一步探究。【结论】 FLGNN模型能捕获法律文本的全局图信息并挖掘深层语义信息,进一步提升了法律文本细粒度分类效果,可为法律领域智能化管理和人工智能提供有效支撑。
【目的】 从评论文本中挖掘人格信息,提升虚假新闻检测模型的效率和准确性。【方法】 BERT模型学习新闻与评论文本特征,基于BERT模型训练的人格预测模型学习评论用户的大五人格特征,使用新闻与评论文本特征和人格特征预测真假新闻。【结果】 在部分微博公开数据集上进行实验,结果显示人格特征的加入能够提升虚假新闻检测的准确率(+1.96%,90.76%)和F1值(+1.51%,90.60%)。【局限】 使用人格预测模型需要一定数量的评论文本,并且模型的可解释性还需要进一步提升。【结论】 评论用户的人格特征能够有效提升虚假新闻的识别准确率和F1值。
【目的】 为实现在海量互联网新闻中快速准确地找到特定事件的相关报道,提出一种基于多维度事件特征融合和语义特征交互的事件匹配算法。【方法】 通过依存句法分析,概括新闻事件;通过低秩张量特征融合的方式,融合BiLSTM、DPCNN、多头注意力机制提取的多维度事件特征;最后,通过注意力机制进行语义特征交互,共同参与事件匹配的判断。【结果】 在来自搜狐的真实数据上进行不同算法的对比实验,结果表明,在新闻长短不一的三个数据集上,本文方法均有较好的匹配效果,F1值分别提升0.7个百分点、0.69个百分点和0.23个百分点。【局限】 目前公开的语料库规模较小,可制作更大的语料库进一步实验。【结论】 本文模型可以更好地对文本特征进行抽取和交互,有效提升了新闻事件的匹配性能。
【目的】 利用图片和文本的多模态信息,基于图文匹配技术提出ITRHP多模态评论有用性预测模型。【方法】 首先,采用Faster R-CNN和Bi-GRU模型分别提取图像和文本特征;其次,通过协同注意力机制捕捉文本和图片之间相互匹配的区域以提高特征表达的一致性;然后,引入正负注意力机制获取匹配单词区域对和不匹配单词区域对的共享语义信息,并采用一个自适应的匹配阈值学习模块,使其能够更好地识别相似度最大的单词区域对;最后,将语义信息传递给全连接层获取最终的分类结果。【结果】 实验结果表明,ITRHP模型在Yelp数据集和Amazon数据集上的准确率分别达到了80.17%和80.27%,F1值分别达到了79.38%和89.01%。与基准模型相比,在两个数据集上的准确率分别最高提升了2.80和2.42个百分点,F1值最高分别提升了2.70和7.48个百分点。【局限】 主要聚焦于评论中的图像和文本数据,缺乏对评论情感、评论者信息等更多评论特征的探究。【结论】 ITRHP模型使用图文匹配技术能够有效利用多模态信息,解决多模态评论有用性预测模型分类准确性低的问题。
【目的】 构建一套应用于我国政府开放数据的自动化质量评估方法,在数据检索等方面助力政府开放数据价值实现。【方法】 在对我国政府开放数据平台进行深入调研的基础上,结合数据质量评估等领域的研究成果,构建包含内容质量、效用质量、元数据质量、开放质量4个一级指标和16个二级指标的评估框架,并基于可得字段设计了自动化评估的测度方法,最后使用14个省级行政区真实数据验证所提方法的有效性。【结果】 基于所提方法的自动化评估结果与人工评估结果的相关系数均值为0.537,与现有研究成果的相关系数为0.736,呈较强的相关性,初步验证了所提评估方法的有效性。【局限】 由于强调可操作性,指标选取的广度和测量的深度都受到一定限制。【结论】 所提方法可用于按照用户设定的周期和指标权重,低资源消耗地进行数据集层面的动态评估,能够服务于全国一体化政府开放数据检索平台的建设。
【目的】 探索医疗美容用户健康信息获取行为的机制,为医疗美容用户科学决策和行业有序发展提供理论支持。【方法】 采用扎根理论,对29份受访者资料和6份网络资料进行编码分析,构建医疗美容用户健康信息获取行为机制理论模型,并利用结构方程模型进行量化验证。【结果】 医疗美容用户的健康信息获取行为总体遵循“客观因素-主观因素-需求因素-行为”的机制路径。所构建的模型通过了量化检验(除H2a外其他假设均通过检验)。【局限】 访谈数据可能存在回忆偏差和表述误差,未来研究可结合现场实验进行补充验证;医疗美容用户在不同阶段的健康信息获取行为有所不同,后续研究可获取面板数据进行动态分析。【结论】 所提模型可为医疗美容用户的信息决策、医疗美容行业的内容创作和信息咨询服务提供有价值的参考。
【目的】 明确与群体智慧密切相关的群体特征对OKC知识创新绩效的影响作用及影响路径。【方法】 以英文版Wikipedia为研究对象,使用等额随机分层抽样方法获取180个词条及其版本编辑数据,基于偏最小二乘-结构方程模型(PLS-SEM)对研究模型进行验证。【结果】 群体多样性、独立性和去中心性对OKC知识创新绩效的新颖性和实用性存在不同的影响作用;间接协作对提高OKC知识创新绩效有显著中介作用。【局限】 使用社会计算实验方法补充研究发现,并拓展研究发现到其他群体智慧涌现的OKC场景中。【结论】 从群体特征视角丰富了OKC知识创新绩效影响因素相关研究,并拓展群体智慧理论在OKC知识创新中的应用,研究发现可为OKC管理和平台设计提供指导,从而更好地汇聚群体智慧促进知识创新。
【目的】 针对科技前沿弱信号探测过程自动化程度有限、经验依赖性强等问题,提出一种融合信号放大和去噪两种信号处理策略的探测方法。【方法】 通过模拟信号处理流程,首先利用正则表达式对信号进行预处理;然后采用N-Gram模型和词频-逆文档频率算法放大弱信号;再利用迭代阈值收缩算法测度弱信号的未来增长趋势并进一步过滤噪声;最后,利用Word2Vec模型增强的K-Means++算法整合增长性信号。【结果】 信号放大和信号过滤作为两种核心的处理策略,能有效避免噪声对弱信号的淹没现象,提高科技前沿弱信号探测的准确性和聚焦度。【局限】 探测效果评估仍然依赖专业知识,更为客观的结果评估方法有待进一步探索;以单一数据源为对象进行弱信号探测,有待进一步拓展数据源。【结论】 本文提出的自动化探测框架能在一定程度上降低对人为经验的依赖,取得有效且准确的探测结果。
【目的】 聚焦于人文社会科学领域,优化大语言模型在机器翻译中的实际应用价值。【方法】 采用术语特征提取、数据扩充和指令微调的方法,选取Baichuan2-13B-Base和Qwen-14B作为基线模型,进行翻译效果评估实验。【结果】 实验结果表明,大语言模型较神经机器翻译模型具有显著优势,通过指令微调的方法将优势进一步扩大,微调模型比基线模型平均输出时间减少60%,指标表现高出0.82-8.54个百分点,且微调模型在英译汉翻译任务较之汉译英翻译任务的翻译指标增量分别达2.99倍和4.58倍。【局限】 本文主要处理蕴含深厚学科背景和社会文化信息的术语概念,未对人文社会科学领域的不同数据来源展开细分研究。【结论】 本文为优化大语言模型在专业领域上的应用提供了重要参考,也对促进跨语言文化交流起到重要推动作用。
【目的】 针对LLM频遭数据投毒攻击而使分配器不受控暗中输出黑化信息的问题,分别设计投毒与黑化识别方案及模型,将其整合后形成情报感知方法运行机制。【方法】 首先,分别以XMC-GAN+YOLO和New Phillips-Huber作为信息生成模式与数据投毒活动识别支撑方法并形成贯穿方案;其次,分别以RNA-Seq、KdV-IE、Percolation和AREMBMTD作为黑化分离、能量、渗透与破坏程度核心表示方法并得到实施模型;最后,根据重构机理与联动问题解决框架将上述方案模型连结为完整方法运行机制,使之有效输出情报感知结果。【结果】 实证分析结果表明方法运行机制整体较同类次优方法性能平均提升率为18.81%,平均领先率为7.48%,在该条件下能够输出三类信息生成模式(人工、融合与AI)、投毒方式(单一、复合与混合)及4类情报感知结果(分离、能量、渗透与破坏)。【局限】 不同黑化信息模态情报感知效率降序为文本、图像和音视频,受制于内容解析粒度及渠道,没有特别关注文本以外的低效率情况。【结论】 充分融合数据投毒原理与LLM黑化现象并提供情报感知方法,避免了深层原理与表层现象的研究割裂影响,能够有效输出投毒活动识别及黑化感知结果,且在提升率与领先率等指标上优于对比方法。
【目的】 以中医知识问答领域为例,分析以知识库资源为例的非结构化知识和以知识图谱资源为例的结构化知识在提升大语言模型对抗幻觉效果上的差异性,并基于此进一步探讨大语言模型在垂直领域对抗幻觉能力的提升策略。【方法】 利用外部知识配合提示工程的方法,在中医知识问答领域进行知识库资源和知识图谱资源在提示效果上的差异性分析,并探讨动态三元组策略和融合微调策略等进行大语言模型对抗幻觉优化的优越性。【结果】 实验结果表明,与知识库非结构化知识提示相比,知识图谱结构化知识提示在精确度、召回率和F1值方面表现更佳,分别比知识库提示高出1.90、2.42和2.20个百分点,达到71.44%、60.76%和65.31%;基于此进行优化策略分析后发现,动态三元组策略融合微调后在对抗幻觉上效果最佳,精确度、召回率和F1值分别达到了72.47%、65.87%和68.62%。【局限】 只在中医问答领域进行了测试,尚需在广泛科研领域验证其泛化能力。【结论】 在中医领域,知识图谱结构化知识在减少幻觉现象和提升模型回复精确度方面优于传统非结构化知识,揭示了结构化知识在增强模型理解能力中的关键作用;微调策略和知识资源的融合使用为大语言模型提供了一种有效的性能提升路径。研究内容为大语言模型融合外部知识以提升知识服务提供了理论依据和方法支持。
【目的】解决基于深度学习的实体关系抽取方法在古籍小样本场景下,由于依赖大规模标注数据而导致的微调效率低、抽取性能不佳问题。【方法】提出一种基于提示学习和抽取式阅读理解的古籍礼仪实体关系联合抽取方法。首先,将实体识别和关系抽取任务整合至一个抽取式阅读理解框架中,简化模型结构。然后,利用领域知识设计三种轻量级提示策略,有效降低联合抽取任务的复杂度。最后,基于预训练语言模型和全局指针网络构建古籍礼仪实体关系联合抽取模型MPG-GP (MRC-Prompt-GujiBERT with Global Pointer),有效抽取古籍中的礼仪实体关系三元组。【结果】在构建的古籍礼仪实体关系联合抽取数据集上进行实验,本文方法F1值比基线方法提升了0.32~6.05个百分点。【局限】 在构建提示模板时,未采用可学习的软提示方式,并且提示设计仍有进一步优化的空间。【结论】所提方法能够有效缓解深度神经网络对大量标注数据的依赖,提升了模型在小样本古籍礼仪实体关系联合抽取任务上的准确性,为古籍低资源场景信息抽取提供了新的方法和思路。
【目的】针对当前案件相似度计算方法存在难以捕捉关键法律要素间长距离、全局和非连续的法律关系,以及文本相似但案件不相似的难分样本区分问题,提出一种更有效的案件相似度计算方法。【方法】构建案件知识图谱结构化表示案件事实,结合图卷积与双向长短期记忆网络编码案件知识图谱,感知主客体间复杂的法律关系,引入难/易混合的负样本挖掘机制提升区分难分样本的能力。【结果】在“中国法研杯”司法人工智能挑战赛提供的基准数据集上的实验表明,所提模型相较冠军模型准确率提升11个百分点,较基于注意力卷积神经网络方法提升7个百分点。【局限】 案件知识图谱构建可能会影响相似度计算的效率,但可以通过离线图谱构建、节点预向量化等计算加速策略来克服。【结论】本方法能有效感知关键法律要素间复杂的法律关系,学习不同案件的区别与联系,提升案件相似度计算性能。
【目的】针对英文文本中存在多重嵌套和实体语义不明确的问题,提出一种融合单词多元信息的嵌套命名实体识别方法GTR-NNER。【方法】基于三仿射注意力引导的图卷积网络模块融合单词信息、单词位置信息、单词边界信息、单词标签信息以及语法信息,根据得到的多元信息进行跨度枚举,最后通过判别器完成实体识别。【结果】在两个嵌套数据集上进行10折交叉验证,GTR-NNER方法的平均F1值分别为84.38%和91.44%;在两个非完全嵌套数据集GENIA和ACE2005上,GTR-NNER方法的F1值分别为82.19%和89.27%。【局限】 融合单词的多元信息致使模型的收敛速度变慢。【结论】在命名实体识别模型中结合单词的多元信息能够提高嵌套实体识别的效果,且实验结果证明本文融合单词多元信息的方法是有效的。
【目的】为了有效识别非结构化学术文献中有价值的实体,建立一个统一的实体识别框架。【方法】采用BERT+Global Pointer(GP)框架,通过整体统一的思想建模实体边界,设计适配指针机制的交叉熵损失函数,并结合CRF、GPT-4和BERT进行多模型对比验证。【结果】在不同类型的数据集上,本文模型的准确率、召回率和F1值均有不错表现。在非嵌套数据集上的平均F1值分别达到95.38%和79.81%,而在嵌套数据集上的平均F1值分别达到66.91%和61.47%,且模型总体性能在不需要人工制定特征模板的情况下优于对比模型。【局限】 对于整体的嵌套实体识别,GP模型为了能够从应用的角度高效而精准地识别相应的实体,仍需要进一步优化。【结论】GP模型在实体统一识别中可以有效利用实体的位置特征,对于复杂的嵌套实体,不仅能提高识别的准确度,还能兼顾识别的便捷性。