Please wait a minute...
Advanced Search
数据分析与知识发现
  本期目录 | 过刊浏览 | 高级检索 |
基于BERT-DPCNN的警情文本分类研究
张静,高子信,丁伟杰
(浙江警察学院计算机与信息安全系,浙江省杭州市 310051)
Alarm Text Classification based on BERT-DPCNN
Zhang Jing,Gao Zixin,Ding Weijie
Department of Computer and Information Security, Zhejiang Police College, Hangzhou 310051, China
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]现代警务工作依托大量的案情文本数据,如何对海量的警情文本数据进行智能化分类成为了公安行业关注的一个课题。

[方法]本文针对警情文本分类任务,提出了一个基于BERT-DPCNN的文本分类模型。该模型采用BERT预训练模型生成文本词向量,并通过优化DPCNN模型中的激活函数和改进动态学习率来提高分类性能。

[结果]将BERT-DPCNN与BERT,BERT-CNN,BERT-RCNN,BERT-RNN,BERT-LSTM,ERNIE六类模型进行对比实验,结果表明BERT-DPCNN的准确率、召回率和精准率上的效果最佳,其中二分类任务中BERT-DPCNN的准确率达到98%以上,十一分类任务中的准确率达到82%以上,验证了该模型的有效性。

[局限]模型参数较多,实验次数有局限,仍有待进一步测试。

[结论]基于BERT-DPCNN的文本分类模型有效地提升了警情文本分类的准确率,为公安对警情的分析和研判提供了一定的数据支撑。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 BERTDPCNN警情文本分类激活函数     
Abstract

[Objective]The operation of modern police service relies on a large amount of alarm text data. How to intelligently classify the massive alarm text data has become a topic of concern in the field of public security.

[Methods]A BERT-DPCNN-based text classification model is proposed for the alarm text classification task. The BERT pre-training model is used to generate text word vectors, and the activation function and dynamic learning rate are also modified in the DPCNN to improve the performance of classification.

[Results]Experiments are carried out for the comparison of BERT-DPCNN with six other models, which are BERT, BERT-CNN, BERT-RCNN, BERT-RNN, BERT-LSTM, and ERNIE, respectively. The results show that BERT-DPCNN achieves the best performance in terms of accuracy, recall, and precision. In the binary classification task, the accuracy of BERT-DPCNN reached over 98%, and in the eleven classification task, the accuracy reached over 82%, verifying the effectiveness of the proposed model.

[Limitations]Due to the large number of model parameters and limited iterations, further testing is still needed to fully evaluate the performance of the proposed model.

[Conclusions]The BERT-DPCNN-based text classification model effectively improves the accuracy of alarm text classification and provides a certain data support for public security agencies to analyze and judge police situations.

Key words BERT    DPCNN    Alarm text classification    Activation function
     出版日期: 2024-05-17
ZTFLH:  TP391  
引用本文:   
张静, 高子信, 丁伟杰. 基于BERT-DPCNN的警情文本分类研究 [J]. 数据分析与知识发现, 10.11925/infotech.2096-3467.2023.1347.
Zhang Jing, Gao Zixin, Ding Weijie. Alarm Text Classification based on BERT-DPCNN . Data Analysis and Knowledge Discovery, 0, (): 1-.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2023.1347      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y0/V/I/1
[1] 全安坤, 李红莲, 张乐, 吕学强. 融合内容和图片特征的中文摘要生成方法研究*[J]. 数据分析与知识发现, 2024, 8(3): 110-119.
[2] 黄泰峰, 马静. 基于提示学习增强的文本情感分类模型*[J]. 数据分析与知识发现, 2024, 8(3): 77-84.
[3] 胡忠义, 税典程, 吴江. 基于ERNIE和DPCNN的科技文献摘要结构要素识别*[J]. 数据分析与知识发现, 2024, 8(1): 125-144.
[4] 吕学强, 杨雨婷, 肖刚, 李育贤, 游新冬. 稀疏样本下长术语的抽取方法*[J]. 数据分析与知识发现, 2024, 8(1): 135-145.
[5] 贺超城, 黄茜, 李欣儒, 王春迎, 吴江. 元宇宙的冷与热——融合BERT与动态主题模型的微博文本分析*[J]. 数据分析与知识发现, 2023, 7(9): 25-38.
[6] 赵雪峰, 吴德林, 吴伟伟, 孙卓荦, 胡瑾瑾, 廉莹, 单佳宇. 基于深度学习与多分类轮询机制的高质量“卡脖子”技术专利识别模型——以专利申请文件为研究主体*[J]. 数据分析与知识发现, 2023, 7(8): 30-45.
[7] 本妍妍, 庞雪芹. 融入词性的医疗命名实体识别研究*[J]. 数据分析与知识发现, 2023, 7(5): 123-132.
[8] 徐康, 余胜男, 陈蕾, 王传栋. 基于语言学知识增强的自监督式图卷积网络的事件关系抽取方法*[J]. 数据分析与知识发现, 2023, 7(5): 92-104.
[9] 苏明星, 吴厚月, 李健, 黄菊, 张顺香. 基于多层交互注意力机制的商品属性抽取*[J]. 数据分析与知识发现, 2023, 7(2): 108-118.
[10] 赵一鸣, 潘沛, 毛进. 基于任务知识融合与文本数据增强的医学信息查询意图强度识别研究*[J]. 数据分析与知识发现, 2023, 7(2): 38-47.
[11] 王宇飞, 张智雄, 赵旸, 张梦婷, 李雪思. 中文科技论文标题自动生成系统的设计与实现*[J]. 数据分析与知识发现, 2023, 7(2): 61-71.
[12] 张思阳, 魏苏波, 孙争艳, 张顺香, 朱广丽, 吴厚月. 基于多标签Seq2Seq模型的情绪-原因对提取模型*[J]. 数据分析与知识发现, 2023, 7(2): 86-96.
[13] 吕学强, 杜一凡, 张乐, 潘慧萍, 田驰. GKTR:一种融合图卷积拓扑特征和关键词特征的工程咨询报告检索模型*[J]. 数据分析与知识发现, 2023, 7(12): 155-163.
[14] 吴旭旭, 陈鹏, 江欢. 基于多特征融合的微博细粒度情感分析*[J]. 数据分析与知识发现, 2023, 7(12): 102-113.
[15] 高浩鑫, 孙利娟, 吴京宸, 高宇童, 吴旭. 基于异构图卷积网络的网络社区敏感文本分类模型*[J]. 数据分析与知识发现, 2023, 7(11): 26-36.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn