Please wait a minute...
Advanced Search
数据分析与知识发现  2024, Vol. 8 Issue (5): 46-58     https://doi.org/10.11925/infotech.2096-3467.2023.0446
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于知识库增强深度学习模型的隐私政策合规性研究——从完整性与语义冲突角度*
朱侯(),罗颖嘉,陈梦蕾,欧阳佳祥,肖颖,蔡伊南
中山大学信息管理学院 广州 510006
Analyzing Compliance of Privacy Policy with Knowledge-Enhanced Deep Learning Model: From the Perspective of Integrity and Semantic Conflict
Zhu Hou(),Luo Yingjia,Chen Menglei,Ouyang Jiaxiang,Xiao Ying,Cai Yinan
School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China
全文: PDF (939 KB)   HTML ( 11
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 通过融合法律法规知识,在语义层面对隐私政策的合规性进行智能检测。【方法】 依据《信息安全技术 个人信息安全规范》(GB/T 35273-2020)从完整性和语义冲突角度构建合规性评价指标体系,标注语料。基于嵌入知识图谱的K-BERT模型构建完整性评价模型,并构建用于检测语义冲突的一致性评价模型。最后运用完整性评价模型和一致性评价模型分析15个领域的APP隐私政策合规性。【结果】 构建通过肯德尔W检验的中文隐私政策语料库,完整性和一致性评价模型的F1值分别达到0.92和0.87。分析1 762篇APP隐私政策发现,影音娱乐、购买比价、金融理财、运动健康和汽车领域的APP隐私政策完整性表现较好,社交通讯和购买比价领域的APP隐私政策在语义层面较符合法律法规的要求。【局限】 忽略了少数隐私政策中可能出现的超链接所包含的内容,导致对部分隐私政策合规性的检验可能存在偏差。【结论】 本文模型实现了自动化分析各领域隐私政策合规性的目标,对于提升国家对移动APP平台处理用户隐私数据的监管能力具有重要意义。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
朱侯
罗颖嘉
陈梦蕾
欧阳佳祥
肖颖
蔡伊南
关键词 隐私政策合规性语义冲突K-BERTTF-IDF    
Abstract

[Objective] The paper aims to detect the compliance of privacy policies at the semantic level by integrating legal and regulatory knowledge. [Methods] We constructed a compliance evaluation index system from the integrity and semantic conflict perspective based on the Information Security Technology—Personal Information Security Specification (GB/T 35273-2020) and annotated the corpus. Then, we used the K-BERT model embedded with a knowledge graph to build an integrity evaluation model and a consistency evaluation model to detect semantic conflicts. Finally, we analyzed the compliance of app privacy policies in 15 fields with the integrity and consistency evaluation models. [Results] We constructed a Chinese privacy policy corpus that passed the Kendall's W test, and the F1 Score of the integrity and consistency evaluation models reached 0.92 and 0.87, respectively. We analyzed 1762 app privacy policies and found that policies in the fields of Audio-Video Entertainment, Purchase Comparison, Financial Planning, Sports and Health, and Automotive are better in integrity, while those in the fields of Social Communication and Purchase Comparison are more semantically compliant with legal and regulatory requirements. [Limitations] The content in hyperlinks that may appear in a few privacy policies is ignored, which may cause bias in the compliance testy of some privacy policies. [Conclusions] The proposed model achieves the goal of automated analysis of privacy policy compliance in various fields, which is significant for China in enhancing the regulatory capacity for mobile apps handling user privacy data.

Key wordsPrivacy Policy    Compliance    Semantic Conflict    K-BERT    TF-IDF
收稿日期: 2023-05-11      出版日期: 2024-03-15
ZTFLH:  TP391  
  G203  
基金资助:*教育部人文社会科学研究一般项目(23YJC630270);广东省自然科学基金面上项目的研究成果之一(2021A1515011805)
通讯作者: 朱侯,ORCID:0000-0002-6843-9795,E-mail:zhuhou3@mail.sysu.edu.cn。   
引用本文:   
朱侯, 罗颖嘉, 陈梦蕾, 欧阳佳祥, 肖颖, 蔡伊南. 基于知识库增强深度学习模型的隐私政策合规性研究——从完整性与语义冲突角度*[J]. 数据分析与知识发现, 2024, 8(5): 46-58.
Zhu Hou, Luo Yingjia, Chen Menglei, Ouyang Jiaxiang, Xiao Ying, Cai Yinan. Analyzing Compliance of Privacy Policy with Knowledge-Enhanced Deep Learning Model: From the Perspective of Integrity and Semantic Conflict. Data Analysis and Knowledge Discovery, 2024, 8(5): 46-58.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2023.0446      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2024/V8/I5/46
一级指标 二级指标
A基本信息 A1政策适用的产品或服务范围
A2政策的生效时间
A3政策的更新时间
A4开发方及版权所有方
B信息收集 B1收集的各项信息
B2收集和使用个人信息的业务功能
B3不同业务功能所收集的个人信息类型
B4在收集法定证件信息(身份证、护照、驾驶证等)和个人生物识别信息时,专门提醒个人信息主体此次收集活动涉及的信息,并说明处理目的、处理规则
C信息使用 C1个人信息在使用过程中涉及的地理区域
C2个人信息预计的保留时间
C3在需要改变信息收集和使用的目的时,征得个人信息主体的同意
C4根据个人信息的使用情况注明个人信息需要删除或销毁的截止日期
D信息委托处理、共享、转让、公开披露 D1明确需要委托处理/共享个人信息的说明
D2个人信息的接收方
D3需要共享/委托处理的个人信息类型和原因
D4安全措施与规范的说明
D5共享/委托处理个人信息是否对个人信息主体带来高危风险的说明
D6明确需要转让个人信息的说明
D7转让个人信息的相关说明
D8明确需要公开披露个人信息的说明
D9公开披露个人信息的相关说明
D10个人信息控制者会不经过个人信息主体同意,共享、转让和公开披露数据的特殊情况的说明
E信息保护 E1个人信息控制者对个人信息进行安全保护的措施说明
E2目前遵循的个人信息安全协议和取得的认证说明
E3提供个人信息后可能存在的安全风险说明
E4发生个人信息安全事件后个人信息控制者将承担法律责任的说明
E5发生个人信息安全事件后将及时告知个人信息主体的说明
F用户权利 F1个人信息主体对其个人信息拥有的权利说明
F2配置和操作的过程说明
F3对个人信息主体行使权利进行收费的原因和依据说明
F4响应个人信息主体需求的说明
F5验证个人信息主体身份的原因说明
F6拒绝个人信息主体对个人信息进行访问、更正、删除、撤回授权同意等要求的原因和依据说明
G儿童信息 G1收集未成年人个人信息的情况前需获取父母或监护人的授权同意的说明
G2处理和保护未成年人个人信息的机制说明
H信息转移 H1对是否进行信息跨境传输的说明
H2对个人信息在境外管辖区的保护举措的说明
I政策更新 I1个人信息保护政策更新的有关事项说明
I2更新个人信息保护政策后会通知个人信息主体的方式的说明
J联系方式 J1处理个人信息安全问题相关反馈、投诉的渠道
J2外部争议解决机构及其联络方式
Table 1  完整性评价指标体系
一致性指标 标注方案
B3 提到“信息”,但未列举信息类型标注负值-1,列举具体信息类型的标注正值1。
B4 做到“专门提醒个人信息主体此次收集活动涉及的信息,并说明处理目的、处理规则”的标注正值1,否则标注负值-1。关于信息处理规则,提到收集、使用、存储等其中之一即认为提到信息处理规则。
D3 明确具体的个人信息类型和原因则标注正值1,若有“服务所必需的信息”“个人信息”“部分个人信息”“某些个人信息”等模糊说法标注负值-1。
F6 列举说明标注正值1,否则标注负值-1。
H1 若列举数据类型、标准、协议或法律机制标注正值1,否则标注负值-1。
Table 2  一致性指标体系
指标 个数 指标 个数 指标 个数
A1 125 D3 268 F2 1 241
A2 87 D4 208 F3 59
A3 75 D5 13 F4 149
A4 102 D6 107 F5 92
B1 434 D7 104 F6 449
B2 1 080 D8 157 G1 140
B3 2 050 D9 122 G2 194
B4 85 D10 55 H1 91
C1 100 E1 477 H2 57
C2 101 E2 40 I1 135
C3 79 E3 143 I2 133
C4 103 E4 29 J1 126
D1 323 E5 81 J2 75
D2 492 F1 534
Table 3  人工标注的隐私政策完整性指标标签数量统计
一致性指标 合计
B3不同业务功能所收集的个人信息类型 1 969 58 2 027
B4在收集法定证件信息(身份证、护照、驾驶证等)和个人生物识别信息时,专门提醒个人信息主体此次收集活动涉及的信息,并说明处理目的、处理规则 37 48 85
D3需要共享/委托处理的个人信息类型和原因 316 241 557
F6拒绝个人信息主体对个人信息进行访问、更正、删除、撤回授权同意等要求的原因和依据说明 91 10 101
H1对于是否进行信息跨境传输的说明 37 51 88
合计 2 450 408 2 858
Table 4  人工标注的隐私政策一致性指标标签数量统计
一致性指标 正负标签个数之差
B3 18.74
B4 -0.11
D3 0.74
F6 0.79
H1 -0.14
Table 5  各指标在隐私政策中正负标签个数差均值
指标 个数 指标 个数 指标 个数
A1 250 D3 553 F2 1 204
A2 119 D4 250 F3 94
A3 106 D5 42 F4 231
A4 250 D6 133 F5 228
B1 434 D7 250 F6 438
B2 1 080 D8 230 G1 250
B3 2 050 D9 250 G2 250
B4 250 D10 250 H1 117
C1 250 E1 472 H2 250
C2 250 E2 106 I1 250
C3 250 E3 250 I2 250
C4 250 E4 59 J1 602
D1 249 E5 250 J2 250
D2 483 F1 518
Table 6  数据增强后的完整性指标标签统计
一致性指标 合计
B3不同业务功能所收集的个人信息类型 1 899 178 2 077
B4在收集法定证件信息(身份证、护照、驾驶证等)和个人生物识别信息时,专门提醒个人信息主体此次收集活动涉及的信息,并说明处理目的、处理规则 93 95 188
D3需要共享/委托处理的个人信息类型和原因 315 233 548
F6拒绝个人信息主体对个人信息进行访问、更正、删除、撤回授权同意等要求的原因和依据说明 80 39 119
H1对于是否进行信息跨境传输的说明 67 55 122
合计 2 454 600 3 054
Table 7  数据增强后的一致性指标标签统计
指标 权重 w i 指标 权重 w i 指标 权重 w i
A1 0.015 8 D3 0.013 5 F2 0.016 6
A2 0.013 9 D4 0.024 5 F3 0.035 8
A3 0.020 0 D5 0.117 7 F4 0.021 6
A4 0.003 2 D6 0.022 4 F5 0.022 8
B1 0.031 5 D7 0.015 8 F6 0.037 4
B2 0.015 1 D8 0.014 8 G1 0.016 7
B3 0.010 5 D9 0.027 7 G2 0.020 9
B4 0.046 6 D10 0.038 7 H1 0.011 3
C1 0.010 0 E1 0.012 8 H2 0.042 2
C2 0.011 5 E2 0.059 8 I1 0.007 3
C3 0.026 3 E3 0.018 6 I2 0.009 1
C4 0.015 1 E4 0.079 9 J1 0.008 5
D1 0.011 0 E5 0.016 4 J2 0.027 6
D2 0.011 5 F1 0.017 4
Table 8  完整性评价指标权重
指标 权重 w i
B3 0.014 4
B4 0.239 8
D4 0.151 8
F6 0.102 1
H1 0.491 9
Table 9  一致性评价指标权重
分类
模型
一级分类效果 二级分类效果
Precision Recall F1 Score Precision Recall F1 Score
BERT 0.934 6 0.928 2 0.930 3 0.890 3 0.864 8 0.871 7
CNN 0.943 7 0.942 9 0.943 0 0.902 0 0.864 8 0.874 2
RNN 0.948 3 0.947 6 0.947 1 0.903 6 0.893 6 0.893 6
RCNN 0.959 4 0.957 7 0.958 4 0.911 8 0.918 9 0.912 0
K-BERT 0.957 4 0.963 6 0.960 0 0.932 8 0.921 0 0.924 0
Table 10  完整性评价模型效果
二级分类模型 Precision Recall F1 Score
K-BERT(优化前) 0.932 8 0.921 0 0.924 0
K-BERT(优化后) 0.930 2 0.937 7 0.929 9
Table 11  二级分类模型优化效果
模型 Precision Recall F1 Score
Logistics 0.851 0 0.888 8 0.864 0
NB 0.781 6 0.797 6 0.802 4
KNN 0.814 6 0.811 1 0.818 8
SVM 0.840 4 0.862 0 0.856 1
Table 12  一致性评价模型效果
Fig.1  各领域隐私政策完整性得分
指标 篇数 指标 篇数 指标 篇数
A1 52 D3 40 F2 13
A2 470 D4 165 F3 988
A3 502 D5 1 643 F4 396
A4 316 D6 563 F5 602
B1 104 D7 372 F6 108
B2 20 D8 276 G1 171
B3 4 D9 972 G2 233
B4 231 D10 469 H1 947
C1 452 E1 26 H2 858
C2 263 E2 1 265 I1 67
C3 514 E3 344 I2 110
C4 386 E4 1 282 J1 21
D1 93 E5 351 J2 699
D2 170 F1 43
Table 13  1 762份隐私政策中各指标个数为0的隐私政策数量
Fig.2  各领域隐私政策一致性得分
指标 均值 标准差
B3不同业务功能所收集的个人信息类型 9.13 1.32
B4在收集法定证件信息(身份证、护照、驾驶证等)和个人生物识别信息时,专门提醒个人信息主体此次收集活动涉及的信息,并说明处理目的、处理规则 -8.50 3.34
D3需要共享/委托处理的个人信息类型和原因 2.05 4.88
F6拒绝个人信息主体对个人信息进行访问、更正、删除、撤回授权同意等要求的原因和依据说明 8.43 4.84
H1对于是否进行信息跨境传输的说明 -6.29 7.48
Table 14  隐私政策中一致性指标得分统计
[1] 李延舜. 我国移动应用软件隐私政策的合规审查及完善——基于49例隐私政策的文本考察[J]. 法商研究, 2019, 36(5): 26-39.
[1] (Li Yanshun. The Compliance Review and Improvement of China’s Mobile App Privacy Policy: A Text Review on 49 Cases of Privacy Policy[J]. Studies in Law and Business, 2019, 36(5): 26-39.)
[2] 郭清玥, 吴丹. 基于文本分析的APP隐私政策框架优化研究[J]. 信息资源管理学报, 2021, 11(1): 17-29.
[2] (Guo Qingyue, Wu Dan. Research on Optimization of APP Privacy Policy Framework Based on Text Analysis[J]. Journal of Information Resources Management, 2021, 11(1): 17-29.)
[3] 刘百灵, 夏惠敏, 李延晖, 等. 保健和激励双因素视角下影响移动支付意愿的实证研究[J]. 管理学报, 2017, 14(4): 600-608.
[3] (Liu Bailing, Xia Huimin, Li Yanhui, et al. An Empirical Study on User’s Mobile Payment Willingness from the Double Perspectives of Both Hygiene and Motivation[J]. Chinese Journal of Management, 2017, 14(4): 600-608.)
[4] 梁晓丹, 李颖灏, 刘芳. 在线隐私政策对消费者提供个人信息意愿的影响机制研究——信息敏感度的调节作用[J]. 管理评论, 2018, 30(11): 97-107.
[4] (Liang Xiaodan, Li Yinghao, Liu Fang. The Influence Mechanism of Privacy Policies on Consumers’ Willingness to Provide Information: Based on Moderating Effects of Information Sensitivity[J]. Management Review, 2018, 30(11): 97-107.)
[5] 朱侯, 张明鑫, 路永和. 社交媒体用户隐私政策阅读意愿实证研究[J]. 情报学报, 2018, 37(4): 362-371.
[5] (Zhu Hou, Zhang Mingxin, Lu Yonghe. An Empirical Study on Privacy Policy Reading Intention of Social Media Users[J]. Journal of the China Society for Scientific and Technical Information, 2018, 37(4): 362-371.)
[6] 张艳丰, 邱怡. 我国移动阅读应用个人信息保护政策合规性测度研究[J]. 图书情报工作, 2021, 65(22): 35-43.
doi: 10.13266/j.issn.0252-3116.2021.22.004
[6] (Zhang Yanfeng, Qiu Yi. Research on Compliance Measurement of Personal Information Protection Policies for Mobile Reading Applications in China[J]. Library and Information Service, 2021, 65(22): 35-43.)
doi: 10.13266/j.issn.0252-3116.2021.22.004
[7] 张玥, 王坚, 朱庆华. 医疗问诊APP隐私政策的认知影响因素框架模型研究——基于扎根理论方法[J]. 情报理论与实践, 2019, 42(6): 105-110.
doi: 10.16353/j.cnki.1000-7490.2019.06.019
[7] (Zhang Yue, Wang Jian, Zhu Qinghua. Research on Cognitive Influencing Factors Framework Model of Medical Interrogation APP Privacy Policy: Based on Grounded Theory[J]. Information Studies: Theory & Application, 2019, 42(6): 105-110.)
doi: 10.16353/j.cnki.1000-7490.2019.06.019
[8] 张玥, 王坚, 余姝, 等. 信息表征对移动医疗APP隐私政策阅读效果的影响研究——基于认知负荷理论[J]. 图书情报工作, 2021, 65(11): 3-13.
doi: 10.13266/j.issn.0252-3116.2021.11.001
[8] (Zhang Yue, Wang Jian, Yu Shu, et al. Research on the Influence of Information Representation on Privacy Policy of M-Health APP: Based on Cognitive Load Theory[J]. Library and Information Service, 2021, 65(11): 3-13.)
doi: 10.13266/j.issn.0252-3116.2021.11.001
[9] 徐磊, 郭旭. 大数据时代读者个人信息保护的实践逻辑与规范路径——以图书类App隐私政策文本为视角[J]. 图书馆建设, 2021(1): 74-83.
[9] (Xu Lei, Guo Xu. Practice Logic and Normative Path of Protecting Readers’ Personal Information in the Age of Big Data—From the Perspective of Privacy Policy of Book Apps[J]. Library Development, 2021(1): 74-83.)
[10] 马骋宇, 刘乾坤. 移动健康应用程序的隐私政策评价及实证研究[J]. 图书情报工作, 2020, 64(7): 46-55.
doi: 10.13266/j.issn.0252-3116.2020.07.006
[10] (Ma Chengyu, Liu Qiankun. Research on the Privacy Policy’s Evaluation and Empirical Study of Mobile Health Applications[J]. Library and Information Service, 2020, 64(7): 46-55.)
doi: 10.13266/j.issn.0252-3116.2020.07.006
[11] 石婧, 潘雅. 隐私声明评估指标体系与网络应用文本分析[J]. 现代传播(中国传媒大学学报), 2020, 42(3): 76-82.
[11] Shi Jing, Pan Ya. Evaluation Index System of Privacy Statement and Text Analysis of Network Application[J]. Modern Communication (Journal of Communication University of China), 2020, 42(3): 76-82.)
[12] 朱颖. 我国移动APP隐私保护政策研究——基于96个移动应用APP的分析[J]. 暨南学报(哲学社会科学版), 2017, 39(12): 107-114.
[12] Zhu Ying. Research on Privacy Protection Policy of Mobile Apps in China—Based on the Analysis of 96 Mobile Apps[J]. Jinan Journal (Philosophy & Social Science Edition), 2017, 39(12): 107-114.)
[13] 杨瑞仙, 沈嘉宁, 许帆, 等. 社交媒体APP隐私政策评价指标体系构建及实证研究[J]. 情报理论与实践, 2023, 46(1): 81-89.
[13] (Yang Ruixian, Shen Jianing, Xu Fan, et al. Construction of Privacy Policy Evaluation Index System for Social Media APPs and Empirical Study[J]. Information Studies: Theory & Application, 2023, 46(1): 81-89.)
[14] 朱璋颖, 陆亦恬, 唐祝寿, 等. 基于隐私政策条款和机器学习的应用分类[J]. 通信技术, 2020, 53(11): 2749-2757.
[14] (Zhu Zhangying, Lu Yitian, Tang Zhushou, et al. Application Classification Based on Privacy Policy Terms and Machine Learning[J]. Communications Technology, 2020, 53(11): 2749-2757.)
[15] Wilson S, Schaub F, Dara A A, et al. The Creation and Analysis of a Website Privacy Policy Corpus[C]// Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. 2016: 1330-1340.
[16] Oltramari A, Piraviperumal D, Schaub F, et al. PrivOnto: A Semantic Framework for the Analysis of Privacy Policies[J]. Semantic Web, 2018, 9(2): 185-203.
[17] Sánchez D, Viejo A, Batet M. Automatic Assessment of Privacy Policies Under the GDPR[J]. Applied Sciences, 2021, 11(4): Article No.1762.
[18] Harkous H, Fawaz K, Lebret R, et al. Polisis: Automated Analysis and Presentation of Privacy Policies Using Deep Learning[C]// Proceedings of the 27th USENIX Conference on Security Symposium. ACM, 2018: 531-548.
[19] 贾哲. 基于本体的隐私策略冲突检测研究[D]. 南京: 南京航空航天大学, 2012.
[19] (Jia Zhe. Research on Ontology-Based Privacy Policy Conflict Detection[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2012.)
[20] 雷永康. 中文隐私政策命名实体识别研究[D]. 西安: 西安电子科技大学, 2020.
[20] (Lei Yongkang. Research on Named Entity Recognition of Chinese Privacy Policy[D]. Xi’an: Xidian University, 2020.)
[21] Hosseini M B, Breaux T D, Slavin R, et al. Analyzing Privacy Policies Through Syntax-Driven Semantic Analysis of Information Types[J]. Information and Software Technology, 2021, 138: Article No.106608.
[22] Elluri L, Pande Joshi K, Kotal A. Measuring Semantic Similarity across EU GDPR Regulation and Cloud Privacy Policies[C]// Proceedings of the 2020 IEEE International Conference on Big Data. 2020: 3963-3978.
[23] Liu W J, Zhou P, Zhao Z, et al. K-BERT: Enabling Language Representation with Knowledge Graph[C]// Proceedings of the 34th AAAI Conference on Artificial Intelligence. 2020: 2901-2908.
[1] 赵杨, 严周周, 沈棋琦, 李钟航. 基于机器学习的医疗健康APP隐私政策合规性研究*[J]. 数据分析与知识发现, 2022, 6(5): 112-126.
[2] 肖悦珺, 李红莲, 张乐, 吕学强, 游新冬. 特征融合的中文专利文本分类方法研究*[J]. 数据分析与知识发现, 2022, 6(4): 49-59.
[3] 唐晓波,高和璇. 基于关键词词向量特征扩展的健康问句分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 66-75.
[4] 彭郴,吕学强,孙宁,张乐,姜肇财,宋黎. 基于CNN的消费品缺陷领域词典构建方法研究*[J]. 数据分析与知识发现, 2020, 4(11): 112-120.
[5] 殷聪, 张李义. 基于TF-IDF的情境后过滤推荐算法研究*——以餐饮业O2O为例[J]. 数据分析与知识发现, 2018, 2(11): 28-36.
[6] 李昌兵, 庞崇鹏, 李美平. 基于权重的Apriori算法在文本统计特征提取方法中的应用*[J]. 数据分析与知识发现, 2017, 1(9): 83-89.
[7] 何跃, 肖敏, 张月. 结合话题相关性的热点话题情感倾向研究*[J]. 数据分析与知识发现, 2017, 1(3): 46-53.
[8] 徐冬冬, 吴韶波. 一种基于类别描述的TF-IDF特征选择方法的改进[J]. 现代图书情报技术, 2015, 31(3): 39-48.
[9] 路永和, 李焰锋. 多因素影响的特征选择方法[J]. 现代图书情报技术, 2013, (5): 34-39.
[10] 覃世安, 李法运. 文本分类中TF-IDF方法的改进研究[J]. 现代图书情报技术, 2013, 29(10): 27-30.
[11] 叶春蕾, 冷伏海. 基于词汇链的路线图关键词抽取方法研究[J]. 现代图书情报技术, 2013, 29(1): 50-56.
[12] 谷俊, 王昊. 基于领域中文文本的术语抽取方法研究[J]. 现代图书情报技术, 2011, 27(4): 29-34.
[13] 梁文超, 徐朝军, 沈书生. 模糊规则算法在教育信息分类中的应用[J]. 现代图书情报技术, 2011, 27(1): 94-98.
[14] 许德山, 张智雄, 王峰, 邢美凤. 上下文分析与统计特征相结合的英文术语抽取研究[J]. 现代图书情报技术, 2010, 26(12): 28-33.
[15] 杨陟卓,韩燮. 一种基于特征抽取的文档信息过滤算法研究[J]. 现代图书情报技术, 2008, 24(4): 29-34.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn