Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. 28 Issue (3): 23-26     https://doi.org/10.11925/infotech.1003-3513.2012.03.04
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
FCA在医学领域文本分类中的研究和应用
徐坤1, 曹锦丹1, 毕强2
1. 吉林大学公共卫生学院 长春 130021;
2. 吉林大学管理学院 长春 130022
A Study and Application on Medical Text Categorization Based on FCA
Xu Kun1, Cao Jindan1, Bi Qiang2
1. School of Public Health, Jilin University, Changchun 130021, China;
2. School of Management, Jilin University, Changchun 130022, China
全文: PDF (451 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 在对文本分类技术和形式概念分析理论进行分析的基础上,针对医学领域文本的专业性特点,阐述利用形式概念分析进行医学领域文本分类的技术路线。通过中图法构建形式背景,进而生成概念格,利用概念格对领域文本进行分类,使分类效果接近人工分类。探索基于形式概念分析的医学领域文本分类的新途径。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
徐坤
曹锦丹
毕强
关键词 文本分类医学领域文本形式概念分析概念格    
Abstract:Based on the analysis of text categorization and the theory of Formal Concept Analysis(FCA),this paper elaborates the text categorization method of using FCA according to the medical field text characteristics.It uses Classification of Chinese to construct the formal context, and generates concept lattices, which are used to classify the medical field text and make classification effect close to artificial classification.This paper explores a new approach based on FCA for medical text categorization.
Key wordsText categorization    Medical field text    Formal concept analysis    Concept lattices
收稿日期: 2012-02-10      出版日期: 2012-04-19
: 

G202

 
基金资助:

本文系国家自然科学基金项目“基于概念格的数字图书馆知识构建研究”(项目编号:70973044)的研究成果之一。

引用本文:   
徐坤, 曹锦丹, 毕强. FCA在医学领域文本分类中的研究和应用[J]. 现代图书情报技术, 2012, 28(3): 23-26.
Xu Kun, Cao Jindan, Bi Qiang. A Study and Application on Medical Text Categorization Based on FCA. New Technology of Library and Information Service, 2012, 28(3): 23-26.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.03.04      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2012/V28/I3/23
[1] 张铭,宋炜. 语义网简明教程[M].北京:高等教育出版社,2004:36-45.(Zhang Ming,Song Wei. A First Step Towards the Semantic Web[M].Beijing: Higher Education Press,2004:36-45.)

[2] 孙霞,郑庆华,刘均. Web 知识挖掘:理论、方法与应用[M]. 北京:科学出版社, 2010:65-77.(Sun Xia,Zheng Qinghua,Liu Jun.Web Knowledge Mining: Theory, Methods and Applications[M].Beijing:Science Press,2010:65-77.)

[3] Wille R.Restructuring Lattice Theory: An Approach Based on Hierarchies of Concepts[A].//Rival I.Ordered Sets[M].Dordrecht: Reidel,1982:445-470.

[4] 樊旭琴.形式概念分析在突发事件新闻文本聚类中的应用[D].太原:山西大学,2010.(Fan Xuqin.The Application of Emergency News Text Clustering Based on Formal Concept Analysis [D].Taiyuan: Shanxi University, 2010.)

[5] Hu X G, Chen H,Ma F. The Mining of Classification Rules Based on Multiple Extended Concept Lattice[C].In:Proceedings of 2005 International Conference on Machine Learning and Cybernetics, Guangzhou, China.2005:18-21.

[6] Wang H, Yang J, Hu X G. A New Classification Algorithm Based on Entropy and Relative Reduced Exended Concept Lattice[C]. In:Proceedings of 2004 International Conference on Machine Learning and Cybernetics.2004:26-29.

[7] 周顽,周才学. 基于扩展概念格模型的文本分类规则提取的研究[J]. 计算机工程与科学,2010,32(8):98-101.(Zhou Wan,Zhou Caixue.Research on the Extracting Rules of Text Categorization Based on the Extended Concept Lattice Model[J]. Computer Engineering & Science, 2010, 32(8):98-101.)

[8] Yang Y. An Evaluation of Statistical Approaches to Text Categorization [J]. Journal of Information Retrieval,1999,l(1-2):69-90.

[9] Joachims T. Text Categorization with Support Vector Machine: Learning with Many Relevant Features[C].In:Proceedings of the 10th European Conference on Machine Learning.1998:137-142.

[10] Luo S, Tapas K. Thresholding Strategies for Text Classifiers: TREC 2005 Biomedical Triage Task Experiments[C]. In:Proceedings of the 14th Text Retrieval Conference.2005.

[11] Niu J, Sun L. WIM at TREC 2005[C]. In:Proceedings of the 14th Text Retrieval Conference.2005.

[12] Yang Z, Lin H.TREC 2005 Genomics Track Experiments at DUTAI[C]. In:Proceedings of the 14th Text Retrieval Conference.2005.

[13] 倪茂树, 赵晶, 林鸿飞. 生物医学文本分类方法比较研究[J]. 计算机工程与应用,2007,43(12):147-150.(Ni Maoshu,Zhao Jing,Lin Hongfei. Comparison Study on Categorization Algorithms for Biomedical Literatures[J]. Computer Engineering and Applications, 2007,43(12):147-150.)

[14] 马张华. 数字环境下文献分类法的检索应用及其发展[J]. 大学图书馆学报,2011,29(4):64-68.(Ma Zhanghua. A Study on Searching Applications and Development of Document Classification Under the Digital-environment [J]. Journal of Academic Libraries, 2011,29(4):64-68.)

[15] Godin R,Missaoui R,Alaoui H.Incremental Concept Formation Algorithms Based on Galois(Concept) Lattices[J]. Computational Intelligence, 1995,11(2):246-267.
[1] 陈杰,马静,李晓峰. 融合预训练模型文本特征的短文本分类方法*[J]. 数据分析与知识发现, 2021, 5(9): 21-30.
[2] 周泽聿,王昊,赵梓博,李跃艳,张小琴. 融合关联信息的GCN文本分类模型构建及其应用研究*[J]. 数据分析与知识发现, 2021, 5(9): 31-41.
[3] 余本功,朱晓洁,张子薇. 基于多层次特征提取的胶囊网络文本分类研究*[J]. 数据分析与知识发现, 2021, 5(6): 93-102.
[4] 王艳, 王胡燕, 余本功. 基于多特征融合的中文文本分类研究*[J]. 数据分析与知识发现, 2021, 5(10): 1-14.
[5] 唐晓波,高和璇. 基于关键词词向量特征扩展的健康问句分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 66-75.
[6] 王思迪,胡广伟,杨巳煜,施云. 基于文本分类的政府网站信箱自动转递方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 51-59.
[7] 刘萍,彭小芳. 基于形式概念分析的词汇相似度计算*[J]. 数据分析与知识发现, 2020, 4(5): 66-74.
[8] 徐月梅,刘韫文,蔡连侨. 基于深度融合特征的政务微博转发规模预测模型*[J]. 数据分析与知识发现, 2020, 4(2/3): 18-28.
[9] 徐彤彤,孙华志,马春梅,姜丽芬,刘逸琛. 基于双向长效注意力特征表达的少样本文本分类模型研究*[J]. 数据分析与知识发现, 2020, 4(10): 113-123.
[10] 余本功,曹雨蒙,陈杨楠,杨颖. 基于nLD-SVM-RF的短文本分类研究*[J]. 数据分析与知识发现, 2020, 4(1): 111-120.
[11] 马捷,葛岩,蒲泓宇. 属性约简方法研究综述*[J]. 数据分析与知识发现, 2020, 4(1): 40-50.
[12] 聂维民,陈永洲,马静. 融合多粒度信息的文本向量表示模型 *[J]. 数据分析与知识发现, 2019, 3(9): 45-52.
[13] 邵云飞,刘东苏. 基于类别特征扩展的短文本分类方法研究 *[J]. 数据分析与知识发现, 2019, 3(9): 60-67.
[14] 秦贺然,刘浏,李斌,王东波. 融入实体特征的典籍自动分类研究 *[J]. 数据分析与知识发现, 2019, 3(9): 68-76.
[15] 陈果,许天祥. 基于主动学习的科技论文句子功能识别研究 *[J]. 数据分析与知识发现, 2019, 3(8): 53-61.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn