Please wait a minute...
Advanced Search
现代图书情报技术  2012, Vol. 28 Issue (3): 23-26    DOI: 10.11925/infotech.1003-3513.2012.03.04
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
FCA在医学领域文本分类中的研究和应用
徐坤1, 曹锦丹1, 毕强2
1. 吉林大学公共卫生学院 长春 130021;
2. 吉林大学管理学院 长春 130022
A Study and Application on Medical Text Categorization Based on FCA
Xu Kun1, Cao Jindan1, Bi Qiang2
1. School of Public Health, Jilin University, Changchun 130021, China;
2. School of Management, Jilin University, Changchun 130022, China
全文: PDF(451 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 在对文本分类技术和形式概念分析理论进行分析的基础上,针对医学领域文本的专业性特点,阐述利用形式概念分析进行医学领域文本分类的技术路线。通过中图法构建形式背景,进而生成概念格,利用概念格对领域文本进行分类,使分类效果接近人工分类。探索基于形式概念分析的医学领域文本分类的新途径。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
徐坤
曹锦丹
毕强
关键词 文本分类医学领域文本形式概念分析概念格    
Abstract:Based on the analysis of text categorization and the theory of Formal Concept Analysis(FCA),this paper elaborates the text categorization method of using FCA according to the medical field text characteristics.It uses Classification of Chinese to construct the formal context, and generates concept lattices, which are used to classify the medical field text and make classification effect close to artificial classification.This paper explores a new approach based on FCA for medical text categorization.
Key wordsText categorization    Medical field text    Formal concept analysis    Concept lattices
收稿日期: 2012-02-10     
: 

G202

 
基金资助:

本文系国家自然科学基金项目“基于概念格的数字图书馆知识构建研究”(项目编号:70973044)的研究成果之一。

引用本文:   
徐坤, 曹锦丹, 毕强. FCA在医学领域文本分类中的研究和应用[J]. 现代图书情报技术, 2012, 28(3): 23-26.
Xu Kun, Cao Jindan, Bi Qiang. A Study and Application on Medical Text Categorization Based on FCA. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2012.03.04.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2012.03.04
[1] 张铭,宋炜. 语义网简明教程[M].北京:高等教育出版社,2004:36-45.(Zhang Ming,Song Wei. A First Step Towards the Semantic Web[M].Beijing: Higher Education Press,2004:36-45.)

[2] 孙霞,郑庆华,刘均. Web 知识挖掘:理论、方法与应用[M]. 北京:科学出版社, 2010:65-77.(Sun Xia,Zheng Qinghua,Liu Jun.Web Knowledge Mining: Theory, Methods and Applications[M].Beijing:Science Press,2010:65-77.)

[3] Wille R.Restructuring Lattice Theory: An Approach Based on Hierarchies of Concepts[A].//Rival I.Ordered Sets[M].Dordrecht: Reidel,1982:445-470.

[4] 樊旭琴.形式概念分析在突发事件新闻文本聚类中的应用[D].太原:山西大学,2010.(Fan Xuqin.The Application of Emergency News Text Clustering Based on Formal Concept Analysis [D].Taiyuan: Shanxi University, 2010.)

[5] Hu X G, Chen H,Ma F. The Mining of Classification Rules Based on Multiple Extended Concept Lattice[C].In:Proceedings of 2005 International Conference on Machine Learning and Cybernetics, Guangzhou, China.2005:18-21.

[6] Wang H, Yang J, Hu X G. A New Classification Algorithm Based on Entropy and Relative Reduced Exended Concept Lattice[C]. In:Proceedings of 2004 International Conference on Machine Learning and Cybernetics.2004:26-29.

[7] 周顽,周才学. 基于扩展概念格模型的文本分类规则提取的研究[J]. 计算机工程与科学,2010,32(8):98-101.(Zhou Wan,Zhou Caixue.Research on the Extracting Rules of Text Categorization Based on the Extended Concept Lattice Model[J]. Computer Engineering & Science, 2010, 32(8):98-101.)

[8] Yang Y. An Evaluation of Statistical Approaches to Text Categorization [J]. Journal of Information Retrieval,1999,l(1-2):69-90.

[9] Joachims T. Text Categorization with Support Vector Machine: Learning with Many Relevant Features[C].In:Proceedings of the 10th European Conference on Machine Learning.1998:137-142.

[10] Luo S, Tapas K. Thresholding Strategies for Text Classifiers: TREC 2005 Biomedical Triage Task Experiments[C]. In:Proceedings of the 14th Text Retrieval Conference.2005.

[11] Niu J, Sun L. WIM at TREC 2005[C]. In:Proceedings of the 14th Text Retrieval Conference.2005.

[12] Yang Z, Lin H.TREC 2005 Genomics Track Experiments at DUTAI[C]. In:Proceedings of the 14th Text Retrieval Conference.2005.

[13] 倪茂树, 赵晶, 林鸿飞. 生物医学文本分类方法比较研究[J]. 计算机工程与应用,2007,43(12):147-150.(Ni Maoshu,Zhao Jing,Lin Hongfei. Comparison Study on Categorization Algorithms for Biomedical Literatures[J]. Computer Engineering and Applications, 2007,43(12):147-150.)

[14] 马张华. 数字环境下文献分类法的检索应用及其发展[J]. 大学图书馆学报,2011,29(4):64-68.(Ma Zhanghua. A Study on Searching Applications and Development of Document Classification Under the Digital-environment [J]. Journal of Academic Libraries, 2011,29(4):64-68.)

[15] Godin R,Missaoui R,Alaoui H.Incremental Concept Formation Algorithms Based on Galois(Concept) Lattices[J]. Computational Intelligence, 1995,11(2):246-267.
[1] 余本功,陈杨楠,杨颖. 基于nBD-SVM模型的投诉短文本分类*[J]. 数据分析与知识发现, 2019, 3(5): 77-85.
[2] 谭章禄,王兆刚,胡翰. 一种基于χ2统计的特征分类选择方法研究*[J]. 数据分析与知识发现, 2019, 3(2): 72-78.
[3] 张紫玄,王昊,朱立平,邓三鸿. 中国海关HS编码风险的识别研究*[J]. 数据分析与知识发现, 2019, 3(1): 72-84.
[4] 李心蕾,王昊,刘小敏,邓三鸿. 面向微博短文本分类的文本向量化方法比较研究*[J]. 数据分析与知识发现, 2018, 2(8): 41-50.
[5] 庞贝贝,苟娟琼,穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[6] 李琳,李辉. 一种基于概念向量空间的文本相似度计算方法[J]. 数据分析与知识发现, 2018, 2(5): 48-58.
[7] 刘浏,王东波. 基于论文自动分类的社科类学科跨学科性研究*[J]. 数据分析与知识发现, 2018, 2(3): 30-38.
[8] 刘萍,李亚楠,郁聪. 面向学术搜索的交互式知识地图建构研究*[J]. 数据分析与知识发现, 2018, 2(12): 43-51.
[9] 冯国明,张晓冬,刘素辉. 基于CapsNet的中文文本分类研究*[J]. 数据分析与知识发现, 2018, 2(12): 68-76.
[10] 李湘东,阮涛,刘康. 基于维基百科的多种类型文献自动分类研究*[J]. 数据分析与知识发现, 2017, 1(10): 43-52.
[11] 路永和,陈景煌. 混合蛙跳算法在文本分类特征选择优化中的应用*[J]. 数据分析与知识发现, 2017, 1(1): 91-101.
[12] 刘红光,马双刚,刘桂锋. 基于降噪自动编码器的中文新闻文本分类方法研究*[J]. 现代图书情报技术, 2016, 32(6): 12-19.
[13] 陆佳莹,袁勤俭,黄奇,钱韵洁. 基于概念格理论的产品领域本体构建研究*[J]. 现代图书情报技术, 2016, 32(5): 38-46.
[14] 张群, 王红军, 王伦文. 词向量与LDA相融合的短文本分类方法*[J]. 数据分析与知识发现, 2016, 32(12): 27-35.
[15] 胡菊香, 吕学强, 刘克会. 利用类别引导词的投诉文本分类[J]. 现代图书情报技术, 2015, 31(7-8): 97-103.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn