Please wait a minute...
Advanced Search
现代图书情报技术  2004, Vol. 20 Issue (10): 33-35     https://doi.org/10.11925/infotech.1003-3513.2004.10.05
  22届机检会专题 本期目录 | 过刊浏览 | 高级检索 |
纯文本文档处理技术的研究与应用
李海涛
(中国科学技术信息研究所  北京 100038)
The Research and Application of Pure Text Document Technique
Li Haitao
(Institute of Scientific and Technical Information of China, Beijing 100038, China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

从项目实践出发,对纯文本文档的处理技术进行了深入的研究,包括文档内容的识别、抽取、关联修改等,并在此基础上分别用Visual C#.NET和Java实现了纯文本资源自动解析系统和基于纯文本的参数配置系统。最后结合实际应用,总结了纯文本技术的应用特点,指出了其应用价值和发展方向。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 纯文本识别抽取关联修改      
Abstract

This paper based on the practice of the project, researches the means of dealing with pure text, which including the content identification and pick-up, associated modification etc, and realized the Pure Text Parser System with Visual C#. NET and Parameter Configuration System based on pure text with Java. At last, combining the application, summarizes the characteristic of technique that based on pure text, and demonstrates the value of it.

Key wordsPure text    Identification    Pick-up    Associated modification
收稿日期: 2004-04-16      出版日期: 2004-10-25
: 

TP391.1

 
通讯作者: 李海涛     E-mail: liht518@sohu.com
作者简介: 李海涛
引用本文:   
李海涛. 纯文本文档处理技术的研究与应用[J]. 现代图书情报技术, 2004, 20(10): 33-35.
Li Haitao. The Research and Application of Pure Text Document Technique. New Technology of Library and Information Service, 2004, 20(10): 33-35.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2004.10.05      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2004/V20/I10/33

1  李保利等.信息抽取研究综述.计算机工程与应用,2003(10):4
http://www.chinalinuxpub.com/doc/manual/9.0/rhl-gsg-zh_CN-9/s1-docs-txt.html(Accessed Apr.6,2004)
3  解析文本和列表.http://www.5d.cn/5dmedia/multimedia/director/basic/20040406/00003467.htm
(Accessed Apr.8,2004)
4  parse text,http://www.javapractices.com/Topic87.cjp,(Accessed Apr.2,2004)

[1] 王寒雪,崔文娟,周园春,杜一. 基于机器学习的食源性疾病致病菌识别方法*[J]. 数据分析与知识发现, 2021, 5(9): 54-62.
[2] 王一钒,李博,史话,苗威,姜斌. 古汉语实体关系联合抽取的标注方法*[J]. 数据分析与知识发现, 2021, 5(9): 63-74.
[3] 马江微, 吕学强, 游新冬, 肖刚, 韩君妹. 融合BERT与关系位置特征的军事领域关系抽取方法*[J]. 数据分析与知识发现, 2021, 5(8): 1-12.
[4] 柴庆凤, 史霖炎, 梅珊, 熊海涛, 贺惠新. 基于人工特征和机器特征融合的科技文献知识元抽取*[J]. 数据分析与知识发现, 2021, 5(8): 132-144.
[5] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[6] 张建东, 陈仕吉, 徐小婷, 左文革. 基于词向量的PDF表格抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 34-44.
[7] 喻雪寒, 何琳, 徐健. 基于RoBERTa-CRF的古文历史事件抽取方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 26-35.
[8] 赵丹宁,牟冬梅,白森. 基于深度学习的科技文献摘要结构要素自动抽取方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 70-80.
[9] 沈科杰, 黄焕婷, 化柏林. 基于公开履历数据的人物知识图谱构建*[J]. 数据分析与知识发现, 2021, 5(7): 81-90.
[10] 陈星月, 倪丽萍, 倪志伟. 基于ELECTRA模型与词性特征的金融事件抽取方法研究*[J]. 数据分析与知识发现, 2021, 5(7): 36-47.
[11] 尹鹏博,潘伟民,张海军,陈德刚. 基于BERT-BiGA模型的标题党新闻识别研究*[J]. 数据分析与知识发现, 2021, 5(6): 126-134.
[12] 王义真,欧石燕,陈金菊. 民事裁判文书两阶段式自动摘要研究*[J]. 数据分析与知识发现, 2021, 5(5): 104-114.
[13] 石湘,刘萍. 基于知识元语义描述模型的领域知识抽取与表示研究 *——以信息检索领域为例[J]. 数据分析与知识发现, 2021, 5(4): 123-133.
[14] 闫强,张笑妍,周思敏. 基于义原相似度的关键词抽取方法 *[J]. 数据分析与知识发现, 2021, 5(4): 80-89.
[15] 成彬,施水才,都云程,肖诗斌. 基于融合词性的BiLSTM-CRF的期刊关键词抽取方法[J]. 数据分析与知识发现, 2021, 5(3): 101-108.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn