Please wait a minute...
Advanced Search
现代图书情报技术  2008, Vol. 24 Issue (5): 85-88     https://doi.org/10.11925/infotech.1003-3513.2008.05.16
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
基于MIME邮件结构的邮件内容提取技术的研究
胡燕 滕桂法 董素芬 王聃
(河北农业大学信息科学与技术学院 保定 071001)
Research on Extracting E-mail Information Based on Structure of MIME Mail
Hu Yan  Teng Guifa  Dong Sufen   Wang Dan
(School of Information Science and Technology, Agricultural University of Hebei, Baoding 071001, China)
全文: PDF (337 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

为准确提取电子邮件的内容,对邮件的组成结构进行详尽的分析,归纳出邮件正文特征,并设计出一个基于MIME邮件结构的邮件预处理系统。该系统采用分块处理和特征识别的方法,克服电子邮件不规范的缺点,并对邮件正文中的回复行和广告行进行过滤,从而实现对邮件内容快速准确提取。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王聃
胡燕
滕桂法
董素芬
关键词 多用途互联网邮件扩展电子邮件预处理    
Abstract

 In order to accurately extract the information of E-mail,  E-mail’s structure and content features are analyzed, and an E-mail pretreatment system based on structure of MIME mail is designed. Using block-treatment and feature identification methods, this system overcomes the shortcomings of informal style and filteres reply lines and advertising lines. The system finally realizes expectative goal of extracting E-mail information quickly and accurately.

Key wordsMIME    E-mail    Pretreatment
收稿日期: 2008-01-04      出版日期: 2008-05-25
: 

TP393.098

 
通讯作者: 胡燕     E-mail: katehu_2001@163.com
作者简介: 胡燕,滕桂法,董素芬,王聃
引用本文:   
胡燕,滕桂法,董素芬,王聃. 基于MIME邮件结构的邮件内容提取技术的研究[J]. 现代图书情报技术, 2008, 24(5): 85-88.
Hu Yan,Teng Guifa,Dong Sufen,Wang Dan. Research on Extracting E-mail Information Based on Structure of MIME Mail. New Technology of Library and Information Service, 2008, 24(5): 85-88.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2008.05.16      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2008/V24/I5/85

[1] 汪晓平,钟军.Visual C++网络通信协议分析与应用实现[M].北京:人民邮电出版社,2003:347-380.
[2] 张孝祥,方立勋.Java 邮件开发详解[M].北京:电子工业出版社,2007:64-78.
[3] MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies[S]. Nathaniel Borenstein and Ned Freed, 1994.
[4] KFC 822:Standard for ARPA Internet Text Messages[EB/OL].[2007-09-28]. http://www.ietf.org/rfc/rfco822.txt?number=822.
[5] Carvalho V R, Cohen W W. Learning to Extract Signature and Reply Lines from Email[EB/OL]. [2007-09-28].http://www.cs.cmu.edu/~wcohen/postscript/email-2004.pdf.

[1] 刘伙玉, 王东波. 面向论文相似性检测的数据预处理研究[J]. 现代图书情报技术, 2015, 31(5): 50-56.
[2] 化柏林 . 用VBA实现文献计量分析研究中的数据预处理技术[J]. 现代图书情报技术, 2007, 2(3): 69-72.
[3] 薛红 . 在金盘系统中实现基于.NET和Windows服务的超期借阅电子邮件催还服务[J]. 现代图书情报技术, 2006, 1(6): 80-84.
[4] 袁利民. 实时预约通知系统的设计与实现[J]. 现代图书情报技术, 2004, 20(8): 87-88.
[5] 何月顺,杜萍,丁秋林. 基于Python的电子邮件系统的研究与应用[J]. 现代图书情报技术, 2004, 20(4): 72-74.
[6] 柳胜国. Web日志挖掘数据预处理方法研究  [J]. 现代图书情报技术, 2004, 20(12): 55-57.
[7] 邵敏,李旭. 合作虚拟参考咨询服务——QuestionPoint系统剖析[J]. 现代图书情报技术, 2003, 19(3): 37-41.
[8] 邱建霞. 安全电子邮件[J]. 现代图书情报技术, 2000, 16(5): 53-57.
[9] 胡德华,方平. 基因库(GenBank)的电子邮件检索[J]. 现代图书情报技术, 1999, 15(3): 31-32.
[10] 李健英. 如何利用E-mail获取互联网信息[J]. 现代图书情报技术, 1996, 12(5): 30-31.
[11] 董小英. 电子邮件的技术指标及其应用[J]. 现代图书情报技术, 1995, 11(1): 13-17.
[12] 吕维平. 电子邮件及其对图书馆的影响[J]. 现代图书情报技术, 1994, 10(2): 49-52.
[13] 刘继昌. 国际联机情报检索系统的若干进展[J]. 现代图书情报技术, 1991, 7(1): 25-27.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn