Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. 3 Issue (1): 28-33     https://doi.org/10.11925/infotech.1003-3513.2009.01.06
  专题 本期目录 | 过刊浏览 | 高级检索 |
基于数据挖掘的Web Archive资源应用分析*
吴振新张智雄孙志茹1,2
1 (中国科学院国家科学图书馆 北京 100190)
2 (中国科学院研究生院 北京 100049)
An Analysis of the Application of Web Archive Resources Based on Data Mining
Wu ZhenxinZhang ZhixiongSun Zhiru1,2
1(National Science Library, Chinese Academy of SciencesBeijing 100190,China)
2(Graduate University of Chinese Academy of Sciences,Beijing 100049,China)
全文: PDF (1158 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

介绍Web archive资源应用的基本情况,从数据挖掘的角度,对Web archive资源的深层次应用进行总结和分析。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
吴振新
孙志茹
关键词 Web archive应用分析数据挖掘    
Abstract

 This article introduced current applications of web archive resources, and then from the perspective of data mining, analyzes and sums up the in-depth applications of web archive resources.

Key wordsWeb archive    Application analysis    Data mining
收稿日期: 2008-12-22      出版日期: 2009-01-25
: 

 

 
  G350

 
基金资助:

* 本文系国家社会科学基金项目“网络信息资源保存的理论与方法研究”(项目编号:06BTQ025)的研究成果之一。

通讯作者: 吴振新     E-mail: wuzx@mail.las.ac.cn
作者简介: 吴振新,张智雄,孙志茹
引用本文:   
吴振新,张智雄,孙志茹. 基于数据挖掘的Web Archive资源应用分析*[J]. 现代图书情报技术, 2009, 3(1): 28-33.
Wu Zhenxin,Zhang Zhixiong,Sun Zhiru. An Analysis of the Application of Web Archive Resources Based on Data Mining. New Technology of Library and Information Service, 2009, 3(1): 28-33.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.01.06      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V3/I1/28

[1] Internet Archive[EB/OL]. [2007-12-16].http://www.archive.org/index.php.
[2] 中国Web信息博物馆[EB/OL].[2008-11-2].http://www.infomall.cn/.
[3] Wayback Machine[EB/OL].[2008-11-02].http://www.archive.org/index.php.
[4] Report on the 8th International Workshop on Web Archiving[R/OL].[2008-11-02].http://www.dlib.org/dlib/november08/rauber/11rauber.html.
[5] WEAR[EB/OL].[2008-11-02].http://archive-access.sourceforge.net/projects/wera/.
[6] XTF[EB/OL]. [2008-11-02].http://www.cdlib.org/inside/projects/xtf/.
[7] Xinq[EB/OL].[2008-11-02].http://www.nla.gov.au/xinq/.
[8] Warrick[EB/OL]. [2008-05-28]. http://warrick.cs.odu.edu/.
[9] Lazy Preservation: Reconstructing Websites by Crawling the Crawlers[EB/OL]. [2008-11-02].http://www.cs.odu.edu/~fmccown/pubs/lazyp-widm06.pdf.
[10] WebContinuity[EB/OL]. [2008-11-08].http://www.nationalarchives.gov.uk/webcontinuity/.
[11] 阎宏飞.可扩展Web信息搜集系统的设计、实现与应用初探[D].北京:北京大学,2002.
[12] Rauber A,Aschenbrenner A, Witvoet O. Austrian Online Archive Processing: Analyzing Archives of the World Wide Web[J].Research and Advanced Technology for Digital Libraries: 6th European Conference, ECDL, 2002:16-31.
[13] Rauber A, Aschenbrenner A, Witvoet O,et al. Uncovering Information Hidden in Web Archives[J].D-Lib Magazine, 2002,8(12):1082-9873.
[14] William Y A , Aya S, Dmitriev P,et al. Building a Research Library for the History of the Web[J].Proceedings of the 6th ACM/IEEE-CS Joint Conference on Digital Libraries, 2006:95-102.
[15] William Y A , Aya S, Dmitriev P, et al. A Research Library Based on the Historical Collections of the Internet Archive[J].D-Lib Magazine, 2006,12(2):1082-9873.
[16] Kitsuregawa M, Tamura T, Toyoda M,et al.Socio-Sense: A System for Analysing the Societal Behavior from Long Term Web Archive[M]. Progress in WWW Research and Development.Heidelberg :Springer Berlin ,2008.
[17] 让社会科学插上信息技术的翅膀[EB/OL]. [2008-11-02].http://cess.grids.cn/ourpdfs/Let%20social%20science%20ride% 20on%20IT%20bullet%20train.pdf.

[1] 谢旺, 王丽珍, 陈红梅, 曾兰清. 基于空间序偶模式挖掘污染源与癌症病例的关系 *[J]. 数据分析与知识发现, 2021, 5(2): 14-31.
[2] 张勇,李树青,程永上. 基于频次有效长度的加权关联规则挖掘算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 85-93.
[3] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[4] 牟冬梅,法慧,王萍,孙晶. 基于结构方程模型的疾病危险因素研究*[J]. 数据分析与知识发现, 2019, 3(4): 80-89.
[5] 李勇男. 贝叶斯理论在反恐情报分类分析中的应用研究*[J]. 数据分析与知识发现, 2018, 2(10): 9-14.
[6] 牟冬梅, 王萍, 赵丹宁. 高维电子病历的数据降维策略与实证研究*[J]. 数据分析与知识发现, 2018, 2(1): 88-98.
[7] 胡忠义, 王超群, 吴江. 融合多源网络评估数据及URL特征的钓鱼网站识别技术研究*[J]. 数据分析与知识发现, 2017, 1(6): 47-55.
[8] 江思伟, 谢振平, 陈梅婕, 蔡明. 混合特征数据的自解释归约建模方法*[J]. 数据分析与知识发现, 2017, 1(12): 92-100.
[9] 牟冬梅,任珂. 三种数据挖掘算法在电子病历知识发现中的比较*[J]. 现代图书情报技术, 2016, 32(6): 102-109.
[10] 李峰,李书宁,于静. 面向院系的高校毕业生图书馆记忆系统[J]. 现代图书情报技术, 2016, 32(5): 99-103.
[11] 赵静娴. 基于决策树的网络伪舆情识别研究[J]. 现代图书情报技术, 2015, 31(6): 78-84.
[12] 何建民, 王哲. 社交网络话题信息传播影响簇发现谱系挖掘方法[J]. 现代图书情报技术, 2015, 31(5): 65-72.
[13] 黄文彬, 徐山川, 马龙, 王军. 利用通信数据的移动用户行为分析[J]. 现代图书情报技术, 2015, 31(5): 80-87.
[14] 郝玫, 王道平. 面向供应链的产品评论中客户关注特征挖掘方法研究[J]. 现代图书情报技术, 2014, 30(4): 65-70.
[15] 孙鸿飞, 侯伟. 改进TFIDF算法在潜在合作关系挖掘中的应用研究[J]. 现代图书情报技术, 2014, 30(10): 84-92.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn