Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. 25 Issue (5): 72-75     https://doi.org/10.11925/infotech.1003-3513.2009.05.14
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
基于增量的网页快照及其可视化
何明贵1,2  周宁荣辉贵1
1(武汉大学信息管理学院 武汉 430072)
2(武汉大学新闻与传播学院 武汉 430072)
Web Page Snapshot Based on Delta Encoding and It’s Visualization
He Minggui1,2  Zhou NingRong Huigui1
1(School of Information Management, Wuhan University,Wuhan 430072,China)
2(School of Journalism and Communication, Wuhan University, Wuhan 430072,China)
全文: PDF (766 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

为了持续跟踪某网页的变更情况,搜索引擎需要保存多个快照版本,这会大大增加服务器的存储空间。通过增量的方法,保存快照版本间的差异可减小磁盘空间占用。采用可视化方法,使用户能从全局了解各个版本间的修订情况、从细节上了解快照任意两个版本间的差异。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
何明贵
周宁
荣辉贵
关键词 增量网页快照可视化    
Abstract

In order to trace the changes of a Web page, the search engine needs to save many snapshots of it, that will increase the storage usage of the server. This paper introduces the method of delta encoding to save disk space. In order to let users understand global changes of all the snapshots and the detail changes of every two snapshots easily, this paper introduces the method of visualization.

Key wordsDelta encoding    Page snapshot    Visualization
收稿日期: 2009-03-06      出版日期: 2009-05-25
: 

TP18

 
通讯作者: 何明贵     E-mail: heccjj@gmail.com
作者简介: 何明贵,周宁,荣辉贵
引用本文:   
何明贵,周宁,荣辉贵. 基于增量的网页快照及其可视化[J]. 现代图书情报技术, 2009, 25(5): 72-75.
He Minggui,Zhou Ning,Rong Huigui. Web Page Snapshot Based on Delta Encoding and It’s Visualization. New Technology of Library and Information Service, 2009, 25(5): 72-75.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.05.14      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V25/I5/72

[1] 孙静,赵恒永.搜索引擎网页快照的实现与安全[J].中国科技信息,2007(11):138-141.
[2] Internet Archive [EB/OL].[2009-03-03].http://www.archive.org/index.php.
[3] 阳万安,李彦.通用版本控制系统的研究和设计[J].计算机工程,2008,34(12):283-285.
[4] Khalid S.Lossless Compression Handbook[M]. Academic Press.2003,269-263.
[5] Mogul J,Krishnamurthy B,Douglis F,et al.Delta Encoding in HTTP[EB/OL].(2002-01-02)[2009-03-03].http://tools.ietf.org/html/rfc3229.
[6] James J H, Ktem-Phong V, Walter F T, et al. Delta Algorithms: An Empirical Analysis[J]. Source ACM Transactions on Software Engineering and Methodology (TOSEM) Archive,1998,7(4):449.
[7] Ouyang Z,Memon N, Suel T, et al. Cluster-based Delta Compression of a Collection of Files[M]. Web Information Systems Engineering, 2002. WISE 2002. Proceedings of the Third International Conference, 2002: 257-268.
[8] Dimitre T, Nasir M, Torsten S, et al. zdelta: An Efficient Delta Compression Tool[EB/OL].(2002-06-26).[2009-03-04]. http://cis.poly.edu/tr/tr-cis-2002-02.pdf.
[9] Daniel A K.Information Visualization and Visual Data Mining[J].IEEE Transactions on Visualization and Computer Graphics,2002(7):100-107.
[10] Tortoise Merge Manual[EB/OL].[2009-03-04]. http://tortoisesvn.net/docs/release/TortoiseMerge_en/tmerge-dug.html#tmerge-dug-dia-3pane.
[11] Deng C, Shipeng Y, Ji-Rong W, et al. Extracting Content Structure for Web Pages Based on Visual Representation[J]. Web Technologies and Applications,2003(2642):596.

[1] 陈挺,王海名,王小梅. 基于可视化的基金资助热点及其演化发现方法研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 60-67.
[2] 杨海慈,王军. 宋代学术师承知识图谱的构建与可视化[J]. 数据分析与知识发现, 2019, 3(6): 109-116.
[3] 杨亚楠,赵文辉,张健,谭珅,张贝贝. 基于多视图协同的政策文本可视化研究*[J]. 数据分析与知识发现, 2019, 3(6): 30-41.
[4] 吴江,刘冠君,胡仙. 在线医疗健康研究的系统综述: 研究热点、主题演化和研究方法*[J]. 数据分析与知识发现, 2019, 3(4): 2-12.
[5] 吴志强,祝忠明,刘巍,王思丽. CSpace知识分析与可视化功能扩展研究与实践*[J]. 数据分析与知识发现, 2019, 3(3): 112-119.
[6] 陈挺, 李国鹏, 王小梅. 基于t-SNE降维的科学基金资助项目可视化方法研究*[J]. 数据分析与知识发现, 2018, 2(8): 1-9.
[7] 王永, 王永东, 郭慧芳, 周玉敏. 一种基于离散增量的项目相似性度量方法*[J]. 数据分析与知识发现, 2018, 2(5): 70-76.
[8] 杨斯楠, 徐健, 叶萍萍. 网络评论情感可视化技术方法及工具研究*[J]. 数据分析与知识发现, 2018, 2(5): 77-87.
[9] 王丽, 邹丽雪, 刘细文. 基于LDA主题模型的文献关联分析及可视化研究[J]. 数据分析与知识发现, 2018, 2(3): 98-106.
[10] 谢秀芳, 张晓林. 针对科技路线图的文本挖掘研究: 集成分析及可视化*[J]. 数据分析与知识发现, 2017, 1(1): 16-25.
[11] 陈挺,王小梅,吕伟民. ng-info-chart: 基于自定义HTML标签的交互式可视化组件*[J]. 现代图书情报技术, 2016, 32(6): 88-95.
[12] 李进华,安仲杰. 基于地理坐标的微博事件检测与分析*[J]. 现代图书情报技术, 2016, 32(2): 90-101.
[13] 夏立新,谭荧. LOD的网络结构分析与可视化*[J]. 现代图书情报技术, 2016, 32(1): 65-72.
[14] 彭浩, 徐健, 肖卓. 基于比较句的网络用户评论情感分析[J]. 现代图书情报技术, 2015, 31(12): 48-56.
[15] 郑飏飏, 徐健, 肖卓. 情感分析及可视化方法在网络视频弹幕数据分析中的应用[J]. 现代图书情报技术, 2015, 31(11): 82-90.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn