Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (6): 88-92     https://doi.org/10.11925/infotech.1003-3513.2010.06.15
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
基于.Net的农产品市场行情信息采集 ——以重庆农产品市场行情查询网为例
陈诗琴1,李文江2
1(重庆文理学院图书馆重庆 402160)
2(重庆文理学院教务处重庆 402160)
Information Collection of Market Quotation of Agricultural Products Based on .Net ——Taking Chongqing Market Quotation of Agricultural Products as an Examples
Chen Shiqin1,Li Wenjiang2
1(Library of Chongqing University of Arts and Sciences, Chongqing 402160, China)
2(Office of Academic Affairs, Chongqing University of Arts and Sciences, Chongqing 402160, China)
全文: PDF (666 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

 针对农产品市场行情信息的精确采集,综合运用WebClient类和开源类库HtmlParser.NET,自动生成行情信息动态网页的分页下载链接,将每个分页下载转换为静态网页。建立基于HTML结构特征的网页数据精确提取通用方法,实现循环提取所有行情信息数据。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈诗琴
李文江
关键词 农产品市场行情信息采集WebClientHtmlParser.NET    
Abstract

According to the information collection of market quotation of agricultural products, the paper comprehensively uses WebClient class and opens source class libraries HtmlParser.net, automatically generates the downloading link of dynamic web page of market quotation, and converts each page downloading to the static page. Accurate extract common method of web data is founded based on HTML structure, and all market quotation data is extracted cyclically.

Key wordsmarket quotation of agricultural products    information collection    WebClient    HtmlParser.net
收稿日期: 2010-05-11      出版日期: 2010-07-26
: 

TP391.1

 
通讯作者: 李文江     E-mail: cqwulwj@126.com
引用本文:   
陈诗琴 李文江. 基于.Net的农产品市场行情信息采集 ——以重庆农产品市场行情查询网为例[J]. 现代图书情报技术, 2010, 26(6): 88-92.
Chen Shiqin Li Wenjiang. Information Collection of Market Quotation of Agricultural Products Based on .Net ——Taking Chongqing Market Quotation of Agricultural Products as an Examples. New Technology of Library and Information Service, 2010, 26(6): 88-92.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.06.15      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I6/88

[1] HTML Parser for .NET C#,VB.NET[EB/OL].[2010-04-25].http://www.netomatix.com/Products/DocumentManagement/HTMLParserNet.aspx.
[2] 桂林斌.基于HtmlParser抽取动态异构Web信息的研究与实现[J].计算机与数字工程,2009,37(7):161-164.
[3] 李彦刚,魏海平,侯兴华. 基于HTMLParser的Web信息抽取系统的设计与实现[J].辽宁石油化工大学学报,2006,26(2):83-86.
[4] 宫继兵,唐杰.基于Ontology的视频描述信息抽取系统[J].计算机工程,2009,35(18):34-36.
[5] 火善栋.基于网页结构特征的网页主要文本信息抽取策略[J].现代计算机:专业版,2008(4):73-75.
[6] 金砚硕, 迟呈英,战学刚.一种基于隐马尔可夫聚类的信息提取方法[J].情报杂志,2008,27(3):96-98.
[7] 方宏,吕太之.求职网站职位列表页链接信息的自动提取[J].现代图书情报技术,2009(7):93-96.
[8] Olsen A,Allison D, Speer J. Visual Basic.NET类设计手册[M].袁勤勇,吴静译.北京:清华大学,2002:35-179.

[1] 王思丽, 刘巍, 祝忠明, 吴志强, 王金平. 基于CSpace的科技信息可配置化自动监测功能设计与实现*[J]. 数据分析与知识发现, 2017, 1(10): 85-93.
[2] 潘竹虹,萧德洪. 一种支持双栈及高速网络的数字资源利用分析系统数据过滤方法[J]. 现代图书情报技术, 2016, 32(3): 90-96.
[3] 武海东, 何晓阳, 张精理. 医学学术信息自动采集系统的设计与实现[J]. 现代图书情报技术, 2014, 30(11): 73-78.
[4] 吴红, 王凤英, 付秀颖. 面向专利分析的法律状态分布式采集系统的设计与实现[J]. 现代图书情报技术, 2012, (12): 66-71.
[5] 许鑫 黄仲清 邓三鸿. 互联网侨情信息采集系统设计与实现*[J]. 现代图书情报技术, 2010, 26(7/8): 95-101.
[6] 黄进. 图书馆应用系统监控的设计与实现[J]. 现代图书情报技术, 2010, 26(3): 90-94.
[7] 许鑫,黄仲清. 垂直搜索引擎应用中的若干策略探讨*——以12580餐饮垂直搜索为例[J]. 现代图书情报技术, 2009, 3(2): 62-70.
[8] 钱爱兵. 基于主题的网络舆情分析模型及其实现[J]. 现代图书情报技术, 2008, 24(4): 49-55.
[9] 徐德智,王庆涛,王斌 . 基于本体的Web信息采集*[J]. 现代图书情报技术, 2007, 2(2): 53-55.
[10] 刘莉,肖诗斌,王涛,施水才. 基于RSS的博客采集系统的设计与实现*[J]. 现代图书情报技术, 2007, 2(11): 45-48.
[11] 吴金红,张玉峰,王翠波 . 面向主题的网络竞争情报采集系统*[J]. 现代图书情报技术, 2006, 1(12): 54-57.
[12] 邵晓良,刘红. Web主题信息采集中信息主题的识别[J]. 现代图书情报技术, 2004, 20(10): 51-54.
[13] 李培,赵麟. 网上证券金融信息采集系统的研究[J]. 现代图书情报技术, 2001, 17(6): 56-59.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn