开源软件Piwik的门户网站统计技术和方法分析
温明章
华南农业大学图书馆 广州 510642
摘要

探讨Piwik开源软件在图书馆门户网站系统中的应用,在此基础上扩展收集真实IP的功能,并重点介绍系统的参数指标间的关系和可靠性,包括退出率、页面停留时间、转化率、访问来源和关键词等参数指标。

关键词: Piwik; 网站统计技术; 统计方法分析
中图分类号:G250.7
Analysis of the Portal Statistical Techniques and Methods Based on Source Software Piwik
Wen Mingzhang
South China Agricultural University Library, Guangzhou 510642, China
Abstract

Open source software Piwik is applied in the Web portal system of library. On the basis of the Piwik, the paper extends the function of collection of real IP, and puts emphasis on the relationship and reliability of the parameters in the system, including the bounce rate, page retention time, conversion, referer and keywords etc.

Keyword: Piwik; Technology of website statistics; Analysis of statistical method
1 引言

随着Cookie和Ajax技术的迅猛发展并且成熟地被应用到各领域,在线分析工具也得到快速发展。在线分析工具对网站访问信息进行记录和归类,在此基础上进行统计分析,如网站访问量的增长趋势图、用户访问最高的时段、访问最多的网页、停留时间、用户使用的搜索引擎和主要关键词等。这些数据可以分析门户网站各页面中栏目的布置和可到达率问题,提升用户操作满意度。建立网站的统计分析系统,可以有效地评估图书馆门户网站中资源栏目的设计使用、部署及用户使用的效果,对于合理改善图书馆网站发布资源的页面布局和提升用户体验都有较好的推动作用。

2 在线统计分析工具分析

目前,在线统计分析工具有SiteCatalyst[ 1, 2, 3]、WebTrends[ 4, 5, 6, 7]、Google Analytics[ 8, 9, 10]、百度统计[ 11, 12]以及Piwik[ 13]等。从表1分析可知,免费的在线分析工具可满足图书馆的一般需求。在免费的在线统计分析工具中,Piwik软件在开放和开源方面表现比较突出。

表1 商业模式比较

在应用技术方面,分析技术主要有HTTP协议头信息技术 、第一方Cooki 、第三方Cooki 、P3P协议Cooki 、LSO技术 以及Web Beacons和JavaScript技术,笔者实验得出现有工具使用的各项技术基本一致,应用技术的情况如表2所示:

表2 技术对比

表2可以说明所有的在线分析工具都采用了JavaScript、Web Beacons、第一方Cookie技术和HTTP协议头信息以及P3P协议Cookie技术等。从在线分析工具的商业模式和应用技术上分析,Piwik开源软件比较适合图书馆使用,所以笔者使用Piwik进行图书馆门户网站的用户行为研究。

3 系统实践思路

目前,有关网站统计技术应用方面的文献较多,有部分文献只是使用Web服务器日志来分析访问者行为[ 21, 22],服务器日志收集到的用户信息比较少,无法收集访问者使用环境情况和停留时间等一些信息,而且只是论述整个的网站访问量或是单个页面的访问量情况,而对访问的来源、访问者的行为路径和停留时间等访问行为参数指标并没有论述。虽然有些文献论述过访问行为的一些参数指标[ 23, 24],但是没有对这些参数指标间的关系和可靠性进行分析。笔者利用Piwik系统的前端运行JavaScript技术来收集访问者的大量访问行为数据信息,包括访问者使用环境、停留时间和访问上下文等信息,其分析原理和技术已经非常成熟,也在互联网上各商业网站得到了广泛的应用,但在图书馆门户网站的应用较少。笔者并没有对具体的Cookie和JavaScript等技术和原理进行剖析,而是在Piwik系统实际应用的基础上,重点对Piwik系统收集的页面停留时间、转化率、访问来源分类和关键词等数据参数指标进行分析,并在实践中对这些指标间的关系或可靠性进行考量,从而辨别出页面或转化目标是否需要优化。

基于Piwik的系统分两个部分实现,即 Piwik开源软件安装与改造和图书馆门户页面的改造。Piwik开源软件安装与改造是在图书馆的独立服务器上安装Piwik系统(具体安装过程可访问http://piwik.org/docs/installation/),可以响应校园网和公网读者或服务的请求,并按Piwik开发规则,增加收集真实IP信息的功能。图书馆门户页面的改造是在图书馆门户目标页面上加入Piwik的JavaScript跟踪代码,目标页面就是网站管理员认为需要进行统计分析的页面以及转换目标。

4 基于Piwik软件的系统开发
4.1 Piwik基本分析

Piwik是一个PHP和MySQL架构的开放源代码的Web统计软件,使用JavaScript技术跟踪所有PC机用户,而且使用Web Beacons技术来支持非JavaScript环境。Piwik的安装非常简单,使用者只需要按系统提示即可完成。Piwik可以提供退出页面、网页逗留时间、关键字分析、访问路径、外部网站和最佳搜索引擎等功能。系统的核心工作流程如下:

(1)访问者通过浏览器向门户服务器发送请求。

(2)门户服务器响应请求,返回预先设置了Piwik的跟踪代码的页面。Piwik的跟踪代码部分如下:

//TAG begin

//idsite为跟踪页面在Piwik系统的编码,每个目标页面有一个唯一号码

//TAG end

(3)客户端浏览器执行TAG标记,向Piwik请求数据获取的JavaScript代码。

(4)Piwik服务器响应请求,返回用于收集网页、浏览器和Cookie信息的JavaScript代码。

(5)客户端浏览器执行JavaScript代码,发送相关网页被访问的行为数据给Piwik服务器。

(6)Piwik服务器产生点击流日志,保存于后台数据库中,以便日后统计分析。

Piwik收集的信息有:被系统屏蔽后的IP地址信息、访问来源链接、第一次访问网站时间、累计网页浏览数和第几次来访数据等。由于Piwik比较注重用户隐私,对IP信息进行了屏蔽,这也是Piwik的不足之处,为了能够准确定位读者群,笔者需要对访问来源的IP信息进行分析,并对Piwik进行必要的二次开发。

4.2 Piwik收集IP信息的二次开发

(1)Piwik后台数据库改造

Piwik将用户的访问时间信息、访问事件和浏览器的环境等信息记录在MySQL数据库的Piwik_log_visit表中,笔者在此表上新增加一个ipinfo字段以便可以存放用户的真实IP信息。在MySQL的命令窗口执行如下命令语句完成信息表的建设:

“alter table Piwik.'Piwik_log_visit' Add column ipinfo varchar(20) not null default 0 AFTER 'location_provider'”

(2)新建一个获取IP信息的类

Piwik提供插件扩展功能的方法[ 25],所有的二次开发类必须遵守此方法。具体实现步骤为:在Piwik的plugins目录中建立 ipinfo.php扩展类继承Piwik_plugin类,重写Piwik_plugin中getListHooksRegistered方法获取已经注册的“Tracker.Visit.setVisitorIp”钩子;将此钩子绑定一个方法来获取IP信息;将IP信息存入Piwik_log_visit 表的ipinfo字段中。ipinfo.php部分代码如下:

class ipinfo extends Piwik_plugin{//继承Piwik_plugin类

……

Public function getListHooksRegistered(){

return array('Tracker.Visit.setVisitorIp'=>'setVisitorIpAddress'

//注册一个“Tracker.Visit.setVisitorIp”钩子来获取IP信息。

);

}

Static public function applyIPMash(﹩ip,﹩maskLength){

//解开屏蔽IP信息

﹩i=Piwik_Common:strlen(﹩ip);

If(﹩maskLength>﹩i){

﹩maskLength=﹩i;

}

While(﹩maskLength-->0){

﹩ip[--i]=chr(0);

}

Return ﹩ip;

}

function setVisitorIpAddress(﹩notifiaction){

// 建立与“Tracker.Visit.setVisitorIp”钩子绑定的方法

﹩ip=&﹩notification->getNotificationObject();

//得到的参数引用相关联的钩子

﹩ip=self::applyIPMask(﹩ip,Piwik_Tracker_Config::getInstance()->Tracker['ip_address_mask_length']);

//获取真实IP地址

}…… }

5 Piwik统计参数指标在实际应用中的利用与分析

同一个读者每次访问图书馆网站,在图书馆网站或者某个页面产生的停留时间、访问来源(如搜索引擎、搜索关键字和网站来源)、离开页面链接和目标转化率等都有可能不一样,分析这些信息才能使网站统计分析有意义。笔者重点结合实际使用情况对Piwik的跳出率、目标转化率、页面停留时间和访问来源分类等指标进行利用和分析。

5.1 跳出率[ 12]与停留时间的数据关系分析

x是跳出网站/网页的访问次数,y是访问网站/网页的停留时间,B是跳出率,V是访问次数,A是访问者在网站/网页平均停留时间,T是所有访问网站的总时间。跳出率与停留时间关系如下[ 26]:

A=T/V(1)

T=0x+(V-x)y (2)

x=VB(3)

公式(1)和(3)代入公式(2)得出:

A=[0x+(V-x)y]/V=(V-VB)y/V=y(1-B)(4)

由公式(4)得出:

y=A/(1-B)(5)

公式(5)[ 26]可以证明:跳出率越低,网站的平均停留时间就越接近实际停留时间。所以在优化网站布置和设计时,不仅要有平均停留时间的统计还要参考退出率统计的大小。

如果仅分析单纯的页面/网站停留时间意义不大,主要原因有:

(1)这些指标是战术层面的,分析员无法认识到这些数据对页面统计的影响,单纯的页面停留时间或网站停留时间并不能反映出具体的页面对读者的影响力;

(2)这些指标需要很多推断,这些数据无法直接推断出某页面的好坏,简单的逻辑依据数据量越大越好;

(3)这些指标主要是短期数据,随着互联网的发展,依照访问会话来度量指标远远不能满足需求,长期的访客行为、读者生命周期等更加能反映问题,不同的停留时间需要用不同的逻辑去判断。

笔者进行的实验如表3所示:

表3 平均访问时间的实验

出现上述不同数据的主要原因有:华南农业大学读者想获取本馆资源;第一时间可能是访问华南农业大学图书馆的门户网站;因为目标位置不确定,门户网站内容丰富,所以读者要多花费时间;网络数据库网站是一个对电子资源进行分类的导航网站,提供各种资源的访问入口,因此读者进入网络数据库一般都有明确的目标,快速找到目标、搜索,然后快速离开,也可能是网站界面简洁或是读者很容易就找到想要的东西,所以网络数据库网站的跳出率高,停留时间自然就少,而网络数据库的读者使用量很高,这时单纯的跳出率数据分析就失去了意义。

笔者在网站分析的初期,发现直接使用单一停留时间数据,在有些情况下不能找出数据变化的原因,而且通常会耗费大量的精力。经过多次实验后,笔者理清停留时间与跳出率的关系,基本可以判断出准确的统计分析结果。笔者并没有列出具体停留时间与跳出率对应的关系值,是因为统计分析是一个比较综合的分析过程,不同的网站和服务对象等因素都会影响它们的关系,所以还要依靠分析者在应用中不断总结。

5.2 转化率和跳出率的分析

转化率是读者访问图书馆网站,到达目标页面(链接、下载图片、文章等)的人次与网站总人次之比,比如所有到达淘宝店铺并产生购买行为的人数和所有到达店铺的人数的比率就是淘宝店铺的转化率。

对于华南农业大学图书馆网站,笔者将如下信息定为转化目标,也是重点跟踪对象,按触发动作划分目标:

(1)链接到外部网站:网络数据库栏目下的所有资源导航链接(如CNKI、维普等)、CALIS的外文期刊导航平台、广东省高校联盟平台、珠三角数图联盟和天河九校资源等;

(2)访问特定网站:馆藏书目检索、读秀、馆内通知、借阅规则、党建园地和机构组织等;

(3)下载文件:随书光盘、表格和一些常用软件。

它们的转化率统计如表4所示:

表4 2月份转化率统计

表4可以看出,转化率高说明跟踪对象主体设置和布置有明显效果,内容更加符合读者使用;CNKI、维普和老版的CALIS第三方统一检索平台都是部署在同一个级别栏目上,但CALIS第三方统一检索平台的转化率几乎为零,笔者发现此平台的建设速度慢,资源配置技术要求高,而且整合的资源过少,检索命中率低,不能满足读者要求,所以这个平台已被屏蔽。而外文期刊导航在2011年11月至2012年2月期间,一级栏目上就有16%的转化率,二级栏目只有7%,这体现出栏目部署很重要。外文期刊导航平台、广东省高校联盟平台、珠三角数图联盟和天河九校资源有部分资源可能重复,读者在某个平台上获取资源的转化率高,说明读者比较喜欢这个平台,利用率自然会升高。对一些常用的重点资源,比如CNKI、维普和超星电子书,转化率自然就高,在网站布置时可以考虑重点突出这些高转化率的平台和资源,但是对一些刚推广资源和稀缺资源,使用对象本身很少,分析员也要兼顾考虑。

以上跟踪对象的跳出率统计如表5所示:

表5 2月份跳出率统计

表5可以看出,跳出率分6等数量级别,分级的数据只是笔者经实验做出的判断,并得出如下结论:同类型的导航库或栏目的跳出率数量级别基本一样;对于那些能帮助用户很快完成任务(如通知类)的页面,跳出率就会高;对于分类页或导航用于引领用户深入发掘的页面,跳出率就会比较低。

如何分析才有利于提高转化率和降低退出率,关于这方面论述有不同的观点和建议,不过有一个共同的观点即优化网站和页面的关键词。 Google公司的联合创建者Kaushik[ 27]提出几个提高转化率和降低退出率的观察方法,笔者认为其中三点比较符合优化图书馆网站:

(1)分析网站流量的来源:特别是关于关键词和URL的来源,确定网站被访问者搜索的命中率;分析访问者的访问途径是否达到网站设计的预期目标和效果。分析来源是一个最基本的观察方法,网站管理者应该清楚转化目标是如何被读者获取、通过什么路径到达目标,只有这样才可以认清网站和页面优化目标。

(2)页面触发动作是否明显突出和有效:这是离开链接、目标和页面来源整合考量项。使用此项观察方法,必须结合Piwik统计项的离开链接、目标和页面来源的数据。

(3)关注访问者反馈信息:这是最直接和最好的方法,也是必要的。只是反馈信息还要依赖读者的参与度和反馈的质量,如果反馈的信息少或是反馈信息质量差,分析员也无从下手。

除了以上三种方法,笔者还总结出以下分析方法:

(1)栏目(资源等)归类分析。从表5可以得出同类型的资源应被归类统计,分析员定出同类资源参考值范围,然后观察在某个时期内的数值变化情况,如果变化值超出参考值范围,应该立即深入调研。

(2)同一个资源在不同级别栏目下同时考察。有很多资源内容会涉及到多个类型的栏目,栏目分类的合理性将体现为相应转化率。如果某资源具有高转化率说明读者接受此资源在网站的分类情况,低转化率则说明此资源分类不合理,需要调整和优化分类。

(3)分时段考察。有些资源是有时段性的,比如每年9月至10月新生入学,借阅规则、培训通知等新生急需资源的转化率自然就高,而在其他时间就会很低,分析员不能因此否定这些资源的合理性,因此要合理分时段统计分析资源。

5.3 访问来源的分类应用

笔者重点要统计出读者是如何到达被统计页面的,读者的访问路径是怎样的。这里的访问来源是指一次访问或一个网页浏览的真实IP来源(简称推荐来源)。访问来源的统计是提高转化率和降低退出率的一个重要分析方法,Piwik提供最佳搜索引擎、外来网站以及来源国家/地区的统计功能,这些不能满足笔者的要求,而且来源国家/地区的统计功能没有实际意义,笔者将访问来源从不同的角度进行分类。

(1)按访问来源网站的性质分类

①搜索引擎。如果访问起始于搜索引擎的搜索结果,它的访问来源就可以归类为搜索引擎。这类访问来源还可以进一步细分到具体的搜索引擎(百度、Google等),然后还可以利用搜索的关键字进行细分。

②一般网站。访问来自于搜索引擎以外的网站,例如图书馆门户网站友情链接等。大多数工具会将广告来源作为一个独立的分类,通过提取URL中预先加入的特殊参数来获得一些更为详细的附加信息。

③没有访问来源。通常是指访问者直接进入网站的情况,例如访问者直接在浏览器里输入网站地址,或者从收藏夹中点击网站地址。但是由于技术上的局限性,造成了一部分访问来源丢失的情况,例如浏览器的弹出窗口和网页的重定向等情况也将统计为无访问来源。

(2)按访问来源的IP分类

笔者根据华南农业大学网络的具体情况,按IP地址来源进行统计分析,其IP地址分配情况如表6所示:

表6 IP地址分配表

教工区包括教工办公楼以及教工宿舍,研究生楼包括在校博士以及在校研究生宿舍,东区、跃进南北区和华山区基本是本科生的宿舍区。

5.4 搜索引擎的关键词统计方法的分析

现在读者比较喜欢使用百度、Google等搜索引擎检索资源,近年来很多图书馆员抱怨读者的流失,其中的原因有很多,但是如果现在流行的搜索引擎找不到图书馆的资源页面或网站,这就是图书馆流失读者的一部分原因;或是读者要经过繁琐的搜索才可以找到图书馆的某些资源,这也是图书馆工作的一种缺陷表现。建立一个用户快捷、方便、高效的搜索目标信息和资源的网站将是图书馆网站管理员的重点工作。

在网站设计开发或是资源发布的时候,关键词的选择非常重要,以下是笔者整理的一些关于关键词确定方法以及参考标准:

(1)关键词搜索结果数量

搜索结果少于50万的属于关注度较小的;搜索结果位于30-100万的属于中等偏小的;搜索结果位于100-300万的属于中等;搜索结果位于300-500万的属于中等偏上;搜索结果达到500万以上的属于高难度词。

(2)关键词搜索次数

它的数值反映了关键词的用户搜索频繁度,日搜索量越大,说明此词关注度越高。关键词搜索次数可以分成以下几个数值范围(以百度指数为参考依据):搜索次数少于100的属于关注度较小的;搜索次数位于100-300的属于中等偏小的;搜索次数位于300-500的属于中等;搜索次数位于500-1 000的属于中等偏上;搜索次数达到1 000以上的属于高难度词。一般难度太高的关键词,根本就不可能实现。

(3)关键词的命中率

网站或资源页面众多关键词中高命中率的词被作为重点关键词。关键词的命中率可以分成以下几个数值范围:命中率70%以上的为最高;命中率为50%-70%的为高;命中率为30%-50%的为中等;命中率为10%-30%为低;命中率10%以下的为最低。

优化网页设计、网站链接和网页内部结构等才能让搜索引擎更好地抓取信息,对搜索引擎更具有友好性,进而在搜索结果上有更前的排序。要想知道如何优化图书馆网站,管理员就应该知道目前网站被搜索的具体情况,关键词的分析成为关键突破点。关键词的正确选择很重要,还要实际反映图书馆资源内容,导致关键词的分析难度增大。有些图书馆资源根本没有定位自己的关键词,在线统计分析工具无法进行分析,读者通过搜索引擎也无法检索到相关的资源。

6 结语

在线分析工具使用的技术比较广泛并且非常成熟。Piwik开源工具为Web管理者提供了一个免费的开源环境,而且全面收集了用户信息以便网站管理员进行相关统计分析。统计分析是一个比较综合的分析过程,分析员需要了解各渠道的数据以及统计分析方法的过程,还要知道整个互联网的变化情况,因为网络情况会影响到很多指标,如停留时间、转化率和访问来源等。因此要提供一个网站统计分析的准确数据,分析者就要了解统计分析方法基本技术和网络情况,对参数指标的可靠性和指标之间的关系进行分析。

参考文献
[1] SiteCatalyst. Omniture营销套件[EB/OL]. [2012-02-10]. http://www.sitecatalyst.com.cn/download/form.php?file=09_productoverview_onlinemarketingsuite_LO.pdf.(SiteCatalyst.MarketingSuiteofOmniture[EB/OL]. [2012-02-10]. http://www.sitecatalyst.com.cn/download/form.php?file=09_productoverview_onlinemarketingsuite_LO.pdf [本文引用:1]
[2] SiteCatalyst[EB/OL]. [ 2012-02-10]. SiteCatalyst[EB/OL]. [2012-02-10]. http://www.sitecatalyst.com.cn/download/form.php?file=09_zh_productoverview_sitecatalyst.pdf. [本文引用:1]
[3] SiteCatalyst. SiteCatalyst功能[EB/OL]. [2012-02-10]. http://www.sitecatalyst.com.cn/function/.(SiteCatalyst.FunctionofSiteCatalyst[EB/OL]. [2012-02-10]. http://www.sitecatalyst.com.cn/function/ [本文引用:1]
[4] 融海咨询. WebTrends客户名单[EB/OL]. [2012-02-10]. http://webtrends.ronghai.com/webtrends.jsp?pageid=cuslist.(RonghaiConsulting.ClientListofWetTrends[EB/OL]. [2012-02-10]. http://webtrends.ronghai.com/webtrends.jsp?pageid=cuslist [本文引用:1]
[5] 融海咨询. WebTrends网站运营分析解决方案[EB/OL]. [2012-02-10]. http: //wenku. baidu. com/view/8833802e737
5a417866f8f0d. html. (Ronghai Consulting. Solutions of Web Analytics on WebTrends[EB/OL]. [2012-02-10]. http://wenku.baidu.com/view/8833802e7375a417866f8f0d.html [本文引用:1]
[6] 张学宏. 北京大学图书馆的主页日志分析[J]. 现代图书情报技术, 2005(5): 81-83, 70. (Zhang Xuehong. Log File Analysis of Peking University Library Homepage[J]. New Technology of Library and Information Service, 2005(5): 81-83, 70. ) [本文引用:1]
[7] WebTrends. Unified Digital Marketing Performance: Maximizing Return on Digital Marketing Campaigns[EB/OL]. [2012-02-10]. http: //understand ing. webtrends. com/forms/JAN27112Uni
fiedWhitepaper. [本文引用:1]
[8] Google Analytics. 免费使用更智能、更友好的企业级网站分析服务[EB/OL]. [2012-02-10]. http://www.google.com/analytics/.(GoogleAnalytics.Enterprise-ClassWebAnalytics[EB/OL]. [2012-02-10]. http://www.google.com/analytics/ [本文引用:1]
[9] Google Analytics. Google Analytics服务条款[EB/OL]. [2012-04-01]. http://www.google.com/analytics/tos.html.(GoogleAnalytics.TermsofServiceaboutGoogleAnalytics[EB/OL]. [2012-04-01]. http://www.google.com/analytics/tos.html [本文引用:1]
[10] 王玥, 周玲, 李博, . 利用Google Analytics追踪科技期刊门户网站流量数据[J]. 中国科技期刊研究, 2011, 22(2): 248-252.
(Wang Yue, Zhou Ling, Li Bo, et al. Tracking Traffic Data for Journal’s Website Using Google Analytics[J]. Chinese Journal of Scientific and Technical Periodicals, 2011, 22(2): 248-252. ) [本文引用:1] [CJCR: 0.9855]
[11] Baidu统计. 成功案例[EB/OL]. [2012-01-10]. http://tongji.baidu.com/web/welcome/cases.(BaiduAnalytics.SuccessfulCases[EB/OL]. [2012-01-10]. http://tongji.baidu.com/web/welcome/cases [本文引用:1]
[12] Baidu营销. 百度统计教程[EB/OL]. [2012-02-05]. http://yingxiao.baidu.com/support/class/tongji/.(BaiduMarketing.TutorialsofBaiduStatisticalTool[EB/OL]. [2012-02-05]. http://yingxiao.baidu.com/support/class/tongji/ [本文引用:2]
[13] Piwik. Using Piwik[EB/OL]. [2011-11-10]. http://piwik.org/docs/. [本文引用:1]
[14] Inteliture. Professional Search Engine Optimization Services[EB/OL]. [2012-02-15]. http://www.inteliture.com/search-engine-optimization-services.html#analysis. [本文引用:1]
[15] Inteliture. Customers[EB/OL]. [2012-03-16]. http://www.inteliture.com/customers.html. [本文引用:1]
[16] Inteliture. Search Engine Marketing Case Studies[EB/OL]. [2012-04-11]. http://www.inteliture.com/search-engine-marketing-case-studies.html. [本文引用:1]
[17] 任栋, 刘连忠. HTTP头信息在Web 网站开发中的应用研究[J]. 计算机应用, 2002, 22(3): 65-67, 70. (Ren Dong, Liu Lianzhong. Research on HTTP Headers for Web Site Development[J]. Computer Applications, 2002, 22(3): 65-67, 70. ) [本文引用:1]
[18] 梁雪松. 基于Cookie的认证机制及其安全性分析[J]. 通信技术, 2009, 42(6): 132-134, 137. (Liang Xuesong. Cookie-based Authentication Mechanism and Its Security Analysis[J]. Communications Technology, 2009, 42(6): 132-134, 137. ) [本文引用:1]
[19] Reagle Jr J M, Wenning R. P3P and Privacy on the Web FAQ[EB/OL]. [2011-10-18]. http://www.w3.org/P3P/P3FAQ.html. [本文引用:1]
[20] Moscaritolo A. Top Websites Using Flash Cookies to Track User Behavior[EB/OL]. [2011-11-09]. http://www.scmagazine.com/top-websites-using-flash-cookies-to-track-user-behavior/article/141486/. [本文引用:1]
[21] 刘延华, 陈国龙, 高洪垒. 基于增量复制的Apache 日志管理分析系统设计与实现[J]. 漳州师范学院学报: 自然科学版, 2009, 22(3): 43-47.
(Liu Yanhua, Chen Guolong, Gao Honglei. Design and Implementation of Apache Log Management Based on Algorithm of Increment Copy[J]. Journal of Zhangzhou Teachers College: Natural Science Edition, 2009, 22(3): 43-47. ) [本文引用:1] [CJCR: 0.1633]
[22] 郭振英, 赵文兵, 魏育辉. 电子资源日志统计系统分析与设计[J]. 现代图书情报术, 2008(9): 102-106.
(Guo Zhenying, Zhao Wenbing, Wei Yuhui. Analysis and Design on Electronic Resource Log Statistics System[J]. New Technology of Library and Information Service, 2008(9): 102-106. ) [本文引用:1] [CJCR: 1.073]
[23] 耶健. 网络读者访问流量统计分析系统的研究与实现[J]. 现代图书情报术, 2005(6): 54-59.
(Ye Jian. Study and Realization of Flux Statistical Analysis System for Library Network Reader[J]. New Technology of Library and Information Service, 2005(6): 54-59. ) [本文引用:1] [CJCR: 1.073]
[24] 曹进军. 构建基于读者Web访问行为分析的决策支持系统[J]. 图书馆杂志, 2007(4): 49-53.
(Cao Jinjun. Construction of Decision Supporting System Based on the Analysis of Web Access Behavior of User[J]. Library Journal, 2007(4): 49-53. ) [本文引用:1]
[25] Piwik. FAQ Piwik[EB/OL]. [2011-11-10]. http://piwik.org/faq/. [本文引用:1]
[26] The Roi Revolution Blog. Time on Page and Time on Site-How Confident Are You?[EB/OL]. [2011-10-10]. http://www.roirevolution.com/blog/2008/05/time_on_page_and_time_on_site_how_confident_are_yo.php. [本文引用:2]
[27] Kaushik A. Six Tips for Improving High Bounce Rate / Low Conversion Web Pages[EB/OL]. [2011-11-10]. http: //www. kaushik. net/avinash/tips-for-improving-high-bounce-low-conversion-web-pages/.
(作者E-mail: superskill@scau. edu. cn) [本文引用:1] [JCR: 4.826]