社会性书签网站的使用者与标签特征初探
高斌
江苏科技大学图书馆 镇江 212003
摘要

以Web2.0时代的社会性书签网站的使用者为对象,采用内容分析、Q方法及访谈法,分析其书签及标签使用特征,并依据其标签选择行为,进一步归纳使用者类型及其标签选择特征。根据影响因素的多元性与使用者选择标签取向,初步分析出4种社会性使用者类型,并探讨其社会性特征及在相关系统的应用。

关键词: 社会性书签; 社会性标记; 网络使用者研究
An Exploratory Study of Users and Tags on Social Bookmarking Websites
Gao Bin
Library of Jiangsu University of Science and Technology, Zhenjiang 212003, China
Abstract

This paper analyzes the characteristics of experienced users’ bookmarks and tags on social bookmarking websites in Web2.0 ages. The research methods used in this study include content analysis, Q method and interviews. Clustering analysis of the test subjects is also conducted to understand the relations between user types and tag selection behaviors. Through the analysis of the diverse factors affecting the test subjects and their tagging orientations, the paper categorizes four social types of users and further discusses the characteristics of sociality and the implications for related system applications.

Keyword: Social bookmarking; Social tagging; Web user studies
1 引 言

随着Web 2.0概念与应用的普及,维基百科、百度百科和个人博客这类由使用者参与创作的资源已成为重要的网络信息来源,这种潮流对于传统以搜索引擎寻找网络资源的方式产生很大的影响。因此用户除了以关键词搜索模式寻找外,又增加了以信息发掘为主的搜索模式。

有关社会性标记的概念在社会性书签Delicious(delicious.com)及图片共享Flickr(flickr.com)等网站带动下,已成为Web 2.0最重要的特征之一。其研究也受到图书情报领域的关注,主要原因是标记与图书情报专业中的分类与索引概念类似[ 1]。这种新兴的信息组织方式已成为重要发展趋势,也逐渐成为一个重要的跨领域研究主题[ 2]

具有社会性标记概念的网站中,书签网站是具有代表性的应用之一。它主要是将分散储存于个人浏览器中的书签共同储存于网络服务器中,并公开呈现,与人分享。其设计理念是希望能扩充个人记忆,并结合众人记忆,让使用者获取不易找到的优质信息。以Delicious为例,一般包括储存、共享及发现书签等功能,而其最大特色就是由使用者自定标签来为书签分类。

2 相关研究
2.1 社会性标记的含义与特征

在Web 2.0的研究中,强调使用者自定标签的社会性标记的应用是近年来的热门研究议题。究其本质,是指在公开分享的环境中,由使用者共同为各类资源进行标记或分类,进而集结成众人共同索引或分类的机制[ 3]

社会性标记出现在社会性书签网站的应用中,个人可对所收集的网站或网页给定标签或关键词,用标签分类,方便日后取用,这种新的网络资源组织方式称为社会性标记。

社会性标记可从三个方面来思考其含义,即资源、使用者及分类。资源是指使用者收集、分类或描述的各类资源;使用者是为该资源进行分类或描述的特定个人或群体;分类指用以描述资源所使用的标签或类别等。资源方面有各种具体资源如书签、相片、引文等概念;使用者方面有社会性、合作、民族等概念;分类方面有标记、标识、分类、索引等概念。每项关注点不同,也反映社会性标记的多元观点。有关标签特征的探讨,有很多研究尝试比较社会性标记与图书情报领域中控制词汇机制的优缺点[ 1],如表1所示:

表1 社会性标记与控制词汇特征比较

社会性标记与控制词汇机制各有特色和优缺点,如何使其相辅相成是相关研究中亟待探讨并解决的重要方面[ 4]

2.2 标识的类型与品质

除了有关社会性标记的含义探讨,目前图书情报领域较为关心的研究课题有三个重要方向:由信息组织观点探讨标签特征、由信息使用观点探讨标记行为特征以及社会性系统发展观点探讨使用者与系统的互动特征。其中以探讨标签类型及品质的相关研究居多,而有关标记行为的研究刚起步,下面将分别加以介绍。

(1)针对标签的内容或类型分析。使用者使用的标签类型相当多元化,大致可归纳为事实型、主观型及个人型三类。事实型是以书签内容主题为标签来源,与一般关键词索引概念相似;而后两类标签则是书签网站的重要特色,这类标签与使用目的息息相关,是一种为满足某种目的的功能型标签[ 5]

(2)针对标签词汇品质的讨论。用使用者所选择的词汇与作者提供的词汇或中介者的索引词汇比较,显示使用者词汇与上述二者的一致性并不高,但词汇间多有相关性。较有趣的是这些标签即使没有外力影响,随着时间演化,一样也能达到某种自我规范。同时,标签的数量也会达到某种程度的稳定性。随着使用者收集的书签数量上升,新标签的数量有逐渐下降的趋势。说明标签达到一定数量,标签的再用率也会上升。

2.3 社会性标记行为

标记行为是指使用者选择或产生标签的过程,研究重点是以标记行为特征及标记动机为主。有一现象是:标签的使用频率与排序名次比率基本符合幂次法则(个体规模和名次之间存在着幂次方的反比关系),即少数标签占多数的使用比例。除这些热门的标签外,也存在许多低使用频率的特殊标签,即呈现长尾效应(“头”和“尾”是两个统计学名词,正态曲线中间的突起部分叫“头”,两边相对平缓的部分叫“尾”)。

有关使用者标记的主要动机与个人信息管理有关,利用标签有助于个人再寻获所收集的资源;另一动机则与信息分享有关,通过标签有助于他人较易获得所欲分享的资源。

有关标记行为的社会性特征或社会性探讨,Bouman等[ 6]认为社会性是指人们形成社会群体的倾向。一方面社会性是基于人群或事物的互动而产生,前者所形成的群体,主要来自人与人之间的直接关联,而后者形成的群体,则是来自于对某一特定事物的联系;另一方面,这些群体也可以单一或多元方面来区分,单一方面的群体多聚焦于某一特定角度,例如图片网站,群体成员间的关系单纯以分享上传图片为主,不强调其他互动关系,而多元方面的群体,其社会性关系相对复杂,例如群体成员间的关系包括参与、交谈、创意构想等多元互动过程。依上述群体的形成依据(人群/事物)及社会性关系的复杂度(单一/多元方面),可分为网络为中心、社群为中心、事物为中心及系统为中心4种社会性类型,如表2所示:

表2 Bouman等学者认为的社会性类型架构

就标记的应用,当使用者凭借标签浏览其他人所收集的资源及其个人背景信息时,就等于进行所谓的社群性浏览行为。因此,不论使用者是基于个人或社群因素进行标记,都直接或间接对整个社群做贡献,而这也是社会性标记被视为是一种具有合作性质活动的原因。Web 2.0所强调的社群与合作等社会性特征,是区别社会性标记行为与一般标记行为的差异所在。

社会性标记行为的研究范畴以标记行为特征及标记动机居多,依标记系统的社会性特征,标记行为会呈现标签使用集中及标签使用多元的现象。而标记的动机除由个人信息管理出发外,也延伸出自我呈现、互动分享等社会性动机。此外,探讨标记与社会性之间的关系,是区别社会性标记与一般标记行为的差异所在。

2.4 社会性书签网站

社会性标记的概念应用于各种网站,不同利用角度有许多分类方式。最常见的是以资源类型为区分方式,如书签、图片、影片、博客等。基本上没有文字的资源(如图片、影片等)最需要使用标记机制,因为这些事物缺乏文字说明,若有标签,对于检索会相当有用。此外,即使博客这类以文字型为主的资源,也常会因内容过多,而发生“字”对、“义”不符的情况,若有适当标签,则可帮助过滤,节省浏览时间。

在社会性标记应用中,社会性书签网站是最具代表性的应用之一。书签的概念类似资源示意图,是将URL储存于浏览器中,方便取用的一种功能。书签功能首次出现在NCSA所开发的Mosaic(互联网历史上第一个普遍使用的网页浏览器)浏览器中,所采用的组织方式类似档案管理的阶层式架构,其后微软的Internet Explorer浏览器也提供收藏夹功能。从使用者来看,即便有查询全文网页的搜索引擎,书签仍是浏览网络不可或缺的工具。但个人所存的书签,无法随时随地取用。而利用社会性书签网站则无此限制,使用者可以轻松获得书签并与他人分享。

3 研究方法

本研究对象是QQ书签(http://shuqian.qq.com)、Google书签(http:// www.google.com/bookmarks)、百度收藏(http://cang.baidu.com)与好网角网络收藏夹(http://www.wang1314.com)的使用者。

最终研究人数确定的条件是:

(1)使用上述书签收藏网站时间在两年以上;

(2)收藏书签数量不少于200个;

(3)至少每月都有使用或者收藏更新记录;

(4)网络素养高、具有主题搜索能力。

选取其中符合条件的100位使用者通过E-mail方式与其联系,最终共有23位同意参与测试及访谈。通过联系了解到这些人的网龄至少在3年以上,无论是工作、学习还是娱乐,喜欢通过主题搜索方式获取自己所需要的信息,并且通过书签收藏将有用的信息标记出来。他们中很多人热衷于网络新技术和各种社群活动,其中有系统开发者7位,社群代表如版主、网络爱好者、博客主等16位,体现了较高的网络素养。

研究采用内容分析、Q方法(是由Stephenson于1935年提出的一种科学地研究“主观性”的心理学方法[ 7])及访谈方法,分三个阶段进行:

(1)第一阶段以QQ书签网站的13位受访者为对象,获取书签标题、URL、建置时间及标签等项目,共收集13 348个书签及32 253个标签,以提供相关背景的统计分析。同时,人工分析书签及标签的主题及使用特征,分析范畴包括其所收集的书签类型与主题类别,以及标签的形式与主题类别。

(2)第二阶段利用Q方法来了解23位受访者在进行标记时,其选择标签的影响因素及程度。使用Q方法的主要目的是通过受访者的自我陈述,由个人界定对某一事物的态度或想法。这类方法常用来研究个人主观性,如个人认知、信念、政治态度等。本文采用Q方法主要考虑到受访者在标记过程中,对于标签的选择多包含主观意识,大体符合Q方法所强调的测量主观意识的目的;研究中所采用的陈述句因彼此可互相作用,不同于一般统计概念,各项目或各陈述句间彼此独立,有时更能反映真实现况;研究通过面对面、QQ、E-mail等沟通方法进行详细说明,以协助受访者排除对陈述句的可能疑惑,并确保获得受访者的真实反应。

而在应用Q方法的步骤上,先收集相关文献,主要以使用者书签分类行为所获得的影响因素为基础,并参照其他相关研究,归纳出本文标记行为陈述句问卷(参考附录1)及访谈大纲,分情境、个人、书签及社会等4项内容,以及对应的陈述句。例如在情境方面,其中之一的陈述句为“我会根据自己的需求来选择标签词汇”,之后由受访者根据个人主观意识,将这些陈述句,先依其影响程度分为高、中、低三级,再决定各陈述句的最后等级。所收集的Q分类资料再利用SPSS软件进行因素分析。每一因素可视为是意见或态度类似的受访者所组成的集合体,即根据其对标签选择因素的重视程度将受访者进行归类。

(3)第三阶段主要是对第二阶段Q方法陈述句有疑问、对陈述句理解不准确、易受其他陈述句干扰的受访者进行个别访谈,主要了解受访者标记书签的动机,及澄清在前两个阶段可能产生的疑问。再整合第一、二阶段所得的分析结果进行综合归纳。依据社会性分析架构、依影响因素的多元性与标签的取向依据,区分为4种社会性使用者类型。

本文是探索性研究,对象为小样本,且以网络素养较高、具有主题搜索能力的使用者为主,研究结果不足以推论至全体网络用户。但基本上这些使用者具有新产品先期进入者的特征。根据相关研究,先期进入者对于新事物发展有很大裨益。因此,研究对象的需求与行为对发展社会性标记网站有相当大的参考价值。此外,量化的标签分析仅限于少数使用者,所反映的标签特征可能较为有限。Q方法的特点为采用强制选择程序,对了解使用者行为也会有所限制。

4 研究结果
4.1 被调查者背景分析

本研究23位受访者的相关背景详见附录1。其中有男性16位,女性7位。年龄段以25-34岁受访者居多,35-44岁次之。就职业而言,以上班族最多,有三位为待业,两位为学生。就教育程度而言,硕士人数最多,其次为大学,高中学历仅两位。而学科背景以人文社科居多,其次为理工科。

就网络使用情况看,最常见的活动为查资料、收发邮件、阅读及经营博客。就书签网站使用来看,有15人使用QQ书签最多,有4位使用Google书签最多,百度收藏与好网角网络收藏夹有两位。使用书签网站的频率也相当高,有18位每周都使用书签网站的功能,其中更有10位每天使用。研究的对象特征是以大学学历以上的上班族为主,其网络获得以查询及阅读网络信息资源为主,同时也是社会性书签网站的前期及长期使用者,具有很高的网络素养并有相关兴趣主题。

4.2 书签的使用特征

研究第一阶段以QQ书签的13位受访者为资料收集的对象,截至2011年12月20日,共收集13 348个书签及32 253个标签资料。其中有1 306个书签无标签资料,90.22%的书签都有标签资料,比例较高。平均每位受访者收集了1 027个书签,最多的人有2 563个,最少也有294个。重复的书签有367个,仅占全部书签2.75%,重复率很低;且重复书签中,多数为2-3名受访者收集,说明收藏书签比较多元化。

观察书签类型,85.7%主要收集博客的文章,其次82.1%为收集网页,其他类型收集比例相当低。就书签主题看,电脑、人文、社会相关主题的最多,其次是生活相关主题,而收集娱乐的主题较少,如表3所示:

表3 受访者收集书签主题类别分布
4.3 标签的使用特征

根据第一阶段13位受访者的标签资料,平均每位受访者提供约926个书签,提供标签最多的有6 743个,最少的有538个,不重复的有6 889个,其使用频率分布如表4所示:

表4 受访者的标签使用频率及次数

使用频率高的标签占有相当多的次数,使用频率大于3的标签,虽然仅占标签数的18.55%,但使用次数却占了76.80%,换言之,受访者所使用的标签有集中现象,符合80/20原则,即在任何特定群体中,重要的因子通常只占少数,而不重要的因子则占多数,因此只要能控制具有重要性的少数因子即能控制全局;但同时也有不少使用频率低的标签,反映出标签使用的长尾现象,初步观察,这些较少使用的标签多是专有名词。

标签的语言是以中文为主,外文比例也不低,且以英文为主,仅有极少数为日语或欧洲语言。至于中英文夹杂或纯数字的比例也不高,且以英文专有名词加上中文为主,也有极少的标签以数字或符号呈现。观察使用者的标签发现,有许多非主题性的、只是满足个人特定需求的功能性标签。因此分析标签内容,归纳出标签的需求功能类型,如表5所示:

表5 受访者的功能型标签举例

受访者使用书签网站的目的呈现多元化,例如为了便于再次搜索,有些受访者以同义词来重复书签的主题内容,如同时用“Travel”及“旅游”来重复标记;为了存储对书签内容进行描述,如以短句或摘要来说明内容;为了辨别以特殊符号突出个人对书签内容的直观感受,如用“_”来标记优惠信息;为了区分利用个人特殊用语来避免与他人书签有所混淆;为了排序用日期作为书签排序依据;为了评论用较主观的用词抒发情绪;为了分享参考大家较常使用的标签。

4.4 使用者类型与标签选择特征

根据第二阶段23位受访者的Q分类资料因素分析结果,他们可被划分为5种类型。Q方法所得出的因素可由分析最同意或最不同意的陈述句(参考附录2),相对应的就是影响程度高或影响程度低的因素,及比较因素之间的异同,来诠释各类型的特征。依据这个概念架构,按照主要影响因素的不同,初步划分5种类型的受访者特征。各类型以英文字母顺序来区分,将陈述句简练入表,如表6所示:

表6 受访者类型及选择标签影响因素排名

A型受访者标签选择主要受个人背景因素影响较大,不太受环境因素影响。在选择标签时,多重视标签的主题性,也会注意标签是否与网络社群所使用的标签切合,一般不考虑个人方便等功能性目的。B型受访者受环境因素影响较大,不太受社会性因素影响。反映在标记行为上,多会依个人需求及未来使用方便的目的,将标签做个人化的分类,与社群所使用的标签分类有明显差异。C型受访者受情境因素影响较大,但与B型不同的是,前者多参考社群所使用的标签,不像后者多以个人需求为取向,不太受书签因素影响。D型及E型受访者在选择标签时的影响因素较为多元,如D型受访者就书签因素而言,其同时有影响程度高的书签主题和程度低的书签产生时间,其重视书签本身内容远高于其他情感或外在因素,标记行为重视资料整理高于资料使用。而E型受访者受影响程度高的因素较为多元,包括情境、书签、个人背景,不太受社会性因素影响。

综合上述第二阶段的类型分析及第三阶段访谈结果,本研究参考社会性分析架构,依影响因素的多元性与标签的取向依据,分为4种社会性使用者类型,并分别简述其标签选择特征,如表7所示:

表7 社会性书签使用者类型

前面因素分析结果为5种人群,再依访谈结果,并考虑标签取向依据及影响因素的特征,初步将5种人群归类至4种类型,以便说明各类使用者的社会性特征。因此每组群并不表示完全以人群或信息为标签基础,或只受单一或多元因素影响,只是便于呈现每组所偏重的方向。

以网络为中心的社会性是指个人由网络与他人建立联系,但主要是以信息交换为目的,与社群关系是有必要时才联系,如本文中的B型受访者,多以个人信息收集与管理需求出发,强调便利性是其使用书签网站的唯一因素,虽然标签选择时,会以人群为基础,但属于个人为中心的网络连接关系。相比较,以社群为中心的社会性则是个人与社群间有较亲密的连接关系,多会通过讨论来保持社群的凝聚力。由于强调成员间的互动,其影响因素也显得复杂,A、C型受访者就属于此类型。在选择标签时,多通过某些信息加值后串起来,例如D型受访者,重视书签内容高于社群关系。同时在选择标签时,也受书签的单一因素影响,并以书签的信息加值作为标签的依据。最后以系统为中心的社会性,是指同时保有个人隐密信息空间,也与社群保持互动,如E型受访者,其重视信息加值,并受到情境与书签等多重因素影响,即标签选择时,会注意标签的隐密性,但同时也注意标签的主题性,是属于较复杂的社会性类型。

5 结 语

本文初步分析社会性书签网站的书签及标签使用特征,并依据使用者的标签选择行为,归纳使用者类型及其标签选择特征。据第一阶段QQ书签的受访者标签资料分析结果,书签多有标签资料,标签呈多元化,重复率低。书签的资料类型主要是博文及网页;书签内容是专业内容如电脑、人文、与社会相关主题的书签为主,娱乐书签较少;标签的语言以中文为主,也有极少数标签以符号呈现;就标签使用目的,分为搜寻、存储、辨识、区分、排序、评论及分享等。

而根据第二阶段受访者经Q方法的因素分析及访谈结果,依影响因素的多元性与标签的取向依据,分为4种社会性使用者类型。这4种类型的使用者虽为社会性书签网站的使用者,但社会性程度较高,在选择标签时,会以人为基础,即思考他人或社群所使用的标签功能;而以信息系统为中心的使用者,社会性程度则相对较低,在选择标签时,会以信息为基础,即关心书签的内容主题及个人信息空间。此外,以网络及信息为中心的使用者,其标签选择所受到的影响因素通常较为单纯,仅受情境或书签因素影响;而以社群及系统为中心的使用者,影响其标签选择的因素则相对多元,如情境、社会、个人因素皆会相互影响。

社会性标记是一种新兴的信息组织方式,也成为图书馆信息领域所关心的重要研究课题,相关研究多数正在起步。本文对于研究使用者标签标记行为及其社会特征提供了一些实证研究结果。对于后续了解控制词汇与使用者词汇的差异,探讨社会性网站使用及互动行为特征、发展图书馆信息服务应用的相关研究都具有参考价值。以下针对其可能的应用提出一些建议。

有越来越多的图书馆利用社会性标记网站提供的API(应用程序编程接口),或效法其概念,开发标记相关应用。例如将百度收藏作为网络主题信息指引平台,或在OPAC系统(联机公共目录查询系统)进行图书馆信息标记,提供标签云的浏览方式等[ 8]。这都有助于增加图书馆资源的丰富性,提升对相关系统的使用经验。值得注意的是,社会性是区别社会标记行为与一般标记行为的差异所在,在发展社会性相关应用时,有必要对使用者的社会性特征有更深入的了解,并能针对不同类型的使用者,提供不同的信息组织、搜寻及浏览机制,以触发社会性的产生并发挥社会性标记的价值。

附录1 被调查者背景分析
附录2 标签选择影响因素及陈述句
参考文献
[1] Peterson E. Beneath the Metadata: Some Philosophical Problems with Folksonomy[J/OL]. D-Lib Magazine, 2006, 12(11). [2012-05-01]. http://www.dlib.org/dlib/november06/peterson/11peterson.html. [本文引用:2]
[2] Tonkin E, Corrado E M, Moulaison H L, et al. Collaborative and Social Tagging Networks[EB/OL]. (2008-01-30). [2012-05-01]. http://www.ariadne.ac.uk/issue54/tonkin-et-al. [本文引用:1]
[3] Trant J. Studying Social Tagging and Folksonomy: A Review and Framework[J]. Journal of Digital Information, 2009, 10(1): 1-44. [本文引用:1]
[4] Hayman S. Folksonomies and Tagging: New Developments in Social Bookmarking[C]. In: Proceedings of the Ark Group Conference: Developing and Improving Classification Schemes, Sydney, Australia. 2007. [本文引用:1]
[5] Golder S A, Huberman B A. Usage Patterns of Collaborative Tagging Systems[J]. Journal of Information Science, 2006, 32(2): 198-208. [本文引用:1] [JCR: 1.238]
[6] Bouman W, Hoogenboom T, Jansen R, et al. The Realm of Sociality: Notes on the Design of Social Software[J/OL]. Sprouts: Working Papers on Information Systems, 2008, 8(1). [2012-05-01]. http://sprouts.aisnet.org/8-1. [本文引用:1]
[7] 赵德雷, 乐国安. Q方法论述评[J]. 自然辩证法通讯, 2003, 25(4): 34-39.
(Zhao Delei, Yue Guoan. On Q Methodology[J]. Journal of Dialectics of Nature, 2003, 25(4): 34-39. ) [本文引用:1] [CJCR: 0.2955]
[8] 任家乐, 雷若寒, 姜晓. OPAC与“美味书签”相结合的学术资源导航系统构建探索[J]. 图书馆杂志, 2010, 29(6): 21-24, 20. (Ren Jiale, Lei Ruohan, Jiang Xiao. Integrating OPAC with Delicious: A New Guidance System for Academic Resources [J]. Library Journal, 2010, 29(6): 21-24, 20. ) [本文引用:1]