中英文网络问答社区比较研究与评价实验
吴丹, 刘媛, 王少成
武汉大学信息管理学院 武汉 430072
摘要

对Web2.0环境下12个典型的中英文网络互动问答社区的基本信息、交互性、个性化服务等方面进行比较研究,并通过一个问答实验按照三个领域4类问题,对其回答问题的质量与效率等方面进行评价。研究结果对网络问答社区的进一步完善与发展提出建议。

关键词: 问答社区; 交互性; 个性化服务
中图分类号:G203
A Comparison and Evaluation Experiment on Chinese and English Online Question Answering Communities
Wu Dan, Liu Yuan, Wang Shaocheng
School of Information Management, Wuhan University, Wuhan 430072, China
Abstract

This paper gives comparisons of twelve Chinese and English Q&A communities from basic information, interaction, and personalized service. Q&A experiment on four types of questions in three fields is also conducted to evaluate those communities from the quality and efficiency of answering questions, etc. Research results give some advices on the development strategies of Q&A community.

Keyword: Question answering community; Interaction; Personalized service
1 中英文网络问答社区概述

Web2.0技术的发展为用户获取知识带来了方式上的革新。网络问答社区采用网络协作的方式,突破现有技术,将所有用户组成高效的社会协作网,互相解决对方提出的问题。大部分网络问答社区采取的是“提问-网友回答-反馈”的模式。即首先用户通过交互平台提问,系统将其和知识库进行匹配。若匹配成功,则直接向用户推荐该问题。若用户觉得不满意,可以继续提问并公布。接着是其他用户的回答,除了提问者每个用户都可以对问题进行回答;最后提问者以选择最佳答案或者通过投票确定;如果无满意答案,可以选择关闭问题。最佳答案便被归为形成的知识,最后组成知识库,作为站内搜索引擎的信息源。还有一部分比较专业的问答社区采取的是“提问-专家回答-反馈”的模式。即首先用户通过填写表单提交问题,系统匹配过程与上述模式基本相同。不同的是,用户发布问题后,该问题并不是全程完全公开的。当问题被某个专家锁定后,其他专家就丧失了对该问题的回答权。因为是比较专深的回答,专家可能需要进行调查和研究,耗时较普通问答社区长。在此期间,提问者还可以与专家联系,补充问题细节。有的网站为保证答案质量,还包括收费程序。交互问答结束后,答案同样归入知识库,成为搜索引擎的信息源。

本文选取了12个典型的中英文网络问答社区进行比较研究与评价。由于这几个问答社区在国内外的知名度和实用性都很高,又各具特色,付费问答和免费问答系统也均已涵盖,因此比较具有典型性。下面是这些问答社区的简要介绍。

(1)百度知道[ 1]最大特点在于和搜索引擎的结合,让用户所拥有的隐性知识转化成显性知识,在这里累积的知识数据可以反映到搜索结果中。通过用户和搜索引擎的相互作用,实现搜索引擎的社区化。

(2)天涯问答[ 2]是一个由谷歌和天涯社区联合开发(注:2010年7月20日,谷歌终止与天涯合作,停止对问答的技术支持,天涯独立运营问答)的网友互助问答社区。

(3)奇虎问答[ 3]收录了中国绝大部分论坛和博客的优质内容,用户的很多问题都能在奇虎网找到满意答案。另外,奇虎网还提供手机问答。

(4)雅虎知识堂[ 4]是雅虎中国于2006年2月14日正式推出(2010年8月3日改版运行)的全新互动问答信息服务平台。雅虎知识堂同时将社群互动的知识内容妥善保存,并提供历史问答的搜寻功能。

(5)新浪爱问[ 5]是新浪完全自主研发的搜索产品,采用了目前最为领先的智慧型互动搜索技术,充分体现人性化应用的产品理念,为广大网民提供全新搜索服务。

(6)搜搜问问[ 6]是腾讯SOSO为广大用户提供的问答互动平台,问题可以在用户的QQ上显示出来,让QQ好友关注问题并且参与解答;如果觉得与某位网友有一样的兴趣爱好,就可以加他为QQ好友。

(7)Yahoo! Answers[ 7]是美国Yahoo公司的交互问答平台,访问量极高,在互动问答领域非常具有权威性,是时下最流行的问答社区之一。其更新速度、每日解决的问答数量都是非常巨大的。

(8)Uclue[ 8]是原Google Answer的原班人马创建的类似于Google Answer的互动问答社区。Uclue充当问答者之间的中介,用户提问并支付费用,回答者得到费用,Uclue收取其中25%作为其网站运营及维护经费。

(9)Answers.com[ 9]结合以社区为主导的最好问题和答案与数百本受人尊敬和信任的编辑的参考书籍。该网站把最好答案给用户,无论答案是来自社区答案集合,还是利用全套已编辑的问题答案数据库。

(10)ChaCha[ 10]是美国的一个免费移动问答服务提供商,致力于手机问答服务。它是一个基于人力的搜索引擎,用户可以通过它现有的10 000多个向导来帮助用户进行搜索。

(11)MadSciNet[ 11]相当于科学家头脑的集合,为用户的问题提供答案。它是专门提供自然科学和医学的问答社区,不回答这些领域以外的问题。

(12)Quora.com[ 12]由数名Facebook前员工于2008年6月创建。2010年6月21日,它决定向公众开放注册,但是仅针对Facebook和Twitter的已注册用户。作为对Facebook的传统继承,Quora引进了诸多社交网络的元素。

2 典型的中英文网络问答社区比较
2.1 基本信息比较

基本信息包括问答社区的基本组成部分,决定了用户类型、社区易用性和网站管理难度等。对于基本信息的比较,以下主要从用户界面、开放程度、问题分类和时间限制4个方面进行分析,统计数据如表1所示。

(1)用户界面是问答社区给用户的第一印象,在很大程度上影响其用户体验。实验中有一半的问答社区首页均采用三栏式结构,优点是美观大方、节约空间和凸显内容丰富度等。界面最友好的是百度知道和Yahoo! Answers,二者排版简洁、图文兼备、信息较全面。天涯问答排列紧密的文字影响了美观。雅虎知识堂改版后界面得到改善,更加突出“知识贡献”版块。Uclue是所有问答社区中最简单的。

(2)开放程度不仅对用户操作有影响,对社区本身的管理也很重要。过严会对用户造成不便,而过松则会加重社区管理难度。新浪爱问对用户的开放程度最高,游客可以进行评论和举报,这样可以得到更多的意见,但是也会造成对其他用户的误导。百度其次,吸引了一些有知识而没有百度账号的网友参与,但也难免出现无效答案。搜搜问问和ChaCha都可以对答案评价或评论,对其他用户有一定的参考价值。Quora.com的开放程度最低,只有Facebook和Twitter用户才能在该网站注册,游客不能搜索和浏览。总的来说,绝大多数问答社区都遵循一个原则:注册用户拥有提问、回答和相关权利,游客只能搜索和浏览。

表1 问答社区基本信息比较

(3)问题分类能反映问答社区系统性和严谨性高低,不过由于用户一般是普通网民,分类一般集中在日常生活和搜索热点上。像百度知道、雅虎知识堂、新浪爱问、搜搜问问和Yahoo! Answers都是基于搜索引擎或门户网站建立起来的,因此分类有一定保证。专为问答设计的Answers.com是分类最完整的。天涯问答让用户自主选择给出的标签,比较灵活,但随意性太大。分类最混乱的是奇虎问答,没有进行学科分类。雅虎知识堂改版后,丰富性和科学程度不及以前,中间还夹杂了自身服务和产品,而不像Yahoo! Answers等网站单独列出。

(4)时间限制主要是方便网站管理,提升社区活跃度。网络问答社区应根据自己的实际条件确定自己的问答期限以方便用户,同时提高自身的工作效率。其中,Yahoo! Answers最短;其次是奇虎。Uclue在14天之内任何时候用户都可以修改问题或者删除并获得退款;14天内若无回答,此问题删除,也可获得退款。由于无时间限制,可以在天涯问答中搜索出数月乃至数年前的问题,雅虎知识堂最近才改版,这种现象还暂未出现。

2.2 交互性比较

网络问答社区不仅强调人与互联网的互动,同时也强调用户与用户/专家之间的互动。对于交互性的比较,以下主要从互动方式、深入交流工具、专家团队、激励机制4个方面进行分析,统计数据如表2所示。

(1)互动方式方面,提问-回答这样的功能各大社区都是具备的。不同的是,在百度知道、天涯问答和奇虎问答等社区中,用户可以自由提问与回答。Uclue只有申请成为研究者才能在用户问题提出并被自己锁定后进行回答;ChaCha和MadSciNet的问题则由网站的专家团队回答。百度知道、新浪爱问和Yahoo! Answers具有举报选项,以约束用户行为。另外,新浪爱问独有对已选择的最佳答案纠错的功能,对答案的正确性有双重保证。

表2 问答社区交互性比较

(2)深入交流工具是问答平台的进一步扩展。新浪爱问拥有最多的交流工具,从三方面为用户构筑了一个比较完整的交流平台。电子邮件是各大社区的主流工具。站内短消息、留言板和IM也有部分社区使用,相比电子邮件更为便捷。虽然分别为新浪公司和腾讯公司的产品,但是新浪爱问没有和UC进行链接,搜搜问问没有和QQ邮箱进行链接。雅虎做得较好,不过新浪爱问还有站内短消息和留言板,在这方面优于搜搜问问。因为ChaCha是基于手机的问答社区,所以是短信形式,这种交流往往是单向的。

(3)专家团队的权威性能够有效保证社区的回答质量。Uclue和MadSciNet最具权威性,Uclue属于付费型网络问答社区,通过用户反馈监督审核。MadSciNet的志愿科学家达900多名,他们来自高校或者研究机构,为回答用户问题会进行较长的调研过程。其次是拥有多达50 000余名专家的ChaCha,不过其申请专家相对容易一些。百度知道、新浪爱问和搜搜问问都有数量庞大的专家团作为支撑,这些专家有企业机构和资深专家,社区对专家也有相应的管理制度。天涯问答和奇虎问答的专家团队相对比较薄弱。Yahoo! Answers有合作组织协同回答,但是数量不多。

(4)激励机制使用户更加积极地提供高质量的答案。百度知道、天涯问答、奇虎问答和新浪爱问积分能够兑换虚拟物品或实物。雅虎知识堂的知识闯关、有奖问答和品牌活动颇具吸引力。Uclue的用户回答问题被采纳后有现金奖励。搜搜问问、Yahoo! Answers和Answers.com的积分/经验值/信任度不能兑换物品,仅用于让其他用户了解其活跃和热心程度。ChaCha只有在用户申请成为专家后,才享有一些特权,普通用户无任何奖励。MadSciNet是志愿科学家在为用户服务,所以没有激励机制。

2.3 个性化比较

对于个性化的比较,以下主要从描述方式、用户操作、社区特色、个人中心4个方面进行分析,统计数据如表3所示。

表3 问答社区个性化比较

(1)问答描述方式直接影响问答的表达效果。以上社区能插入图片的仅百度知道、奇虎问答、雅虎知识堂和搜搜问问4家。其中,百度知道在提问时可以插入图片详细说明,在回答时可以插入地图和图片。雅虎知识堂仅能输入图片网址。新浪爱问独有上传附件的功能,不过大小局限在200KB内。插入图片应该是未来问答社区的发展趋势,附件也有较大的帮助。如果条件许可,插入视频音频能更加改善表达效果。就现在来看,问答社区只能输入音视频的网址。

(2)用户问答操作是回答社区的重要组成部分,影响社区的易用性。其中,新浪爱问拥有最大的自由度,在无(满意)答案的情况下,可以自行撤销或关闭问题。而百度知道、天涯问答、搜搜问问、Yahoo! Answers都只允许对问题进行补充,百度知道还有补充次数的限制。雅虎知识堂改版后操作上的限制明显增加,给习惯旧版的用户造成不便。Answers.com的操作反映出重视用户的合作交流,共同改进答案并互相讨论。因为ChaCha是一项即时性非常强的服务,所以用户发送问题后就不能进行进一步操作;另一方面,ChaCha网站允许用户对答案进行评价。笔者认为删除问题的功能应予开放,管理者只需做一些规定,就能保证这项服务顺利实现。这点可以借鉴改版前的雅虎知识堂,删除后扣除一定积分并需系统审核。

(3)社区特色能提升社区用户的参与度,增加用户黏性。百度知道特色活动很多,其中“小桔灯”公益活动还为社区树立了良好形象。雅虎知识堂居于其次,更专注知识的专题化。奇虎问答的“选吧”是对一个问题两个答案的PK,比较有特色但是发展余地不大。MadSciNet则提倡用户在提问之前,先参考MAD实验室和MAD 图书馆,减轻科学家的负担。大部分问答社区都有用户积分排名榜,并对这些用户予以表扬和奖励。

(4)个人中心是用户专享的界面,是体现社区的个性化服务的关键所在。每个问答社区个人中心最基本的功能包括基本信息、提问和回答。此外,各社区为了增强用户的亲切感,使用第一人称“我的”和“My”,拉近了与用户之间的距离。不同的功能反映了不同社区的发展重点:百度知道全方面发展,天涯问答注重标签,奇虎问答和Yahoo! Answers关注用户间的交流,雅虎知识堂和Uclue回归简洁,新浪爱问用户交流和资料共享并重,搜搜问问不偏不倚,Answers.com侧重协作讨论,ChaCha商业化,Quora延续社交网站的特色。

3 中英文网络问答社区评价实验

为了了解中英文网络问答社区的运作情况,并通过统计数据和其他指标对比分析其综合质量,笔者于2010年7月13日至8月11日对上述9个中英文网络问答社区进行了评价实验(Uclue、ChaCha和Quora.com因特殊情况未参与实验)。

3.1 实验设计

实验选取体育、政治和IT三个领域,每个领域分别设定事实性问题、列举性问题、定义性问题和探索性问题4类问题各一个,共计12个问题,如表4所示:

表4 实验问题设计

MadSciNet另外在自然科学领域提出4个上述类型的问题。

在实验过程中,由于审核未通过和被举报等问题,部分问答社区问题稍作修改。由于MadSciNet是专门提供自然科学的问答社区,所以另外设计了4个问题,即:

(1)Is there any kind of transparent metal?

(2)What are the four galaxies in the universe?

(3)What is carbon capture technology?

(4)Why did typhoon always occurred in summer, but not in winter?

3.2 实验结果分析

实验的统计结果涉及问题的答案总数、有效答案数和首个回答与提问的间隔时间,从参与度、答案有效率和响应速度三点出发,来考察各个问答社区的优劣。以下将根据问题的不同类型进行分析比较。

(1)事实性问题的答案是确定的,相对比较容易回答,实验结果如表5所示。

表5 事实性问题综合比较

可以看出,除了天涯问答,其他问答社区的答案有效率都比较高。百度知道、新浪爱问和搜搜问问的参与度都是比较高的。奇虎问答和雅虎知识堂参与度最低,不过答案质量还是有保证。天涯问答的答案中充斥的广告给人印象很差。大多数社区响应时间都在1天之内,雅虎知识堂则超过了2天。而搜搜问问仅用时14分钟,加上超过90%的答案有效率,在事实性问题方面具有明显优势。

(2)列举性问题由于是列全才正确,因此要求比较高,直接导致答案有效率降低,实验结果如表6所示:

表6 列举性问题综合比较

可以看出,除奇虎问答和雅虎知识堂外,各大社区的参与度比上一类型问题略有提高。对于这一类型的题目,各个社区响应时间参差不齐。百度知道和新浪爱问仅用11分钟,而且答案质量也不错,新浪爱问更是达到100%的有效率。雅虎知识堂则超过了9天,并且答案有效率也不高。在该类型问题的比较中,新浪爱问以100%的答案有效率和快速响应成为最佳选择。

(3)定义性问题是问事物或概念的定义,具有一定的专业性,实验结果如表7所示:

表7 定义性问题综合比较

可以看出,各大社区的参与度与其他类型问题相差不大。雅虎知识堂参与度最低,不过答案有效率高。天涯问答的答案有效率略微提升。对于这一类型的题目,各个社区响应时间悬殊很大,百度知道和新浪爱问分别只用时18分钟和7分钟,奇虎问答则超过了1天。Yahoo! Answers在该类型问题中参与度和答案有效率都很高。因此,Yahoo! Answers在这次比较中是表现最好的。

(4)探索性问题是问关于事件或现象的起因等,需要一定的分析和推理,没有特定的答案,主观性较大,实验结果如表8所示:

表8 探索性问题综合比较

除雅虎知识堂和Yahoo! Answers外,各大社区的参与度明显有所提升。但是由于探索性问题本身较以上类型的题目更有难度,因此除雅虎知识堂外,各大社区的答案有效率都有所下降,一直发挥稳定的Yahoo! Answers答案有效率更是直降到50%以下。主要是因为用户对探索性问题都有所调侃,特别是体育和政治领域。可见,答案有效率不仅受题目难度影响,与用户的答题态度也有关系。题目难度提升后,大多数社区的响应速度反而变快,笔者认为这与探索性问题的吸引力相关。

3.3 实验结论

经过综合分析,得出对各个问答社区在不同类型问题的满意度,结果如表9所示:

表9 问答社区满意度比较

从答案总数角度出发,搜搜问问的答案总数是最高的,第二是天涯问答,百度知道和新浪爱问紧随其后,这与网站的点击率和问答平台的完善程度有密切关系。搜搜问问相比其他问答社区是后起之秀,依附QQ用户和奖励Q币的激励机制使其获得了飞速发展。在高度参与的情况下,天涯问答的低质量回答率暴露了其网站审核管理的漏洞,回答者的素质和水平不高。问题的答案中广告频繁出现,如果无法有效遏制这种现象,最终会导致问答社区失去吸引力,用户流失和系统数据冗余等。雅虎知识堂的答案总数是最少的,第二是奇虎问答,第三是Yahoo! Answers。雅虎知识堂由于改版,服务器大部分数据还没有恢复,因此造成知识库有所贫乏,用户响应速度也受到影响。不过基于多年的发展和严格的管理,它的答案质量在各大问答社区中处于领先地位。奇虎问答首先是针对网络多个资源的知识开发的搜索引擎,旗下的“悬赏社区”才算作真正意义上的问答社区。加上奇虎问答服务没有进行大力宣传,知名度较低。Yahoo! Answers回答质量比较高,用户热心负责。用户回答往往会提供相关链接注明资料来源或扩展信息;也有用户提供自己的电子邮箱地址,方便提问者进一步询问交流。Answers.com对问题去重非常重视,不允许用户提出重复问题。用户可以改善和讨论问题,但是展示在用户面前的则只有唯一的答案。这两方面的努力促成了知识库的高质量,减轻了数据库的负荷。MadSciNet的科学家对问题的回答态度非常谨慎,要求用户对自己的问题给出详细的描述,以便他们更准确深入地解答问题。缺点是由于科学家要处理大量的问题以及进行调研,所以对于简单的问题会直接推荐其他相关网站,而复杂的问题需要等待较长的时间才能得到答案。

对于互联网用户而言,如果用户的提问非常普通,可以在百度知道、新浪爱问、搜搜问问和Yahoo! Answers中任意选择。四者相比较,百度知道的回答更为专业,新浪爱问交流便捷,搜搜问问则在参与度和响应速度方面有优势,Yahoo! Answers的用户更活跃。奇虎问答和雅虎知识堂的用户参与度不及前三个网站,但是如果用户需要查找其他来源(如博客)的答案,可以使用奇虎问答的搜索引擎;雅虎知识堂则可以提供趣味性强的知识专题和问答活动。如果用户想解决专业性极强的问题并方便支付美元,可以选择Uclue;如果用户时间比较宽裕又不想花费,可以选择MadSciNet。Answers.com则适合喜欢探讨问题答案和经常参考维基百科的人们。ChaCha适用于在美国的手机用户,可以随时随地通过该项服务获得答案。拥有Facebook和Twitter账户的用户,可以尝试Quora.com的社交型问答社区。

4 网络问答社区的发展建议

在实验中发现,各大问答社区各有自己的优缺点,应该互相借鉴优点,以其他社区缺点为警示。

4.1 控制问答质量

问答质量是一个问答社区的核心所在,要通过控制问答质量为社区提供良好的知识氛围。每个社区应制定适合自己的管理规则,并提醒用户注意。同时,社区应完善问答审核系统,成立监控问答的管理团队,将最初审核和不定期检查相结合,及时清理社区中重复无意义问题、广告和违反其他规定的信息。在实验中,雅虎知识堂最严格,起初的问题都做了修改才通过审核;改版之初曾经在首页上出现的不正当言论很快得到了清理,其谨慎和效率值得推荐。给予用户举报这些信息的权限也有利于创造更加清洁高效的环境,如百度知道、新浪爱问和Yahoo! Answers的举报功能都取得了良好效果。在加强管理的同时,还可以大力发挥专家团队的作用。邀请各领域内表现卓越的可靠单位合作,聘请特定领域的权威专家,提供基于专家的问答服务。社区也应提供激励措施,鼓励单位和个人积极加入建设知识库的队伍之中。

4.2 整合优质资源

随着日积月累,问答社区的问答逐渐形成了一个庞大的知识库。在知识库中,有些问答能够高效地解决其他用户同样的问题。问答社区要从知识库中挑选出优质资源,有序整合到一起,让用户短时间内获取有效答案。

(1)问题分类使知识库内容结构化、层次化,即使对某个领域不太了解的用户也能在逻辑上认识,减少查找问题的失误。

(2)知识专题能够为用户提供更为全面的信息,用户的知识面不再局限在一个问题之内,而是扩展到一系列的问题。

(3)一些社区提供百科编辑和资料上传的平台,使用户能够获取更加权威的知识。

(4)社区的知识库不仅限于社区内部,可以利用搜索引擎等外部信息加以探索,如奇虎问答的搜索引擎可以搜索国内博客和论坛的问答,Answers.com能够将维基百科的相关知识展示给用户等都值得借鉴。

4.3 鼓励用户互动

问答社区的活跃是通过用户之间的互动促进的,问答本身就是互动的一方面。简单的一问一答对用户是不够的,因为一个问题有时不能将用户的疑问完全解决,提问者有时也不能完全理解回答者的意思。于是问答社区需要开发另外的互动工具,推动用户深入交流,改进问答体验。简单的工具有电子邮件、留言板和站内短信息等,高级的工具有即时通信工具,如百度HI和雅虎通等。

4.4 加强个性化服务

个性化服务是为不同用户偏好设置的。目前的问答社区基本都有属于自己的个人中心,在该方面功能的扩展和改进能够增加社区的用户吸附能力。管理设置个人中心的前提是注册账号,为了方便用户使用,账号在一个网站内的各项服务应该都能通用。像Answers.com除了在本网站注册外,还可以链接Facebook、Twitter、Yahoo、Google和LinkedIn的账号登录。由于这些网站外国人经常使用,所以为国外用户省去了注册的不便。具体到个人中心的操作界面,在提问和回答的基础功能外,提供用户感兴趣或擅长的问题、收藏问题、其他用户求助,以及其他附加应用等功能都是吸引用户的重要部分。问答社区要定期进行调研,了解用户需求和不满,是加强个性化服务最快捷的途径,如Yahoo! Answers的建议板,以开放的态度接受用户的意见和建议。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。

参考文献
[1] 百度知道[EB/OL]. [2010-07-13]. http://zhidao.baidu.com/. [本文引用:1]
[2] 天涯问答[EB/OL]. [2010-07-13]. http://wenda.tianya.cn/wenda/. [本文引用:1]
[3] 悬赏社区_奇虎网[EB/OL]. [2010-07-13]. http://shequ.qihoo.com/. [本文引用:1]
[4] 雅虎知识堂[EB/OL]. [2010-07-13]. http://ks.cn.yahoo.com/. [本文引用:1]
[5] 爱问知识人[EB/OL]. [2010-07-13]. http://iask.sina.com.cn/?k=. [本文引用:1]
[6] 搜搜问问[EB/OL]. [2010-07-13]. http://wenwen.soso.com/. [本文引用:1]
[7] Yahoo! Answers[EB/OL]. [2010-07-13]. http://answers.yahoo.com/. [本文引用:1]
[8] Welcome to Uclue[EB/OL]. [2010-07-13]. http://uclue.com/. [本文引用:1]
[9] Answers. com Reference Library[EB/OL]. [2010-07-13]. http://www.answers.com/main/what_content.jsp. [本文引用:1]
[10] Live Questions & Answers|ChaCha[EB/OL]. [2010-07-13]. http://www.chacha.com/. [本文引用:1]
[11] MadSciNet[EB/OL]. [2010-07-13]. http://www.madsci.org/. [本文引用:1]
[12] Quora[EB/OL]. [2010-07-13]. http://www.quora.com/. [本文引用:1]