在线群体创新中的图片推荐方法研究
张晓燕, 张朋柱, 李嘉, 刘景方
上海交通大学安泰经济与管理学院 上海 200052
通讯作者: 张晓燕 E-mail:zzlveofer@hotmail.com

作者贡献声明:张晓燕: 论文思路设计、系统开发、实验、数据分析及论文撰写;
张朋柱: 提出研究思路, 设计研究方案;
李嘉: 指导实验设计和实验分析, 论文修订;
刘景方: 数据分析。

摘要

【目的】

基于相关性、多样性原则, 利用图片推荐的方法刺激群体创新。

【应用背景】

在群体创意的环境中提供刺激信息刺激群体思维。

【方法】

基于文本分词、网页分析以及余弦相似度算法, 建立图片推荐系统的模型, 提出最大差异化算法, 向正在创意的群体推荐多样性高的图片信息。

【结果】

通过实验研究, 证明采用最大差异化算法的图片推荐系统对于群体创新绩效的促进作用。

【局限】

图片最大差异化算法中的相关性和差异性主要基于图片的描述信息, 与图片本身的内容有一定的差异, 因此基于图片描述信息的最大差异化算法存在局限性。

【结论】

在群体创新过程中, 通过不断推荐差异化图片的方法能够提高群体创意的绩效。

关键词: 在线群体研讨; 群体支持系统; 图片推荐系统; 群体创意
Research on Picture Recommendation for Creativity Support System
Zhang Xiaoyan, Zhang Pengzhu, Li Jia, Liu Jingfang
Antai College of Economics & Management, Shanghai Jiaotong University, Shanghai 200052, China
Abstract

[Objective]

Base on the principle of diversity and correlation, stimulate the group creativity by recommending pictures.

[Context]

The application context is group idea generation environment.

[Methods]

Base on text segmentation, webpage analysis technique and cosine similarity algorithm, the paper establishes a model of picture recommending system and raises Max Difference Algorithm (MDA) to select pictures for groups which in the process of creativity.

[Results]

This research proves the positive effect of picture recommendation system to group idea generation by an experiment method and proves the usability and accessibility of the system by survey.

[Limitations]

The Max Difference Algorithm is based on the text information around the pictures, and this information is often in difference with the pictures’ content, so there are limitations on the MDA.

[Conclusions]

In the group idea generation process, group creativity performance can be improved by recommending pictures.

Keyword: Online group discussion; Group support system; Picture recommendation; Group idea generation
1 引 言

创新性问题解决一般被看作一个多阶段的流程, 包括问题的构建、可选项生成、可选项选择[ 1]。有些阶段被认为是神秘的和可能无法理解的。例如, 在Wallas被广泛引用的理论核心中, 创新性模型分为孵化和启发, 以及在他们之间的准备和检验阶段; 孵化和启发的活动大多数时间是不为外部观察者所见的[ 2]。大多数其他创新性模型也描述了相似的阶段[ 3, 4]。在所有这些步骤中, 创意的生成(可选项的生成或者想法的生成)被认为是其中非常神秘又非常重要的一步。因为创意的质量将决定最终问题解决的质量[ 5]。创意的创新性决定了最终方案的创新性。

然而, 在创意的产生过程中功能固著(Functional Fixedness)是阻碍创新的一大因素。心理学家Duncker等[ 6]认为在解决特定的问题时, 你的主观意识会被限定在特定类型的解决方案中。尽管其他的方案更好, 被限定的主观意识也不会考虑到其他的解决方案。就像你有一把锤子, 你会把所有的问题都当作钉子看待, 这种现象就叫做功能固著。功能固著使得人们在解决问题时, 常因受限于情境中从而妨碍了问题解决的创新性。研究认为, 在创新过程中提供外部信息支持可以缓解功能固著[ 7, 8]。同时根据认知网络理论[ 9], 在人类的认知网络中的, 与当前信息距离较远的多样化的信息可以打破认知惯性, 缓解功能固著从而达到刺激创新的目的。

2 研究背景

目前已有很多系统通过提供信息支持的方式支持创新。例如, El-Sharkawy等[ 10]使用语义衔接内容来支持产品的创新, 基于启发性的原则, 采用类比的方法刺激产品的革新。Viriyayudhakorn等[ 11]认为关联信息, 例如: 关联文档、关联关键词、免费链接和分类都是发散思考支持的潜在来源。Gartrell等[ 12]将维基百科及Facebook上的在线内容作为在线知识库支持头脑风暴, 根据当前讨论的内容在维基百科上寻找资源辅助头脑风暴过程。讨论的内容与最匹配的维基百科页面进行关联, 引导相关的内容被深入地讨论, 并根据讨论者的社交网络判断他们的经验和专业知识, 然后根据这些知识和经验推荐范围更广的新思路。Zhang等[ 13]通过结合一个规模比较大的概念字典和引入陌生化修辞改变约束来提高广告生成系统的绩效。Nishimoto等[ 14]认为不同概念产生的冲突对产生新的想法非常有用, 通过建立一个外部代理(Outsider Agent)激活人的脑电波, 并给出一个外部代理的信息检索模型, 将那些明显相关和隐含相关的信息推荐给用户, 通过将Outsider中不同的知识与用户发表的意见相结合, 挖掘出新的相关信息, 提供给用户刺激进一步思考。Li等[ 15]利用互联网上的内容构建了一个概念空间, 并利用概念空间中的概念对正在讨论的群体进行刺激, 从而达到刺激创新的目的。

已有的方法大多数都是采用文字的方式向用户提供信息, 采用图片的方式刺激创新的研究很少。根据认知网络理论, 图片可以将大量的信息通过捆绑的方式捆绑在一张图片中, 可以在保证信息多样化的基础上, 缓解认知负载, 使人们能够在瞬间接受大量的提示信息。美国马里兰大学的Malaga[ 16]认为图片和文字一起对人脑进行刺激创新会比单纯的文字刺激创新更加有效, 并通过实验证明利用图片进行刺激比利用文字进行刺激效果要好。

早期已有一些创新技术采用图片对人脑进行刺激。例如, 德国的Battelle团队[ 17]发现图片是输入大脑的最丰富的信息形式, 他们设计了一个利用图片刺激群体创新的方法, 叫做视觉面对(Visual Confrontation), 在这个方法中, 精心挑选的图片会被展示给被试群体, 最先展示的图片会帮助被试暂时抛开所面临的问题放松心情, 接下来会有另外一组含有大量信息的图片展示给被试, 用来分析和面临的问题之间的关系, 也叫强制联系(Forced Relationship)。在设计领域也有很多人利用图片对设计者进行刺激。例如, Cubukcu等[ 18]利用分布于8个不同领域的152张图片, 分别对设计新手和有经验的设计者进行刺激。其研究证明: 视觉的提示可以在流畅性和灵活性等方面提高创新潜力。

但是这些方法都是预先选定一些图片, 然后再轮流利用这些图片对被试者进行创新刺激, 图片的筛选基本是靠人工来完成的, 自动化程度很低, 费时费力, 因此影响了这些方法的实际应用。这种情况下, 研究如何利用信息技术, 有效地组织和推送图片是非常必要和迫切的, 这就涉及到了本文的研究内容——图片的自动化推荐系统研究。本文基于自然语言处理技术, 在群体研讨过程中, 根据讨论的内容, 实时动态给正在讨论的群体推送相关图片, 从而达到刺激创新的目的。

目前的图片自动化推荐系统主要研究目的是向用户推荐感兴趣的信息或者商品, 这些信息或者商品有可能是图片本身, 也有可能是图片作为信息的载体描述的某些实体的特征, 被推荐只是图片所描述的实体。所以这种图片推荐系统与其他的推荐系统(例如商品推荐)没有本质区别。

以创新为目的的图片推荐系统并不适合采用传统的图片推荐算法, 主要是因为传统的推荐算法主要是基于相似、类似的关系, 向用户推荐相似的、相关联的信息, 这种方式对于创新性想法的提出反而不利, 会加重功能固著, 因为大多数人采用的或者认可的知识就不是创新性的知识, 所以相似、类似的信息不是作为刺激创新的信息的最佳载体。根据认知网络理论, 与当前问题距离较远的多样化信息的刺激有可能产生创新性较高的想法, 所以本文的图片推荐系统是基于相关、差异化的关系, 最大限度地向群体提供相关的多样化的信息, 才能达到较好的刺激创新的效果。目前, 还没有以刺激创新为目的图片推荐系统的研究, 所以本文初探性地提出了最大差异化图片推荐算法, 根据群体当前的讨论内容, 在不造成认知负载的条件下, 实时地向群体提供差异化的图片信息刺激创新。

3 推荐框架

整个推荐流程如图1所示。

3.1 文本分词

文本分词技术可以将非结构化的文本信息转换成半结构化的文本向量, 便于计算文本之间的关系。在本研究中共用到两次文本分词技术: 一次是在服务器分析用户输入的信息时, 一次是在将图片描述文本信息转化成半结构化的图片描述向量时。

本研究使用基于词典的正向最大匹配法(Forward Maximum Matching, FMM)作为分词算法。基于词典的方法的基本思想是: 事先建立一个包含所有可能词的词库, 对待分词的文本, 按照某种确定的原则切取字符串的子串, 判断该子串与词库中的词条是否匹配, 如果匹配则认为该子串是词, 插入切分标志, 然后继续分割其余部分, 直到剩余部分为空。最大匹配算法遵循“长词优先”原则, 这样切分出来的词语长度相对要大, 切出来的词语数量较少。本研究中所用的词典是搜狗互联网词库(http://www.sogou.com/labs/dl/w.html)。搜狗互联网词库是利用统计学方法将互联网上的大规模中文语料进行统计分析, 统计出词条, 同时还标出了词性信息。通过分词的技术手段可以将文本转化成离散的词语集合, 同一个文本中包含的不重复的词语作为文本的特征项。

3.2 图片获取

本文所使用的图片主要来源于互联网, 利用聚焦爬虫将固定站点中包含图片的网页爬取下来, 再采用HTML文本分析技术将网页中的图片信息抽取出来存到本地的图片数据库, 这些工作由离线的图片更新器负责完成。

3.3 图片间关系计算

为了配合最大差异化图片选择算法, 同时为了减少服务器在线计算的复杂度, 缩短服务器的响应时间, 图片库离线更新器预先计算图片库中的图片之间的关系, 并存储下来, 供服务器实时选择图片所用。

具体做法是: 生成图片向量后, 首先按照图片特征寻找与此图片有特征重合的图片, 没有特征重合的图片相似度为0, 只需按照余弦相似度公式[ 19]计算有特征重合的图片的两两相似度即可。

3.4 图片最大差异化算法

为了避免在讨论过程中, 向群组推送过多的图片, 导致认知过载, 避免对讨论的过程产生过大的干扰, 在本研究中设置每次对群组推送的图片不能超过三张。同时, 为了使这三张图片涵盖更多的线索信息, 首先要保证这三张图片描述的内容各不相同, 越不相似的图片放在一起推送给群体成员效果越好, 故本文采用最大差异化算法筛选图片。3.3节将图片间的关系预先计算好并存于图片库中, 在此基础上, 图片搜索引擎可以快速地找出具有最大差异的三张图片, 推送给研讨群体。具体流程如图2所示:

图2 相关图片最大差异化算法

4 实证研究

为了验证提出的图片推荐系统对群体创新的有用性, 本研究组织了一次实验室实验: 招募了40个商学院本科大四的学生, 随机分成20组, 2人一组。其中10组使用本文设计的图片推荐系统, 10组使用文献[15]中使用的概念支持系统作为对照组。参与者都具有使用计算机为媒介的交流工具的经验, 包括即时聊天工具、在线聊天室或网络论坛等, 为了更好地激励参与者, 对于最终研讨绩效最好的组会提供200元的现金奖励。

本研究使用的创意任务是经典的“袋泡茶”问题[ 20]。一个生产袋泡茶的厂商生产能力过剩, 该问题要求创意小组帮袋泡茶厂商出谋划策, 解决生产能力过剩的问题。“袋泡茶”问题已经在许多涉及创意任务的研究中被使用。实验结束后, 邀请了两位专家对实验过程中产生创意进行评估, 评估内容包括创意可行性(Implementability)、有效性(Effectiveness)、完整性(Completeness)以及Idea创新性(Creativity), 评估采用1-7分打分法, 对每一个Idea在4个维度上进行打分。评估完成后, 采用Cronbach’s Alpha系数法计算两位专家评估的一致性。结果显示可行性评估一致性为0.731, 有效性评估一致性为0.703, 完整性评估一致性为0.548, 创新性评估一致性为0.746, 最终采用两位专家评分的均值作为每个创意的最终得分。

将可行性得分大于5.5分, 有效性得分大于5.5分, 完整性得分大于3.5分, 创新性得分大于5.5分的创意视为高质量且高创新性的创意。分别对每一组研讨的发言条数、有效创意数量、高质量高创新性创意的数量进行独立样本t检验。 结果如表1所示, 使用图片推荐系统组的发言条数显著高于使用概念支持组(t= -9.859, p<0.001), 说明使用图片推荐系统的用户讨论比较积极, 研讨气氛比较热烈。同时结果也显示图片推荐系统组产生的有效创意数量显著高于概念支持组(t= -8.167, p<0.001), 说明图片推荐系统的产出相较于概念支持系统具有较大的提升。在高质量且高创新性创意的数量上, 使用图片推荐系统组也显著高于概念支持组(t= -3.720, p<0.01), 说明图片支持系统在刺激创新产生高质量高创新性的创意上面也有一定的优势。

表1 创新绩效的比较

同时, 本文采用问卷的方式收集了用户对于系统使用过程中主观评价。根据开放性问题的回答, 也收集到一些对于图片推荐系统的正面或者负面的回答, 其中包含一些系统的改进的建议。例如, 有人认为图片支持功能很神奇, 可以启发思维, 使其想到一些之前很难想到的创意; 有人认为提供的图片很有意思; 有人认为提供的图片和主题比较相关等。问卷中也有一些关于系统的负面评论, 例如, 由于没有发言的快捷键, 使用很不方便; 还有人提出容易被图片牵着鼻子走, 在讨论过程中, 没有时间考虑和图片无关的创意等。 用户也提出了一些系统的改进意见, 例如, 提高系统稳定性, 增加快捷键等。

5 结 语

本文研究了在群体创新过程中, 如何推荐图片刺激群体成员创新, 并给出图片推荐系统运行框架以及实现方法。利用最大差异化算法检索图片能够保证在不对群体成员讨论产生很大干扰的情况下, 提供不同方面的图片, 对群体成员从不同侧面进行创新刺激。通过实验研究, 证明了此系统对于群体创意的促进作用, 并通过问卷调查的方式, 证明了系统的有用性及易用性。

但是本文的工作也存在一些局限性, 例如, 在选择相关图片和计算图片间差异时, 主要基于图片的文本描述信息, 这些信息与图片的真实内容还有一定的差异, 仅仅采用文本描述信息表示图片的内容存在一定的局限性。同时, 在计算相似度时忽略了文本词语语义间的关系, 对图片间相关性以及差异性的准确程度, 会有一定的影响。未来的研究还需要将文本描述信息与图片内容信息相结合以达到更加精确表示图片内容的目的, 同时应该考虑文本语义间的关系, 以提高算法的精确程度。

同时由于图片推荐系统刺激创新方面的研究刚刚起步, 本文只是初探性地提出了最大差异化算法, 采用其他算法提供图片有可能会比最大差异化算法更加有效。例如, 利用图片和研讨的相似程度检索图片。提供相似程度高的图片以及提供相似程度低的图片, 对创新的影响也会有很大的不同。还有问卷中提出的被图片牵着鼻子走, 在讨论过程中, 没有时间考虑和图片无关的创意, 要解决这个问题就需要对图片提供的时机有一个很好的把握, 在群体需要图片时才提供支持, 不需要时则保持沉默。这一部分的研究对于图片的自动推荐有很大的意义, 也是未来研究中很重要的一部分。

参考文献
[1] MacCrimmon K R, Wagner C. Stimulating Ideas through Creative Software[J]. Management Science, 1994, 40(11): 1514-1532. [本文引用:1] [JCR: 1.859]
[2] Wallas G. The Art of Thought [M]. London : Jonathan Cape, 1926. [本文引用:1]
[3] Osborn A F. Applied Imagination [M]. New York : Scribner, 1953. [本文引用:1]
[4] Parnes S J, Noller R B, Biondi A M. Guide to Creative Action [M]. New York : Scribner, 1977. [本文引用:1]
[5] Briggs R O, Reinig B A, Shepherd M M, et al. Quality as a Function of Quantity in Electronic Brainstorming [C]. In: Proceedings of the 30th Hawaii International Conference on System Sciences: Information Systems Track-Collaboration Systems and Technology. IEEE, 1997, 2: 94-103. [本文引用:1] [JCR: 1.616]
[6] Duncker K, Lees L S. On Problem-solving[J]. Psychological Monographs, 1945, 58(5). doi: 10.1037/h0093599. [本文引用:1]
[7] Kaufmann G. A Theory of Symbolic Representation in Problem Solving[J]. Journal of Mental Imagery, 1985, 9(2): 51-69. [本文引用:1]
[8] Logie R H, Denis M. Mental Images in Human Cognition [M]. Amsterdam: Elsevier, 1991. [本文引用:1]
[9] Santanen E L, Briggs R O, Vreede G-J D. Causal Relationships in Creative Problem Solving: Comparing Facilitation Interventions for Ideation[J]. Journal of Management Information Systems, 2004, 20(4): 167-198. [本文引用:1] [JCR: 1.262]
[10] El-Sharkawy S, Grube P P, Schmid K. Using Semantically Linked Content to Support Creativity in Product Innovation [C]. In: Proceedings of the 1st International Conference on Creative Content Technologies. IEEE, 2009: 638-642. [本文引用:1] [JCR: 1.616]
[11] Viriyayudhakorn K, Kunifuji S, Ogawa M. Knowledge, Information, and Creativity Support Systems[M]. Berlin, Heidelberg: Springer, 2011. [本文引用:1]
[12] Gartrell M, Beach A, Ramanarayanankrishnaniyer J, et al. Integrating Wikipedia and Facebook Context into Collaborative E-brainstorming [R]. Technical Report CU-CS-1073-10University of Colorado at Boulder, 2010. [本文引用:1]
[13] Zhang Y, Ono J, Ogata T. Single Event and Scenario Generation Based on Advertising Rhetorical Techniques Using the Conceptual Dictionary in Narrative Generation System [C]. In: Proceedings of the 4th International Conference on Digital Game and Intelligent Toy Enhanced Learning (DIGITEL). IEEE, 2012: 162-164. [本文引用:1] [JCR: 1.616]
[14] Nishimoto K, Sumi Y, Mase K. Toward an Outsider Agent for Supporting a Brainstorming Session——An Information Retrieval Method from a Different Viewpoint[J]. Knowledge-Based Systems, 1996, 9(6): 377-384. [本文引用:1] [JCR: 4.104]
[15] Li J, Zhang P, Cao J. External Concept Support for Group Support Systems through Web Mining[J]. Journal of the American Society for Information Science and Technology, 2009, 60(5): 1057-1070. [本文引用:1] [JCR: 2.005]
[16] Malaga R A. The Effect of Stimulus Modes and Associative Distance in Individual Creativity Support Systems[J]. Decision Support Systems, 2000, 29(2): 125-141. [本文引用:1] [JCR: 2.201]
[17] Geschka H. Creativity Techniques in Germany[J]. Creativity and Innovation Management, 1996, 5(2): 87-92. [本文引用:1]
[18] Cubukcu E, Cetintahra G E. Does Analogical Reasoning with Visual Clues Affect Novice and Experienced Design Students’ Creativity?[J]. Creativity Research Journal, 2010, 22(3): 337-344. [本文引用:1]
[19] Salton G. Developments in Automatic Text Retrieval[J]. Science, 1991, 253(5023): 974-980. [本文引用:1]
[20] Fellers J W. The Effect of Group Size and Computer Support on Group Idea Generation for Creativity Tasks: An Experimental Evaluation Using a Repeated Measures Design [D]. Bloomington, Indiana: Indiana University, 1989. [本文引用:1]