Advanced Search
  首页 > 行业动态
Facebook如何让搜索工具理解人类语言

Facebook如何让搜索工具理解人类语言

 人类的行为就是 Facebook 的生意。Facebook 的成功要靠对人的行为进行理解:人们是如何展现自己,如何记忆、信任谁,是如何搜索信息的?
 在推出图谱搜索之前,Facebook 已经组建过一只跨专业的团队来研究用户的搜索内容和方式。团队成员包括两位语言学家、一位心理学博士以及统计学家,还有作为骨干的程序员。任务很明确:教Facebook的系统如何更好地与人沟通,即创建一种自然直观的语言。 
 团队工作开始,面临的状况是 Facebook 低效的搜索引擎仅能理解“机器语言”,听不懂人话。要教会机器掌握问题的建构模块才能理解问题,这就像教小学生理解句子一样。所有代码都需要重新调整。
 工作人员让用户操作不同版本的搜索引擎,团队成员则通过单向可见玻璃来观察用户的表现并把观察记录下来。团队成员通过研究词典、报纸、国会会议记录等来掌握近乎无限量的提问方式,然后训练算法去理解问题的意思。再对搜索工具进行测试、调整,并评估特定一组用户对象的反映。 
 从事人机交互研究的斯坦福大学教授 Clifford I. Nass 说,Facebook 要做的产品并非大家线下交互的复制品,而是一种“有关如何沟通的理想化视角”的反映。 Nass 认为Facebook 利用的并非人类沟通方式的纯粹心理学研究成果,而是想通过心理学研究来让网站对用户具备粘性、让用户愿意在上面花时间。这可以很好地解释为什么上面有一个“喜欢”按钮却没有“不喜欢”按钮:消极情绪会让人远离网站。“喜欢”按钮的一个根本性的原理是心理学上的同质性概念:物以类聚,人以群分,大家喜欢类似的人和物。 
 为了服务好多样化、全球性的用户,Facebook 非常注意用户响应,不断地测试和调整自己的功能。其第一代的搜索引擎是通过挖掘公司收集的某些数据(照片、兴趣、喜欢等)来回答问题的。最终他还会挖掘状态更新等活动,甚至于用户吃什么和到哪里去。这个引入的过程将非常缓慢,这样才能检验出哪些功能和调整是有效的,哪些是无效的。
 转折点出现在一次对用户的试验中。Facebook 的用户体验团队成员教用户使用早期版本的搜索引擎。有一个用户被要求查找喜欢棒球的朋友,但是他的关系网中最狂热的棒球迷并没有出现在搜索结果中,因为他们喜欢的是“美国职业棒球联盟”,而不是“棒球”。在单向玻璃后面观察的工程师们终于茅塞顿开:如果自己的代码不与人关联起来,那么写得再好也没有用。因此他们得出结论:需要重新调整代码。 
 现在,搜索引擎已经可以理解“学生(Student)”这个词的 25 个同义词,包括“Freshmen”、“Pupils”等,还有 25 个左右的近义词也会被提示为相同的意思,如“Academics”。此外,搜索还可以加上时间参照,如现在的学生,也可以增加细节描述,如主修心理学的学生,把这一切结合起来,搜索引擎可以识别出将近 27.5 万种询问“学生”的方式。 
 这个搜索引擎会对 Google 造成何种威胁尚不得而知。但是有一点是明确的,为了完善它,还需要进行大量的工作。比如现在这个搜索引擎还很难理解很多类型的句子,特别是有歧义的句子、复杂的句子以及需要联系上下文环境理解的句子。总之,计算机对真实世界的了解非常匮乏。
 不过,即便是在缺乏背景的情况下,Facebook 仍然试图去接近现实世界的信任。搜索引擎会对每一个查询的应答根据“社交距离”进行评级。算法会将用户最亲近、最有可能想看到的朋友的答案置于结果的前列。这种做法虽然显得有点笨拙,但是显然 Facebook 认为同质性很重要:如果答案来自于用户喜欢的某人,那么该用户就更有可能会注意到它,并点击该链接。 
 (编译自: http://www.nytimes.com/2013/01/29/business/how-facebook-taught-its-search-tool-to-understand-people.html)

发布时间: 2013-02-25   浏览: 336
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn