Advanced Search
 
公 告
作者指南
行业动态
  首页 > 行业动态
亚马逊、微软、谷歌、IBM 人脸识别技术对比分析

  2001 年, Viola Jones 人脸检测框架被提出, 实现实时检测的同时能够保证较高的准确率。自2010 年举办的大规模视觉识别挑战ImageNet 进一步促进人脸识别的飞速发展, 顶级团队主要结合Fisher 向量机和支持向量机开展工作。2012 年, 多伦多大学团队首次使用深度卷积神经网络进行物体检测, 并一举获得该挑战第一名, 正确率比第二名高出10%。2013 年, 挑战赛前5 名均使用深度卷积神经网络, 并自此方法没有太大变化。

  目前, 业界的人脸识别软件服务供应商(如亚马逊 Rekognition、谷歌Cloud Vision API、IBM Watson Visual Recognition、微软 Face API 等)仍然使用深度卷积神经网络, 同行也会结合其他深度学习技术, 如亚马逊使用深度神经网络; 谷歌使用卷积神经网络; IBM 使用深度学习算法; 微软使用人脸算法等。通过收集公开图片并利用供应商的API 进行效果测试, 总结技术差异如下:

  (1) 成功率: 亚马逊准确率能够达到52.66%, 谷歌和IBM 分别为40.43%和39.36%, 微软只有17.55%。
  (2) 速度: 谷歌和微软的处理速度明显快于另外两家。通常处理实验数据集上的单个图像仍然需要超过一秒钟的时间。
  (3) 针对“人群中的脸”的识别效果, 亚马逊似乎非常擅长检测人群中的人脸以及相对较小的脸部, 谷歌次之, IBM 和微
软最差。
  (4) 对“不同的角度, 不完整的脸”的识别效果: IBM 擅长处理头部处于不寻常角度或者可能没有完全显示的脸部图像。

  效果对比结果相关代码可在GitHub 存储库下载, https://github.com/dpacassi/face-detection
  (编译自: https://www.liip.ch/en/blog/face-detection-an-overview-and-comparison-of-different-solutions-part1.)

(本刊讯)

发布时间: 2018-10-25   浏览: 6837
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn