近日, 谷歌宣布开放Open Images V4 版本, 包含190 万图像、600 个种类, 1 540 万个bounding-box 标注, 是当前最大的带物体位置标注信息的数据集。谷歌方面称, 为了保持标注的高质量, 这些图像大部分由专业标注人员手动完成, 图像丰富多样, 通常还包含了具有多个对象的复杂场景——平均每张图像8 个以上。
与此同时, 谷歌基于Images V4 数据集, 启动Open Images 挑战赛, 将在2018 计算机视觉欧洲会议(ECCV 2018)上举办。Open Images 挑战赛将遵循PASCAL VOC、ImageNet 和COCO 的挑战赛模式, 但规模会更大, 挑战也将是独一无二的。比如:
(1) 训练集包含500 类170 万张图片, 带有1 220 万处bounding-box 标注;
(2) 与以前的检测挑战相比, 将有更广泛的类别, 包括诸如“fedora”“snowman”等这样的新对象;
(3) 除了主流的物体检测外, 还有视觉关系检测, 用来识别特定关系中的物体对, 例如“woman playing guitar”。
训练数据集现已可供使用; 一个包含有 10 万张图片的测试集将于2018 年7 月1 日在Kaggle 上发布。挑战赛提交结果的截止日期为2018 年9 月1 日。
除了上述内容外, Open Images V4 还包含3 010 万张经过人工验证的针对19 794 个类别图像级标签的图片。但这些标签不属于挑战赛的一部分, 其中的 550 万张图像级标签是由来自世界各地成千上万名用户通过crowdsource.google.com 生成的。
大赛时间节点: 2018. 04.30 发布带有bounding-box 标注的对象检测分赛训练集; 2018. 05.10 发布带有注释的视觉关系检测分赛训练集; 2018.05.31 发布评估度量规范; 2018. 07.01 在Kaggle 上发布测试集(10 万张图片); 2018.09.01 提交截止日期。
(编译自: https://research.googleblog.com/2018/04/announcing-open-images-v4-and-eccv-2018.html)
(本刊讯)
|