“Tencent ML-Images”项目由多标签图像数据集ML-Images, 以及业内目前同类深度学习模型中精度很高的深度残差网络ResNet-101 构成。
当前业内公开的最大规模的多标签图像数据集是Google 公司的Open Images, 包含900 万训练图像和6 000 多物体类别。腾讯AI Lab 此次开源的ML-Images 数据集包括1 800 万训练图像和超过1.1 万常见物体类别, 或将成为新的行业基准数据集。此外, 腾讯AI Lab 还将提供基于ML-Images 训练得到的深度残差网络ResNet-101。该模型具有优异的视觉表示能力和泛化性能, 在业内同类模型中精度较高, 将为包括图像、视频等在内的视觉任务提供强大支撑, 并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。
除了图像数据集, 此次开源项目中还包括:
(1) 大规模的多标签图像数据集的构建方法, 包括图像来源、图像候选类别集合、类别语义关系和图像标注。在ML-Images 的构建过程中, 团队充分利用类别语义关系帮助对图像的精准标注。
(2) 基于ML-Images 的深度神经网络的训练方法。团队精心设计的损失函数和训练方法, 可以有效抑制大规模多标签数据集中类别不均衡对模型训练的负面影响。
(3) 基于ML-Images 训练得到的ResNet-101 模型, 具有优异的视觉表示能力和泛化性能。
关于“Tencent ML-Images”项目的更多详情与资源, 请访问项目网址: https://github.com/Tencent/tencent-ml-images。
(本刊讯)
|