深度学习图像标注与用户标注比较研究*
陆伟, 罗梦奇, 丁恒, 李信

Image Annotation Tags by Deep Learning and Real Users: A Comparative Study
Lu Wei,Luo Mengqi,Ding Heng,Li Xin
表1 图像自动标注所涉及的方法与技术
方法/技术 应用/举例
SIFT(尺度不变特征变换)/ SURF
LBP(局部二值模式)
描述图像局部特征
辅助图像局部对比
VLAD 提取图像特征
CNN(卷积神经网络)/RNN(循环神经网络)/DNN(深度神经网络)/LSTM(长短期记忆网络) 生成将图像信息和文字信息对应的模型[32],图像分类[33], 同时也用于图像信息的捕获与解析
NLP(自然语言处理) 对与图像相关联文本的处理
SVM(支持向量机) 图像视觉信息(语义信息)分类器[34]
Fisher Vector Encoding 将图像的视觉描述子映射为高维向量[35]
pLSA/LDA(主题模型) 对图像相关的文本、关键词进行主题模型的建立[28,36]
CCA(典型关联分析) 建立图像和文本的关联[37]
Apriori Algorithm(关联规则) 发掘图像与图像、图像与文本的关联[29]
K-Nearest Neighbor(邻近算法)/LMNN(大间隔最近邻居) 图像信息聚类
Community Detection(社区发现算法) 为图像的语义信息、视觉信息构建概念图[38]
Eigenfaces/Fisherfaces 人脸识别