张瑞茂中大 发表于 2015-9-29 18:07:37

基于正则化相似性学习的可变长深度哈希

本帖最后由 张瑞茂中大 于 2015-9-29 18:19 编辑

在图像检索问题中,提取具有丰富信息的图像特征和学习近似哈希函数是两个十分重要的研究方向。传统的联级方法通常是将两者割裂开来进行处理,例如在一个手工预定义的特征空间中学习哈希函数。另一方面,大多数传统方法最后输出的哈希编码比特位数是预先设定好的,这种设定默认哈希编码中每个比特位具有同等的重要性,极大的限制了哈希编码在实际应用中的灵活性。


为了解决以上问题,我们提出了一个有监督的学习框架,能够直接从原始图像中生成紧凑且位数可变的哈希编码。我们将哈希学习问题定义成一个带有正则化项的相似性学习问题。其中,我们将训练样本以三元组的形式进行组织,每个样本与一张同该样本具有相同标签的图像和一张具有不同标签的图像组成一组。对于这样一个三元组,我们希望在海明空间中最大化匹配对(具有相同标签)和不匹配对(具有不同标签)之间的差异。另外,我们还将引入一个正则化项来保证邻接一致性,例如拥有相似外观的图像应该拥有相似的哈希编码值。我们使用深度卷积神经网络来构建一个终端到终端的模型,使得具有判别性的图像特征和哈希函数可以同步优化。此外,我们认为在哈希编码中,每个比特位所起到的作用是不同的。因此我们可以利用比特位的权重来对哈希编码进行截断,从而得到不同长度的哈希编码以适用在不同应用环境下的需求。


在若干个图像检索公共数据集上测试的效果显示,我们的模型优于现有的其他方法,可变长的哈希编码也能够保留其判别性。同时在监控环境下的人物比对等实际应用中,我们的模型也取得令人满意的结果。


更多的论文信息请参见:Project Page for Bit-Scalable Deep Hash


相关方法的代码请参见:Code for Bit-Scalable Deep Hash











贾伟中科院合肥 发表于 2015-9-29 21:55:58

赞一个!
页: [1]
查看完整版本: 基于正则化相似性学习的可变长深度哈希