组成以图搜图技术的基本要素有哪些?
时间:时间: 2022-01-17 15:59:10 阅读: 2837 次 分类:常见问题在本章中,我们将介绍图搜索技术的一般框架。在介绍以图搜图技术之前,让我们看一下任何搜索技术所具有的基本组成部分。比如我们需要去图书馆找一本书,这需要几个基本要素:
1.图书馆(大量书籍)
2. 图书的类别、书名或作者(这些信息的组合唯一标识了图书馆编码方案下的图书);
3. 图书馆内的图书应按一定的规则(学科、难易程度、首字母、作者、年份等)排列。除了这些基本要素,只要图书馆有书,我们就能很快找到;或者即使没有特定的书,我们也可以查找内容相似的书。
结合上面的例子,我们来看一个典型的图搜索系统的基本框架:
首先看一下离线部分,包括三个基本要素:
01.检索图片库:这相当于前面例子中的书。我们需要一个足够大的图片库,比如淘宝上所有商品的图片集合,百度图片搜索收集的互联网图片数据集合。当然,这里我们介绍一个静态图片库,在实际项目中,我们需要能够处理图片库的动态变化;
02.特征提取:这相当于前面例子中书籍的作者、年份、主题等,我们称之为图片特征。实际上,图像的任何统计量都可以成为图像的特征,甚至图像本身的像素值也可以成为归一化后图像的特征。在实践中,我们使用图像颜色分布、梯度变化统计、纹理、BOW统计、低级/中级/高级语义特征作为图像的特征,非常丰富。
03. 搜索结构:搜索结构的唯一目的是使搜索更快、更准确。简单,一对一比较是最简单的查询结构,最准确,但最慢;所以所有的检索结构本质上都是效率和精度的平衡。通常,我们可以将数据集聚类成数据堆,先选择相似的堆,然后在堆内进行详细比较。分裂堆的思想可以用树结构、Hash结构、倒排索引、图结构等来表示。
火鹰科技以图搜图系统定制化开发方案,根据企业的实际需求搭建出功能完善的专属以图搜图系统。再也不用担心多余功能所产生的费用以及功能不足的问题。100%源码交付,对程序拥有绝对的所有权,终端代码全量开源无加密,支持私有化部署,轻松进行二次开发。