使用Python构建您的第一个图像搜索引擎

2018-12-05 15:57:54 lovesLife

在本文中，我们将使用(可以说)最基本的图像描述符之一(颜色直方图)来量化和描述我们的图片。

我们的数据集中共有25个不同的图像，每个类别有5个。

我们要做的第一件事是索引数据集中的25个图像。索引(index)是通过使用图像描述符从每个图像中提取特征来量化我们的数据集的过程，同时将我们得到的特征存储以供以后使用(例如执行搜索)

图像描述符定义了我们如何量化图像，因此从图像中提取特征被称为描述图像(describing an image)。图像描述符的输出是特征向量，是图像本身的抽象。简而言之，它是用于表示图像的数字列表。

可以使用距离度量来比较两个特征向量。距离度量用于通过检查两个特征向量之间的距离来确定两个图像的“相似”程度。在图像搜索引擎的情况下，我们给脚本提供一个查询图像，并要求它根据图像与查询的相关性对索引中的图像进行排序。

这样想吧。当您访问Google并在搜索框中输入“指环王”时，您希望Google向您返回与Tolkien的图书和电影特许经营相关的网页。类似地，如果我们给图像搜索引擎提供我们的查询图像，我们希望它返回与图像内容相关的图像——因此，我们有时将图像搜索引擎称为学术界中更常见的基于内容的图像检索(CBIR)系统。

我们的图像搜索引擎的目的：给定来自五个不同类别之一的查询图像，在前10个结果中返回类别的相应图像。

接下来让我们建立我们的Image Search Engine

The 4 Steps to Building an Image Search Engine

定义描述符：你要使用什么类型的描述符？
索引我们的数据集:将描述符应用于数据集中的每个图像，提取一系列特征。
定义我们的相似度量:你将如何定义两个图像的“相似”程度？您可能会使用某种距离指标。常见的选择包括Euclidean，Cityblock(Manhattan)，余弦和卡方等等。
搜索:要执行搜索，先将描述符应用于我们要查询图像，然后询问距离指标，以便对索引中的图像与查询图像的相似程度进行排名。通过相似性对结果进行排序，然后检查它们。

Step1:The Descriptor——A 3D RGB Color Histogram

我们的图像描述符是RGB颜色空间中的3D颜色直方图，每个红色，绿色和蓝色通道有8个区间(bins)。

解释3D直方图的最佳方法是使用连接AND(conjunctive AND)。该图像描述符将询问给定图像有多少红色像素具有落入bin＃1和多少绿色像素落入bin＃1的以及有多少蓝色像素落入bin＃1。对于每个bins的组合将重复该过程; 但是，它将以计算有效的方式完成。

当计算具有8个bins的3D直方图时，OpenCV将特征向量存储为(8,8,8)数组。我们简单地将它展平并重塑为(512，)。一旦它被展平(flattened)，我们就可以轻松地将特征向量进行比较以获得相似性。

rgbHistogram.py

import imutils
import cv2 
class RGBHistogram:
 def __init__(self,bins):
 # store the number of bins the histogram will use
 self.bins = bins
 def describe(self,image):
 # compute a 3D histogram in the RGB colorspace,
 # then normalize the histogram so that images
 # with the same content, but either scaled larger
 # or smaller will have (roughly) the same histogram
 hist = cv2.calcHist([image],[0,1,2],None,self.bins,[0,256,0,256,0,256])
 # normalize with openCV 2.4
 if imutils.is_cv2():
 hist = cv2.normalize(hist)
 # otherwise normalize with OpenCV 3+
 else:
 hist = cv2.normalize(hist,hist) 

 # return out 3D histogram as a flattened array
 return hist.flatten()

如您所见，我已经定义了RGBHistogram类。我倾向于将我的图像描述符定义为类而不是函数。这是因为您很少单独从单个图像中提取特征。您改为从整个图像数据集中提取特征。此外，您希望从所有图像中提取的特征使用相同的参数——在这种情况下，是直方图的bins数目。如果您打算比较它们的相似性，从一个图像中使用32个bins来提取特征，而另外一个图像使用128个bins来提取特征，最后来比较它们的相似性是没有意义的。

这里我定义了RGBHistogram的构造函数。我们需要的唯一参数是直方图中每个通道的bins数。同样，这就是为什么我更喜欢使用类而不是图像描述符的函数——通过在构造函数中放置相关参数，可以确保为每个图像使用相同的参数。

接下来是describe方法，它用于“描述”图像并返回特征向量

使用cv2.calcHist函数，我们提取实际的3D RGB直方图(或实际上是BGR，因为OpenCV将图像存储为NumPy数组，但通道的顺序相反)。我们假设self.bins是三个整数的列表，指定每个通道的bin数。

重要的是我们根据像素数量对直方图进行标准化。如果我们使用图像的原始(整数)像素计数，然后将其缩小50％并再次描述它，我们将为相同的图像提供两个不同的特征向量。在大多数情况下，您希望避免这种情况。我们通过将原始整数像素计数转换为实值百分比来获得尺度不变性。例如，我们不说bin＃1中有120个像素，而是说bin＃1中有20％的像素。同样，通过使用像素计数的百分比而不是原始的整数像素计数，我们可以确保两个相同的图像(仅在大小上不同)将具有(大致)相同的特征向量。

当计算3D直方图时，直方图将表示为具有(N，N，N)个bins的NumPy数组。为了更容易地计算直方图之间的距离，我们简单地将该直方图展平为具有(N ** 3，)的形状。例如：当我们实例化RGBHistogram时，每个通道将使用8个bin。没有展平(flatten)我们的直方图，形状将是(8,8,8)。但是通过展平它，形状变为(512，)。

现在我们已经定义了图像描述符，接下来可以进行数据集的索引处理。

Step2:Indexing our Dataset

前面我们已经确定我们的图像描述符是3D RGB直方图。下一步是将我们的图像描述符应用于数据集中的每个图像。

这仅仅意味着我们将遍历我们的25个图像数据集，从每个图像中提取3D RGB直方图，将特征存储在字典中，并将字典写入文件。

index.py

from rgbHistogram import RGBHistogram
from imutils.paths import list_images
import os.path
import argparse
import pickle
import cv2
# construct the argument parser and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument('-d',"--dataset",required=True,
 help="Path to the directory that contains the images to be indexed")
ap.add_argument("-i", "--index", required=True, 

 help="Path to where the computed index will be stored")
args = vars(ap.parse_args())
# initialize the index dictionary to store our our quantifed
# images, with the 'key' of the dictionary being the image
# filename and the 'value' our computed features
index = {}

我们将使用cPickle将索引转储到磁盘。我们将使用list_images来获取我们要索引的图像的路径。

--dataset参数是我们的图像存储在磁盘上的路径，而--index选项是我们在计算索引后存储索引的路径。

最后，我们将初始化索引为字典类型。字典的key是图像文件名。我们假设所有文件名都是唯一的，事实上，对于这个数据集，它们是唯一的。字典的value将是图像的计算直方图。

# initialize our image descriptor -- a 3D RGB histogram with
# 8 bins per channel
desc = RGBHistogram([8, 8, 8])

这里我们实例化我们的RGBHistogram。同样，我们将分别为红色，绿色和蓝色通道使用8个bins。

# use list_images to grab the image paths and loop over them
for imagePath in list_images(args["dataset"]):
 # extract our unique image ID(here is our image filename)
 j, k = os.path.split(imagePath)
 # load the image, describe it using our RGB histogram
 # descriptor, and update the index
 image = cv2.imread(imagePath)
 features = desc.describe(image)
 index[k] = features

我们使用list_images来抓取图像路径并开始遍历我们的数据集。我们提取图像的名字作为我们字典的key。因为数据集中的所有文件名都是唯一的，因此文件名本身就足以作为key。然后将图像从磁盘加载，然后我们使用RGBHistogram从图像中提取直方图。然后将直方图存储在index中。

# we are now done indexing our image -- now we can write our
# index to disk 
f = open(args["index"],'wb')
f.write(pickle.dumps(index))
f.close()
# show how many images we indexed 
print("[INFO] done... indexed {} images".format(len(index)))

现在已经计算了我们的索引，我们将它写入磁盘，以便我们以后可以使用它进行搜索。

要为图像搜索引擎编制索引，只需在终端中输入以下内容即可

python index.py -d images --index index.cpickle

Step3:The Search

我们的磁盘上有我们的index，接下来准备进行搜索。

我们如何比较两个特征向量以及我们如何确定它们的相似程度？先看代码的实现。

searcher.py

import numpy as np
class Searcher:
 def __init__(self, index):
 # store our index of images
 self.index = index
 def search(self, queryFeatures):
 # initialize our dictionary of results
 results = {}
 # loop over the index
 for (k,features) in self.index.items():
 # compute the chi-squared distance between the features
 # in our index and our query features -- using the
 # chi-squared distance which is normally used in the
 # computer vision field to compare histograms
 d = self.chi2_distance(features,queryFeatures)
 # now that we have the distance between the two feature
 # vectors, we can udpate the results dictionary -- the
 # key is the current image ID in the index and the
 # value is the distance we just computed, representing
 # how 'similar' the image in the index is to our query
 results[k] = d
 # sort our results, so that the smaller distances (i.e. the
 # more relevant images are at the front of the list)
 results = sorted(([v,k] for (k,v) in results.items()))
 # return our results
 return results
 def chi2_distance(self,histA,histB,eps=1e-10):
 # conpute the chi-squared distance
 d = 0.5 * np.sum([((a - b) ** 2) / (a + b + eps)
 for (a,b) in zip(histA,histB)])
 # return the chi-squared distance
 return d

我们首先定义Searcher类和一个带有单个参数的构造函数——index。假定该index是我们在index步骤中写入文件的index字典。

我们定义一个字典来存储我们的结果。字典的key是图像文件名，value是给定图像与查询图像的相似程度。

这是我们实际执行searching的部分。我们遍历索引中的图像文件名和相应特征。然后我们使用卡方距离(Chi-square distance)来比较我们的颜色直方图。然后将计算的距离存储在结果字典中，指示两个图像彼此有多相似。最后结果按照相关性(卡方距离越小,越相关)进行排序并返回。

最后，我们定义用于比较两个直方图的卡方距离函数。一般来说，大垃圾箱与小垃圾箱之间的差异不那么重要，应该按此加权。这正是卡方距离的作用。我们提供epsilon以避免那些讨厌的“除以零”错误。如果图像的特征向量的卡方距离为零，则认为图像是相同的。距离越大，它们就越不相似。

Step4:Performing a Search

接下来我们从磁盘加载图像并执行搜索：

search.py

from searcher import Searcher
import numpy as np
import argparse
import os
import pickle
import cv2
# construct the argument parser and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-d", "--dataset", required = True,
 help = "Path to the directory that contains the images we just indexed")
ap.add_argument("-i", "--index", required = True,
 help = "Path to where we stored our index")
args = vars(ap.parse_args())
# load the index and initialize our searcher
index = pickle.loads(open(args["index"],'rb').read())
searcher = Searcher(index)

我们使用cPickle从磁盘加载index并初始化我们的Searcher。

# loop over images in the index -- we will use each one as
# a query image
for (query,queryFeatures) in index.items(): 

 # perform the search using the current query
 results = searcher.search(queryFeatures)
 # load the query image and display it
 path = os.path.join(args["dataset"],query)
 queryImage = cv2.imread(path)
 cv2.imshow("Query",queryImage)
 print("query: {}".format(query))
 # initialize the two montages to display our results --
 # we have a total of 25 images in the index, but let's only
 # display the top 10 results; 5 images per montage, with
 # images that are 400x166 pixels
 montageA = np.zeros((166 * 5,400,3),dtype="uint8")
 montageB = np.zeros((166 * 5, 400, 3), dtype="uint8")
 # loop over the top ten results
 for j in range(0,10):
 # grab the result (we are using row-major order) and
 # load the result image
 (score,imageName) = results[j]
 path = os.path.join(args["dataset"],imageName)
 result = cv2.imread(path)
 print("\t{} . {} : {:.3f}".format(j+1,imageName,score))
 # check to see if the first montage should be used
 if j < 5:
 montageA[j * 166:(j + 1) * 166,:] = result
 # otherwise , the second montage should be used
 else:
 montageB[(j - 5) * 166:((j - 5) + 1) * 166,:] = result
 # show the results
 cv2.imshow("Results 1-5",montageA)
 cv2.imshow("Result 6-10",montageB)
 cv2.waitKey(0)

我们将把index中的每个图像视为一个query，看看我们得到的结果。通常，查询是外部的而不是数据集的一部分，但在我们开始之前，让我们只执行一些示例搜索。

我们将当前图像视作为query并执行searh方法。

然后加载并显示我们的query图像。

为了显示前10个结果，我决定使用两个montage图像。第一个montage显示结果1-5，第二个montage显示结果6-10。最后显示我们search的results给用户。

执行脚本

python search.py --dataset images --index index.cpickle

最终结果：

query: Mordor-002.png
 1. Mordor-002.png : 0.000
 2. Mordor-004.png : 0.296
 3. Mordor-001.png : 0.532
 4. Mordor-003.png : 0.564
 5. Mordor-005.png : 0.711
 6. Goblin-002.png : 0.825
 7. Rivendell-002.png : 0.838
 8. Rivendell-004.png : 0.980
 9. Goblin-001.png : 0.994
 10. Rivendell-005.png : 0.996

Bonus: External Queries

截至目前，我只向您展示了如何使用索引中已有的图像执行搜索。但显然，这不是所有图像搜索引擎的工作方式。 Google允许您上传自己的图片。我们为什么不能？让我们看看我们如何使用尚未编入索引的图像执行搜索：

search_external.py

from rgbhistogram import RGBHistogram
from searcher import Searcher
import numpy as np
import argparse
import os
import pickle
import cv2
# construct the argument parser and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-d", "--dataset", required = True,
 help = "Path to the directory that contains the images we just indexed")
ap.add_argument("-i", "--index", required = True,
 help = "Path to where we stored our index")
ap.add_argument("-q", "--query", required = True,
 help = "Path to query image")
args = vars(ap.parse_args())
# load the query image and show it
queryImage = cv2.imread(args["query"])
cv2.imshow("Query",queryImage)
print("query: {}".format(args["query"]))
# describe the query in the same way that we did in
# index.py -- a 3D RGB histogram with 8 bins per channel
desc = RGBHistogram([8,8,8])
queryFeatures = desc.describe(queryImage)
# load the index perform the search
index = pickle.loads(open(args["index"],"rb").read())
searcher = Searcher(index)
results = searcher.search(queryFeatures)
# initialize the two montages to display our results --
# we have a total of 25 images in the index, but let's only
# display the top 10 results; 5 images per montage, with 

# images that are 400x166 pixels
montageA = np.zeros((166 * 5, 400, 3), dtype = "uint8")
montageB = np.zeros((166 * 5, 400, 3), dtype = "uint8")
# loop over the top ten results
for j in range(0,10):
 # grab the result (we are using row-major order) and
 # load the result image
 (score,imageName) = results[j]
 path = os.path.join(args["dataset"],imageName)
 result = cv2.imread(path)
 print("\t{} . {} : {:.3f}".format(j+1,imageName,score))
 # check to see if the first montage should be used
 if j < 5:
 montageA[j * 166:(j + 1) * 166, :] = result
 # otherwise, the second montage should be used
 else:
 montageB[(j - 5) * 166:((j - 5) + 1) * 166, :] = result
# show the results
cv2.imshow("Results 1-5", montageA)
cv2.imshow("Results 6-10", montageB)
cv2.waitKey(0)

--query是我们将要query的图像的路径。然后载入我们的query image并显示出来。

使用与索引步骤中完全相同的bin数来实例化我们的RGBHistogram。然后，我们从查询图像中提取特征。

使用cPickle将我们的索引加载到磁盘上并执行搜索。最后显示我们的结果。

在query文件夹中有我们索引中没有的两张图片。这两个图像将是我们的查询。

执行我们的脚本：

python search_external.py --dataset images --index index.cpickle --query queries\rivendell-query.png

结果:

query: queries\rivendell-query.png
 1 . Rivendell-002.png : 0.195
 2 . Rivendell-004.png : 0.449
 3 . Rivendell-001.png : 0.643
 4 . Rivendell-005.png : 0.757
 5 . Rivendell-003.png : 0.769
 6 . Mordor-001.png : 0.809
 7 . Mordor-003.png : 0.858
 8 . Goblin-002.png : 0.875
 9 . Mordor-005.png : 0.894
 10 . Mordor-004.png : 0.909

觉得有用可以关注加收藏转发，完整代码和图集请私信我。

分享到:

閱讀更多 lovesLife 的文章

關鍵字: Google Python 图像

Python 63个内置函数

Python Turtle画分形树理解递归

python 内存管理

python 递归输出文件

Python 中的

python copy

Python—turtle画图（哆啦A梦）

python 协程

Python 绘图以及文件的基本操作

Python wordcloud库介绍

python 闭包

Python 判断列表是否已排好序

python：序列和元组的区别

Python While 循环语句介绍

03.04 Python While 循环语句介绍

03.01 Python 模块

python 注释

python pandas数据清洗

Python 中的bool值

python-unittest基本介绍

Python 分发包中添加额外文件

# Python 3 # Python 3字典Dictionary（2）

# Python 3 # Python 3字典Dictionary（1）

# Python 3 # Python 3运算符（4）

# Python 3 # Python 3基本数据类型（3）

12.21 python lambda表达式简单用法

python :中文大写转阿拉伯数字（金额）

python str和bytes的区别

Python 的四种共享传参详解

[PYTHON]，字符串的查找，什么时候能混到给钱不用找零了

说说在 Python 中如何导入类

[PYTHON]，字符串的大小写，大赌场小赌场大小赌场赌大小

[PYTHON]，字符串的类型判断，只听得惊堂木一拍

[PYTHON]，字符串转义字符，字符串变身

python 音频处理

python 可变对象和不可变对象

Python 程序运行时间计时

python 字典底层实现原理

06.20 Python 枚举类型 Enum

06.17 Python Lambda 表达式

06.17 Python 数据类型转换

06.16 Python 中的包 Packages

06.09 Python 正则表达式断言 Assertions

06.09 Python 异常处理

python-with语法

05.27 python-with语法

python-as语法

05.27 python-as语法

「python」高阶函数map、reduce的介绍

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"