《OpenCV3计算机视觉》 - Python语言实现（原书第2版）

python OpenCV 图片相似度 5种算法

2020-05-17 14:19 技巧评论 0 更多详情

5种算法
值哈希算法、差值哈希算法和感知哈希算法都是值越小，相似度越高，取值为0-64，即汉明距离中，64位的hash值有多少不同。三直方图和单通道直方图的值为0-1，值越大，相似度越高。

import cv2
import numpy as np
from PIL import Image
import requests
from io import BytesIO
import matplotlib
matplotlib.use('TkAgg')
import matplotlib.pyplot as plt

def aHash(img):
# 均值哈希算法
# 缩放为8*8
img = cv2.resize(img, (8, 8))
# 转换为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# s为像素和初值为0，hash_str为hash值初值为''
s = 0
hash_str = ''
# 遍历累加求像素和
for i in range(8):
for j in range(8):
s = s+gray[i, j]
# 求平均灰度
avg = s/64
# 灰度大于平均值为1相反为0生成图片的hash值
for i in range(8):
for j in range(8):
if gray[i, j] > avg:
hash_str = hash_str+'1'
else:
hash_str = hash_str+'0'
return hash_str

def dHash(img):
# 差值哈希算法
# 缩放8*8
img = cv2.resize(img, (9, 8))
# 转换灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
hash_str = ''
# 每行前一个像素大于后一个像素为1，相反为0，生成哈希
for i in range(8):
for j in range(8):
if gray[i, j] > gray[i, j+1]:
hash_str = hash_str+'1'
else:
hash_str = hash_str+'0'
return hash_str

def pHash(img):
# 感知哈希算法
# 缩放32*32
img = cv2.resize(img, (32, 32)) # , interpolation=cv2.INTER_CUBIC

# 转换为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 将灰度图转为浮点型，再进行dct变换
dct = cv2.dct(np.float32(gray))
# opencv实现的掩码操作
dct_roi = dct[0:8, 0:8]

hash = []
avreage = np.mean(dct_roi)
for i in range(dct_roi.shape[0]):
for j in range(dct_roi.shape[1]):
if dct_roi[i, j] > avreage:
hash.append(1)
else:
hash.append(0)
return hash

def calculate(image1, image2):
# 灰度直方图算法
# 计算单通道的直方图的相似值
hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
# 计算直方图的重合度
degree = 0
for i in range(len(hist1)):
if hist1[i] != hist2[i]:
degree = degree + \
(1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
else:
degree = degree + 1
degree = degree / len(hist1)
return degree

def classify_hist_with_split(image1, image2, size=(256, 256)):
# RGB每个通道的直方图相似度
# 将图像resize后，分离为RGB三个通道，再计算每个通道的相似值
image1 = cv2.resize(image1, size)
image2 = cv2.resize(image2, size)
sub_image1 = cv2.split(image1)
sub_image2 = cv2.split(image2)
sub_data = 0
for im1, im2 in zip(sub_image1, sub_image2):
sub_data += calculate(im1, im2)
sub_data = sub_data / 3
return sub_data

def cmpHash(hash1, hash2):
# Hash值对比
# 算法中1和0顺序组合起来的即是图片的指纹hash。顺序不固定，但是比较的时候必须是相同的顺序。
# 对比两幅图的指纹，计算汉明距离，即两个64位的hash值有多少是不一样的，不同的位数越小，图片越相似
# 汉明距离：一组二进制数据变成另一组数据所需要的步骤，可以衡量两图的差异，汉明距离越小，则相似度越高。汉明距离为0，即两张图片完全一样
n = 0
# hash长度不同则返回-1代表传参出错
if len(hash1) != len(hash2):
return -1
# 遍历判断
for i in range(len(hash1)):
# 不相等则n计数+1，n最终为相似度
if hash1[i] != hash2[i]:
n = n + 1
return n

def getImageByUrl(url):
# 根据图片url 获取图片对象
html = requests.get(url, verify=False)
image = Image.open(BytesIO(html.content))
return image

def PILImageToCV():
# PIL Image转换成OpenCV格式
path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"
img = Image.open(path)
plt.subplot(121)
plt.imshow(img)
print(isinstance(img, np.ndarray))
img = cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)
print(isinstance(img, np.ndarray))
plt.subplot(122)
plt.imshow(img)
plt.show()

def CVImageToPIL():
# OpenCV图片转换为PIL image
path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"
img = cv2.imread(path)
# cv2.imshow("OpenCV",img)
plt.subplot(121)
plt.imshow(img)

img2 = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.subplot(122)
plt.imshow(img2)
plt.show()

def bytes_to_cvimage(filebytes):
# 图片字节流转换为cv image
image = Image.open(filebytes)
img = cv2.cvtColor(np.asarray(image), cv2.COLOR_RGB2BGR)
return img

def runAllImageSimilaryFun(para1, para2):
# 均值、差值、感知哈希算法三种算法值越小，则越相似,相同图片值为0
# 三直方图算法和单通道的直方图 0-1之间，值越大，越相似。相同图片为1

# t1,t2 14;19;10; 0.70;0.75
# t1,t3 39 33 18 0.58 0.49
# s1,s2 7 23 11 0.83 0.86 挺相似的图片
# c1,c2 11 29 17 0.30 0.31

if para1.startswith("http"):
# 根据链接下载图片，并转换为opencv格式
img1 = getImageByUrl(para1)
img1 = cv2.cvtColor(np.asarray(img1), cv2.COLOR_RGB2BGR)

img2 = getImageByUrl(para2)
img2 = cv2.cvtColor(np.asarray(img2), cv2.COLOR_RGB2BGR)
else:
# 通过imread方法直接读取物理路径
img1 = cv2.imread(para1)
img2 = cv2.imread(para2)

hash1 = aHash(img1)
hash2 = aHash(img2)
n1 = cmpHash(hash1, hash2)
print('均值哈希算法相似度aHash：', n1)

hash1 = dHash(img1)
hash2 = dHash(img2)
n2 = cmpHash(hash1, hash2)
print('差值哈希算法相似度dHash：', n2)

hash1 = pHash(img1)
hash2 = pHash(img2)
n3 = cmpHash(hash1, hash2)
print('感知哈希算法相似度pHash：', n3)

n4 = classify_hist_with_split(img1, img2)
print('三直方图算法相似度：', n4)

n5 = calculate(img1, img2)
print("单通道的直方图", n5)
print("%d %d %d %.2f %.2f " % (n1, n2, n3, round(n4[0], 2), n5[0]))
print("%.2f %.2f %.2f %.2f %.2f " % (1-float(n1/64), 1 -
float(n2/64), 1-float(n3/64), round(n4[0], 2), n5[0]))

plt.subplot(121)
plt.imshow(Image.fromarray(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB)))
plt.subplot(122)
plt.imshow(Image.fromarray(cv2.cvtColor(img2, cv2.COLOR_BGR2RGB)))
plt.show()

if __name__ == "__main__":
p1="https://ww3.sinaimg.cn/bmiddle/007INInDly1g336j2zziwj30su0g848w.jpg"
p2="https://ww2.sinaimg.cn/bmiddle/007INInDly1g336j10d32j30vd0hnam6.jpg"
runAllImageSimilaryFun(p1,p2)

............

Python&OpenCV轮廓检测及cv2.threshold，cv2.findContours，cv2.cvtColor，cv2.drawContours函数

2020-05-09 20:27 方法评论 0 更多详情

对与轮廓检测就是cv2.threshold，cv2.findContours，cv2.cvtColor，cv2.drawContours这几个函数的调用。下面就是代码及对这几个函数的解释：

import cv2
import numpy as np
img = np.zeros((200,200),dtype = np.uint8 )#构造一个两百行两两百列的矩阵
img[50:150,50:150]= 225 #把50到150行和50到150列赋值为225
# cv2.imshow('img',img)
# cv2.waitKey()
ret ,thresh = cv2.threshold('img',127,255,0)#选取一个全局阈值，然后就把整幅图像分成了非黑即白的二值图像
'''
cv2.threshold() 函数解释
这个函数有四个参数，第一个原图像，第二个进行分类的阈值，第三个是高于（低于）阈值时赋予的新值，第四个是一个方法选择参数，常用的有：
• cv2.THRESH_BINARY（黑白二值）
• cv2.THRESH_BINARY_INV（黑白二值反转）
• cv2.THRESH_TRUNC （得到的图像为多像素值）
• cv2.THRESH_TOZERO
• cv2.THRESH_TOZERO_INV
该函数有两个返回值，第一个retVal（得到的阈值值（在后面一个方法中会用到）），第二个就是阈值化后的图像。
'''
image,contours ,hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
'''
cv2.threshold函数的解释
参数
第一个参数是寻找轮廓的图像；
第二个参数表示轮廓的检索模式，有四种（本文介绍的都是新的cv2接口）：
cv2.RETR_EXTERNAL表示只检测外轮廓
cv2.RETR_LIST检测的轮廓不建立等级关系
cv2.RETR_CCOMP建立两个等级的轮廓，上面的一层为外边界，里面的一层为内孔的边界信息。如果内孔内还有一个连通物体，这个物体的边界也在顶层。
cv2.RETR_TREE建立一个等级树结构的轮廓。
第三个参数method为轮廓的近似办法
cv2.CHAIN_APPROX_NONE存储所有的轮廓点，相邻的两个点的像素位置差不超过1，即max（abs（x1-x2），abs（y2-y1））==1
cv2.CHAIN_APPROX_SIMPLE压缩水平方向，垂直方向，对角线方向的元素，只保留该方向的终点坐标，例如一个矩形轮廓只需4个点来保存轮廓信息
cv2.CHAIN_APPROX_TC89_L1，CV_CHAIN_APPROX_TC89_KCOS使用teh-Chinl chain 近似算法
返回值
cv2.findContours()函数返回两个值，一个是轮廓本身，还有一个是每条轮廓对应的属性。'''
color =cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)#将灰度图像转化成BGR图像
'''
cvCvtColor(...)，是Opencv里的颜色空间转换函数，可以实现RGB颜色向HSV,HSI等颜色空间的转换，也可以转换为灰度图像。
参数CV_RGB2GRAY是RGB到gray。
参数 CV_GRAY2RGB是gray到RGB。
'''
img = cv2.drawContours(color,contours,-1,(0,255,0),2)#主要用于画出图像的轮廓
'''
cv2.drawContours的参数解释(此例只用了前五个)
其中第一个参数image表示目标图像，
第二个参数contours表示输入的轮廓组，每一组轮廓由点vector构成，
第三个参数contourIdx指明画第几个轮廓，如果该参数为负值，则画全部轮廓，
第四个参数color为轮廓的颜色，
第五个参数thickness为轮廓的线宽，如果为负值或CV_FILLED表示填充轮廓内部，
第六个参数lineType为线型，
第七个参数为轮廓结构信息，
第八个参数为maxLevel
'''
cv2.imshow('contours',color)
cv2.waitKey()
cv2.destroyAllWindows()

............

cv2.applyColorMap

2020-04-28 12:30 方法评论 0 更多详情

用途
在图像处理中，伪色彩用途广泛。在OpenCV库中，常见的伪色彩模式都可通过 cv2.applyColorMap(src, userColor[, dst]) 直接调用，很是方便快捷。

cv2.applyColorMap(src, userColor[, dst])

COLORMAP_AUTUMN = 0,
COLORMAP_BONE = 1,
COLORMAP_JET = 2,
COLORMAP_WINTER = 3,
COLORMAP_RAINBOW = 4,
COLORMAP_OCEAN = 5,
COLORMAP_SUMMER = 6,
COLORMAP_SPRING = 7,
COLORMAP_COOL = 8,
COLORMAP_HSV = 9,
COLORMAP_PINK = 10,
COLORMAP_HOT = 11

............

提取图片中的指定颜色

2020-04-28 12:10 技巧评论 0 更多详情

我们的目标是提取下面这张图片的白色区块

最终结果如下：

import cv2
import numpy as np
import matplotlib.pyplot as plt
img = cv2.imread("/home/judson/图片/pic/src/左上角/18.jpg")
img1 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#转到HSV
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
# print(hsv)
#设置阈值
l_blue = np.array([[0, 0, 110]])
h_blue = np.array([221, 40, 255])
#构建掩模
mask = cv2.inRange(hsv, l_blue, h_blue)
#进行位运算
res = cv2.bitwise_and(img, img, mask = mask)
plt.figure(1)
plt.imshow(img1)
plt.show()
plt.imshow(mask)
plt.show()
plt.imshow(res)
plt.show()
其中颜色取值范围可以参考下表：

............

cv2.bitwise_and

2020-04-28 11:25 方法评论 0 更多详情

cv2.bitwise_and()是对二进制数据进行“与”操作，即对图像（灰度图像或彩色图像均可）每个像素值进行二进制“与”操作，1&1=1，1&0=0，0&1=0，0&0=0

OutputArray dst = cv2.bitwise_and(InputArray src1, InputArray src2, InputArray mask=noArray());
//dst = src1 & src2

利用掩膜（mask）进行“与”操作，即掩膜图像白色区域是对需要处理图像像素的保留，黑色区域是对需要处理图像像素的剔除，其余按位操作原理类似只是效果不同而已。

............

cv2.inRange

2020-04-28 11:20 方法评论 0 更多详情

hsv = cv2.cvtColor(rgb_image, cv2.COLOR_BGR2HSV)
功能：按hsv颜色取颜色区域
参数有三个：
第一个参数：hsv指的是原图
第二个参数：lower_red指的是图像中低于这个lower_red的值，图像值变为0
第三个参数：upper_red指的是图像中高于这个upper_red的值，图像值变为0

............

HSV

2020-04-28 11:13 概念评论 0 更多详情

HSV颜色模型：HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。
这个模型中颜色的参数分别是：色调（H），饱和度（S），明度（V）。
颜色模型编辑

色调H
用角度度量，取值范围为0°～360°，从红色开始按逆时针方向计算，红色为0°，绿色为120°,蓝色为240°。它们的补色是：黄色为60°，青色为180°,紫色为300°；
饱和度S
饱和度S表示颜色接近光谱色的程度。一种颜色，可以看成是某种光谱色与白色混合的结果。其中光谱色所占的比例愈大，颜色接近光谱色的程度就愈高，颜色的饱和度也就愈高。饱和度高，颜色则深而艳。光谱色的白光成分为0，饱和度达到最高。通常取值范围为0%～100%，值越大，颜色越饱和。
明度V
明度表示颜色明亮的程度，对于光源色，明度值与发光体的光亮度有关；对于物体色，此值和物体的透射比或反射比有关。通常取值范围为0%（黑）到100%（白）。
RGB和CMY颜色模型都是面向硬件的，而HSV（Hue Saturation Value）颜色模型是面向用户的。
HSV模型的三维表示从RGB立方体演化而来。设想从RGB沿立方体对角线的白色顶点向黑色顶点观察，就可以看到立方体的六边形外形。六边形边界表示色彩，水平轴表示纯度，明度沿垂直轴测量。

............

CV.ml 机器学习算法

2019-07-24 18:32 算法评论 0 更多详情

cv2.ml.svm---------------------支持向量机
cv2.ml.knn---------------------K.近邻
cv2.ml.bayesian----------------正态贝叶斯分类器
cv2.ml.em----------------------期望最大化
cv2.ml.boost.tree--------------boost分类器
cv2.ml.tree--------------------决策树分类器
cv2.ml.ann.mlp-----------------感知器神经网络分类器
cv2.ml.cnn---------------------卷积神经网络
cv2.ml.random.trees-----------------随机树分类器
cv2.ml.extremely.randomized.trees---随机森林分类器
cv2.ml.gradient.boosting.trees------梯度boost分类器

............

反向传播

2019-07-24 18:27 概念评论 0 更多详情

反向传播（英语：Backpropagation，缩写为BP）是“误差反向传播”的简称，是一种与最优化方法（如梯度下降法）结合使用的，用来训练人工神经网络的常见方法。该方法对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法，用来更新权值以最小化损失函数。
反向传播要求有对每个输入值想得到的已知输出，来计算损失函数梯度。

............

cv2.getStructuringElement

2019-07-10 21:27 方法评论 0 更多详情

cv2.getStructuringElement( ) 返回指定形状和尺寸的结构元素。
这个函数的第一个参数表示内核的形状，有三种形状可以选择。
矩形：MORPH_RECT;
交叉形：MORPH_CROSS;
椭圆形：MORPH_ELLIPSE;
第二和第三个参数分别是内核的尺寸以及锚点的位置。一般在调用erode以及dilate函数之前，先定义一个Mat类型的变量来获得 getStructuringElement函数的返回值: 对于锚点的位置，有默认值Point（-1,-1），表示锚点位于中心点。element形状唯一依赖锚点位置，其他情况下，锚点只是影响了形态学运算结果的偏移。
代码： kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))

............

cv2.xfeatures2d.SURF_create

2019-07-02 18:30 方法评论 0 更多详情

static Ptr cv::xfeatures2d::SURF::create ( double hessianThreshold = 100, int nOctaves = 4, int nOctaveLayers = 3, bool extended = false, bool upright = false )
参数：
hessianThreshold Threshold for hessian keypoint detector used in SURF.
nOctaves Number of pyramid octaves the keypoint detector will use.
nOctaveLayers Number of octave layers within each octave.
extended Extended descriptor flag (true - use extended 128-element descriptors; false - use 64-element descriptors).
upright Up-right or rotated features flag (true - do not compute orientation of features; false - compute orientation).

............

svm.predict

2019-06-14 18:04 方法评论 0 更多详情

predict(samples[,results[,flags]]) 检测样本
参数：
samples：样本矩阵
results：结果 flags：

............

svm.train

2019-06-14 17:56 方法评论 0 更多详情

train(trainData, flags=None): 训练模型
参数：
trainData：训练数据

............

cv2.resize

2019-06-14 15:27 方法评论 0 更多详情

cv2.resize(InputArray src, OutputArray dst, Size, fx, fy, interpolation)
参数解释：
InputArray src 输入图片
OutputArray dst 输出图片
Size 输出图片尺寸
fx, fy 沿x轴，y轴的缩放系数
interpolation 插入方式 interpolation 选项所用的插值方法： INTER_NEAREST 最近邻插值 INTER_LINEAR 双线性插值（默认设置） INTER_AREA 使用像素区域关系进行重采样。 INTER_CUBIC 4x4像素邻域的双三次插值 INTER_LANCZOS4 8x8像素邻域的Lanczos插值

............

sklearn.make_classification

2019-06-11 21:05 方法评论 0 更多详情

make_classification(n_samples=100, n_features=20, n_informative=2, n_redundant=2, n_repeated=0, n_classes=2, n_clusters_per_class=2, weights=None, flip_y=0.01, class_sep=1.0, hypercube=True, shift=0.0, scale=1.0, shuffle=True, random_state=None):
参数：

n_features :特征个数= n_informative（） + n_redundant + n_repeated

n_informative：多信息特征的个数

n_redundant：冗余信息，informative特征的随机线性组合

n_repeated ：重复信息，随机提取n_informative和n_redundant 特征

n_classes：分类类别

n_clusters_per_class ：某一个类别是由几个cluster构成的

weights:列表类型，权重比

class_sep:乘以超立方体大小的因子。较大的值分散了簇/类，并使分类任务更容易。默认为1

random_state: 如果是int，random_state是随机数发生器使用的种子; 如果RandomState实例，random_state是随机数生成器; 如果没有，则随机数生成器是np.random使用的RandomState实例。
返回值：

X：形状数组[n_samples，n_features] 生成的样本。

y：形状数组[n_samples] 每个样本的类成员的整数标签。

............

cv2.xfeatures2d_SIFT.compute

2019-06-11 14:34 方法评论 0 更多详情

compute(self, image, keypoints, descriptors=None) 计算特征描述符
args:
image：输入图像
keypoints：图像的关键点集合
return:
特征点，特征描述符元组

............

cv2.xfeatures2d_SIFT.detect

2019-06-11 14:01 方法评论 0 更多详情

detect(self, image, mask=None)
检查图片中的关键点

............

cv2.drawKeypoints

2019-06-11 13:39 方法评论 0 更多详情

drawKeypoints(image, keypoints, outImage, color=None, flags=None)

image:也就是原始图片

keypoints：从原图中获得的关键点，这也是画图时所用到的数据

outputimage：输出 color：颜色设置，通过修改（b,g,r）的值,更改画笔的颜色，b=蓝色，g=绿色，r=红色。

flags：绘图功能的标识设置flags的四个参数：

   cv2.DRAW_MATCHES_FLAGS_DEFAULT：创建输出图像矩阵，使用现存的输出图像绘制匹配对和特征点，对每一个关键点只绘制中间点

   cv2.DRAW_MATCHES_FLAGS_DRAW_OVER_OUTIMG：不创建输出图像矩阵，而是在输出图像上绘制匹配对

   cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS：对每一个特征点绘制带大小和方向的关键点图形

   cv2.DRAW_MATCHES_FLAGS_NOT_DRAW_SINGLE_POINTS：单点的特征点不被绘制

............

cv2.cornerHarris

2019-06-11 13:33 方法评论 0 更多详情

cv2.cornerHarris(src, blockSize, ksize, k, dst=None, borderType=None)

   src：数据类型为 float32 的输入图像

   blockSize：角点检测中考虑的区域大小

   ksize：Sobel求导中使用的窗口大小

   k：Harris 角点检测方程中的自由参数，取值参数为 [0.04 0.06]

   dst：输出图像

   borderType：边界的类型

............

cv2.BOWKMeansTrainer

2019-06-10 21:03 方法评论 0 更多详情

# 创建BOW训练器，指定k-means参数k 把处理好的特征数据全部合并，利用聚类把特征词分为若干类，此若干类的数目由自己设定，每一类相当于一个视觉词汇

............

cv2.FlannBasedMatcher

2019-06-07 22:03 方法评论 0 更多详情

FLANN英文全称Fast Libary for Approximate Nearest Neighbors，FLANN是一个执行最近邻搜索的库，官方网站http://www.cs.ubc.ca/research/flann。

它包含一组算法，这些算法针对大型数据集中的快速最近邻搜索和高维特征进行了优化，对于大型数据集，它比BFMatcher工作得更快。经验证、FLANN比其他的最近邻搜索软件快10倍。

flann = cv2.FlannBasedMatcher(indexParams,searchParams)

其中FLANN匹配对象接收两个参数：indexParams和searchParams。这两个参数在python中以字典形式进行参数传递(在C++中以结构体形式进行参数传递)，为了计算匹配，FALNN内部会决定如何处理索引和搜索对象。

1、indexParams 对于像SIFT，SURF等算法，您可以传递以下内容： indexParams = dict(algorithm = FLANN_INDEX_KDTREE,trees = 5) 参数algorithm用来指定匹配所使用的算法，可以选择的有LinearIndex、KTreeIndex、KMeansIndex、CompositeIndex和AutotuneIndex，这里选择的是KTreeIndex(使用kd树实现最近邻搜索)。KTreeIndex配置索引很简单(只需要指定待处理核密度树的数量，最理想的数量在1~16之间)，并且KTreeIndex非常灵活(kd-trees可被并行处理)。

2、searchParams SearchParams它指定索引数倍遍历的次数。值越高，精度越高，但也需要更多时间。如果要更改该值，请传递：searchParams = dict(checks = 50) 实际上、匹配效果很大程度上取决于输入。5 kd-trees和50 checks总能取得具有合理精度的结果，而且能够在很短的时间内完成匹配。

............

flann

2019-05-28 18:53 算法评论 0 更多详情

FLANN是快速最近邻搜索包（Fast_Library_for_Approximate_Nearest_Neighbors）的简称。它是一个对大数据集和高维特征进行最近邻搜索的算法的集合，而且这些算法都已经被优化过了。在面对大数据集是它的效果要好于BFMatcher。

............

生成器

2019-05-19 18:29 概念评论 0 更多详情

在 Python 中，使用了 yield 的函数被称为生成器（generator）。
跟普通函数不同的是，生成器是一个返回迭代器的函数，只能用于迭代操作，更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中，每次遇到 yield 时函数会暂停并保存当前所有的运行信息，返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。

............

代码DEMO

2019-05-18 14:20 代码评论 0 更多详情

opencv计算机视觉学习笔记

............

cv2.imread

2019-05-03 19:01 方法评论 0 更多详情

使用函数cv2.imread() 读入图像。这幅图像应该在此程序的工作路径，或者给函数提供完整路径，第二个参数是要告诉函数应该如何读取这幅图片。

............

骑车数据集（图片）

2019-05-01 19:52 资源评论 0 更多详情

............

SURF（Speeded-Up Robust Features）

2019-05-01 18:19 算法评论 0 更多详情

SURF算法采用快速Hessian算法检测关键点，而SURF算子会通过一个特征向量来描述关键点周围区域的情况。这和SIFT算法很像，SIFT算法分别采用DoG和SIFT算子来检测关键点和提取关键点的描述符。
SURF特征检测的步骤：
1.尺度空间的极值检测：搜索所有尺度空间上的图像，通过Hessian来识别潜在的对尺度和选择不变的兴趣点。
2.特征点过滤并进行精确定位。
3.特征方向赋值：统计特征点圆形邻域内的Harr小波特征。即在60度扇形内，每次将60度扇形区域旋转0.2弧度进行统计，将值最大的那个扇形的方向作为该特征点的主方向。
4.特征点描述：沿着特征点主方向周围的邻域内，取4×4个矩形小区域，统计每个小区域的Haar特征，然后每个区域得到一个4维的特征向量。一个特征点共有64维的特征向量作为SURF特征的描述子。

............

SIFT

2019-04-29 18:43 算法评论 0 更多详情

尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种电脑视觉的算法用来侦测与描述影像中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。

............

支持向量机-SVM

2019-04-29 10:42 概念评论 0 更多详情

支持向量机（英语：support vector machine，常简称为SVM，又名支持向量网络）是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点，这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后，将新的实例映射到同一空间，并基于它们落在间隔的哪一侧来预测所属类别。

............

方向梯度直方图-HOG

2019-04-29 10:04 概念评论 0 更多详情

方向梯度直方图（英语：Histogram of oriented gradient，简称HOG）是应用在计算机视觉和图像处理领域，用于目标检测的特征描述器。这项技术是用来计算局部图像梯度的方向信息的统计值。这种方法跟边缘方向直方图（edge orientation histograms）、尺度不变特征变换（scale-invariant feature transform descriptors）以及形状上下文方法（ shape contexts）有很多相似之处，但与它们的不同点是：HOG描述器是在一个网格密集的大小统一的细胞单元（dense grid of uniformly spaced cells）上计算，而且为了提高性能，还采用了重叠的局部对比度归一化（overlapping local contrast normalization）技术。

............

词袋-BOW

2019-04-26 14:13 概念评论 0 更多详情

BoW使用一组无序的单词(words)来表达一段文字或一个文档。

............

支持向量机-SVM

2019-04-25 14:33 概念评论 0 更多详情

支持向量机（support vector machines）是一种二分类模型，它的目的是寻找一个超平面来对样本进行分割，分割的原则是间隔最大化，最终转化为一个凸二次规划问题来求解。由简至繁的模型包括：

............

图像金字塔

2019-04-25 13:59 概念评论 0 更多详情

图像金字塔是一种以多分辨率来解释图像的结构，通过对原始图像进行多尺度像素采样的方式，生成N个不同分辨率的图像。把具有最高级别分辨率的图像放在底部，以金字塔形状排列，往上是一系列像素（尺寸）逐渐降低的图像，一直到金字塔的顶部只包含一个像素点的图像，这就构成了传统意义上的图像金字塔。

............

非极大值抑制

2019-04-25 12:32 概念评论 0 更多详情

非极大值抑制（Non-Maximum Suppression，NMS），顾名思义就是抑制不是极大值的元素，可以理解为局部最大搜索。这个局部代表的是一个邻域，邻域有两个参数可变，一是邻域的维数，二是邻域的大小。

............

笔记关键词检索?

《OpenCV3计算机视觉》 ── Python语言实现（原书第2版）

python OpenCV 图片相似度 5种算法

Python&OpenCV轮廓检测及cv2.threshold，cv2.findContours，cv2.cvtColor，cv2.drawContours函数

cv2.applyColorMap

提取图片中的指定颜色

cv2.bitwise_and

cv2.inRange

HSV

CV.ml 机器学习算法

反向传播

cv2.getStructuringElement

cv2.xfeatures2d.SURF_create

svm.predict

svm.train

cv2.resize

sklearn.make_classification

cv2.xfeatures2d_SIFT.compute

cv2.xfeatures2d_SIFT.detect

cv2.drawKeypoints

cv2.cornerHarris

cv2.BOWKMeansTrainer

cv2.FlannBasedMatcher

flann

生成器

代码DEMO

cv2.imread

骑车数据集（图片）

SURF（Speeded-Up Robust Features）

SIFT

支持向量机-SVM

方向梯度直方图-HOG

词袋-BOW

支持向量机-SVM

图像金字塔

非极大值抑制