业务背景
从去年年底开始,我们团队一直在做一款能够给电商商品自动拍照的智能硬件。拍完照后,会将商品的套图在电商平台上进行展示。
对于要展示的商品图片而言,我们对图片本身的质量要求会比较高,例如不能将模糊不清的图片进行展示。因此,需要一种图像模糊检测的方法,便于我们筛选出可用的图片。
我们使用基于 Laplacian 的算法来检测图片是否模糊。调用它比较简单,因为 OpenCV 内置了 Laplacian 函数。
Laplacian 算子
求多元函数的二阶导数的映射被称为 Laplacian 算子,它相当于二阶 Sobel 算子的导数。
Laplacian 算子的定义:
Laplacian 算子
我们分别对 Laplace 算子 x,y 两个方向的二阶导数进行差分就得到了离散函数的 Laplace 算子。
以 x 方向为例:
一阶差分:f'(x) = f(x) - f(x - 1)
二阶差分:f''(x) = f'(x+1) - f'(x) = (f(x + 1) - f(x)) - (f(x) - f(x - 1))
化简后:f''(x) = f(x - 1) - 2 f(x)) + f(x + 1)
提取前面的系数:[1, -2, 1]
同理,可得 y 方向的系数[1,-2,1]
叠加起来就得到了拉普拉斯矩阵
拉普拉斯矩阵
也就是拉普拉斯 3x3 卷积核。
图像模糊检测算法
算法的主要思想:先将图像转换成灰度图像,然后单一通道的灰度图像经过刚才计算出来的拉普拉斯 3x3 卷积核计算后会得到一个响应图,最后再计算这个响应图的方差。
基于该方差和按照经验设定的阈值进行比较,就可以判断图像是否模糊。对于同一种类型的商品图片,可以采用同一个阈值。不同的商品、不同环境拍摄的图片可能需要调整阈值。
bool isImageBlurry(cv::Mat& img, double threshold) { cv::Mat matImageGray; cv::cvtColor(img, matImageGray, COLOR_BGR2GRAY); cv::Mat dst, abs_dst; cv::Laplacian(matImageGray, dst, CV_16S, 3); cv::convertScaleAbs( dst, abs_dst ); cv::Mat tmp_m, tmp_sd; double sd = 0; cv::meanStdDev(dst, tmp_m, tmp_sd); sd = tmp_sd.at<double>(0,0); // 方差 return ((sd * sd) <= threshold); }
找一张模糊的图片,写一个简单的例子进行测试
test.jpeg
using namespace std; using namespace cv; bool isImageBlurry(cv::Mat& img, double threshold=49.0); int main(int argc,char *argv[]) { String imageName; cout << "Enter the image file name: " << endl; cin >> imageName; // read the image Mat image = imread(imageName); double time = (double)getTickCount(); bool result = isImageBlurry(image); time = ((double)getTickCount() - time) / getTickFrequency(); cout << "所用时间为:" << time << "s" << endl; cout << "result:" << result << endl; return 0; } bool isImageBlurry(cv::Mat& img, double threshold) { cv::Mat matImageGray; cv::cvtColor(img, matImageGray, COLOR_BGR2GRAY); cv::Mat dst, abs_dst; cv::Laplacian(matImageGray, dst, CV_16S, 3); cv::convertScaleAbs( dst, abs_dst ); cv::Mat tmp_m, tmp_sd; double m = 0, sd = 0; cv::meanStdDev(dst, tmp_m, tmp_sd); m = tmp_m.at<double>(0,0); sd = tmp_sd.at<double>(0,0); std::cout << "sd * sd: " << sd * sd << std::endl; return ((sd * sd) <= threshold); }
执行结果:
Enter the image file name: test.jpeg sd * sd: 31.0646 所用时间为:0.0219034s result:1
可以通过上述程序判断出该图片是模糊的。
最后,我们团队主要使用的语言是 Java/Kotlin,还需要编写一个 jni 来调用该函数。
总结
在无参考图像的情况下,Laplacian 是一种常见的图像模糊检测的方式。除此之外,还可以采用 Brenner、Tenengrad、SMD、SMD2 等等。