【阿旭机器学习实战】【19】如何在不减少分辨率的情况下降低图片存储空间?K-Means算法进行图片颜色点分类存储

简介: 【阿旭机器学习实战】【19】如何在不减少分辨率的情况下降低图片存储空间?K-Means算法进行图片颜色点分类存储

前言


在如今的互联网时代,网络上充满了海量的数据,当然也包括很多图片。因此图像压缩技术对于压缩图像和减少存储空间变得至关重要。


本文我们将使用无监督学习算法K-means聚类算法通过对图片颜色点进行聚类的方式,达到降低图片存储空间的目的。


图像由称为像素的几个强度值组成。在彩色图像中, 每个像素为3个字节, 每个像素包含RGB(红-蓝-绿)值, 该值具有红色强度值, 然后是蓝色, 然后是绿色强度值。


具体方法如下:


  1. 使用K均值聚类算法将图片相似的颜色归为不同的” k”个聚类(例如k = 64),每个簇质心(RGB值)代表其各自簇的RGB颜色空间中的颜色矢量。


  1. 根据Kmeans算法找出图片上每个像素点对应的簇质心(RGB值)的标号值。


  1. 图片存储时,我们只需存储每个像素的标签编号, 并保留每个聚类中心的颜色向量的记录,根据编号及这个聚类中心颜色向量就可以告诉该像素所属的集群,即RGB值。


由上述存储方式可以看出,图片单个像素点的存储由RGB的3个字节,变为了只需存储一个标签编号的数字。存储空间只需原来的30%左右。


1. 加载图片及特征处理


from sklearn import datasets
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
# 加载图片
china = datasets.load_sample_image("china.jpg")
plt.imshow(china)

4fefea5c5511412b8403778c9858d375.png

china.dtype
• 1
dtype('uint8')
• 1
china.shape
• 1
(427, 640, 3)

# 除以255,将像素点的值变为0-1之间
china = china/255
• 1
• 2
h,w,d = china.shape
• 1
# 把像素点展开
img_array = china.reshape((h*w,d))

img_array.shape
• 1
(273280, 3)
# 把像素点随机打乱
from sklearn.utils import shuffle
img_array_shuffle = shuffle(img_array,random_state=0)
plt.imshow(img_array_shuffle.reshape((h,w,d)))

62dd45a2a3dc483cb81e0769a8583784.png

2. 进行KMeans聚类建模


from sklearn.cluster import KMeans
# 用64个聚类来划分这些像素点
km = KMeans(n_clusters=64,random_state=0)
# 仅用前1000个像素点进行模型训练
km.fit(img_array_shuffle[:1000])
KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
    n_clusters=64, n_init=10, n_jobs=1, precompute_distances='auto',
    random_state=0, tol=0.0001, verbose=0)
# 表示这1000个样本对应的聚类标签,展示前100个标签编号
km.labels_[:100]
array([22, 36,  8, 56, 38, 42, 22, 31,  7,  2, 55, 31, 62, 21, 52, 43, 31,
       18,  2,  4, 31, 56, 21,  2, 15,  5,  6, 49, 57, 13,  5, 21, 21,  3,
       21, 47, 21,  2, 47, 32,  5, 42,  5, 33, 45, 56,  5, 57,  2, 38, 47,
        6, 50, 50, 27, 62, 56, 57, 30, 28,  6,  5, 26, 24, 58, 44,  8, 21,
       58, 60, 10, 56, 31, 10, 41,  5, 62, 41, 22,  6, 38, 25, 57, 36, 28,
       21, 49,  2, 21, 48, 14, 15, 57, 22, 47, 63, 47,  2, 41, 34])
# # 用聚类中心点的颜色来代表这个聚类的颜色,展示前10个聚类中心
km.cluster_centers_[:10] 
array([[0.62570806, 0.60261438, 0.53028322],
       [0.15546218, 0.1557423 , 0.12829132],
       [0.82063983, 0.89896801, 0.98462332],
       [0.42039216, 0.43843137, 0.2227451 ],
       [0.69527105, 0.74994233, 0.76516724],
       [0.92174422, 0.9556336 , 0.99514194],
       [0.07058824, 0.0754637 , 0.0508744 ],
       [0.28205128, 0.26395173, 0.19638009],
       [0.46509804, 0.43372549, 0.36901961],
       [0.71328976, 0.41960784, 0.31851852]])


3. 使用算法对原始图片进行聚类


# 用km模型去对原图进行聚类
labels = km.predict(img_array)
• 1
• 2


创建一个函数用于重新合成图片


def recreate_img(centers,labels,h,w):
    # 行数的作用是将每个像素点的值,用对应编号的聚类中心代替
    # 按照h和w创建一个空白图片
    img = np.zeros((h,w,3))
    # 通过for循环,遍历img中每一个点,并且从labels中取出下标对应的聚类重新给img赋值
    label_index = 0
    for i in range(h):
        for j in range(w):
            img[i][j] = centers[labels[label_index]]
            label_index += 1
    return img


img_re = recreate_img(km.cluster_centers_, labels, h, w)
• 1


4. 展示原始图片与使用64个聚类中心聚类后的图片


plt.figure(figsize=(12,6))
axes1 = plt.subplot(121)
axes1.imshow(china)
axes1.set_title("Instaces")
axes2 = plt.subplot(122)
axes2.imshow(img_re)
axes2.set_title("64 colors,K-Means")


Text(0.5,1,'64 colors,K-Means')

50f907e27d4a4b91a6641f93c2149fb5.png

5. 图片存储方式


  1. 存储上面的图片每个像素点对应的聚类编号:labels, 形状为:(273280,)
  2. 存储每个聚类编号对应聚类中心RGB值:km.cluster_centers_。形状为:(64, 3)


依据以上labels与km.cluster_centers_,我们即可还原出聚类之后的图片。相对于原始数据存储量降低了60%以上。


相关文章
|
25天前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习、分类问题和逻辑回归的基本概念、步骤、特点以及多分类问题的处理方法
机器学习是人工智能的一个核心分支,它专注于开发算法,使计算机系统能够自动地从数据中学习并改进其性能,而无需进行明确的编程。这些算法能够识别数据中的模式,并利用这些模式来做出预测或决策。机器学习的主要应用领域包括自然语言处理、计算机视觉、推荐系统、金融预测、医疗诊断等。
19 1
|
1月前
|
机器学习/深度学习 算法
【机器学习】简单解释贝叶斯公式和朴素贝叶斯分类?(面试回答)
简要解释了贝叶斯公式及其在朴素贝叶斯分类算法中的应用,包括算法的基本原理和步骤。
51 1
|
21天前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
如何用贝叶斯方法来解决机器学习中的分类问题?
|
26天前
|
存储 缓存 算法
深入解析B树:数据结构、存储结构与算法优势
深入解析B树:数据结构、存储结构与算法优势
|
26天前
|
存储 算法
【数据结构与算法】队列(顺序存储)
【数据结构与算法】队列(顺序存储)
10 0
|
1月前
|
机器学习/深度学习 数据采集 自然语言处理
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4 机器学习LGB 方案
在讯飞英文学术论文分类挑战赛中使用LightGBM模型进行文本分类的方案,包括数据预处理、特征提取、模型训练及多折交叉验证等步骤,并提供了相关的代码实现。
23 0
|
3月前
|
存储 算法 Java
Java查找算法概览:二分查找适用于有序数组,通过比较中间元素缩小搜索范围;哈希查找利用哈希函数快速定位,示例中使用HashMap存储键值对,支持多值关联。
【6月更文挑战第21天】Java查找算法概览:二分查找适用于有序数组,通过比较中间元素缩小搜索范围;哈希查找利用哈希函数快速定位,示例中使用HashMap存储键值对,支持多值关联。简单哈希表实现未涵盖冲突解决和删除操作。
33 1
|
3月前
|
机器学习/深度学习 分布式计算 算法
在机器学习项目中,选择算法涉及问题类型识别(如回归、分类、聚类、强化学习)
【6月更文挑战第28天】在机器学习项目中,选择算法涉及问题类型识别(如回归、分类、聚类、强化学习)、数据规模与特性(大数据可能适合分布式算法或深度学习)、性能需求(准确性、速度、可解释性)、资源限制(计算与内存)、领域知识应用以及实验验证(交叉验证、模型比较)。迭代过程包括数据探索、模型构建、评估和优化,结合业务需求进行决策。
41 0
|
3月前
|
存储 算法 Java
Java数据结构与算法:用于高效地存储和检索字符串数据集
Java数据结构与算法:用于高效地存储和检索字符串数据集
|
3月前
|
机器学习/深度学习 数据采集 自然语言处理
【机器学习】逻辑回归:智能垃圾邮件分类实例
【机器学习】逻辑回归:智能垃圾邮件分类实例
122 0