K均值算法——应用

1. 应用K-means算法进行图片压缩

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

K均值算法——应用

 

 

K均值算法——应用

 

 

K均值算法——应用

 

 代码如下

from sklearn.datasets import load_sample_image
from matplotlib import pyplot as plt
from sklearn.cluster import KMeans
import numpy as np
import sys

#读取sklearn.datasets里的图片china.jpg
china = load_sample_image('china.jpg')

#观察图片的大小和内存
print("图片原大小:",china.size)
print("图片原内存:",sys.getsizeof(china))

#根据图片的分辨率,可适当降低分辨率
image=china[::5,::5] #降低分辨率
x=image.reshape(-1,3) #生成行数未知,列数为3

#将图片中所有的颜色值做聚类,然后获取每个像素的颜色类别,每个类别的颜色。
n_colors=64
model=KMeans(n_colors)
labels=model.fit_predict(x) #每个点颜色分类,训练x
colors=model.cluster_centers_#找聚类点
new_img=colors[labels].reshape(image.shape)

#新图片的大小和内存
print("新图片大小:",new_img.size)
print("新图片内存:",sys.getsizeof(new_img))

#新的图片
plt.imshow(new_img.astype(np.uint8))
plt.show()

 

 

2. 观察学习与生活中可以用K均值解决的问题。

从数据-模型训练-测试-预测完整地完成一个应用案例。

这个案例会作为课程成果之一,单独进行评分。

上一篇:docker 从入门到自动化构建 PHP 环境 | Laravel China 社区


下一篇:开源方案搭建可离线的精美矢量切片地图服务-5.Mapbox离线项目实现