字符画是什么?
字符画是一系列字符的组合,我们可以把字符看作是比较大块的像素,一个字符能表现一种颜色,字符的种类越多,可以表现的颜色也越多,图片也会更有层次感。 如果我们想要手工绘制出字符画,首先要有扎实的美术基础,其次还要花费大量的时间和精力。但是我们可以使用Python,只需要几行代码,就能够将一张图片轻而易举地转化为一个字符画。
那么我们能将一张图片转化为一个字符画,我们能否将一个视频转化为一个字符画视频呢?
答案当然可以的啦!视频不就是由一张张图片组成的
文章结尾附完整代码
项目效果展示
首先我们要准备自己要转化的视频
导入本次项目需要的包
import os from PIL import Image import cv2 import random import numpy as np
接着将视频转化为图片
# 将视频转换为图片 并进行计数 def video_to_pic(vp): number = 0 if vp.isOpened(): r, frame = vp.read() if not os.path.exists('cache_pic'): os.mkdir('cache_pic') os.chdir('cache_pic') else: r = False while r: number += 1 cv2.imwrite(str(number) + '.jpg', frame) r, frame = vp.read() os.chdir("..") return number
效果:
接着将我们转化的图片在转化为字符画
def img2strimg(frame, K=3): # 读取矩阵的长度 有时返回两个值,有时三个值 height, width, *_ = frame.shape # 颜色空间转化 图片对象, 灰度处理 frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 转换数据类型,将数据降维 frame_array = np.float32(frame_gray.reshape(-1)) # 得到labels(类别)、centroids(矩心) compactness(密度值)。 # 如第一行6个像素labels=[0,2,2,1,2,0],则意味着6个像素分别对应着 第1个矩心、第3个矩心、第3、2、3、1个矩心。 compactness, labels, centroids = cv2.kmeans(frame_array, K, None, (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0), 10, cv2.KMEANS_RANDOM_CENTERS) centroids = np.uint8(centroids) # 转换成整形 # labels的数个矩心以随机顺序排列,所以需要简单处理矩心. # 返回一个折叠成一维的数组 centroids = centroids.flatten() # 排序 centroids_sorted = sorted(centroids) # 获得不同centroids的明暗程度,0最暗 centroids_index = np.array([centroids_sorted.index(value) for value in centroids]) # 亮度设置 bright = [abs((3 * i - 2 * K) / (3 * K)) for i in range(1, 1 + K)] bright_bound = bright.index(np.min(bright)) # 背景阴影设置 shadow = [abs((3 * i - K) / (3 * K)) for i in range(1, 1 + K)] shadow_bound = shadow.index(np.min(shadow)) # 返回一个折叠成一维的数组 labels = labels.flatten() # 将labels转变为实际的明暗程度列表,0最暗。 labels = centroids_index[labels] # 列表解析,每2*2个像素挑选出一个,组成(height*width*灰)数组。 labels_picked = [labels[rows * width:(rows + 1) * width:2] for rows in range(0, height, 2)] canvas = np.zeros((3 * height, 3 * width, 3), np.uint8) canvas.fill(255) # 创建长宽为原图三倍的白色画布。 # 因为 字体大小为0.45时,每个数字占6*6个像素,而白底画布为原图三倍 # 所以 需要原图中每2*2个像素中挑取一个,在白底画布中由6*6像素大小的数字表示这个像素信息。 y = 0 for rows in labels_picked: x = 0 for cols in rows: if cols <= shadow_bound: # 添加文字 图片,添加的文字,左上角坐标,字体,字体大小,颜色,字体粗细 cv2.putText(canvas, str(random.randint(2, 9)), (x, y), cv2.FONT_HERSHEY_PLAIN, 0.45, 0.1) elif cols <= bright_bound: cv2.putText(canvas, "-", (x, y),cv2.FONT_HERSHEY_PLAIN, 0.4, 0, 1) x += 6 y += 6 return canvas
效果:
最后我们将所有的字符画合成为MP4视频
def charts2video(img_path, video_path): """将给定目录下的图片转成视频 Args: img_path: 图片路径 video_path: 输出视频的路径和名称 Returns: 图片转成的视频 """ images = os.listdir(img_path) images.sort(key=lambda x: int(x[:-4])) # 以名称字符串的数字从小到大排序 fps = 30 # 帧数 fourcc = cv2.VideoWriter_fourcc('M', 'P', '4', 'V') im = Image.open(img_path + images[0]) video_writer = cv2.VideoWriter(video_path, fourcc, fps, im.size) for img_i in images: frame = cv2.imread(img_path + img_i) print('开始将 ' + img_i + ' 加入视频\n') video_writer.write(frame) # 注意:图片尺寸必须和视频尺寸一样,不然不会被加入视频中!!! video_writer.release()
当然还差一个我们的主函数
if __name__ == '__main__': video_path = 'xiaoye.mp4' save_pic_path = 'cache_pic' save_charpic_path = 'cache_char/' vp = cv2.VideoCapture(video_path) number = video_to_pic(vp) for i in range(1, number): fp = r"cache_pic/{}.jpg".format(i) img = cv2.imread(fp) # 返回图片数据 (高度, 宽度,通道数) print(img) # 若字符画结果不好,可以尝试更改K为3。若依然无法很好地表现原图,请换图尝试。 -_-|| str_img = img2strimg(img) cv2.imwrite("cache_char/{}.jpg".format(i), str_img) FPS = vp.get(cv2.CAP_PROP_FPS) star_to_char(number, save_pic_path) charts2video(save_charpic_path,'char_video.mp4')
其中 video_path就是我们需要转化的视频的名字,最后一行的'char_video.mp4'就是我们最后要保存字符画视频的名字,这个自己随便起,其他的不用修改即可使用
最后的文件目录是这样的
最最最后就是本次项目的完整代码:
import os from PIL import Image import cv2 import random import numpy as np # 将视频转换为图片 并进行计数 def video_to_pic(vp): number = 0 if vp.isOpened(): r, frame = vp.read() if not os.path.exists('cache_pic'): os.mkdir('cache_pic') os.chdir('cache_pic') else: r = False while r: number += 1 cv2.imwrite(str(number) + '.jpg', frame) r, frame = vp.read() os.chdir("..") return number def star_to_char(number, save_pic_path): if not os.path.exists('cache_char'): os.mkdir('cache_char') def img2strimg(frame, K=3): # 读取矩阵的长度 有时返回两个值,有时三个值 height, width, *_ = frame.shape # 颜色空间转化 图片对象, 灰度处理 frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 转换数据类型,将数据降维 frame_array = np.float32(frame_gray.reshape(-1)) # 得到labels(类别)、centroids(矩心) compactness(密度值)。 # 如第一行6个像素labels=[0,2,2,1,2,0],则意味着6个像素分别对应着 第1个矩心、第3个矩心、第3、2、3、1个矩心。 compactness, labels, centroids = cv2.kmeans(frame_array, K, None, (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0), 10, cv2.KMEANS_RANDOM_CENTERS) centroids = np.uint8(centroids) # 转换成整形 # labels的数个矩心以随机顺序排列,所以需要简单处理矩心. # 返回一个折叠成一维的数组 centroids = centroids.flatten() # 排序 centroids_sorted = sorted(centroids) # 获得不同centroids的明暗程度,0最暗 centroids_index = np.array([centroids_sorted.index(value) for value in centroids]) # 亮度设置 bright = [abs((3 * i - 2 * K) / (3 * K)) for i in range(1, 1 + K)] bright_bound = bright.index(np.min(bright)) # 背景阴影设置 shadow = [abs((3 * i - K) / (3 * K)) for i in range(1, 1 + K)] shadow_bound = shadow.index(np.min(shadow)) # 返回一个折叠成一维的数组 labels = labels.flatten() # 将labels转变为实际的明暗程度列表,0最暗。 labels = centroids_index[labels] # 列表解析,每2*2个像素挑选出一个,组成(height*width*灰)数组。 labels_picked = [labels[rows * width:(rows + 1) * width:2] for rows in range(0, height, 2)] canvas = np.zeros((3 * height, 3 * width, 3), np.uint8) canvas.fill(255) # 创建长宽为原图三倍的白色画布。 # 因为 字体大小为0.45时,每个数字占6*6个像素,而白底画布为原图三倍 # 所以 需要原图中每2*2个像素中挑取一个,在白底画布中由6*6像素大小的数字表示这个像素信息。 y = 0 for rows in labels_picked: x = 0 for cols in rows: if cols <= shadow_bound: # 添加文字 图片,添加的文字,左上角坐标,字体,字体大小,颜色,字体粗细 cv2.putText(canvas, str(random.randint(2, 9)), (x, y), cv2.FONT_HERSHEY_PLAIN, 0.45, 0.1) elif cols <= bright_bound: cv2.putText(canvas, "-", (x, y),cv2.FONT_HERSHEY_PLAIN, 0.4, 0, 1) x += 6 y += 6 return canvas def charts2video(img_path, video_path): """将给定目录下的图片转成视频 Args: img_path: 图片路径 video_path: 输出视频的路径和名称 Returns: 图片转成的视频 """ images = os.listdir(img_path) images.sort(key=lambda x: int(x[:-4])) # 以名称字符串的数字从小到大排序 fps = 30 # 帧数 fourcc = cv2.VideoWriter_fourcc('M', 'P', '4', 'V') im = Image.open(img_path + images[0]) video_writer = cv2.VideoWriter(video_path, fourcc, fps, im.size) for img_i in images: frame = cv2.imread(img_path + img_i) print('开始将 ' + img_i + ' 加入视频\n') video_writer.write(frame) # 注意:图片尺寸必须和视频尺寸一样,不然不会被加入视频中!!! video_writer.release() if __name__ == '__main__': video_path = 'xiaoye.mp4' save_pic_path = 'cache_pic' save_charpic_path = 'cache_char/' vp = cv2.VideoCapture(video_path) number = video_to_pic(vp) for i in range(1, number): fp = r"cache_pic/{}.jpg".format(i) img = cv2.imread(fp) # 返回图片数据 (高度, 宽度,通道数) print(img) # 若字符画结果不好,可以尝试更改K为3。若依然无法很好地表现原图,请换图尝试。 -_-|| str_img = img2strimg(img) cv2.imwrite("cache_char/{}.jpg".format(i), str_img) FPS = vp.get(cv2.CAP_PROP_FPS) star_to_char(number, save_pic_path) charts2video(save_charpic_path,'char_video.mp4')
其中cv2使用pip install opencv安装