Python图像处理
一、简介
实现计算机视觉任务的过程中,不可避免地需要对图像进行读写操作以及图像预处理操作,下面介绍两个常用的Python图像处理库:OpenCV和Pillow。
OpenCV全称是由英特尔公司资助的开源计算机视觉库。
它由一系列C函数和少量C++类所组成,实现图像处理和计算机视觉方面的很多通用算法,例如特征检测与跟踪、运动分析、目标分割与识别以及3D重建等。
OpenCV作为基于C/C++语言编写的跨平台开源软件,可以运行在Linux、Windows、Android和MacOS操作系统上,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
1.1 图像处理-OpenCV
OpenCV是模块结构的,有以下主要模块。
1.2 图像处理- PIL和Pillow
作为Python2的第三方图像处理库是Pillow的前身。随着Python3的更新,PIL移植到Python3更名为Pillow。与OpenCV一样,Pillow也是模块结构,主要包括以下结构。
【Image】–图像功能模块,包含内容有:读写图像、图像混合、图像放缩、图像裁切、图像旋转。
【ImageFilter】–图像滤波功能模块,包含内容有:各类图像滤波核。
【ImageEnhance】–图像增强功能模块,包含内容有:色彩增强、亮度增强、对比度增强、清晰度增强。
【ImageDraw】–图像绘画功能模块,包含内容有:绘制几何形状、绘制文字。
二、 常用图像类型
2.1 二值图像
二值图像只有黑白两种颜色,如图所示。图像中的每个像素只能是黑或白,没有中间的过渡。因此二值图像的像素值只能为0或1,0表示黑色,1表示白色。
2.2 灰度图像

2.3 RGB图像

2.4 常用颜色空间简介
• cv2.COLOR_BGR2GRAY
• cv2.COLOR_BGR2RGB
• cv2.COLOR_BGR2HSV
• cv2.COLOR_BGR2YUV
• cv2.COLOR_BGR2HLS
三、OpenCV图像读写与显示
3.1 读入图像
(高,宽,通道数)即(height, width, channel)。OpenCV图像坐标与常规的数学坐标有区别,左上角位置为坐标原点。
• 在Windows【画图】工具中,帽檐红点坐标为(248, 102),但在OpenCV中像素位置应为(102, 248)。
• X轴 == 列位置 == 图像宽
• Y轴 == 行位置 == 图像高

3.2 显示图像
3.3 写出图像
import cv2
import matplotlib.pyplot as plt
import numpy
# 读写图像
img = cv2.imread(filename='lena.jpg', flags=cv2.IMREAD_GRAYSCALE)
img.shape
# (377, 373)
img.dtype
# dtype('uint8')
# 图像展示
cv2.imshow(winname='lena', mat=img)
cv2.waitKey(0)
# 图像保存
cv2.imwrite(filename='test_img.jpg', img=img)
四、图像几何变换
4.1 图像平移
图像平移变换将一幅图像中的所有像素点都按照给定的偏移量在水平方向(沿x轴方向)或垂直方向(沿y轴方向)移动,是图像几何变换中较为简单的一种变换。
图像平移原理示意图如下图所示。
假设对点P_0 (x_0,y_0 )进行平移后得到点P(x,y),其中x方向的平移量为∆x,y方向的平移量为∆y ,则点P(x,y)的坐标如下式。
利用齐次坐标表示图像平移变换前后点P_0 (x_0,y_0 )到点P(x,y)的关系如下式所示。
实现步骤:
1. 定义平移变换矩阵: 例如:np.float32([[1,0,50], [0,1,100]])
• [1,0,50]表示在x轴方向移动50个单位
• [0,1,100]表示在y轴方向移动100个单位
2. 执行转换:cv2.warpAffine (src, M, dsize)
通过OpenCV实现图像平移操作,结果如下图所示,(a)为原图和(b)为平移后图像。
import cv2
import matplotlib.pyplot as plt
import numpy as np
img = cv2.imread('lena.jpg')
height, width, channel = img.shape
# 图像平移
# 1、定义平移变换矩阵
M = np.float32([[1,0,50], [0,1,100]])
# 2、执行平移变换
img_tran = cv2.warpAffine(src=img, M=M, dsize=(height, width))
cv2.imshow('image translation', img_tran)
cv2.waitKey(0)
4.2 图像旋转


上式的矩阵的形式如下式所示。

实现步骤:


通过OpenCV实现图像旋转,得到的效果如图所示。

# 图像旋转
# 1、定义旋转变换矩阵
M = cv2.getRotationMatrix2D(center=(height*0.5, width*0.5), # 旋转的中心位置坐标
angle=45, # 旋转的角度
scale=0.8 # 缩放比例
)
# 2、执行旋转变换
img_rotation = cv2.warpAffine(img, M, dsize=(height,width))
cv2.imshow('image_rotation', img_rotation)
cv2.waitKey(0)
4.3 图像缩放

• 最邻近插值:cv2.INTER_NEAREST
• 双线性插值:cv2.INTER_LINEAR
• 区域插值:cv2.INTER_AREA
• 三次样条插值:cv2.INTER_CUBIC
• Lanczos插值:cv2.INTER_LANCZOS4
# 图像缩放
# 1、直接指定缩放大小
img_res = cv2.resize(img, dsize=(244,244))
img_res.shape
# (244, 244, 3)
cv2.imshow('image_resize', img_res)
cv2.waitKey(0)
# 2、最近邻插值
img_near = cv2.resize(img, dsize=None, fx=1.5, fy=1,
interpolation=cv2.INTER_NEAREST)
cv2.imshow('img_near', img_near)
cv2.waitKey(0)
来源:明之季