代码收藏家技术教程 2024-01-02

RGB与BGR颜色深度、像素和字节的关系解析

在处理图像时，了解 RGB 和 BGR 色彩空间之间的区别非常重要。RGB 和 BGR 都具有三个颜色通道：红色、绿色和蓝色。但是，这些通道在图像文件中的存储顺序可能不同。

RGB 通常用于图像编辑和显示应用程序，顺序为红色、绿色和蓝色。

BGR 通常用于图像处理应用程序，顺序为蓝色、绿色和红色。

图像数据可以保存在不同的颜色空间（RGB、BGR、Gray等），不同的文件格式可以将图像保存在不同的颜色空间。这取决于图像处理库和软件在保存（或打开）图像时使用的颜色空间。

但是，将图像保存为文件格式时，通常的做法是将其保存在 RGB 颜色空间中。值得注意的是，当你以 BGR 顺序保存图像时，它仍然可以被大多数库和软件读取，但它们会将其视为 RGB 图像并以 RGB 格式显示。（你会看到交换了红色和蓝色通道的图像）

使用exiftool之类的工具查看图片的元数据，可能会得到这样的结果：color mode: RGB或者Color Space Data: RGB

这意味着一张图片有 3 个通道，但并不意味着 3 个颜色通道的顺序是red-green-blue，它也可能是blue-green-red。

读取和解释图像文件的程序决定了如何解释图像的颜色通道：不同的库（例如 OpenCV 和 PIL）对图像文件使用不同的默认解码方法，这可能导致图像被解释为BGR或RGB。

使用 Python 处理图像文件时，OpenCV 库（cv2）在读取图像时默认使用 BGR 颜色空间，而 PIL 库使用 RGB 颜色空间：

import cv2
from PIL import Image

#reading an image using cv2.imread()
img_bgr = cv2.imread("image.jpg")

#reading an image using plt.imread()
img_rgb = Image.open("image.jpg")

总而言之，当我们说 rgb 图像（有时称为真彩色图像）时，这意味着通过假设该图像的颜色通道顺序为红-绿-蓝来保存图像，而 bgr-image 则通过假设颜色顺序为蓝-绿-红。当我们打开该图像并通过某些软件或库进行绘图时，该软件或库将决定以 RGB 色彩空间还是 BGR 色彩空间显示图像。

使用 PIL 库打开 rgb 图像：

import numpy as np
from PIL import Image, ImageOps
import matplotlib.pyplot as plt

# Here we show rgb-image in RGB-color-space
rgb_img = Image.open("parrot-org.jpg") 
plt.imshow(rgb_img)

使用 PIL 库打开 bgr 图像：

BGR 不是实际的颜色空间，它只是图像的表示，其中颜色通道的顺序不同于传统的 RGB 表示。图像中像素的颜色值保持不变，但颜色通道的顺序交换了，第一个通道是蓝色，第二个通道是绿色，第三个通道是红色。

例如，[240，26，0]是左上角的像素值，当你通过 plt.imshow() 绘制图像时，你将在图像的左上角看到一个红点。因此，这意味着 plt.imshow() 使用了RGB-color-space，它确定了255表示红色，0表示绿色，0表示蓝色。然后像这样交换颜色通道：(1,2,3)–>(3,2,1)。

之后，左上角的像素值 ( [240, 26, 0]) 变为[0, 26, 240]，然后你再次绘制它。现在你将在图像的左上角看到一个蓝点。因此，这意味着plt.imshow()使用了RGB 颜色空间，它确定0表示红色，0表示绿色，255表示蓝色。

这就是为什么你看到的是蓝点而不是红点。

基于此，我们可以说BGR颜色空间是RGB颜色空间中交换颜色通道的图像的表示。

# Here we show bgr-image in RGB-color-space
rgb_data = np.array(rgb_img)
bgr_data = rgb_data[:, :, ::-1]  # (red,green,blue) --> (blue,green,red)
bgr_img = Image.fromarray(bgr_data)
plt.imshow(bgr_img);

将 3 通道图像转换为 1 通道图像

有多种方法可以将图像从 RGB 颜色空间转换为灰度，但最常用的方法之一是使用红色、绿色和蓝色值的加权平均值。该方法根据人眼对每种颜色的相对敏感度，为三个颜色通道分配不同的权重。

最常用的权重是：gray_weighted_average= 0.299 * R + 0.587 * G + 0.114 * B

另一种转换为灰度的方法是使用光度法，它根据人眼的光度函数分配不同的权重。这是将彩色图像转换为灰度图像的更准确方法：gray_luminosity = 0.2126 * R + 0.7152 * G + 0.0722 * B

OpenCV的cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)采用加权平均法，Pil.ImageOps.grayscale(rgb_img)采用光度法。

gray_img = ImageOps.grayscale(rgb_img)
plt.imshow(gray_img, cmap='gray');

分别查看具有不同色调的 3 个颜色通道

tint_names = ["red", "green", "blue"]

plt.figure(figsize=(12,5))
for i in range(3):
    plt.subplot(1, 3, i+1)
    arr = np.zeros((3,), dtype='int')
    arr[i] = 1
    img1 = rgb_data*arr
    plt.title(f"channel={i+1} in  #{tint_names[i]} tint")
    plt.imshow(img1)    
        
plt.figure(figsize=(12,5))
for i in range(3):
    plt.subplot(1, 3, i+1)
    img1 = rgb_data[:, :, i]
    plt.title(f"channel={i+1} in  #grey tint")
    plt.imshow(img1, cmap='gray')

使用 OpenCV

RGB 图像——假设颜色通道的顺序是红-绿-蓝保存。

当你使用 opencv 读取 RGB 图像时 —>cv2.imread()读取 rgb 图像并通过交换颜色通道将其作为 bgr 图像返回

在通过 opencv 读取 rgb 图像之后，如果你还使用 opencv 绘图 ->cv2.imshow()将在 BGR 颜色空间中绘制图像

因此，当你使用 opencv 打开 rgb 图像并使用 opencv 绘制它时，你将在 BGR 颜色空间中看到 bgr 图像，这看起来与 RGB 颜色空间中的 rgb 图像相同。

import cv2

# Here we see bgr-image in rgb-color-space
bgr_img_by_cv2 = cv2.imread(img_path)  
plt.imshow(bgr_img_by_cv2);

你将通过以下代码片段在 BGR 颜色空间中看到 bgr 图像，并且弹出窗口显示图像（按ESC关闭它）

cv2.imshow("bgr-image in BGR-color-space", bgr_img_by_cv2)
cv2.waitKey(0)
cv2.destroyAllWindows()

通过颜色通道学习颜色深度并计算 1 个像素有多少字节

首先，阅读以下解释：https://www.quora.com/How-does-the-computer-memory-store-media-files/answer/Jabali-Searcot

如果图像具有 1 个颜色通道（灰度）和 1 位颜色深度，则 1 个像素将为 1/8 字节或 0.125 字节：

# 1 channel and 1-bit-color-depth --> 2 color combinations

_, binary_image = cv2.threshold(gray_img_by_cv2, 128, 255, cv2.THRESH_BINARY)
plt.imshow(binary_image, cmap='gray')

如果图像具有 1 个颜色通道（灰度）和 2 位颜色深度，则 1 个像素将为 2/8 字节或 0.25 字节：

# 1 channel 2-bit-color-depth --> 4 color combinations

scaled_image = (gray_img_by_cv2/64).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');

如果图像具有 1 个颜色通道（灰度）和 3 位颜色深度，则 1 个像素将为 3/8 字节或 0.375 字节：

# 1 channel and 3-bit-color-depth --> 8 color combinations

scaled_image = (gray_img_by_cv2/32).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');

如果图像具有 1 个颜色通道（灰度）和 4 位颜色深度，则 1 个像素将为 4/8 字节或 0.5 字节：

# 1 channel 4-bit-color-depth --> 16 color combinations

scaled_image = (gray_img_by_cv2/16).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');

如果图像具有 1 个颜色通道（灰度）和 8 位颜色深度，则 1 个像素将是 8/8 字节或 1 个字节：

# 8bit color depth and 1 channel --> 256 color combinations

scaled_image = (gray_img_by_cv2).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');

如果图像有 3 个颜色通道和每个通道的 1 位颜色深度，则 1 个像素将为 3/8 字节或 0.375 字节：

# 3 channel and 1bit color depth --> 8 color combinations

_, binary_image_from_rgb_img_by_cv2 = cv2.threshold(rgb_img_by_cv2, 128, 255, cv2.THRESH_BINARY)
plt.imshow(binary_image_from_rgb_img_by_cv2);

如果图像有 3 个颜色通道，并且每个通道的每个通道都是 8 位颜色深度，那么 1 个像素将是 24/8 字节或 3 个字节：每个通道 1 个像素。

通常，图像有 3 个颜色通道，每个通道都是 8 位颜色深度，称为 24 位颜色（或真彩色）图像：

# 3 channel and 8-bit-color-depth --> 16777216 color combinations
# 256*256*256 = 16777216

scaled_image = (rgb_img_by_cv2).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');