Dieser Artikel bietet Ihnen eine kurze Einführung in die Bildlese- und Schreibmethoden verschiedener Bildbibliotheken (mit Code). Ich hoffe, dass er einen gewissen Referenzwert hat Es wird Ihnen helfen.
Es gibt derzeit mehrere gängige Bildbibliotheken:
1. PIL (Pillow) 3. matplotlib.image: Unter den oben genannten Bildbibliotheken ist OpenCV zweifellos die leistungsstärkste und ausgereifteste. 1.1 Lesen und Speichern von OpenCV-Bildernimport cv2
#读取图像 直接是numpy矩阵格式
img = cv2.imread('horse.jpg',1) # 0表示读入灰色图片,1表示读入彩色图片
cv2.imshow('image',img) # 显示图像
print(img.shape) # (height,width,channel)
print(img.size) # 像素数量
print(img.dtype) # 数据类型
print(img) # 打印图像的numpy数组,3纬数组
#储存图像
# 当前目录储存
cv2.write(‘horse1.jpg',img)
# 自定义储存
cv2.write(‘/path_name/’ + str(image_name) + '.jpg',img)
cv2.waitKey()
import cv2 #方法一 img = cv2.imread('horse.jpg',0) # 0表示读入灰色图片,或者使用cv2.IMREAD_GRATSCALE 替代0 cv2.imshow('gray image',img) #方法二 img = cv2.imread('horse.jpg') gray_img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) cv2.imshow('gray image',gray_img) print(gray_img.shape) # (height, width) print(gray_img.size) # 像素数量 print(gray_img) # 打印图像的numpy数组,2维 cv2.waitKey()
1.3 Konvertierung des OpenCV-MatrixformatsWarum? :OpenCVs Matrixformat (Höhe, Breite, Kanäle) -->> Der Deep-Learning-Matrixtyp kann sein (Kanäle, Höhe, Breite)import cv2
import numpy as np
img = cv2.imread('horse.jpg',1)
cv2.imshow('image',img)
# 矩阵格式的变换
print(img.shape)
img = img.transpose(2,0,1) #变换函数
print(img.shape)
# 矩阵扩展 (batch_size, channels, height, width) 预测单张图片的操作
# 加一列作为图片的个数
img = np.expand_dims(img, axis=0) #使用numpy函数
print(img.shape)
# 训练阶段构建batchdata_lst = []
loop:
img = cv2.imread('xxx.jpg')
data_lst.append(img)
data_arr = np.array(data_lst)
import cv2 # 为了减少计算量,需要把像素值0-255转换到0-1之间 img = cv2.imread('horse.jpg') img = img.astype('float') / 255.0 # 先转化数据类型为float print(img.dtype) print(img)
1.5 OpenCV BRG zu RGBimport cv2
img = cv2.imread('horse.jpg')
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) # 转为RGB format
print(img)
import cv2 img = cv2.imread('horse.jpg') gray_img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) # 转为Gray image print(img[4,4]) # 3 channels print(gray_img[4,4]) # 1 channel
1.7 OpenCV Region of Interest Clipping (ROI)
import cv2 img = cv2.imread('horse.jpg') print(img.shape) roi = img[0:437,0:400] # [y:height,x:width] cv2.imshow('roi',roi) cv2.waitKey()
2.1 PIL-Bild lesen und speichern
from PIL import Image import numpy as np #图像读取 img = Image.open('horse.jpg') print(img.format) # 图片格式 print(img.size) # (width,height) print(img.mode) # 图片通道类型 #将图像转化为矩阵格式 arr = np.array(img) print(arr.shape) print(arr.dtype) #图像储存 new_img = Image.fromarray(arr) new_img.save('test.jpg') img.show()
2.2 PIL-Bildvergrauungsverarbeitung
#图像灰化处理 gray = Image.open('horse.jpg').convert('L') gray_arr = np.array(gray) print(gray_arr.shape) # (height,width) print(gray_arr.dtype) print(gray_arr) gray.show()
# 感兴趣区域剪切 img = Image.open('horse.jpg') roi = img.crop((0,0,200,200)) # (左上x,左上y,右下x,右下y) roi.show()
# 通道处理 r,g,b = img.split() #分离 img = Image.merge("RGB",(b,g,r)) #合并 img = img.copy() #复制
import matplotlib.pyplot as plt import numpy as np # 图像读取为numpy数组格式 img = plt.imread('horse.jpg') plt.axis('off') # 关闭刻度显示 print(img.shape) # (height, width, channel) print(img.size) # 像素数量 print(img.dtype) #储存图片 plt.savefig('./name.jpg') figure = plt.figure(figsize=(20,10)) # 调整显示图片的大小 plt.imshow(img) plt.show()
#图片灰化处理 # 平均值发 img_mean = img.mean(axis=2) plt.imshow(img_mean,cmap='gray') plt.show() #最大值法 img_max = img.max(axis=-1) plt.imshow(img_max,cmap='gray') plt.show() #RGB三原色法 gravity = np.array([0.299,0.587,0.114]) img_gravity = np.dot(img,gravity) plt.imshow(img_gravity,cmap="gray") plt.show()
from skimage import io #读取图像numpy数组格式 img = io.imread('horse.jpg') print(img.shape) print(img.dtype) print(img.size) #print(img) io.imshow(img) #储存图像 io.imsave('test.jpg',img)
#图像灰化处理并归一化 img = io.imread('horse.jpg',as_gray=True) print(img.shape) print(img.dtype) # 数据类型位float print(img.size) print(img) io.imshow(img) io.show()
5.1 scipy.misc Lesen und Speichern von Bildern
#在1.2.0 之后统一用imageio模块 import imageio import matplotlib.pyplot as plt #读取图片为numpy数组 img = imageio.imread('horse.jpg') print(img.dtype) print(img.size) # 像素数量 print(img.shape) #(height, width, channels) plt.imshow(img) plt.show() print(img) #储存图片 imageio.imsave('test.jpg',img)
Das obige ist der detaillierte Inhalt vonEine kurze Einführung in die Bildlese- und Schreibmethoden verschiedener Bildbibliotheken in Python (mit Code). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!