首頁 > 後端開發 > Python教學 > 在 PyTorch 中調整大小

在 PyTorch 中調整大小

Mary-Kate Olsen
發布: 2025-01-19 22:12:10
原創
935 人瀏覽過

請我喝杯咖啡☕

*備忘錄:

  • 我的帖子解釋了 OxfordIIITPet()。

Resize() 可以調整零個或多個影像的大小,如下所示:

*備忘錄:

  • 初始化的第一個參數是 size(必要型別:int 或 tuple/list(int)): *備註:
    • 它是[寬度,高度]。
    • 必須是 1
    • 元組/列表必須是具有 1 或 2 個元素的一維。
    • 單一值(int 或 tuple/list(int`))套用於較小影像的寬度或高度邊緣,然後另一個較大的寬度或高度邊緣也會調整大小: *備註:
    • 如果影像寬度小於其高度,則為 [尺寸, 尺寸 * 寬度 / 高度]。
    • 若影像寬度大於其高度,則為 [尺寸 * 寬度 / 高度 , 尺寸]。
    • 如果影像寬度等於其高度,則為 [size, size]。
  • 初始化的第二個參數是插值(Optional-Default:InterpolationMode.BILINEAR-Type:InterpolationMode)。
  • 初始化的第三個參數是 max_size(Optional-Default:None-Type:int): *備註:
    • 僅當 size 為單一值(int 或 tuple/list(int`))時才支援。
    • 應用尺寸後,如果較大影像的寬度或高度邊緣超過它,則會將其應用於較大影像的寬度或高度邊緣以限制影像尺寸,然後其他較小影像的寬度或高度邊緣也會變得比之前小。
  • 初始化的第四個參數是抗鋸齒(可選預設值:True-Type:bool)。 *即使設定為 False,插值為 InterpolationMode.BILINEAR 或 InterpolationMode.BICUBIC 時也始終為 True。
  • 第一個參數是img(必需類型:PIL映像或張量(int,float,complex或bool)): *備註:
    • 張量必須是一個或多個元素的 3D 或多維張量。
    • 不要使用img=。
  • v2建議依照V1還是V2使用?我應該使用哪一個?
from torchvision.datasets import OxfordIIITPet
from torchvision.transforms.v2 import Resize
from torchvision.transforms.functional import InterpolationMode

resize = Resize(size=100)
resize = Resize(size=100,
                interpolation=InterpolationMode.BILINEAR,
                max_size=None,
                antialias=True)
resize
# Resize(size=[100],
#        interpolation=InterpolationMode.BILINEAR,
#        antialias=True)

resize.size
# [100]

resize.interpolation
# <InterpolationMode.BILINEAR: 'bilinear'>

print(resize.max_size)
# None

resize.antialias
# True

origin_data = OxfordIIITPet(
    root="data",
    transform=None
)

p1000_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=1000)
    # transform=Resize(size=[1000])
)

p100_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=100)
)

p50_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=50)
)

p10_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=10)
)

p100p180_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=[100, 180])
)

p180p100_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=[180, 100])
)

p100ms110_data = OxfordIIITPet(
    root="data",
    transform=Resize(size=100, max_size=110)
)

import matplotlib.pyplot as plt

def show_images1(data, main_title=None):
    plt.figure(figsize=(10, 5))
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    for i, (im, _) in zip(range(1, 6), data):
        plt.subplot(1, 5, i)
        plt.imshow(X=im)
    plt.tight_layout()
    plt.show()

show_images1(data=origin_data, main_title="origin_data")
show_images1(data=p1000_data, main_title="p1000_data")
show_images1(data=p100_data, main_title="p100_data")
show_images1(data=p50_data, main_title="p50_data")
show_images1(data=p10_data, main_title="p10_data")
print()
show_images1(data=origin_data, main_title="origin_data")
show_images1(data=p100p180_data, main_title="p100p180_data")
show_images1(data=p180p100_data, main_title="p180p100_data")
print()
show_images1(data=p100_data, main_title="p100_data")
show_images1(data=p100ms110_data, main_title='p100ms110_data')

# ↓ ↓ ↓ ↓ ↓ ↓ The code below is identical to the code above. ↓ ↓ ↓ ↓ ↓ ↓
def show_images2(data, main_title=None, s=None, ms=None):
    plt.figure(figsize=(10, 5))
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    for i, (im, _) in zip(range(1, 6), data):
        plt.subplot(1, 5, i)
        if not s:
            s = im.size
        resize = Resize(size=s, max_size=ms) # Here
        plt.imshow(X=resize(im)) # Here
    plt.tight_layout()
    plt.show()

show_images2(data=origin_data, main_title="origin_data")
show_images2(data=origin_data, main_title="p1000_data", s=1000)
show_images2(data=origin_data, main_title="p100_data", s=100)
show_images2(data=origin_data, main_title="p50_data", s=50)
show_images2(data=origin_data, main_title="p10_data", s=10)
print()
show_images2(data=origin_data, main_title="origin_data")
show_images2(data=origin_data, main_title="p100p180_data", s=[100, 180])
show_images2(data=origin_data, main_title="p180p100_data", s=[180, 100])
print()
show_images2(data=origin_data, main_title="p100_data", s=100)
show_images2(data=origin_data, main_title="p100ms110_data", s=100, ms=110)
登入後複製

Image description

Image description

Image description

Image description

Image description


Image description

Image description

Image description


Image description

Image description

以上是在 PyTorch 中調整大小的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板