이 기사는 Python+OpenCV 이미지 스타일 마이그레이션의 구현 방법에 대한 설명을 제공합니다. 이는 특정 참조 가치가 있으므로 도움이 될 수 있습니다.
요즘 많은 사람들이 사진(셀카) 찍는 것을 좋아합니다. 제한된 필터와 장식을 너무 많이 사용하면 지치게 되므로 프리즈마, 베르사 등 유명 그림의 스타일을 모방하여 사진을 반 고흐, 피카소, 뭉크의 느낌으로 바꿔주는 앱이 있습니다. 등 마스터 스타일.
이 기능은 "
Image Style Transfer"라고 불리며, 이는 거의 모두 CVPR 2015 논문 "A Neural Algorithm of Artistic Style" 및 ECCV 2016 논문 "Perceptual Losses for Real"을 기반으로 합니다. -Time" Style Transfer 및 Super-Resolution에서 제안된 알고리즘과 후속 관련 연구를 기반으로 개발되었습니다.
일반인의 용어로 말하자면,신경망을 사용하여 유명 그림의 스타일을 모델로 사전 훈련한 다음 이를 다른 사진에 적용하여 새로운 스타일화된 이미지를 생성하는 것을 의미합니다.
"A Neural Algorithm of Artistic Style" 중에서컴퓨터 비전에서 신경망의 사용이 점차 증가함에 따라 유명한 시각 개발 라이브러리인 OpenCV는 3.3 버전에서
DNN(Deep Neural Network)을 공식 도입했습니다. , Caffe, TensorFlow, Torch/PyTorch 등과 같은 주류 프레임워크의 모델을 지원하며 이미지 인식, 감지, 분류, 분할, 색상 지정과 같은 기능을 구현하는 데 사용할 수 있습니다. 최근에 ECCV 2016 논문의 네트워크 모델 구현을 기반으로 하는 OpenCV 샘플 코드에 이미지 스타일 전송에 대한 Python 예제가 있다는 것을 발견했습니다. 따라서 인공지능 초보자라도 다른 사람이 훈련한 모델을 가지고 놀면서 신경망의 경이로움을 경험할 수 있습니다.
python fast_neural_style.py --model starry_night.t7
model
매개변수는 사전 훈련된 모델 파일 경로를 제공하는 것입니다. OpenCV는 다운로드를 제공하지 않지만 참조 프로젝트 https://github.com/jcjohnson /fast-neural이 제공됩니다. 스타일은 model
参数是提供预先训练好的模型文件路径,OpenCV 没有提供下载,但给出的参考项目 https://github.com/jcjohnson/fast-neural-style 中可以找到
其他可设置参数有:
input
可以指定原始图片/视频,如果不提供就默认使用摄像头实时采集。
width
、height
,调整处理图像的大小,设置小一点可以提高计算速度。在我自己的电脑上,300x200 的转换视频可以达到 15 帧/秒。
median_filter
에서 찾을 수 있습니다. 기타 설정 가능한 매개변수는 다음과 같습니다:
input
원본 이미지를 지정할 수 있습니다. /video, 제공되지 않을 경우 기본적으로 카메라를 사용하여 실시간으로 수집합니다. 너비
, 높이
, 처리된 이미지의 크기를 조정하고 더 작게 설정하면 계산 속도가 향상될 수 있습니다. 내 컴퓨터에서는 300x200으로 변환된 비디오가 15fps에 도달할 수 있습니다.
median_filter
중앙값 필터링의 창 크기는 결과 이미지를 매끄럽게 만드는 데 사용됩니다. 이는 결과에 거의 영향을 미치지 않습니다. 실행 후 효과(jcjohnson/fast-neural-style에서 가져옴):
원본 이미지
ECCV16 모델
instance_norm 모델
핵심 코드는 실제로 매우 짧습니다.모델 로드-> 계산 수행-> 공식 예제를 기반으로 더욱 단순화했습니다. import cv2
# 加载模型
net = cv2.dnn.readNetFromTorch('the_scream.t7')
net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV);
# 读取图片
image = cv2.imread('test.jpg')
(h, w) = image.shape[:2]
blob = cv2.dnn.blobFromImage(image, 1.0, (w, h), (103.939, 116.779, 123.680), swapRB=False, crop=False)
# 进行计算
net.setInput(blob)
out = net.forward()
out = out.reshape(3, out.shape[2], out.shape[3])
out[0] += 103.939
out[1] += 116.779
out[2] += 123.68
out /= 255
out = out.transpose(1, 2, 0)
# 输出图片
cv2.imshow('Styled image', out)
cv2.waitKey(0)
위 내용은 Python+OpenCV 이미지 스타일 마이그레이션 구현 방법에 대한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!