


신속한 공격과 방어 전투! Columbia University는 검토 메커니즘을 우회할 수 있는 BPE 단어 작성 방법을 제안했습니다. DALL-E 2가 속였습니다.
2022년 가장 소중한 것은 무엇인가요? 즉각적인!
DALL-E 2와 같은 텍스트 안내 이미지 생성(텍스트 안내 이미지 생성) 모델이 인기를 끌면서 네티즌들은 온갖 종류의 재미있는 이미지를 끝없이 생성해 왔습니다.
그러나 모델이 명확하고 사용 가능한 대상 이미지를 생성하려면 올바른 "주문"을 숙지해야 합니다. 즉, 프롬프트를 사용하기 전에 신중하게 디자인해야 합니다. 프롬프트 판매
프롬프트가 사악한 주문인 경우 생성된 이미지는 "규정 위반 의심"이 발생할 수 있습니다.
DALL-E 2는 초현실적인 사진 생성을 방지하기 위해 기술적 수단을 사용하여 학습 데이터에서 폭력적이거나 혐오스럽거나 부적절한 이미지를 삭제하는 등 모델이 출시되었을 때 모델이 남용되지 않도록 다양한 메커니즘을 설정했지만, 특히 일부 공인은 인간의 얼굴입니다.
생성 단계에서 DALL-E 2는 사용자가 입력한 프롬프트 단어에 폭력적, 성인용 또는 정치적 콘텐츠가 포함되는 것을 허용하지 않는 프롬프트 필터도 설정합니다.
그러나 최근 컬럼비아 대학의 연구원들은 겉보기에 말도 안 되는 단어가 프롬프트에 추가되어 필터가 단어의 의미를 인식할 수 없게 되지만 결국 AI 시스템이 의미 있는 생성 이미지를 반환할 수 있다는 사실을 발견했습니다.
논문 링크: https://arxiv.org/pdf/2208.04135.pdf
저자는 프롬프트를 구성하는 두 가지 방법을 제안합니다. 첫 번째 방법은 마카로닉 프롬팅(macaronic Prompting)으로, 마카로닉이라는 단어의 원래 의미는 다음과 같습니다. 예를 들어 파키스탄에서는 우르두어와 영어의 혼합이 일반적입니다.
DALL-E 2의 훈련 코퍼스는 일반적으로 인터넷에서 수집된 데이터입니다. 텍스트와 이미지 간의 개념적 연결을 설정하는 과정에는 다소 다중 언어 학습이 포함되므로 훈련된 모델이 여러 언어를 인식할 수 있습니다. 동시에 개념적 능력.
그래서 다중 언어 조합을 사용하여 새로운 단어를 형성하고, 인간이 설계한 프롬프트 필터를 우회하여 공격에 저항하는 목적을 달성할 수 있습니다.
예를 들어 "birds"라는 단어는 독일어로 Vögel, 이탈리아어로 uccelli, 프랑스어로 oiseaux, 스페인어로 pájaros입니다. CLIP 모델은 BPE(바이트 쌍 인코딩) 알고리즘을 사용하여 입력 프롬프트 문장을 분할한 후, 여러 개의 하위 단어로 나뉩니다.
uccoisegeljaros를 입력하는 등 하위 단어를 새로운 단어로 재배열한 후에도 DALL-E 2는 여전히 새의 이미지를 생성할 수 있지만 인간은 단어의 의미를 완전히 이해할 수 없습니다.
하위 단어의 경계가 엄격하게 준수되지 않더라도, 예를 들어 voiscellpajaraux 및 oisvogajaro로 대체하면 모델은 여전히 새 이미지를 생성할 수 있습니다.
연구원들은 새 외에도 여러 언어를 결합하는 방법이 다양한 이미지 영역에서 좋은 결과를 얻을 수 있으며 이미지 생성 결과가 매우 높은 일관성을 보인다는 사실을 발견했습니다.
동물의 왕국부터 풍경, 차량, 장면, 감정까지 관련 이미지를 생성하는 것은 매우 쉽습니다.
텍스트 기반 이미지 생성 모델마다 아키텍처, 학습 데이터, 단어 분할 방법이 다르지만 원칙적으로 마카로닉 힌트는 DALL-E mini와 같이 다국어 데이터로 학습된 모든 모델에 적용할 수 있습니다. 모델에서 효과가 발견됩니다.
비슷한 이름에도 불구하고 DALL-E 2와 DALL-E mini가 상당히 다르다는 점은 주목할 가치가 있습니다. 이들은 서로 다른 아키텍처(DALL-E mini는 확산 모델을 사용하지 않음)를 가지고 있고, 서로 다른 데이터 세트에 대해 교육을 받고, 서로 다른 토크나이저를 사용합니다(DALL-E mini는 CLIP 토크나이저 분할 단어와 다르게 동작할 수 있는 BART 토크나이저를 사용합니다).
이러한 차이점에도 불구하고 마카로닉 팁은 두 모델 모두에서 여전히 작동하며 그 뒤에 숨겨진 원리는 더 많은 연구가 필요합니다.
그러나 모든 마카로닉 신호가 서로 다른 모델 간에 적절하게 전송되는 것은 아닙니다. 예를 들어 Farpapmaripterling이 예상대로 DALL-E 2에서 나비 이미지를 생성한 반면 DALL-E mini에서는 버섯 이미지를 생성했습니다.
연구원들은 아마도 더 큰 데이터 세트로 훈련된 더 큰 모델이 서로 다른 언어의 하위 단어 단위와 시각적 개념 사이를 학습하기 때문에 마카로닉 단서에 더 취약하다고 추측합니다.
DALL-E 2에서 예상한 결과를 생성하는 일부 마카로닉 팁이 DALL-E mini에서 작동하지 않는 이유를 설명할 수 있지만 그 반대의 예는 거의 없습니다.
대형 모델의 경우 마카로닉 힌트를 사용한 적대적 공격에 더 취약할 수 있으므로 이러한 추세는 좋은 소식이 아닐 수 있습니다.
단일 복합어를 프롬프트로 사용하는 것 외에도 복합어를 영어 구문에 삽입하여 문장을 형성할 수도 있으며, 이미지 생성 효과는 원래 단어와 유사합니다.
그리고 합성어의 또 다른 장점은 결합하여 더욱 구체적이고 복잡한 장면을 연출할 수 있다는 점입니다. 복잡한 마카로닉 단서는 영어의 구문 구조를 준수해야 생성된 결과를 합성 문자열을 사용하는 단서보다 더 쉽게 해석할 수 있지만, 모델에 전달되는 정보는 여전히 상대적으로 모호합니다.
대부분의 사람들은 마카로닉 신호에 대한 사전 노출과 교배에 사용되는 언어에 대한 지식이 없으면 An eidelucertlagarzard가 maripofarterling을 먹고 있다는 프롬프트에서 어떤 종류의 시나리오가 발생할지 추측하기 어려울 수 있습니다.
게다가, 검열된 개념이 마카로닉 방법을 사용하여 충분히 "암호화"되는 한, 이러한 정교한 프롬프트는 일반적인 영어 단어를 사용한다는 사실에도 불구하고 블랙리스트 기반 콘텐츠 필터를 트리거하지 않습니다.
마카로닉 팁은 반드시 여러 언어의 하위 단어를 결합할 필요는 없습니다. 단일 언어 내에서 이를 결합하면 효과적인 시각적 개념도 생성할 수 있습니다. 그러나 영어에 익숙한 사람들은 문자열의 의도된 효과를 추측할 수 있습니다. 매우 행복하다(happy)와 유쾌하다(happy)의 합성어라고 짐작하기 쉽습니다.
두 번째 방법은 Evocative Prompting이라고 합니다. Evocative는 마카로닉과 달리 기존 단어 조합에서 시각적 연관성을 유발할 필요가 없지만 특정 분야에서 특정 문자 조합의 통계적 중요성을 기반으로 합니다." 새 단어.
생물학적 분류의 이항 명명법을 참조하여 "속명"과 "종소명"을 기반으로 새로운 "의사-라틴어 단어"를 생성할 수 있으며, DALL-E는 해당 테마를 기반으로 해당 단어를 생성할 수 있습니다. 종.
약품 명명 규칙에 따라 신약 그림도 생성될 수 있습니다.
연상 단서는 언어의 특정 기능과 해당 언어의 장소 및 문화와 관련된 시각적 기능 간의 연관성에도 적용될 수 있습니다. 예를 들어, 모델은 건물 이름을 기반으로 어느 국가의 스타일인지 추론할 수 있습니다. 예를 들어, Woldenbüchel에서 생성된 장면은 독일 또는 오스트리아 마을처럼 보입니다. Valtorigiano는 고대 이탈리아 도시처럼 보입니다. 프랑스의 마을.
그러나 반드시 모든 건물은 아닙니다. 예를 들어 DALL-E mini로 생성된 마지막 이미지는 프랑스 장소가 아닌 17세기 프랑스 초상화이지만 프랑스 문화와의 연관성은 여전히 유지됩니다.
또한 연상 힌트를 어휘 혼합과 결합하여 출력의 특정 기능을 더 효과적으로 제어할 수 있습니다.
유사 라틴어 명명법에 영어 단어 덩어리를 도입하면 DALL-E 2가 특정 속성을 가진 동물 이미지를 생성하게 됩니다. 예를 들어, 프롬프트 단어 Scariosus ferocianensis는 무서운(무서운) 및 사나운(사나운)을 유사 라틴어 용어와 결합합니다. 전갈과 같은 전통적으로 무서운 "파충류"의 이미지를 생성할 수 있습니다.
ㅋㅋㅋ 날아다니는 곤충의 이미지를 생성하기 위해 가짜 라틴어 접사를 사용하여 fly andwinged를 사용합니다.원칙적으로 마카로닉 방식으로 생성된 어휘는 프롬프트 필터를 우회하는 간단하고 신뢰할 수 있는 방법을 제공할 수 있습니다. 숨은 의도가 있는 사람들은 이를 사용하여 폭력적, 공격적, 불법적 또는 기타 민감한 단어를 생성할 수 있습니다. 증오, 인종 차별, 성 차별 또는 포르노 이미지는 물론 지적 재산권을 침해하거나 실제 개인을 묘사할 수 있는 이미지도 포함됩니다.
이미지 생성 서비스를 제공하는 회사에서는 콘텐츠 정책에 따라 이러한 출력물 생성을 방지하기 위해 광범위한 노력을 기울였음에도 불구하고 마카로닉 팁은 여전히 상용 이미지 생성 시스템의 보안 프로토콜에 큰 위협이 될 수 있습니다.
연상 단서가 제기하는 위협은 특정 시각적 연관성을 유발하는 매우 효과적이고 신뢰할 수 있는 방법을 제공하지 않으며 대부분 단어나 언어의 광범위한 형태적 특징과 관련된 개념으로 제한되기 때문에 덜 명확합니다. .
일반적으로 마카로닉 팁은 연상 팁보다 조작성이 뛰어나며 이러한 유형의 모델에서 키워드 기반 블랙리스트 콘텐츠 필터링만으로는 공격을 저항하기에 충분하지 않습니다.
DALL-E 2가 어두워지나요?
위 내용은 신속한 공격과 방어 전투! Columbia University는 검토 메커니즘을 우회할 수 있는 BPE 단어 작성 방법을 제안했습니다. DALL-E 2가 속였습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











<p>Windows 11에서는 시스템의 개인 설정이 향상되어 사용자가 이전에 바탕 화면 배경을 변경한 최근 기록을 볼 수 있습니다. Windows 시스템 설정 애플리케이션의 개인 설정 섹션에 들어가면 다양한 옵션을 볼 수 있으며, 배경 화면 변경도 그 중 하나입니다. 하지만 이제 시스템에 설정된 배경 화면의 최신 기록을 볼 수 있습니다. 이 내용이 마음에 들지 않고 최근 기록을 지우거나 삭제하려면 이 문서를 계속 읽으십시오. 이 문서는 레지스트리 편집기를 사용하여 이를 수행하는 방법에 대해 자세히 배우는 데 도움이 될 것입니다. </p><h2>레지스트리 편집 사용법

Windows는 결코 미학을 무시하는 제품이 아닙니다. XP의 목가적인 녹색 들판부터 Windows 11의 푸른 소용돌이 디자인까지, 기본 바탕 화면 배경화면은 수년간 사용자 즐거움의 원천이었습니다. 이제 Windows 추천을 사용하면 매일 잠금 화면과 바탕 화면 배경 무늬에 사용할 아름답고 경외감을 불러일으키는 이미지에 직접 액세스할 수 있습니다. 불행히도 이러한 이미지는 어울리지 않습니다. Windows 스포트라이트 이미지 중 하나가 마음에 든다면 한동안 배경으로 유지할 수 있도록 해당 이미지를 다운로드하는 방법을 알고 싶을 것입니다. 여기에 당신이 알아야 할 모든 것이 있습니다. WindowsSpotlight란 무엇입니까? Window Spotlight는 설정 앱의 개인 설정 >에서 사용할 수 있는 자동 배경화면 업데이트 프로그램입니다.

인공지능 기술이 지속적으로 발전하면서 이미지 의미분할 기술은 이미지 분석 분야에서 인기 있는 연구 방향이 되었다. 이미지 의미론적 분할에서는 이미지의 다양한 영역을 분할하고 각 영역을 분류하여 이미지에 대한 포괄적인 이해를 얻습니다. Python은 잘 알려진 프로그래밍 언어입니다. 강력한 데이터 분석 및 데이터 시각화 기능으로 인해 인공 지능 기술 연구 분야에서 가장 먼저 선택됩니다. 이 기사에서는 Python에서 이미지 의미 분할 기술을 사용하는 방법을 소개합니다. 1. 전제 지식이 심화되고 있습니다.

Apple은 iOS 17 사진 앱을 통해 원하는 대로 사진을 더 쉽게 자를 수 있습니다. 방법을 알아보려면 계속 읽어보세요. 이전 iOS 16에서는 사진 앱에서 이미지를 자르는 데 여러 단계가 필요했습니다. 편집 인터페이스를 탭하고 자르기 도구를 선택한 다음 핀치 투 줌 동작을 사용하거나 자르기 도구의 모서리를 드래그하여 자르기를 조정합니다. iOS 17에서 Apple은 고맙게도 이 프로세스를 단순화하여 사진 라이브러리에서 선택한 사진을 확대하면 화면 오른쪽 상단에 새로운 자르기 버튼이 자동으로 나타납니다. 이를 클릭하면 선택한 확대/축소 수준으로 전체 자르기 인터페이스가 표시되므로 원하는 이미지 부분으로 자르기, 이미지 회전, 이미지 반전, 화면 비율 적용 또는 마커 사용이 가능합니다.

NeRF가 제공하는 미분 가능 렌더링 덕분에 최근 3D 생성 모델은 정지된 물체에 대해 놀라운 결과를 얻었습니다. 그러나 인체와 같이 더 복잡하고 변형 가능한 범주에서 3D 생성은 여전히 큰 과제를 안고 있습니다. 본 논문에서는 초해상도 모델을 사용하지 않고도 고해상도(512x256) 3D 인체 생성이 가능한 효율적인 결합 NeRF 인체 표현을 제안합니다. EVA3D는 4개의 대규모 인체 데이터 세트에서 기존 솔루션을 크게 능가했으며 코드는 오픈 소스였습니다. 논문명: EVA3D: 2D 이미지 컬렉션의 구성적 3D 인간 생성 논문 주소: http

NVS(New Perspective Image Generation)는 컴퓨터 비전의 응용 분야입니다. 1998년 SuperBowl 게임에서 CMU의 RI는 MVS(멀티 카메라 스테레오 비전)를 통해 NVS를 시연했습니다. 당시 이 기술은 스포츠 TV 방송국에 이전되었습니다. 미국은 결국 상용화되지 않았고, 영국 BBC 방송사는 이를 위해 연구개발에 투자했지만 제대로 상용화되지 못했다. 이미지 기반 렌더링(IBR) 분야에는 깊이 이미지 기반 렌더링(DBIR)이라는 NVS 응용 분야가 있습니다. 또한, 2010년 큰 인기를 끌었던 3D TV 역시 단안 영상에서 양안 입체 효과를 얻어야 했지만, 기술이 미성숙하여 결국 대중화되지는 못했다. 당시에는 머신러닝을 기반으로 한 방법이 연구되기 시작했습니다.

매일 이미지 파일로 작업해야 하는 사람들은 프로젝트와 작업의 필요에 맞게 크기를 조정해야 하는 경우가 많습니다. 그러나 처리할 이미지가 너무 많으면 개별적으로 크기를 조정하는 데 많은 시간과 노력이 소요될 수 있습니다. 이 경우 PowerToys와 같은 도구는 무엇보다도 이미지 크기 조정 유틸리티를 사용하여 이미지 파일의 크기를 일괄 조정하는 데 유용할 수 있습니다. Image Resizer 설정을 지정하고 PowerToys를 사용하여 이미지 일괄 크기 조정을 시작하는 방법은 다음과 같습니다. PowerToys를 사용하여 이미지 크기를 일괄 조정하는 방법 PowerToys는 일상 작업 속도를 높이는 데 도움이 되는 다양한 유틸리티와 기능을 갖춘 올인원 프로그램입니다. 유틸리티 중 하나는 이미지입니다.

디지털 문화 산업의 활발한 발전과 함께 인공지능 기술이 이미지 편집 및 미화 분야에서도 널리 활용되기 시작했습니다. 그중 인물 피부 미화는 의심할 여지 없이 가장 널리 사용되고 가장 요구되는 기술 중 하나입니다. 전통적인 뷰티 알고리즘은 필터 기반 이미지 편집 기술을 사용하여 자동화된 피부 재생 및 잡티 제거 효과를 달성하며 소셜 네트워킹, 라이브 방송 및 기타 시나리오에서 널리 사용되었습니다. 그러나 임계값이 높은 전문 사진 산업에서는 이미지 해상도 및 품질 표준에 대한 높은 요구 사항으로 인해 수동 리터처가 여전히 인물 뷰티 리터칭, 피부 다듬기, 잡티 제거, 미백 등의 작업을 완료하는 주요 생산력입니다. 시리즈 일하다. 일반적으로 전문 리터처가 고화질 인물 사진에 피부 미화 작업을 수행하는 데 걸리는 평균 처리 시간은 1~2분입니다.
