AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?-일체 포함-php.cn

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?

2년 전 콜로라도주 박람회 미술대회에서 '스페이스 오페라'라는 작품이 1위를 차지했습니다.

이 그림은 웅장하고 밝고 어두우며 프랑스 상징주의 화가 구스타브 모로를 연상시킵니다. 하지만 사람이 그린 것이 아니라 그림 기초가 없는 참가자가 AI 그리기 도구를 사용해 그린 것입니다.

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?

시간을 2018년으로 돌려보자. 당시 뉴욕 크리스티 경매에서는 '에드먼드 벨라미의 초상'이라는 AI 그림이 40만 달러 이상에 팔렸다. 이는 인공지능 작품이 최초로 경매되는 것이며, 인공지능 작품이 시장에서 인정받는 시작이기도 하다.

요즘 AI페인팅이 일반화되면서 국내외 AI선수들이 잇따라 필드를 떠나며 이 트랙을 연기로 남기고 있습니다.

예를 들어 잘 알려진 외국 AI 사진 생성 애플리케이션 Midjourney, Stable Diffusion 및 DALL-E는 Byte, Alibaba 및 Tencent와 같은 국내 기업에서도 끊임없이 새로운 제품과 기능을 출시하고 있습니다. 그 다음에.

그러나 AI 매니아를 위한 다양한 AI 페인팅 애플리케이션이 있는데, 어떻게 하면 더 강력한 이미지-텍스트 매칭을 얻을 수 있을까요? 미적으로 더 만족스러운 이미지를 생성하는 방법은 무엇입니까? Vincent 다이어그램 모델을 효율적으로 배포하는 방법은 무엇입니까?

이 내용은 'AIGC 체험학교' 6회에서 다루겠습니다.

Volcano Engine, NVIDIA, 본 웹사이트 및 CMO CLUB이 공동으로 진행하는 "AIGC 체험 파티" 영상 프로그램은 마케팅 분야의 많은 전문가들이 모여 AIGC 기술의 적용, 사고 및 실천에 대해 논의합니다.

이 에피소드에서는 두 명의 업계 선배 게스트가 심미적인 텍스트 이미지 뒤에 숨은 기술적 연관성을 깊이 분석하고 더 강력한 이미지-텍스트 매칭을 달성하는 방법을 모든 사람에게 가르칠 것입니다.

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?

생방송 시간 : 8월 6일 19:00-19:40
생방송 주제 : 판타지 이미징, 고미 빈센트 사진의 기술 링크

여섯번째 프로그램 에피소드에는 두 명의 중요한 게스트, 즉 Doubao Wenshengtu 기술 전문가 Zhang Liang과 NVIDIA 솔루션 설계자 Zhao Yijia가 초대되었습니다.

흥미로운 콘텐츠 미리보기

AIGC 기술의 반복으로 생성 AI의 다중 모드 기능이 빠르게 확장되고 심화되고 있습니다. 대형 모델의 가장 인기 있는 응용 분야 중 하나인 Vincentian 그래픽은 최근 몇 년간 획기적인 발전을 이루며 콘텐츠 제작자의 역량을 크게 강화했습니다.

사용자는 몇 가지 간단한 프롬프트 단어만 입력하면 AI가 자동으로 현실적이고 섬세한 그림을 생성할 수 있습니다. 고전 유화의 섬세한 질감이든, 현대 추상 미술의 자유로운 표현이든, 동양 수묵화의 심오한 예술적 개념이든 쉽게 만들어 낼 수 있습니다. 역사상 유명한 화가들의 스타일을 배우고 모방할 수 있을 뿐만 아니라 새로운 예술 장르를 창조하여 사용자에게 전례 없는 창의적이고 상호 작용적인 경험을 선사합니다.

오늘날 AI 그림은 참과 거짓을 구별하기 어려울 정도로 '고화'하게 진화했습니다.

예:

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?

또는

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?

AI Wenshengtu가 주요 AI 제조업체가 경쟁하는 "향수"가 된 것은 바로 독특한 창의성과 몰입형 상호 작용 경험 때문입니다. ".

예를 들어 Byte는 Jiuying, Xinghua, Jimeng과 같은 AI 제품을 한꺼번에 출시했습니다. 예외 없이 모두 Wenshengtu 기능을 포함하고 있으며 이러한 제품 뒤에는 Byte의 Doubao Wenshengtu Large 모델이 있습니다.

Vincentian 그래프 모델의 경우 사용자의 "인기"를 얻으려면 세 가지가 필요합니다. 더 강력한 이미지-텍스트 매칭, 더 아름다운 이미지 효과, 더 빠른 생성 경험입니다.

그렇다면 Doubao Wensheng 대형 모델은 어떻게 사용자의 아이디어 디자인에 맞게 더 강력한 이미지와 텍스트 매칭을 달성할 수 있을까요? 보다 궁극적인 사용자 경험을 제공하기 위해 더 많은 심미적 이미지를 생성하는 방법은 무엇입니까? 대규모 서비스 요청을 충족하기 위해 그래프를 더 빠르게 생성하는 방법은 무엇입니까?

이 질문에 대한 답은 'AIGC 체험파티' 6호에서 공개됩니다.

생방송 등록

8월 6일 오후 7시 생방송실에 오셔서 "빈센티안 고미 사진의 기술 링크, 판타지 이미징"을 시청하시고, QR코드를 스캔하시면 생방송으로 바로 이동하실 수 있습니다. 방.

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?

지난호 리뷰

"AIGC 체험 파티" 다섯 번째 생방송에서는 Volcano Engine의 콘텐츠 보안 및 위험 관리 책임자인 Zhang Jianyang과 NVIDIA 엔터프라이즈급 수석 관리자인 He Kun이 출연했습니다. 개발자 커뮤니티에서는 AIGC의 마케팅 분야 혁신과 보안 이슈에 대해 심층 분석하고, 변화 속에서도 지속적인 성장과 사업의 꾸준한 발전을 이룰 수 있는 방법을 공유했습니다.

우리 모두 알고 있듯이 AIGC 기술은 점차 기업 마케팅을 위한 혁신적인 도구로 자리잡고 있습니다. 마케팅 담당자가 전례 없는 속도로 상상력이 풍부한 마케팅 자료를 만들 수 있도록 도와줍니다. 몇 가지 키워드나 프롬프트 단어만 입력하면 매력적인 마케팅 카피, 사진, 마케팅 동영상이 단시간에 자동으로 생성됩니다.

그러나 다른 기술 혁신과 마찬가지로 AIGC는 마케팅 창의성과 효율성을 향상시키는 동시에 많은 보안 문제도 가져옵니다.

Volcano Engine의 콘텐츠 보안 및 위험 관리 책임자인 Zhang Jianyang은 실제 사례를 사용하여 Volcano Engine의 AI 기술이 마케팅 담당자를 "보호"할 수 있는 방법을 보여주었습니다.

Zhang Jianyang은 대형 모델의 환상으로 인해 출력 결과를 완전히 제어할 수 없게 되어 마케팅 콘텐츠에 있어 다양한 잠재적인 콘텐츠 위험이 발생한다고 말했습니다. 예를 들어, AIGC 기술로 생성된 마케팅 카피에는 '최고', '최초', '세계 최고', '전체 네트워크 최초' 등 '절대적인' 용어가 포함되어 있으며, 생성된 마케팅 이미지나 동영상은 저속하고 질 낮은 단어가 포함되어 있으면 광고에 등장하면 브랜드 이미지를 손상시킬 뿐만 아니라 대중의 혐오감을 유발합니다.

이와 관련하여 Volcano Engine은 다중 모드 콘텐츠 지원, 다양한 위험 모델 및 실시간 위험 평가 기능을 통해 완전한 대상 콘텐츠 위험 탐지 엔진 세트를 제공하여 기업을 위한 포괄적이고 효율적인 위험 관리 솔루션을 만듭니다. .

그 중 마케팅 자료의 위험 다양성 문제를 해결하기 위해 탐지 엔진에는 수백 가지 위험 모델이 내장되어 있습니다. 예를 들어, 마케팅 카피에 적합한 광고 용어 탐지 모델은 카피에 절대적인 용어, 허위 선전, 소비를 유도하는 불법 콘텐츠가 포함되어 있는지 여부를 정확하게 판단할 수 있으며, 마케팅 동영상에 적합한 화질 및 저작권 탐지 모델은 카피에 포함된 내용이 포함되어 있는지 여부를 정확하게 판단할 수 있습니다. 절대적인 용어, 허위선전, 소비를 유도하는 불법 콘텐츠 등 불량한 이미지와 저품질 콘텐츠가 포함되어 있는지, 침해 가능성이 있는지 여부.

또한 기업에서는 타겟 사용자를 효과적으로 전환시키기 위해 사용자 충성도를 높이기 위해 신규 사용자 보상, 작업 보상 등 다양한 마케팅 활동에 집중적으로 투자하는 경우가 많습니다. 그러나 이러한 유혹적인 보상 메커니즘은 불법 회사의 눈에는 "뚱뚱한 고기"가 될 수도 있습니다. 그들은 허점을 이용하여 회사의 마케팅 자금을 스스로 가져갑니다.

예를 들어, 한 자동차 회사가 온라인 마케팅 활동을 펼쳤을 때 허위 지원과 허위 시승이라는 두 가지 어려운 문제에 직면했습니다. Volcano Engine 지능형 위험 제어 제품에 액세스한 후 단 2개월 만에 108만 건의 비정상 행위, 30,000개 이상의 비정상 계정, 20,000개 이상의 비정상 장치를 효과적으로 식별했으며 직접 중지 손실 금액은 500,000위안에 달했습니다. 마케팅 비용 낭비를 효과적으로 줄일 수 있을 뿐만 아니라 비즈니스 전환율도 크게 향상시킵니다.

NVIDIA 엔터프라이즈 개발자 커뮤니티의 수석 관리자인 He Kun은 멋진 도구인 NeMo Guardrails를 소개했습니다. 이는 대규모 언어 모델이 말도 안되는 소리를 하지 못하도록 하는 "보디가드"와 같습니다.

He Kun에 따르면 NeMo Guardrails는 민감한 주제, 부적절한 발언, 악의적인 공격을 방지하기 위해 프로그래밍 가능한 가드레일을 추가하여 대규모 언어 모델의 출력을 제어하는 오픈 소스 도구 라이브러리입니다. 여기에는 주제 제한, 대화 보안, 공격 방어라는 세 가지 주요 가드레일이 포함되어 있습니다. 사용자 정의 대화 논리를 지원하고 대화 로봇의 응답이 특정 요청 및 사전 정의된 논리를 준수하는지 확인합니다.

NeMo Guardrails의 워크플로우에는 사용자 입력 수신, 생성된 가드레일 일치, 대화 논리 흐름 실행 및 봇 답변 생성이 포함됩니다. 읽기 쉽고 확장성이 뛰어난 대화형 AI 모델링 언어인 Colang을 사용하여 대화형 논리를 정의합니다. 또한 NeMo Guardrails를 LangChain과 함께 사용하면 여러 개의 대규모 언어 모델 대화 엔진을 지원하여 더욱 안전한 대화 시스템 출력을 얻을 수 있습니다.

다섯 번째 호 리뷰 보기 주소: https://vtizr.xetlk.com/s/7CjTy (또는 아래 QR 코드 확인).

AI는 인간 화가가 미술 대회에서 1위를 차지하도록 돕는다. 그 비결은 무엇일까?