올해는 AI 영상 세대 폭발의 원년으로, 소라로 대표되는 알고리즘 모델과 제품 애플리케이션이 꾸준히 등장하고 있습니다. 불과 몇 달 만에 수십 개의 비디오 생성 도구가 출시되었으며 AI 기반 비디오 제작이 시작되었습니다. 그러나 새로운 기술은 "블라인드 박스 열기"라는 잘 알려진 현상 외에도 AI로 생성된 비디오 콘텐츠도 제어 가능성이 낮고 처리 작업 흐름이 번거롭다는 비판을 자주 받아 왔습니다. OpenAI는 소라를 테스트하기 위해 전문 영상 제작팀을 초청한 적이 있습니다. 그 중 토론토의 Shy Kids 팀은 소라를 사용하여 창의성과 AI 기술을 완벽하게 결합한 풍선 맨 테마의 단편 영화를 제작했습니다. 깊은 인상.
사실 단편영화 전체는 소라가 직접 출력한 결과물이 아니고, 여러 개의 영상으로 구성되어 있는데, 소라가 다양한 영상을 제작할 때 주인공의 일관성을 확보하기 어렵습니다. 따라서 최종 단편영화 효과를 선보이기 전에 많은 수작업 사후 편집을 도입했습니다. 샤이키즈 제작자들은 “소라의 기술은 멋지지만 생성 과정을 제어하기 어렵다”고 결론지었습니다. 생성된 콘텐츠를 정확하게 제어하는 것은 AI 영상 제작에 있어서 중요한 요구 사항이자 오늘날의 알고리즘이 직면하고 있는 문제이기도 합니다. 큰 도전.
이를 위해 최근 막을 내린 상하이 세계인공지능회의(WAIC)에서 DAMO아카데미는 원스톱 AI 영상 제작 플랫폼 'Xunguang'을 출시했습니다. 사용자의 스크립트, 스토리보드 제작을 지원하고 워크플로 통합을 통해 전체 창작 프로세스의 효율성을 향상시킬 수 있는 PUGC의 원스톱 AI 동영상 제작 플랫폼으로 자리매김하고, 생성 및 제작을 위한 풍부한 AI를 지원합니다. 편집은 캐릭터 제어, 장면 제어, 스타일 전송, 카메라 이동 제어, 타겟 추가/제거/수정 등 10가지 이상의 AI 편집 기능을 제공하여 영상 속 요소와 개체를 정확하게 제어할 수 있습니다. Dharma Academy는 Xunguang 플랫폼을 통해 AI 비디오 제작의 효율성을 더욱 향상시키기를 희망합니다. 목표는 AI 기능을 사용하여 기존 비디오 제작의 전체 프로세스를 재구성하고 AI 시대의 새로운 비디오 워크플로우를 만드는 것입니다. . Xunguang의 연구 개발 초기 단계에서 DAMO 아카데미는 영화 및 TV 미디어 실무자들과 함께 광범위하고 집중적인 연구를 수행했습니다. 및 제작자는 비디오 AIGC 제작에 대한 요구 사항과 문제점을 이해합니다. 그들은 비디오 레이어가 거의 모든 비디오 제작자 사이에서 가장 자주 언급되고 가장 시급한 요구 사항이라는 것을 발견했습니다. 이를 바탕으로 Xunguang 플랫폼은 업계 최초로 체계적인 비디오 레이어 편집 기능을 출시했습니다. 사용자는 텍스트를 입력하여 텍스트 설명과 일치하고 배경이 투명한 비디오를 생성하고 한 번의 클릭으로 다른 배경 비디오와 혼합할 수 있습니다. 기존의 비디오 생성 기능을 기반으로 레이어와 같은 보다 유연한 형태로 콘텐츠가 생성됩니다. Xunguang은 레이어 분해 기능도 제공합니다. 한 번의 탭으로 선택한 대상이 즉시 별도의 레이어 비디오로 분해된 다음 다양한 배경 비디오를 원활하게 삽입할 수 있습니다. 사용자는 다양한 전경 레이어를 다양한 배경과 융합하여 더 많은 새로운 비디오를 결합할 수 있습니다. 레이어 융합 기능은 AI 창의성과 상상력을 더욱 자극하는 동시에 여러 장면 사이에서 장면과 캐릭터의 일관성을 유지합니다. 다모아카데미의 관점에서는 AI가 창작자의 작업을 대체하는 것이 아니라 영상 제작의 워크플로를 최적화하고 창의성을 주도하는 새로운 엔진이 될 것입니다. 스크립트 작성, 스토리보드 디자인, 자료 편집... 전통적인 비디오 제작 단계에는 명확한 작업 분업이 있습니다. ,주기가 길다. AI 기술의 지원으로 원래 다양한 생산 공정에 분산되어 있던 창의적인 단계가 이제 광탐지 플랫폼에서 원활하게 완료될 수 있습니다. "영상 편집을 PPT처럼 간단하고 직관적이며 사용하기 쉽게 만들고 싶습니다." 다모아카데미 시각기술연구소 수석 알고리즘 전문가인 Chen Weihua가 현장에서 소개한 주요 하이라이트는 다음과 같습니다. 빛을 찾는 플랫폼은 상호작용 측면입니다. Xunguang 플랫폼은 디자인할 때 AI 비디오 제작의 특성을 완전히 고려하여 각 비디오 프로젝트를 여러 하위 샷으로 추상화합니다. 사용자는 스크립트를 기반으로 하위 샷 그룹을 자동으로 생성하거나 업로드할 수 있습니다. 원본 비디오 자료 자체를 알고리즘에 의해 여러 개의 하위 샷으로 나눕니다. 창작 공간에서 사용자는 각 장면을 쉽게 볼 수 있습니다. 장면 내의 여러 장면을 드래그하여 장면 사이의 순서를 조정할 수도 있습니다. 사용자는 또한 어느 위치에서나 새로운 하위 샷을 추가 및 생성할 수 있고, 이미지 생성 또는 비디오 생성 기능을 호출하여 콘텐츠를 생성하거나, 다양한 기존 자료를 추가할 수도 있습니다. 각 샷에 대해 Xunguang은 처리를 위한 완벽하고 지능적인 AI 비디오 편집 기능을 제공하며, 이는 사용자 의도에 따라 픽셀 수준이 아닌 의미 수준에서 편집할 수 있습니다. 분할 샷의 인체, 얼굴, 전경, 배경과 같은 로컬 타겟을 세밀하게 편집하고 수정할 수 있습니다. 예를 들어, 공간적 피사계 심도의 카메라 움직임 제어를 이해하는 것. 또 다른 예, 객체 간의 상대적 관계의 타겟 제거/수정을 이해할 수 있는 것. 비디오의 글로벌 요소 편집 측면에서 Light-finding 플랫폼은 20개 이상의 스타일 마이그레이션을 제공합니다. Xunguang은 프레임 속도 제어 및 비디오 초해상도와 같은 실용적인 비디오 편집 기능도 제공합니다. Chen Weihua는 “사용자에게 최대한의 창작 자유를 제공하기 위해 동영상의 모든 요소를 편집하고 수정할 수 있기를 바랍니다.”라고 말했습니다. 오늘날 우리는 AIGC의 변화의 물결 속에 있으며, AI는 새로운 비디오 워크플로우를 탄생시킬 수 있는 잠재력을 가지고 있습니다. 전문 영화 및 TV 실무자와 창작을 좋아하는 UGC 사용자 모두 이 혜택을 누릴 수 있습니다. "일을 잘하려면 먼저 도구를 갈고닦아야 합니다." Damo Academy는 Xunguang 동영상 제작 플랫폼이 모든 제작자를 위한 독점적인 동영상 스튜디오가 되어 AI와 제작자 사이의 긴밀한 관계를 달성할 수 있기를 바랍니다. , 효율적인 협업으로 진정한 AI 생산성을 발휘합니다. 이를 위해 DAMO아카데미 비전기술연구소에서는 많은 기술비축을 해왔습니다. 이 연구실은 다중 모드 시각 신호 이해 및 생성 기술 연구에 전념하고 있습니다. 현재 주요 연구 방향에는 보다 정확한 이미지/비디오/3D 콘텐츠 생성, 보다 제어 가능한 이미지/비디오/3D 콘텐츠 편집 및 보다 효율적인 프레임 생성이 포함됩니다. , 다중 모드 이해 - 생성 프레임 등 Chen Weihua는 "Xunguang"이 가까운 시일 내에 내부 테스트를 위해 출시될 것이며 계속해서 상호 작용을 반복하고 최적화할 것이라고 말했습니다. 제작자는 자신의 AI 워크플로를 맞춤 설정할 수 있습니다. https://xunguang.damo-vision.com/위 내용은 DAMO 아카데미, 새로운 AI 워크플로우를 만드는 원스톱 AI 영상 제작 플랫폼 'Xunguang' 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!