Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!-일체 포함-php.cn

방법 소개

집

기술 주변기기

일체 포함

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 11, 2024 pm 04:12 PM

동영상 데이터

지난 2년 동안 LAION-5B와 같은 대규모 이미지 및 텍스트 데이터 세트가 공개되면서 이미지 생성 분야에서는 Stable Diffusion, DALL-E 등 놀라운 효과를 갖는 일련의 방법이 등장했습니다. 2, ControlNet 및 Composer. 이러한 방법의 출현은 이미지 생성 분야에서 큰 혁신과 발전을 가져왔습니다. 이미지 생성 분야는 지난 2년 동안 급속도로 발전했습니다.

그러나 비디오 세대는 여전히 큰 도전에 직면해 있습니다. 첫째, 이미지 생성에 비해 비디오 생성은 더 높은 차원의 데이터를 처리해야 하며 추가적인 시간 차원을 고려해야 하므로 타이밍 모델링 문제가 발생합니다. 시간적 역학 학습을 촉진하려면 더 많은 비디오-텍스트 쌍 데이터가 필요합니다. 그러나 비디오의 정확한 시간적 주석은 비용이 많이 들고 비디오 텍스트 데이터세트의 크기가 제한됩니다. 현재 기존 WebVid10M 비디오 데이터 세트에는 10.7M 비디오-텍스트 쌍만 포함되어 있으며 LAION-5B 이미지 데이터 세트와 비교하면 데이터 크기가 크게 다릅니다. 이는 비디오 생성 모델의 대규모 확장 가능성을 심각하게 제한합니다.

위 문제를 해결하기 위해 화중 과학기술대학교, 알리바바 그룹, 저장대학교 및 Ant 그룹의 공동 연구팀은 최근 TF-T2V 비디오 솔루션을 출시했습니다.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

Paper 주소: https: //arxiv.org/abs/2312.15770

프로젝트 홈페이지: https://tf-t2v.github.io/

소스 코드는 곧 공개됩니다: https://github.com /ali-vilab/i2vgen -xl (VGen 프로젝트).

이 솔루션은 새로운 접근 방식을 취하고 풍부한 모션 역학을 학습할 수 있는 대규모 텍스트 프리 주석 비디오 데이터를 기반으로 비디오 생성을 제안합니다.

먼저 TF-T2V의 영상 생성 효과를 살펴보겠습니다:

빈센트 영상 과제

프롬트 단어: 눈 위의 거대한 서리 같은 생물의 영상을 생성하세요- 덮힌 땅.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

프롬프트: 만화 꿀벌의 애니메이션 비디오를 생성하세요.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

프롬프트: 미래형 판타지 오토바이가 포함된 비디오를 생성하세요.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

프롬프트: 행복하게 웃고 있는 어린 소년의 동영상을 생성하세요.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

프롬프트: 두통을 느끼는 노인의 영상을 생성하세요. tf-t2v는 제어 가능한 비디오 생성이 가능합니다. 해상도 비디오 합성:

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

준감시 설정

준감시 설정의 TF-T2V 방식은 "사람이 오른쪽에서 왼쪽으로 달린다"와 같은 동작의 텍스트 설명과 일치하는 동영상도 생성할 수 있습니다.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

방법 소개

TF-T2V의 핵심 아이디어는 모델을 모션 브랜치와 외관 브랜치로 나누고, 모션 브랜치를 사용하여 모션 역학을 모델링하는 것입니다. 모양 분기는 시각 정보를 학습하는 데 사용됩니다. 이 두 가지 분기는 공동으로 훈련되어 최종적으로 텍스트 기반 비디오 생성을 달성할 수 있습니다.

생성된 비디오의 시간적 일관성을 향상시키기 위해 저자 팀은 비디오 프레임 간의 연속성을 명시적으로 학습하기 위한 시간적 일관성 손실도 제안했습니다.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

TF-T2V는 Vincent 비디오 작업뿐만 아니라 스케치-비디오, 비디오 인페인팅, 첫 번째 프레임과 같은 결합된 비디오 생성 작업에도 적합한 일반 프레임워크라는 점을 언급할 가치가 있습니다. -비디오 등

구체적인 내용과 더 많은 실험 결과는 원 논문이나 프로젝트 홈페이지를 참고해주세요.

또한 저자 팀은 TF-T2V를 교사 모델로 사용하고 일관성 증류 기술을 사용하여 VideoLCM 모델을 얻었습니다:

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

논문 주소: https://arxiv.org/abs/ 2312.09109

프로젝트 홈페이지 : https://tf-t2v.github.io/

소스코드 공개 예정 : https://github.com/ali-vilab/i2vgen-xl (VGen 프로젝트) .

약 50단계의 DDIM 노이즈 제거 단계가 필요했던 기존 영상 생성 방식과 달리, TF-T2V 기반의 VideoLCM 방식은 약 4단계의 추론 노이즈 제거만으로 고화질 영상을 생성할 수 있어 영상 생성 효율성이 크게 향상됩니다. 능률.

VideoLCM의 4단계 노이즈 제거 추론 결과를 살펴보겠습니다.

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

자세한 내용과 더 많은 실험 결과는 VideoLCM 원본 논문이나 프로젝트를 참조하세요. 홈페이지.

전체적으로 TF-T2V 솔루션은 비디오 생성 분야에 새로운 아이디어를 제공하고 데이터 세트 크기 및 라벨링 문제로 인한 문제를 극복합니다. TF-T2V는 텍스트가 없는 대규모 주석 비디오 데이터를 활용하여 고품질 비디오를 생성할 수 있으며 다양한 비디오 생성 작업에 적용됩니다. 이러한 혁신은 비디오 생성 기술의 발전을 촉진하고 모든 계층에 더 광범위한 응용 시나리오와 비즈니스 기회를 제공할 것입니다.

위 내용은 Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7684

자바 튜토리얼

1639

Cakephp 튜토리얼

1393

라라벨 튜토리얼

1287

PHP 튜토리얼

1229

Related knowledge

Douyin에 다른 사람의 동영상을 게시하는 것이 침해인가요? 침해 없이 동영상을 편집하려면 어떻게 해야 하나요? Mar 21, 2024 pm 05:57 PM

단편 동영상 플랫폼의 등장으로 Douyin은 모든 사람의 일상생활에 없어서는 안 될 부분이 되었습니다. TikTok에서는 전 세계의 흥미로운 동영상을 볼 수 있습니다. 어떤 사람들은 다른 사람의 동영상을 게시하는 것을 좋아하는데, 이는 다음과 같은 질문을 제기합니다. Douyin이 다른 사람의 동영상을 게시하면 저작권을 침해합니까? 이 글에서는 이 문제에 대해 논의하고 침해 없이 동영상을 편집하는 방법과 침해 문제를 방지하는 방법을 알려드립니다. 1. Douyin이 타인의 영상을 게시하는 것에 대한 침해인가요? 우리나라 저작권법 조항에 따르면, 저작권 소유자의 허락 없이 저작권 소유자의 저작물을 무단으로 사용하는 것은 침해입니다. 따라서 원저작자나 저작권 소유자의 허락 없이 Douyin에 다른 사람의 동영상을 게시하는 것은 침해입니다. 2. 침해 없이 동영상을 편집하는 방법은 무엇입니까? 1. 공개 도메인 또는 라이센스 콘텐츠의 사용: 공개

ddrescue를 사용하여 Linux에서 데이터 복구 Mar 20, 2024 pm 01:37 PM

DDREASE는 하드 드라이브, SSD, RAM 디스크, CD, DVD 및 USB 저장 장치와 같은 파일 또는 블록 장치에서 데이터를 복구하기 위한 도구입니다. 한 블록 장치에서 다른 블록 장치로 데이터를 복사하여 손상된 데이터 블록은 남겨두고 양호한 데이터 블록만 이동합니다. ddreasue는 복구 작업 중에 간섭이 필요하지 않으므로 완전히 자동화된 강력한 복구 도구입니다. 게다가 ddasue 맵 파일 덕분에 언제든지 중지하고 다시 시작할 수 있습니다. DDREASE의 다른 주요 기능은 다음과 같습니다. 복구된 데이터를 덮어쓰지 않지만 반복 복구 시 공백을 채웁니다. 그러나 도구에 명시적으로 지시된 경우에는 잘릴 수 있습니다. 여러 파일이나 블록의 데이터를 단일 파일로 복구

오픈 소스! ZoeDepth를 넘어! DepthFM: 빠르고 정확한 단안 깊이 추정! Apr 03, 2024 pm 12:04 PM

0. 이 글은 어떤 내용을 담고 있나요? 우리는 다재다능하고 빠른 최첨단 생성 단안 깊이 추정 모델인 DepthFM을 제안합니다. DepthFM은 전통적인 깊이 추정 작업 외에도 깊이 인페인팅과 같은 다운스트림 작업에서 최첨단 기능을 보여줍니다. DepthFM은 효율적이며 몇 가지 추론 단계 내에서 깊이 맵을 합성할 수 있습니다. 이 작품을 함께 읽어보아요~ 1. 논문 정보 제목: DepthFM: FastMoncularDepthEstimationwithFlowMatching 저자: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Douyin에 동영상을 게시하여 수익을 창출하는 방법은 무엇입니까? 초보자가 Douyin으로 어떻게 돈을 벌 수 있나요? Mar 21, 2024 pm 08:17 PM

국민 단편 영상 플랫폼인 Douyin은 우리가 여가 시간에 재미있고 참신한 다양한 단편 영상을 즐길 수 있게 해줄 뿐만 아니라, 우리 자신을 보여주고 우리의 가치를 실현할 수 있는 무대를 제공합니다. 그렇다면 Douyin에 동영상을 게시하여 돈을 버는 방법은 무엇입니까? 이 글은 이 질문에 대해 자세히 답변하고 TikTok에서 더 많은 수익을 창출하는 데 도움이 될 것입니다. 1. Douyin에 동영상을 게시하여 수익을 창출하는 방법은 무엇입니까? 동영상을 게시하고 Douyin에서 일정 조회수를 얻은 후 광고 공유 계획에 참여할 수 있는 기회를 얻게 됩니다. 이 수입 방식은 Douyin 사용자들에게 가장 친숙한 방법 중 하나이며, 많은 창작자들의 주요 수입원이기도 합니다. Douyin은 계정 가중치, 영상 콘텐츠, 시청자 피드백 등 다양한 요소를 바탕으로 광고 공유 기회 제공 여부를 결정합니다. TikTok 플랫폼을 통해 시청자는 선물을 보내 좋아하는 크리에이터를 지원할 수 있습니다.

Google은 열광하고 있습니다. JAX 성능이 Pytorch와 TensorFlow를 능가합니다! GPU 추론 훈련을 위한 가장 빠른 선택이 될 수 있습니다. Apr 01, 2024 pm 07:46 PM

Google이 추진하는 JAX의 성능은 최근 벤치마크 테스트에서 Pytorch와 TensorFlow를 능가하여 7개 지표에서 1위를 차지했습니다. 그리고 JAX 성능이 가장 좋은 TPU에서는 테스트가 이루어지지 않았습니다. 개발자들 사이에서는 여전히 Tensorflow보다 Pytorch가 더 인기가 있습니다. 그러나 앞으로는 더 큰 모델이 JAX 플랫폼을 기반으로 훈련되고 실행될 것입니다. 모델 최근 Keras 팀은 기본 PyTorch 구현을 사용하여 세 가지 백엔드(TensorFlow, JAX, PyTorch)와 TensorFlow를 사용하는 Keras2를 벤치마킹했습니다. 첫째, 그들은 주류 세트를 선택합니다.

Xiaohongshu 비디오 작품을 출판하는 방법은 무엇입니까? 영상을 올릴 때 주의할 점은 무엇인가요? Mar 23, 2024 pm 08:50 PM

단편 동영상 플랫폼의 등장으로 Xiaohongshu는 많은 사람들이 자신의 삶을 공유하고 자신을 표현하며 트래픽을 얻는 플랫폼이 되었습니다. 이 플랫폼에서는 비디오 작품을 출판하는 것이 매우 인기 있는 상호 작용 방식입니다. 그렇다면 Xiaohongshu 비디오 작품을 출판하는 방법은 무엇입니까? 1. 샤오홍슈 영상 작품은 어떻게 출판하나요? 먼저, 공유할 비디오 콘텐츠가 준비되어 있는지 확인하세요. 휴대폰이나 기타 카메라 장비를 사용해 촬영할 수 있지만 화질과 사운드 선명도에 주의해야 합니다. 2. 영상 편집 : 작품을 더욱 돋보이게 하기 위해 영상을 편집할 수 있습니다. Douyin, Kuaishou 등과 같은 전문 비디오 편집 소프트웨어를 사용하여 필터, 음악, 자막 및 기타 요소를 추가할 수 있습니다. 3. 표지를 선택하세요. 표지는 사용자의 클릭을 유도하는 핵심 요소입니다. 사용자의 클릭을 유도할 수 있는 명확하고 흥미로운 그림을 표지로 선택하세요.

iPhone의 느린 셀룰러 데이터 인터넷 속도: 수정 사항 May 03, 2024 pm 09:01 PM

지연이 발생하고 iPhone의 모바일 데이터 연결 속도가 느립니까? 일반적으로 휴대폰의 셀룰러 인터넷 강도는 지역, 셀룰러 네트워크 유형, 로밍 유형 등과 같은 여러 요소에 따라 달라집니다. 더 빠르고 안정적인 셀룰러 인터넷 연결을 얻기 위해 할 수 있는 일이 몇 가지 있습니다. 수정 1 – iPhone 강제 다시 시작 때로는 장치를 강제로 다시 시작하면 셀룰러 연결을 포함한 많은 항목이 재설정됩니다. 1단계 – 볼륨 높이기 키를 한 번 눌렀다가 놓습니다. 그런 다음 볼륨 작게 키를 눌렀다가 다시 놓습니다. 2단계 - 프로세스의 다음 부분은 오른쪽에 있는 버튼을 누르는 것입니다. iPhone이 다시 시작되도록 하세요. 셀룰러 데이터를 활성화하고 네트워크 속도를 확인하세요. 다시 확인하세요 수정 2 – 데이터 모드 변경 5G는 더 나은 네트워크 속도를 제공하지만 신호가 약할 때 더 잘 작동합니다

이미지 품질을 압축하지 않고 웨이보에 동영상을 게시하는 방법_화질을 압축하지 않고 웨이보에 동영상을 게시하는 방법 Mar 30, 2024 pm 12:26 PM

1. 먼저 휴대폰에서 웨이보를 열고 오른쪽 하단의 [나]를 클릭하세요(그림 참조). 2. 그런 다음 오른쪽 상단에 있는 [기어]를 클릭하여 설정을 엽니다(그림 참조). 3. 그런 다음 [일반 설정]을 찾아 엽니다(그림 참조). 4. 그런 다음 [동영상 팔로우] 옵션을 입력하세요(그림 참조). 5. 그런 다음 [동영상 업로드 해상도] 설정을 엽니다(그림 참조). 6. 마지막으로 [원본 화질]을 선택하여 압축을 방지합니다(그림 참조).

See all articles

Huake, Ali 및 기타 기업이 공동 개발한 TF-T2V 기술로 AI 영상 제작 비용이 절감됩니다!

방법 소개

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제