작성자: Yu Sheng
AIGC 시대가 도래했는데, 메타버스는 어디까지?
추천 도서:
AIGC "제너레이션 파워"|AIGC 시즌 1위 ①
AI 불안을 극복하는 가장 좋은 방법은 'AIGC에 참여하는 것'│AIGC 계간호 1호
2023년에는 AIGC가 쭉 '급증'할 것입니다.
미국 인공지능 연구 회사인 OpenAI가 개발한 AI 대화 모델 ChatGPT가 AIGC의 불꽃을 일으키며 단시간에 초원의 불을 지폈습니다. 이어 Baidu의 "Wen Xin Yi Yan"과 SenseTime Technology" 리리신'센세노바(Sensenova)' 등 국내 대형 모델 제품이 속속 출시되고 있다.
이뿐만 아니라 AIGC에서는 사진, 오디오, 영상 등 다양한 분야의 신제품도 차례대로 선보이고 있습니다. iiMedia Consulting 데이터에 따르면 중국 AIGC 산업의 핵심 시장 규모는 2023년 79억 3천만 위안, 2028년에는 2,767억 4천만 위안에 이를 것으로 예상됩니다.
이에 비해 대중의 눈에 자주 등장했던 '메타버스'라는 개념은 소외된 것 같습니다. 그러나 실제로 AIGC와 메타버스는 서로를 보완하며 둘 사이에는 트레이드오프가 없습니다.
그렇다면 AIGC가 메타버스에 어떤 기술 지원을 제공할 수 있을까요? AIGC가 가져온 현재의 "산업 진동" 감각이 지속될 수 있으며, 메타버스 콘텐츠 및 응용 시나리오 구축에 있어 힘을 실어주는 효과로 전환될 수 있습니까? 우리는 메타버스에서 얼마나 멀리 떨어져 있나요?
이러한 질문에 대해 No.1은 광저우 버츄얼 필름(주)의 마케팅 디렉터인 징 마오센(Jing Maosen)과 항저우 유롄 타임즈(Hangzhou Youlian Times Co., Ltd.)의 설립자 겸 CEO인 장 야홍(Jiang Yahong)을 인터뷰하여 메타버스의 "사람" AIGC는 메타버스의 "사람"을 위해 무엇을 할 수 있나요?
주요 혁신: AI 가상 인간에 영혼 주입
"가상인간은 미래 메타버스에서 매우 중요한 개념입니다."
가상영화계의 징 마오센의 관점에서 보면, 실제 인물이 조종하는 디지털 아바타든 메타버스의 소위 NPC든 메타버스에서는 없어서는 안 될 존재입니다. 그러나 메타버스의 정상적인 작동을 위해 충분한 수의 가상 인간을 생성하기 위해서는 그들 모두를 실제 사람이 운전하게 하는 것은 필연적으로 불가능하다.
AI 가상인간의 중요성은 자명합니다.
2018년부터 텐센트, 바이두, 알리바바 등 많은 주요 인터넷 기업과 미디어 기업들이 디지털 가상인간 사업을 시작했습니다. Xinhua News Agency와 Tencent의 "Xiao Zheng", Alibaba의 "AYAYI", Zhejiang Satellite TV의 "Gu Xiaoyu", Mango Super Media "YAOYAO" 및 기타 가상 디지털 사용자는 셀 수 없이 많습니다.
하지만 AI 가상인간의 치명적인 약점은 영혼이 없다는 점입니다.
즉, 현재 시중에 나와 있는 AI 가상인간에 대한 우리의 인식은 여전히 대부분 진정으로 소통할 수 있는 가상인간이라기보다는 영혼이 없고 인간의 표정을 이해할 수 없는 AI 로봇이라는 것입니다. Jing Maosen은 또한 현재의 AI 기반 가상 인간은 경직된 움직임, 불충분한 유연성 표현, 감정 없는 목소리, 낮은 피드백 효율성 등의 문제를 가지고 있어 가상 인간 산업의 발전을 어느 정도 제한한다고 말했습니다.
그러나 ChatGPT가 인기를 얻은 후 업계의 많은 사람들은 "ChatGPT가 AI 가상 인간에 영혼을 주입한다"고 생각했습니다.
GPT-4를 예로 들면 대규모 다중 모드 사전 학습 모델로서 이미지와 텍스트 입력을 동시에 수용하고 이에 따라 해당 답변을 제공할 수 있습니다. ChatGPT 1세대와 비교하여 GPT-4의 문제 해결 및 의사소통 능력이 크게 향상되었습니다.
그럼, "AI 가상 인간에 영혼을 주입하는 ChatGPT" 아이디어가 실현 가능할까요?
Jing Maosen은 이 길이 가능하다고 믿습니다.
ChatGPT의 사전 훈련 모델과 강력한 지식 기반을 기반으로 가상 사람은 해당 지침을 받은 후 데이터베이스에서 관련 정보를 신속하게 검색하고 짧은 시간 내에 해당 답변을 제공함으로써 ChatGPT와 가상 사람 간의 관계를 실현할 수 있습니다. 상호 보완적인 장점은 가상 사람들 간의 상호 작용을 인간의 일상적인 의사 소통 및 표현 상태에 더 가깝게 만듭니다.
2월 1일, 국내 가상 기술 서비스 제공업체인 시유테크놀로지(Shiyou Technology)는 자사의 디지털 휴먼 사업이 AI '두뇌'인 ChatGPT를 채택했다고 발표했다. 디지털 휴먼 고유의 두뇌 형태로 맞춤형 모델 트레이닝을 진행합니다. 또한 Yuanjing Technology, Cape Cloud 및 기타 회사에서도 회사의 디지털 인간 관련 비즈니스가 ChatGPT와 연결되어 가상 디지털 인간 관련 비즈니스 역량을 향상 및 강화했다고 밝혔습니다.
이를 바탕으로 Jing Maosen은 가상 인간 산업이 미래에 새로운 혁신과 업그레이드를 가져올 것이라고 예측합니다.
구체적으로, 가상인간 산업은 앞으로 '질적'과 '양적'이라는 두 가지 방향으로 발전할 것입니다.
첫째, 일부 고품질 가상 인간은 지속적으로 최적화되고 개선되어 고정밀 방향으로 발전할 것입니다. 예를 들어, 버추얼 픽처스는 오랫동안 가상 인간의 이미지 제작과 모델 제작에 집중해 왔으며, 그가 만든 가상 인간 '크레인 체이스'는 영화와 TV 분야에 뿌리를 두고 있다. 애니메이션은 효과가 있으며 1억 명이 넘는 사람들이 온라인으로 도달하고 있습니다.
두 번째는 AI가 주도하는 기능성 및 응용 가상 인간의 수가 크게 증가하고 전면적으로 출시될 것이라는 점입니다. "ChatGPT를 비롯한 대형 모델 제품과 AI 매핑, AI 모델링 등 관련 기술은 가상인간 산업의 자산비용을 절감할 것입니다. 많은 중소 스타트업도 이 분야에서 상당한 성공을 거둘 수 있습니다. 발전 기회가 주어지면 산업 전체가 더욱 번영할 것입니다.”
포괄적인 권한 부여: 지구 재건 시간을 단축
미디어 수준 정보 전파 부문의 관점에서 AIGC 관련 기업의 산업 레이아웃의 주요 영역은 텍스트, 사진, 오디오 및 비디오입니다.
그러나 AIGC와 관련된 산업 분야로 볼 때 AIGC는 실제로 정보, 게임, 미디어 및 영화 및 TV 창작, 전자 상거래, 금융 컨설팅 등 다양한 분야에 내재되어 있으며 AIGC의 모든 측면에 지대한 영향을 미칩니다. 우리의 일상.
마찬가지로 AIGC도 메타버스 구축에 완전한 권한을 부여할 것입니다.
Youlian Times의 창립자이자 CEO인 Jiang Yahong은 메타버스에 대한 자신의 비전에서 출발하여 메타버스의 공간 건설, 콘텐츠 생성 및 경험 시나리오에서 AIGC의 역량을 자세히 설명했습니다.
그는 AIGC가 메타버스에 어떻게 힘을 실어주는지에 관해 이야기할 때 가장 먼저 생각해야 할 것은 메타버스에 있는 "사람들"이 가상 세계에서 어떻게 살고 일하고 소비하는지라고 믿습니다. "메타버스에서는 동료와 함께 일하든, 사교 활동을 하든, 오락을 하든 우리 모두는 자신만의 디지털 아바타를 갖고 공간의 제약 없이 메타버스의 다양한 응용 시나리오를 경험할 수 있어야 합니다."
메타버스의 인프라로서 실생활 3D 디지털 휴먼은 메타버스 컨퍼런스, 문화 박물관, 문화 관광, 대학, 오프라인 전시장, 영화 및 TV, 게임 엔터테인먼트, 브랜드 홍보 등 매우 광범위한 응용 가능성을 가지고 있습니다.오늘날 U-Link 시대는 문화 및 관광 현장, 영화 제작, 게임 엔터테인먼트, 브랜드 홍보, 오프라인 전시장 등, 특히 실시간 디지털 시대에 실용적인 제품인 U-Link 3D Cloud Array Camera를 개발했습니다. 아바타. 이 광고는 메타버스에서 1초 만에 실생활 디지털 인물을 생성하고, 단 5분 만에 실생활 3D 디지털 아바타를 생성할 수 있는 스마트 기기로, 비용은 단 100위안으로 '소비자'를 달성한다. 레벨'은 디지털 아바타를 만드는 방식의 획기적인 발전입니다. Jiang Yahong은 AIGC의 개발이 실시간 생성 디지털 아바타의 정확성과 응용 시나리오 개발 측면에서 새로운 기회를 가져올 것이라고 말했습니다.
구체적으로 메타버스의 '사람' 자체 수준에서 말하면 AIGC는 가상 인물에게 '두뇌'를 제공하는 것 외에도 이미지 그리기, 모델 생성 및 가상 인물 구축 측면에서 생산 효율성을 크게 향상시킬 수 있습니다. 또한 가상 인간 표현과 움직임의 유연성과 진정성, 사운드 출력의 의인화 측면에서 질적 발전을 가져옵니다.
예를 들어, 국제 3D 엔진 대기업 Unity China의 수석 관리자이자 교차 단말기 이식 기술 책임자인 Sun Zhipeng은 "Daily Economic News" 기자와의 인터뷰에서 AI 페인팅에 해당하는 3D 엔진이 "한 문장 모델링"을 실현합니다.
또 다른 예로 Jing Maosen은 인터뷰에서 AI 모션 캡처 기술을 구체적으로 언급했습니다.
모션캡처 분야에서 가상휴먼 산업의 투자 및 유지 비용은 늘 매우 높았습니다. “광학 모션 캡처 스튜디오를 구축하는 것만으로도 수백만 달러의 투자가 필요하며, 이는 많은 스타트업 기업에게 높은 비용입니다. "투자비용이 매우 높습니다."
AI 모션 캡쳐 기술은 캡쳐된 영상을 기반으로 영상 속 캐릭터의 움직임을 정확하게 식별하고 재현할 수 있으며, 가상 인간의 골격 움직임 데이터를 자동으로 생성할 수 있습니다. 이를 바탕으로 이 데이터를 가상인간의 3차원 모델에 할당함으로써 가상인간의 행동구동이 완성될 수 있다.
이 과정에서 가상 인간을 구동하기 위해 고가의 전문 모션 캡처 장비나 전문 인력이 모션 캡처 장비를 착용할 필요가 없으므로 모션 캡처 비용을 절감하는 동시에 모션 캡처 효율성을 향상시켜 일석이조에 달합니다.
이렇게 보면 AIGC가 메타버스에서 '사람'에게 권한을 부여하는 것은 포괄적입니다.
AIGC는 메타버스의 장면 구축을 위한 탄탄한 기술 지원을 제공하고 메타버스에서 '사람'의 다양한 활동을 위한 새로운 공간을 열어줄 수 있는 한편, AIGC 자체를 가상 분야에 적용할 수 있습니다. 인간 생산은 또한 가상 인간의 생산 비용을 줄이고 더 많은 사람들이 메타버스에서 자신의 디지털 아바타를 가질 수 있는 기회를 제공합니다.
결국 메타버스의 궁극적인 형태를 달성하는 시간은 가속화됩니다.
Jing Maosen은 메타버스가 생활에서 구현되기 위해서는 실제로 가상 세계에서 지구를 재창조하는 것과 동일하며 엄청난 양의 엔지니어링과 자산이 필요하다고 언급했습니다. 이 과정에서 AI 지원이 있다면 지구를 재건하는 시간은 더욱 빨라질 것이다.
현실로 돌아가기: 우리와 메타버스 사이의 거리
"AIGC 시대가 온다."
Jing Maosen은 ChatGPT의 높은 유연성, 높은 정확성, 높은 피드백 효율성을 경험한 후 이것이 그의 첫인상이라고 솔직하게 말했습니다.
ChatGPT 등의 추측이 사람 일자리의 80%를 대체할 것이고, AI 그림이 중저급 원화의 자리를 대체할 것이라는 게 만연하다. 동시에 ChatGPT 연구원 및 알고리즘 엔지니어와 같은 새로운 직위가 창출되어 사람들의 컴퓨터 기술 사용 능력에 대한 요구 사항이 더 높아졌습니다.
"AI가 그리는 '스페이스 오페라'"
이것은 흔한 말이 아닙니다.
제너레이티브 AI는 컴퓨터 비전, 데이터 마이닝, 기계 학습, 지능형 음성 기술, 자연어 처리, 지식 그래프 및 기타 핵심 AI 기술을 통합하며 창의성, 표현력, 반복, 의사소통, 개인화 등에서 상당한 이점을 발휘할 수 있습니다. 하지만 1번은 AIGC의 실제 구현에 있어서 '이상'과 '현실' 사이에 모순이 있다는 사실을 인터뷰를 통해 알게 됐다.
2022년 7월 Baidu CEO Robin Li는 2022 Baidu World Conference에서 AIGC가 세 가지 개발 단계를 거칠 것이라고 판단했습니다. 첫 번째는 AIGC가 콘텐츠 제작에서 인간을 지원하는 데 사용되는 '보조 단계'입니다. AIGC는 가상과 현실이 공존하는 가상인간의 형태로 등장해 인간과 기계가 공생하는 상황을 형성한다. 세 번째는 AIGC가 독자적으로 콘텐츠 제작을 완성하는 '원래 단계'다.
지금은 '콜라보 무대'와 '원작 무대'가 얽혀있는 시기입니다.
예를 들어 가상인간 산업에서는 '영혼이 없는 가상인간'의 문제는 ChatGPT 등의 대형 모델에 접근하면 어느 정도 해결될 수 있지만, 실제 운영 및 애플리케이션 구현 과정에서는 자연어 처리 및 변환이 이루어집니다. , 피드백 효율성이 부족한 등의 문제도 고려해야 합니다.
가상인물이 충분한 진정성과 생생함을 갖춰야 가상인물의 최대 가치가 발휘될 수 있습니다.
"이제 AI에 대한 모든 사람의 기대는 그다지 높지 않습니다." Jing Maosen은 대부분의 사람들이 현재 AIGC 기술을 경험적 사고 방식으로 보고 있지만 AIGC 관련 응용 프로그램의 실제 구현 단계에서는 그러한 AI 그림을 볼 수 있는 손이 없다고 분석했습니다. 잘 그리는 것과 ChatGPT가 이해할 수 없는 인간의 요구가 AIGC의 향후 발전을 결정하는 열쇠입니다.
현재 AIGC의 인기는 메타버스가 진정한 번영의 단계에 진입하기 전의 서곡에 불과하다고 할 수 있습니다. 우리는 메타버스의 "궁극적 형태"를 구현하려면 아직 멀었습니다.
Jiang Yahong은 또한 현재 Metaverse가 아직 초기 단계이며 Metaverse 관련 애플리케이션이 실제로 구현되기까지는 최소 3년이 걸릴 것이라고 말했습니다. 그는 Youlian Times가 하고 있는 디지털 아바타의 촬영 및 제작 작업은 메타버스를 구축하는 과정의 일부일 뿐이지만, 이는 또한 메타버스의 매우 중요한 인프라임을 솔직하게 인정했습니다. 시장은 폭발하기를 기다리고 있습니다.
그리고 또 다른 문제는 메타버스의 관련 소비 및 적용 시나리오가 아직 완전히 공개되지 않았다는 점입니다. 가상인간 산업을 예로 들어보겠습니다. 현재 가상인간 응용 시장은 주로 미디어, 엔터테인먼트 분야에서 이루어지고 있습니다. 맨드릴픽쳐스가 만든 초현실주의 디지털 인간 '메이세티안'은 주로 지식 대중화, 토크쇼 분야에서 활동하고 있습니다. 공연, 패션 생활, 문학 및 예술 창작 및 기타 분야.
대부분의 사람들은 참여자나 경험자가 아닌 방관자로서 가상의 사람들과 직접 교류하고 소통할 뿐이기 때문에 가상의 사람들을 보다 직관적으로 관찰하고 이해하기는 어렵습니다. 이에 맞춰 메타버스도 마찬가지다. 충분한 인원이 참여해야 메타버스의 프로토타입이 초기에 확립됐다고 볼 수 있다.
이와 관련하여 장야홍은 메타버스의 핵심 요소는 공간, 사람, 콘텐츠, 장면을 포함해야 한다고 말했습니다. 비즈니스 관점에서는 메타버스의 '사람, 물건, 장소'가 빠르게 반영될 수 있어야 합니다. "이를 바탕으로 가상인간 산업의 경제적 가치를 더욱 극대화하고 메타버스의 진정한 의미를 반영할 수 있습니다."
결론 1번
2022년 10월 AIGC 스타트업 Jasper는 시리즈 A 자금 조달에서 1억 2,500만 달러를 받았습니다. 재스퍼가 탄생 당시 무명에서 유니콘 기업으로 거듭나기까지 불과 18개월이 걸렸다.
재스퍼를 비롯해 AIGC를 활용해 빠르게 발전한 수많은 기업이 있습니다. 대규모 자본 유입과 시장 규모의 급속한 확장으로 인해 AIGC 산업은 새로운 급속한 발전을 가져올 것으로 예상됩니다.
4월 19일 Yu Guoming 학자는 "Metaverse, AIGC and Communication Revolution - From ChatGPT to the Future of the Fully Intelligence Era"라는 제목의 강연에서 ChatGPT 기반의 AIGC를 12가지 측면에서 체계적으로 공개했습니다. 지능형 상호 연결, 메타버스는 디지털 지능 시대의 필연적인 산물입니다.
AIGC의 인기로 인해 우리는 떠다니는 메타버스에 대한 환상과 논의를 멈추고 메타버스의 발전을 이끄는 핵심 기술 엔진인 AI와 AIGC를 보기 시작했습니다. 아마도 미래에는 AIGC가 진정한 메타버스의 문을 여는 열쇠로 활용될 수 있을 것입니다.
위 내용은 AIGC는 메타버스의 '사람'을 위해 무엇을 할 수 있나요? |AIGC 시즌1위②의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!