애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

王林
풀어 주다: 2023-06-11 11:16:00
앞으로
1053명이 탐색했습니다.

저자|쑤샤오루

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

AIGC가 너무 인기가 많아서 메타버스는 잊혀졌나요?

애플의 새로운 AR 글래스 비전 프로(Vision Pro)가 24,000위안(한화 약 24,000위안) 출시되면서 한동안 휴면 상태였던 AR과 VR이 다시 한번 모두의 관심의 중심으로 돌아왔습니다.

AR과 ​​VR을 가장 먼저 준비하고, 가장 먼저 다시 설렘을 느끼는 사람은 누구일까요? 물론 가상사람과 디지털사람을 만드는 기업의 연속이다. 가상인간 기술은 엔터테인먼트와 매우 밀접하게 통합된 기술이다. 초기 메타버스 개념과 현 AIGC 시대에는 가상인간이 핫스팟과 통합될 수 있는 곳이 많다.

AIGC 콘셉트와 결합해 올해 상반기 업계 최대 테마다. 이달 초 인터넷 유명인 '한조숲'의 디지털 클론이 출시됐다. 사용자는 월간 또는 연간 단위로 음성, 통화 및 기타 서비스를 즐길 수 있다. AI가 인간 운전자를 대체하기 때문에 디지털 인간은 연중무휴 24시간 일할 수 있어 생산 능력이 크게 늘어납니다.

여기서 언급하는 라이브 방송 과정은 가상 인물의 '전통 장르' 중 하나인 '중간 인물', 즉 실제 인물의 공연을 중심으로 진행됩니다. 전적으로 프로그램이나 AI에 의해 주도되는 인공지능의 지속적인 진화와 함께, 적응 가능한 기반의 질문과 답변을 제공하는 것은 가상인간 산업의 또 다른 주요 발전 방향이 되었습니다.

AI 가상 인간을 구현하기 위한 기술 경로는 현재 두 가지 유형으로 나누어집니다. 하나는 대형 모델을 민영화하여 배포하는 것이고, 다른 하나는 기존 오픈 소스 모델을 기반으로 타겟 2차 개발을 수행하는 것입니다.

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가? 표 1 이 기사에서 인터뷰한 가상 인간 기업 3곳의 유형 분류 도표/오락 자본주의

이 기사에서 Entertainment Capitalism은 대표적인 가상 인간 기술 개발자 세 명을 소개하여 AI가 제품 개발 및 비즈니스 모델에 가져온 변화를 살펴봅니다.

AIGC 가상 콘텐츠 플랫폼 Yunbo는 라이브 방송사를 위한 "Little K Live Ji"를 캐리어로 사용하여 게임화된 방식으로 심층적인 라이브 방송 생태계를 탐색하고 구축합니다.

엔드 투 엔드 생성 AI 가상 인간 기술에 중점을 둔 Zhongke Shenzhi는 판매자를 위한 상품의 "자동 방송"에 중점을 두고 가상 인간 질문 및 답변 상호 작용의 효과를 크게 향상시키기 위해 자체 대형 모델을 출시했습니다.

크로스 모달 지능형 소프트웨어 서비스 회사인 Mejike는 기업을 위한 완전 자동 가상 앵커를 제공할 뿐만 아니라 기업의 내부 데이터를 사용하여 독점 모델을 교육하고 기업의 내부 데이터베이스 및 검색 엔진을 육성합니다.

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

AIGC를 여는 네 가지 방법

스테이션 B의 생방송을 시청하는 많은 앵커와 시청자들은 Xiao K의 생방송 소녀를 결코 낯설지 않을 것입니다. Xiao K Live Ji는 RGB 카메라를 사용하여 2D 사진 동작 데이터를 수집하고 알고리즘을 사용하여 3D 동작 데이터를 생성하여 기술적 해자를 형성합니다. 사용자는 Xiao K 라이브 방송 Ji를 직접 사용하여 자신만의 라이브 방송 가상 인물을 만들 수 있습니다.

"기본 알고리즘을 구축하고 개인 교육 데이터 세트를 보유하는 데 3년이 걸렸으며 제품이 초기 결과를 얻었습니다."

메이송은 2017년 라인콩 인터랙티브 게임 프로듀서직을 그만두고 인공지능 업계에 합류해 Xiao K 라이브 방송 소녀 개발사인 Yunbo Technology를 설립했습니다. 게임 산업과 AI 산업이라는 이중 배경도 윤보의 비즈니스 모델을 매우 독특하게 만듭니다.

Entertainment Capital의 AI 매핑

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가? "저희 회사의 사업 범위는 ToB와 ToC를 모두 포함합니다. 제품에는 Xiao K AI 모션 캡처, AI 드로잉, 가상 인간 엔진 등이 포함됩니다. 또한 자체 운영하는 MCN 길드 및 앵커 베이스도 보유하고 있습니다. 또한 회사는 라이브도 직면하고 있습니다. 방송, 게임, TV 세 가지 핵심 비즈니스 시나리오를 통해 기업에 가상인물과 가상 콘텐츠 서비스를 제공합니다.”

엔드 투 엔드 생성 AI 가상 인간 기술에 중점을 두고 있는 Zhongke GenSense는 5월 10일 "GenSense Digital Intelligence Jiang Shang"이라는 자체 대형 모델을 공식 출시했습니다.

"Open AI가 훈련 방법을 발표한 이후 대형 모델 입학의 난이도가 낮아졌습니다. 기업이 자체 대형 모델을 제작할지 여부는 주로 대형 모델의 상업 공간에 달려 있습니다. Zhongke Shenzhi의 창립자이자 CEO입니다." 설명하다. "2020년 초부터 우리는 Transformer를 기반으로 한 크로스 모달 훈련 작업을 시작했고, 데이터 정리 경험도 있습니다."

“저희는 주로 두 가지 측면에서 대규모 모델을 개발하고 있습니다. 첫째, 미래의 다중 모드 교육은 대규모 언어 모델을 기반으로 하며, 수직 분야의 기본 알고리즘은 대규모 모델에 의존해야 합니다. 둘째, 많은 고객이 민영화된 배포를 제안했습니다. 다른 대형 모델에 연결하면 소스 코드와 데이터 세트를 얻을 수 없습니다.”

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

Zhongke Shenzhi의 사업 범위에는 가상 라이브 방송, 디지털 직원 등 외에도 금융, 의료, 정부 및 기업 기업을 위한 B면 민영화 배포 사업도 포함됩니다. 회사의 가상 인간 실시간 상호 작용 및 응답 시스템 "Yun Xiaoqi", Yuanverse 전자 상거래 및 가상 인간 라이브 방송 도구 "Treasure Box Auto Broadcast & Virtual Assist Broadcast", AI 고속 애니메이션 생성 시스템 "Automatic Animation" "가 모두 출시되었습니다.

현재 Zhongke Shenzhi의 '자동 방송' 고객은 Tmall, Taobao, JD.com 및 기타 플랫폼에서 AI 가상 인간을 사용하는 중저가 브랜드 판매자의 70% 이상을 차지합니다. 최근에는 실제 사람과 가상의 사람이 동시에 등장할 수 있는 가상 비서 제품을 출시했다.

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

"우리의 목표는 엔드투엔드 가상 휴먼 작품을 만드는 것입니다. 사용자가 텍스트를 입력하면 직접 자동으로 3D 캐릭터로 모델링될 수 있고, 액션 표현이 실시간으로 생성되어 콘텐츠 출력을 형성할 수 있습니다." Cheng Weizhong은 회사가 기업에 완전한 도로 솔루션을 제공해야 한다고 지적했습니다.

Maijike Technology가 제공하는 라벨 중 하나는 "크로스 모달"입니다. 이 회사는 지능형 디지털 자산 및 지능형 세대 분야에 중점을 두고 있습니다. 주요 제품은 지능형 콘텐츠 제작, 지능형 가상 라이브 방송 및 수천 명의 사람들을 위한 개인화된 지능형 상호 작용입니다. 최근 중관춘 포럼에서 발표된 신제품인 디지털 지능 우주정거장(Digital Intelligence Space Station)뿐만 아니라 3차원, 실시간 및 지능도 주요 특징입니다.

이르면 2016년부터 Maijike Technology가 AIGC 분야에 진출하기 시작했다고 창업자이자 회장인 Fu Yingna는 말했습니다.

“우리는 수동 보정 데이터 코퍼스를 사용하지 않고 비정형 기술을 기반으로 데이터를 구축합니다. 예를 들어 기업의 다양한 데이터 문서를 계층적으로 처리하고 기업을 위한 교차 모드 검색 엔진을 구축하며 기업 데이터를 지능적으로 사용할 수 있습니다. 콘텐츠를 생성하고 쉽게 상호작용할 수 있습니다.”

기업을 위한 민영화 배포를 하는 회사는 많지만 중소기업이 대형 모델을 구축하는 것은 어렵습니다. Fu Yingna는 그들의 해자가 오픈 소스 대형 모델을 기반으로 한 조합 혁신에 있다고 믿습니다. 모델은 응용 프로그램에서 병렬 또는 직렬로 결합될 수 있습니다." 마이지케 기술의 기본 기술은 계층적 알고리즘입니다. 이러한 알고리즘 조합은 낮은 컴퓨팅 성능을 필요로 하며 저비용 및 고효율로 구성할 수 있습니다. 작은 샘플 데이터를 기반으로 리소스를 반복할 수 있습니다. 궁극적으로 진화 가능한 지능을 형성합니다.”

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

수익 창출의 여지는 어디에 있나요?

버추얼휴먼 라이브 방송은 크게 예능 방송, 게임 방송, 전자상거래 라이브 방송 3가지로 나뉜다. Yunbo의 Mei Song은 “가치 측면에서 가상 인간은 처음 두 가지에 더 적합합니다. 물건을 운반하는 시나리오의 핵심은 물건이 싸면 반드시 물건을 살 것입니다. 비싸면 누구나 판매하기 어려울 것입니다. 가상 사람들 라이브 스트리밍으로는 상품 문제를 해결할 수 없습니다.”

"가상 라이브 방송은 라이브 방송 중에 팬들과 즉시 소통할 수 없는 점을 개선할 수 있습니다. 팬들은 언제든지 가상 앵커에게 보상을 주고 의상을 변경할 수 있으며, 가상 라이브 방송 콘텐츠는 더욱 인터랙티브하고 풍부합니다."라고 메이 송은 말했습니다. -고품질의 라이브 콘텐츠에는 확실히 실제 사람들의 참여가 필요합니다.”

스테이션 B를 열면 어디서나 샤오케이의 '수돗물' 사용자를 볼 수 있습니다. Mei Song은 3D 가상 앵커 분야에서 Xiao K Live Ji의 시장 유지율이 90%에 달했으며 전체 네트워크에 400,000개 이상의 앵커가 서비스를 제공하고 일일 활성 방송이 있는 앵커가 5,000개 이상이라고 밝혔습니다. 모든 모션 캡처 라이브 방송 도구 중에서 Xiao K는 C 측에서 완전히 무료인 유일한 도구입니다.

“저는 Xiao K Live Ji의 제품에 의존하여 돈을 청구할 생각은 없습니다. 나중에 이 제품을 사용하여 더 많은 앵커를 유치할 수 있기를 바랍니다. 우주 장면을 활용해 인터랙티브 게임을 만들고 콘텐츠 트래픽으로 수익을 창출하는 것은 게임의 복합 모델과 유사합니다.”

메이 송은 가상 라이브 상호작용이 세 단계로 나누어질 것이라고 믿습니다. 1.0 시대는 실제 사람들과 함께 매일 생방송을 하고, 선물을 주고, 특수효과를 연주하고, 사격을 하는 시대였습니다. 2.0 팬은 생방송 방의 가상 콘텐츠에 영향을 미치거나 선물을 통해 캐릭터를 만들 수 있지만 팬은 통제할 수 없습니다. 3.0은 라이브 방송에서 팬과 앵커가 자유롭게 소통할 수 있는 공간으로, 팬들은 가상 조이스틱을 갖고 콘서트 개최, PK 플레이 등 완전한 독립적인 제어권을 갖는다. 올해 하반기 윤보는 3세대 라이브 인터랙티브 장면을 구현하기 위해 '메타버스'와 유사한 '리틀 K 우주정거장'을 출시할 예정이다.

Maijike Technology의 Fu Yingna는 플랫폼마다 가상 라이브 방송에 대한 정책이 다르다고 믿습니다. "Douyin은 권장하지 않을 것이지만 Bilibili는 아마도 권장할 것입니다. 결국 사용자는 다릅니다. 앞으로 플랫폼은 별도의 가상 라이브 방송 영역을 가질 수 있습니다. 결국 청중이 있습니다."

한편, "장기적으로 가상의 사람들이 실제 사람들을 대체한다면 그들은 플랫폼을 압박하고 플랫폼의 이익을 침해하는 것입니다. 그들은 미래에 반드시 금지될 것입니다." Zhongke는 상품을 가져오는 디지털 사람들의 이전 생방송이 폭발적이라고 말했습니다. Douyin이 지역 생활을 지원하고 싶어하기 때문에 인기가 있습니다.

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

"미래의 가상인간 라이브 방송은 플랫폼과 Win-Win이 되어야 합니다. 가상인간 기술 공급자는 플랫폼과 사용자, 가맹점이 무엇을 필요로 하는지 명확하게 생각해야 합니다. 가상앵커는 현실을 현실화하는 추론과 분석 능력을 갖춰야 합니다." 예를 들어 공세의 분위기가 긍정적인지 아닌지 즉각적으로 분석하고 판단할 수 있는 것이 바로 인공지능의 가치입니다.”

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?

AI+VR: 미래는 얼마나 밝습니까

대형 모델에 관해 Cheng Weizhong은 다음과 같이 말했습니다. "심층 AI를 교육하려면 많은 양의 말뭉치가 필요하며 이는 모두 OpenAI의 기존 적용 시나리오입니다. 더 중요한 것은 심층 AI 기술이 언제 한계점을 돌파할 수 있고 새로운 기술이 나올 수 있는가입니다. 마찬가지로, 우리가 구축하고 있는 대형 모델도 가상 인간의 한계 돌파구를 모색하고 있으며, 1년 안에 가상 인간 장면 상호 작용에 진전이 있을 것으로 기대합니다.”

ChatGPT 열풍 외에도 Cheng Weizhong은 Apple Glasses에도 주목하고 있습니다. "애플의 AR 글래스가 장기적으로 발전할 수 있을지는 기술적으로 AR과 VR을 통합할 수 있는지 여부뿐만 아니라, 더 중요한 것은 개발자와 돈을 공유하여 개발자의 참여를 유도하고 참여를 유도할 수 있는지 여부에 달려 있습니다. 생태계를 함께 만들어요”

“AR 안경의 발전으로 콘텐츠를 표현하는 방식도 바뀔 것이며, 이는 3D 콘텐츠 생성과 가상 인간을 하는 기업에도 더 큰 기회를 가져다 줄 것입니다.”

Apple Glasses와 관련하여 Mei Song은 VR 및 Metaverse를 위한 최상의 구현 시나리오는 초기 단계의 게임에 있다고 믿습니다. “VR 보급률과 이용자 수가 늘지 않은 이유는 VR을 기반으로 한 좋은 콘텐츠가 없기 때문이에요.”

Yunbo는 Xiao K 라이브 방송 Ji Zhong의 3D 자산을 구축하기 위해 3천만 위안을 투자했습니다. “한편으로는 비용이 드는 반면, Xiao K 비디오 엔진과 같은 자체 개발 기술을 보유하고 있습니다. 수년간의 연구를 통해 우리는 나만의 해자를 만들었습니다.”

"하반기에는 AI 음악, AI 음성 등 AIGC 멀티모달 변환 제품 개발에 착수할 예정이며, Xiao K Live Ji는 단일 카메라 전신 모션 캡처 버전을 출시할 예정입니다. 또한 사용자가 사용 가능한 애니메이션 데이터를 생성할 수 있도록 게임 애니메이션 제작 프로세스에 통합될 것입니다. 또한 Little K 그림의 전자상거래 및 게임 버전도 출시될 예정입니다.”

물론 이러한 계획에는 대형 모델의 지원도 필요하므로 Yunbo는 모델을 훈련하는 데에도 많은 양의 데이터를 사용할 것입니다. 회사에는 이미 수십 명의 라벨링 팀이 있습니다.

푸잉나 역시 AR/VR이 대중화된 이후의 상황을 설명하기 위해 업그레이드라는 용어를 사용했습니다. "인터넷 1세대에서는 모든 회사가 자체 웹사이트를 갖고 있습니다. 인터넷 2세대에서는 모든 회사가 자체 앱을 가지고 있습니다. 인터넷 3세대는 4차원 시공간 경험이 될 것이며, 3D 콘텐츠의 지능형 생성으로 업그레이드되어 시간 및 공간 접기를 통합하면 실시간 지능형 상호 작용이 가능합니다. 3D 콘텐츠는 H5 형식으로 출력될 수 있으며 실시간 상호 작용을 위해 웹 페이지, 클라이언트 등에 표시될 수 있습니다.

애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?마이지케테크놀로지가 개발한 최신 '디지털 우주정거장'은 가상공간에서 기업을 위한 '디지털 명함'을 구축할 수 있어 실제 물리적 시간과 공간의 한계를 뛰어넘어 입체적, 시각적, 지능적으로 제시할 수 있다. 모든 사람을 위한 1:1, 1000명 맞춤형 지능형 서비스를 사용자에게 제공합니다. 이러한 콘텐츠 작업은 프라이빗 배포 또는 SaaS를 통해 달성할 수 있습니다. 이는 차세대 콘텐츠 생산성과 몰입형 경험을 구축하는 핵심이기도 하며, 디지털 경제 시대의 중요한 도구이자 플랫폼이기도 합니다.

AIGC 기술은 계속해서 업계 인식을 혁신하는 동시에 가상 인간 기술에도 혁명을 가져옵니다. 가상인간 기술 실무자들에게 ChatGPT가 촉발한 AI 열풍은 AR/VR이라는 새로운 핫스팟과 결합되어 두 배의 설렘을 불러일으켰습니다.

새로 볼 것이 너무 많고 해야 할 일이 너무 많을 때, AI를 활용하여 끝없는 콘텐츠 소비자 제품을 생성하고 새로운 세계의 문을 여는 방법은 아마도 기술 제공자와 B-side 고객에게 필요한 문제 해결 방법일 것입니다. 함께.

위 내용은 애플의 헤드셋이 온다, AI 가상인간의 구세주인가, 아니면 유성인가?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:sohu.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!