Microsoft는 AR/VR 신체 자세 캡처를 위해 관절형 물체의 자세를 예측하는 특허 기술을 제안합니다.
(2023년 9월 18일) 인간 사용자의 실제 자세를 정확하게 표현하려면 일반적으로 사용자 신체 부위의 위치와 방향에 대한 상대적으로 자세한 정보가 필요하지만 이 정보가 항상 제공되는 것은 아닙니다. 예를 들어, 가상 현실 경험을 제공하기 위해 헤드셋을 사용할 때 시스템은 사용자의 머리와 손과 관련된 공간 정보만 얻을 수 있습니다. 그러나 대부분의 경우 이는 인간 사용자의 실제 자세를 정확하게 재현하기에는 충분하지 않습니다
그래서 마이크로소프트는 "관절형 물체의 자세 예측"이라는 특허 출원에서 관절형 물체의 자세를 예측하는 기술을 제안했습니다. 특히, 기계 학습 모델은 관절 개체의 n개의 서로 다른 관절의 공간 정보를 수신합니다. 여기서 n개의 관절은 관절 개체의 모든 관절보다 작습니다.
인간 사용자의 경우, n개의 관절에는 인간 사용자의 머리 관절 및/또는 하나 또는 두 개의 손목 관절이 포함될 수 있으며, 이는 사용자의 머리 및/또는 손의 매개변수를 자세히 설명하는 공간 정보와 연관됩니다.
기계 학습 모델은 관절로 연결된 물체의 n+m개 관절에 대한 입력 공간 정보를 수신하도록 훈련되었습니다. 여기서 m은 1보다 크거나 같습니다. 예를 들어, 초기 훈련 중에 기계 학습 모델은 연결된 개체의 거의 모든 관절에 해당하는 입력 데이터를 받습니다. n+m개의 관절은 다관절체의 각 관절을 포함할 수 있다.
다른 예에서는 관절로 연결된 물체의 모든 관절보다 적은 수의 관절이 n+m개 있을 수 있습니다. 훈련 과정에서 기계 학습 모델에 입력된 데이터가 점차 숨겨질 수 있습니다. m개의 노드 중 특정 노드의 해당 입력 데이터를 미리 정의된 값으로 바꾸거나 간단히 생략할 수 있습니다
즉, 기계 학습 모델은 관절로 연결된 개체의 다양한 이동 가능한 부분의 위치/방향에 대한 점점 더 적은 정보를 기반으로 관절로 연결된 개체의 자세를 정확하게 예측하도록 훈련됩니다.
이 접근 방식을 사용하면 기계 학습 모델은 희박한 입력 데이터만으로 런타임에 연결된 개체의 자세를 정확하게 예측할 수 있습니다. Microsoft는 이 기술이 각 관절의 방향에 대한 많은 정보를 요구하지 않고도 인간 사용자를 위해 관절 개체의 실제 자세를 정확하게 재현할 수 있다고 지적합니다
즉, 발명품은 인간 사용자의 실제 제스처를 보다 정확하게 재현함으로써 인간과 컴퓨터의 상호 작용을 향상시키는 기술적 이점을 제공할 수 있습니다. 이러한 기술적 이점에는 가상 현실 경험의 몰입도 향상과 제스처 인식 시스템의 정확성 향상이 포함됩니다
또한 설명된 기술은 자세 예측 프로세스에 입력으로 수집해야 하는 데이터의 양을 줄임으로써 인간 사용자의 실제 자세를 정확하게 재현하면서 컴퓨팅 리소스 소비를 줄일 수 있습니다.
예제 방법 200은 관절로 연결된 물체의 자세를 예측하기 위한 그림 2를 보여줍니다
202번 지점에서 관절화된 물체에 사용되는 n개의 관절의 공간정보를 수신합니다. 시스템은 관절 객체의 n개 관절의 공간 정보를 수신하는데, 이는 관절 객체의 모든 관절보다 적은 수의 관절을 포함합니다. 관절의 공간정보를 신체 부위를 연결하는 6자유도의 위치와 방향으로 표현하여 관절의 상태를 유추할 수 있습니다
일례로, n개의 관절에는 인체의 머리 관절이 포함될 수 있으며, 머리 관절의 공간 정보는 인간 머리의 매개변수를 자세하게 기술할 수 있습니다. 또한, n개의 관절은 인체의 하나 이상의 손목 관절을 포함할 수 있으며, 하나 이상의 손목 관절의 공간 정보는 인체의 하나 이상의 손의 파라미터를 상세하게 기술할 수 있다.
그림 3은 인간 사용자를 보여줍니다. 인간 사용자는 머리(300)와 두 손(302A, 302B)을 가지고 있다. 컴퓨팅 시스템은 머리 및/또는 손목 관절을 포함할 수 있는 인간 사용자의 하나 이상의 관절에 대한 공간 정보를 수신할 수 있습니다.
관절로 연결된 물체의 n개 관절의 공간 정보는 하나 이상의 센서에서 출력되는 위치 데이터에서 파생될 수 있습니다. 센서는 인간 사용자의 해당 신체 부위에 의해 유지되거나 착용되는 하나 이상의 장치에 통합될 수 있습니다.
예를 들어 센서에는 머리 장착형 디스플레이 장치 및/또는 휴대용 컨트롤러에 통합된 하나 이상의 관성 측정 장치가 포함될 수 있습니다. 다른 예로서, 센서는 하나 이상의 카메라를 포함할 수 있습니다.
그림 3은 센서의 출력에 공간 정보가 포함되거나 사용될 수 있는 다양한 유형의 센서를 개략적으로 보여줍니다. 구체적으로, 인간 사용자는 머리(300)에 머리 장착형 디스플레이 장치(304)를 착용한다.
또한, 인간 사용자는 위치 센서(306A 및 306B)를 보유하고 있으며, 이는 사용자 손의 움직임을 감지하여 헤드셋(304) 및/또는 공간 정보를 수신하도록 구성된 다른 컴퓨팅 시스템에 보고하도록 구성될 수 있습니다.
그림 2에서는 204 상황으로 돌아갑니다. n개 관절의 공간 정보를 이전에 훈련된 기계 학습 모델에 전달합니다. 이 모델은 n+m개의 관절의 공간정보를 입력으로 받으며, m의 값은 1보다 크거나 같습니다. 즉, 이전 훈련 모델에 비해 이 머신러닝 모델은 관절 공간 정보를 덜 받습니다
206에서는 기계 학습 모델로부터 관절로 연결된 물체의 포즈 예측을 출력으로 수신합니다. 예측은 적어도 n개 관절의 공간 정보를 기반으로 하며 해당 관절의 공간 정보를 포함하지 않습니다. 즉, m개의 관절의 공간정보가 제공되지 않더라도 머신러닝 모델은 관절 객체의 완전한 자세를 예측할 수 있다.
그림 4는 이 프로세스를 설명하기 위한 기계 학습 모델 400의 예를 보여줍니다
그림 4에서 기계 학습 모델은 세 개의 서로 다른 관절 J1, J2, J3에 해당하는 공간 정보(402)를 수신합니다. 관절에 대한 공간 정보는 관절에 연결된 신체 부위의 위치 및/또는 방향을 지정하거나 파생하는 데 사용될 수 있는 적합한 컴퓨터 데이터의 형태를 취할 수 있습니다.
예를 들어 공간 정보는 신체 부위의 위치와 방향을 직접 지정할 수 있으며, 공간 정보는 하나 이상의 회전 축을 기준으로 관절의 하나 이상의 회전을 지정할 수 있습니다. 도 4에서, 관절 J1, J2, J3은 사용자의 신체에 중첩된 음영 원으로 도시된 바와 같이 인간 사용자의 머리 관절(404A) 및 두 개의 손목 관절(404B/404C)에 대응한다.
이 예에서 n개의 관절에는 인체의 머리 관절과 손목 관절에 해당하는 3개의 관절이 포함되어 있습니다. 입력 공간 정보(402)에 기초하여, 기계 학습 모델은 관절로 연결된 물체의 예측된 자세(406)를 출력합니다.
또한 머신러닝 모델은 가상 관절로 표현되는 관절에 해당하는 예측 공간 정보를 출력할 수 있습니다. 인간 사용자는 만화적이거나 인간이 아닌 비율의 아바타로 표현될 수 있습니다. 예를 들어, 예측된 공간정보는 SMPL로 표현되는 관절에 해당할 수 있다.
즉, 관절 표현의 가상 표현의 관절은 관절 개체의 관절과 1:1 대응을 가질 필요가 없습니다. 따라서 기계 학습 모델에 의해 예측된 공간 정보 출력은 관절로 연결된 물체의 n+m 관절과 직접적으로 대응되지 않는 관절에 대한 것일 수 있습니다. 예를 들어, 가상 표현은 관절로 연결된 물체보다 척추 관절 수가 더 적을 수 있습니다.
머신러닝 모델은 어떤 적절한 방식으로든 훈련될 수 있습니다. 일 실시예에서, 기계 학습 모델은 연결된 객체에 대한 실측 라벨이 있는 훈련 입력 데이터를 사용하여 이전에 훈련되었을 수 있습니다.
즉, 기계 학습 모델은 관절 개체의 관절에 대한 학습 공간 정보를 제공하고 공간 정보에 해당하는 관절 개체의 실제 자세를 지정하는 Ground Truth Label로 라벨링할 수 있습니다.
위에서 언급한 것처럼 기계 학습 모델은 n+m개 관절의 공간 정보를 입력으로 받도록 훈련될 수 있습니다. 여기에는 첫 번째 훈련 반복에서 모든 n+m 관절에 대한 훈련 입력 데이터를 기계 학습 모델에 제공하는 것이 포함됩니다. 일련의 후속 훈련 반복에서 m개 관절의 훈련 입력 데이터가 점진적으로 마스킹될 수 있습니다.
예를 들어, 두 번째 훈련 반복에서는 m개의 관절 중 첫 번째 관절을 마스크할 수 있으며, 여기서 훈련 데이터 세트의 관절의 공간 정보는 마스크된 관절을 나타내는 사전 정의된 값으로 대체되거나 간단히 생략됩니다.
예를 들어. 세 번째 훈련 반복에서는 m개의 관절 중 두 번째 관절을 마스크할 수 있으며, 이러한 방식으로 모든 m개의 관절이 마스크되고 n개의 관절의 공간 정보만 기계 학습 모델에 제공됩니다.
이 프로세스는 그림 5a-5d에 설명되어 있습니다. 구체적으로, 도 5A에서 기계 학습 모델(400)에는 훈련 입력 데이터 세트가 제공됩니다. 본 실시예에서, 훈련 입력 데이터는 제1 자세(502A) 및 제2 자세(502B)를 포함하여 관절 대상의 복수의 서로 다른 자세에 대응하는 공간 정보를 포함한다.
그림 5A에서는 기계 학습 모델의 관절 개체에 대한 n+m 관절의 공간 정보를 제공합니다. 인체를 단순화한 이 표현에서 관절을 나타내는 각 원은 흰색 채우기 패턴으로 표시됩니다. 그러나 그림 5B에서는 커넥터 504A의 원을 나타내기 위해 검정색 채우기 패턴으로 표시된 대로 504A를 차폐했습니다.
즉, 그림 5A는 모든 n+m 관절에 대한 공간 정보가 기계 학습 모델에 제공되는 훈련 프로세스의 초기 반복을 나타냅니다. 그림 5B는 m개의 관절 중 첫 번째 관절(504A)이 마스크되는 훈련 과정의 두 번째 반복을 보여줍니다
그림 5C에서는 힌지로 표현된 m개의 관절 중 두 번째 관절(504B)이 폐색되어 있습니다. 마찬가지로, 그림 5D에서는 m개의 관절 중 세 번째 관절이 폐색되어 있습니다. m개 관절 각각의 공간 정보가 마스킹될 때까지 여러 번의 훈련 반복이 계속될 수 있으며, n개 관절의 공간 정보만 기계 학습 모델에 제공됩니다.
위 시나리오에서는 관절화된 물체가 인체 전체인 상황을 설명합니다. 그러나 관절로 연결된 물체는 다른 형태를 취할 수도 있습니다
그림 7에서 볼 수 있듯이 관절로 연결된 물체는 인체 전체가 아닌 사람의 손입니다. 특히, 그림 7은 기계 학습 모델(700)의 예를 보여줍니다.
기계 학습 모델(700)은 관절형 물체의 세 관절(704A-C)에 대응하는 관절(J1, J2, J3)에 대한 공간 정보를 수신하며, 이 경우 인간 손(706)의 형태를 취합니다.
이 경우 구체적으로 n개의 관절에는 사람 손의 손가락 관절이 하나 이상 포함됩니다. 하나 이상의 손가락 관절의 공간 정보는 하나 이상의 손가락 또는 인간 손의 손가락 세그먼트의 매개변수를 자세히 설명합니다. 예를 들어 공간 정보는 손 손가락의 위치/방향 및/또는 손 관절에 적용되는 회전을 지정할 수 있습니다
위치 센서(708) 등 관절 공간 정보를 수집하는 데 적합한 방법을 사용할 수 있습니다. 예를 들어, 위치 센서는 손을 이미지화하도록 구성된 카메라 형태를 취할 수 있습니다. 또 다른 예로, 위치 센서에는 손 표면을 전자기장에 노출시키고 전도성 인간 피부의 움직임과 근접성이 안테나의 전자기장 임피던스에 미치는 영향을 평가하도록 구성된 적절한 무선 주파수 안테나가 포함될 수 있습니다.
입력된 공간 정보(702)를 기반으로 기계 학습 모델은 일련의 예측 공간 정보(710)를 출력합니다. 공간 정보(710)는 관절로 연결된 물체의 예측된 자세를 구성하는 데 사용될 수 있습니다. 앞서 언급했듯이 이 공간 정보는 관절로 연결된 물체의 신체 부위의 위치와 방향을 나타낼 수 있습니다
관련 특허: 관절로 연결된 물체의 자세 예측 |Microsoft는 원래 2022년 6월에 "관절형 개체에 대한 자세 예측"이라는 특허 출원을 제출했으며 해당 출원은 최근 미국 특허청에 공개되었습니다
위 내용은 Microsoft는 AR/VR 신체 자세 캡처를 위해 관절형 물체의 자세를 예측하는 특허 기술을 제안합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제









지난해 2월 메타는 AIGC 게임플레이를 기반으로 한 가상 세계 개발 기능인 빌더봇(BuilderBot)을 시연했다. 음성 명령을 인식해 가상 장면에서 해당 요소를 생성하는 기능이 특징인데, 이는 VR 장면 생성의 어려움을 단순화할 수 있다. 최근 USPTO가 공개한 Apple 특허에서도 유사한 개념이 지적되었습니다. 예를 들어 사용자는 Siri 음성 도우미에게 실제 장면에 가상 가구를 추가하거나 가구 색상을 변경하도록 명령할 수 있습니다. Qingting.com에 따르면 특허 번호는 US20230206912A1이며 주로 워드 프로세서(텍스트 입력, 글꼴 수정 등), XR 장면 등을 제어하는 데 사용할 수 있는 일련의 새로운 Siri 음성 명령을 설명합니다. XR용으로 특별히 설계된 것은 아니지만 특허를 받았습니다.

AR/VR 및 증강 현실 개발을 지원하도록 Linux 시스템 구성 소개: 증강 현실(AR) 및 가상 현실(VR) 기술의 개발로 인해 점점 더 많은 개발자가 이러한 새로운 영역에 관심을 기울이기 시작했습니다. AR/VR 및 증강 현실 개발을 위해서는 Linux 시스템을 올바르게 구성하는 것이 매우 중요합니다. 이 기사에서는 AR/VR 및 증강 현실 개발을 지원하도록 Linux 시스템을 구성하는 방법을 소개하고 해당 코드 예제를 제공합니다. 1단계: 필요한 소프트웨어 설치 시작하기 전에 Linux 시스템에 다음이 설치되어 있는지 확인하십시오.

(2023년 8월 24일 신규) XR 장비에는 일반적으로 왼쪽 빔 경로에 연결된 왼쪽 프로젝터와 오른쪽 빔 경로에 연결된 오른쪽 프로젝터가 포함됩니다. 왼쪽 프로젝터는 왼쪽 이미지를 생성한 다음 왼쪽 이미지를 왼쪽 빔 경로를 통해 사용자의 왼쪽 눈으로 전파하도록 구성됩니다. 올바른 프로젝터는 올바른 이미지를 생성하도록 구성되어 있으며, 이 이미지는 올바른 빔 경로를 통해 사용자의 오른쪽 눈으로 이동합니다. 본 XR 장치의 구조는 일반적인 사용, 온도 변화 및/또는 충격으로 인해 변경될 수 있습니다. R 장치의 구조가 변경되면 이미지의 시각적 축이 사라지고 잘못 정렬될 수 있습니다. 이러한 문제는 안경 형태의 기기에서는 더욱 심각해질 수 있습니다. 교정 이미지를 투사하고 교정 이미지를 사용하여 디스플레이가 올바른지 확인하도록 XR 장비를 구성하십시오.

6월 8일 뉴스에 따르면 AR/VR 솔루션 기업 벡터(Vection)는 VR 스마트 리테일 솔루션 제공업체인 인버션(Invrsion)을 인수했다고 발표했다. 이는 패션 및 리테일 분야에서 XR 솔루션과 시장 기회를 가속화하는 것을 목표로 하고 있다. 인수가 완료된 후 Invrsion의 기술은 Vection의 INTEGRATEDXR 제품군과 통합되어 고객 요구 사항을 더 잘 충족할 것으로 알려졌습니다. Qingting.com에 따르면 Invrsion은 2015년에 설립되었습니다. 이전에는 3D 제품 디지털화 사업에 중점을 두어 고객에게 가상 전시장, 3D 전자 상거래, 산업, 부동산 등을 기반으로 하는 대화형 시뮬레이션 솔루션을 제공했습니다. 클라이언트 측에서 회사는 Walgreens, Ferrero, Nestlé, Coca-Cola, D에 서비스를 제공했습니다.

최근에는 모두가 Apple XR에 대한 많은 뉴스를 읽었습니다. 다양한 폭로를 보는 대신 특허부터 시작하여 Apple XR 헤드셋이 어떤 다른 방식으로 작동할 수 있는지 확인하는 것이 좋습니다. 따라서 우리는 최근 몇 년 동안 Apple이 보유한 수백 개의 AR/VR 특허 중에서 선택하여 XR 제품 경험을 직접적으로 결정하고 영향을 미칠 수 있는 특허를 편집했습니다. 물론 이러한 특허가 하나의 제품에 집중되지는 않을 것이고, Apple XR이 어떤 모습인지 정확하게 알 수는 없지만, 그래도 특허를 통해 엿볼 수는 있습니다. 최근 몇 년 동안 Apple의 AR/VR 특허를 정리할 때 주로 다음과 같은 특징을 발견했습니다. 1) 일부 AR/VR 특허는 PrimeSense, Metaio, NextVR, SMI, Spaces 등과 같이 이전에 인수한 회사에서 나왔습니다. 2) 구조화되었습니다. 빛

인공지능(AI)이 디자인 작업을 대신할 것인가? 인공지능이 언급되면 곧바로 인간을 대체할 것으로 묘사된다. 인공지능이 디자인 작업의 현 상태를 변화시킬 것이라는 점에는 의심의 여지가 없지만, 이 지능형 기술이 인간을 대체할 것이라는 생각은 완전히 정확하지는 않습니다. 기술이 발전하고 경제가 변화함에 따라 비즈니스 프로세스도 변화하는 것이 당연하고, 디자인 업무 프로세스도 이에 영향을 받습니다. 인공 지능이 디자인 프로세스를 어떻게 근본적으로 변화시킬 것인지를 배우면서 (디자이너)는 인공 지능을 위협으로 간주해서는 안 되며, 인공 지능이 디자인 분야에 가져오는 기회, 디자인 관행 및 디자인 원칙에 미치는 영향에 초점을 맞춰야 합니다. , 그리고 디자이너의 작업이 어떻게 변할 것인지. 두 가지 디자인 맥락에서 AI의 역할 디자인에서 AI의 역할을 이해합니다.

애플팬들의 본거지, 10년간 전문적인 애플 휴대폰 기술 연구! Apple Experts Around You ~ Apple은 가까운 시일 내에 “Reality Pro”라는 AR/VR 헤드셋을 출시할 예정입니다. 이 소식은 더 이상 비밀이 아니지만, 출시일이 다가올수록 이 혼합 현실에 관심을 갖는 사람들이 점점 더 많아지는 것 같습니다. 제품은 유망하지 않습니다. 여기에는 Apple 내부 인사도 포함되며 심지어 Apple CEO인 Tim Cook도 이 프로젝트에 대해 긍정적이지 않은 태도를 가지고 있습니다. VR 헤드셋 기업 오큘러스(Oculus)의 창업자인 팔머 럭키(Palmer Luckey)는 애플 헤드셋을 체험한 뒤 제품에 대해 칭찬을 아끼지 않았지만 여전히 회의적인 목소리가 나온다. 최근, 전 Apple 마케팅 임원인 Michael Guttenberg(Mic

(뉴원, 2023년 10월 20일) CNBC에 따르면 미국 연방통신위원회(FCC)는 최근 웨어러블 기기 등 '새로운 종류의 초저전력 기기'에 6GHz 주파수 대역을 개방하기로 합의했으며, 이번 움직임은 증강 현실 및 가상 현실 웨어러블을 위한 새로운 애플리케이션의 길을 열어줍니다. FCC는 성명에서 이 밴드의 개설이 "웨어러블 기술, 증강 현실, 가상 현실을 포함한 최첨단 애플리케이션 생태계의 개발을 촉진하여 기업에 도움이 되고 학습 기회를 늘리며 의료 기회를 향상시킬 것으로 예상된다"고 밝혔습니다. .”라고 전해지며, 새로운 예능 경험을 선사할 예정이다.” 메타는 이 소식에 가장 먼저 설렘을 드러냈다. 회사의 케빈 마틴(Kevin Martin)은 성명에서 이렇게 말했습니다.
