


Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 '목이 막히는' 문제를 해결합니다.
Southern Finance 옴니미디어 연수생 기자 Ma Jialu가 Nansha에서 보도합니다
실제 3차원 동적 환경 기능이 부족하여 로봇 지능의 추가 개발이 제한됩니다. "5월 20일, 과학 기술 혁신 분야의 국가 리더이자 심천대학교 컴퓨터 및 소프트웨어 학부장인 Huang Hui는 여성 과학자 하위 포럼인 "군중 속에서 그녀를 찾아서"에서 지능형 그래픽 인식에 대한 자신의 연구를 소개했습니다. " 결과적으로 드론을 사용하여 3차원 공간을 완전 자동 및 자율적으로 탐색하고 더 적은 데이터량으로 더 높은 정밀도의 모델링을 달성합니다. 현재 이 성과는 국제적으로 선도적인 위치에 있습니다. 디지털 트윈, 지능형 로봇 제조 등 다양한 분야에 활용 가능합니다.
더 작은 데이터 크기, 더 높은 정확도
중국과학원 물리학연구소는 한때 디지털 트윈의 정의를 대중화했습니다. 디지털 트윈, 영어 이름은 Digital Twin(디지털 트윈)이며 디지털 매핑 및 디지털 미러링으로도 알려져 있습니다. 디지털 트윈은 특정 장치나 시스템을 기반으로 디지털 '복사본'을 생성하는 것을 의미합니다. 간단히 말하면 현실 세계의 물리적 사물을 디지털 가상 경험으로 변환하는 것입니다.
2023년 초 중국정보통신기술원에서 발표한 '디지털 트윈 시티 산업 지도 연구 보고서(2022)'에서는 우리나라 디지털 트윈 산업의 발전 단계가 성장기에 접어들고 있는 것으로 관찰됐다. 시장은 활발하고, 시장주체는 지속적으로 확대되고 있습니다. 디지털 트윈은 '메타버스'의 구축 효율성과 실제감을 크게 향상시킬 수 있으며, '메타버스' 개념의 대중화와 함께 디지털 트윈의 첨단 기술이 더욱 발전하고 있다. 사람들에게 더 친숙합니다.
과거에는 데이터 트윈이 데이터를 수집하는 데 많은 인력과 물적 자원이 필요했고, 모델 구축을 위해 많은 계산을 사용했습니다. Huang Hui는 데이터 수집 비용이 높고, 적시성이 낮으며, 3D 모델링 객체가 구조화되지 않고 상관되지 않는다는 점을 지적했습니다. 이는 현재의 디지털 트윈이 지능적, 모듈식, 경량화, 구조화 및 범용성을 갖추는 것을 어렵게 만드는 문제점입니다.
위 문제에 대응하여 지난 10년 동안 Huang Hui는 어려움을 극복하기 위해 "지능형 그래픽 및 지각 컴퓨팅"에 집중했으며, 3차원 도시 스냅샷을 자동으로 수집하는 Usee 정밀 사진 측량 기술을 제안하는 데 앞장섰습니다. 휴대용 드론을 통해 밀리미터 수준의 고화질 해상도를 제공합니다. 전체 프로세스는 지속적으로 계획되고 처음부터 끝까지 크라우드소싱되어 최소한의 시야각으로 최대의 범위를 보장하는 동시에 대규모 도시 장면 데이터의 양을 200배로 줄입니다. 기하학적 세부 손실이 0.6m 미만으로 데이터 수집 장비에 대한 투자가 70% 감소됩니다. 다양한 정보와 양성 신진대사를 정확하게 매핑합니다. 이 기술은 근접 고정밀 도시 3차원 항공 조사라는 단일 프로젝트에 널리 사용되었으며, 적용 범위는 세계에서 국제적으로 선도적인 위치를 유지하고 있습니다.
심천시의 약 2,200제곱킬로미터에 대한 모델링을 예로 들어 보겠습니다. 실제로 모델링은 어려운 공역 조정, 수많은 고도 제한, 빈번한 기상 영향, 열악한 데이터 품질 및 긴 수집 시간이라는 문제에 직면합니다. 기존 모델링 방식을 사용하면 6천만 장의 이미지 데이터를 수집하고 60TB 모델을 구축하는 데 2년이 걸리며 총 비용은 1억 5천만 달러가 소요된다. 수집 방법의 주기가 길고 빈도가 낮기 때문에 City Twin의 3차원 기반에 대한 실시간 업데이트가 불가능합니다. 우시의 정밀 사진 측량 기술을 최적화하면 정확도 저하 없이 2천만 장의 사진 데이터를 활용해 8개월 만에 6TB 소형 모델 구축이 가능해지며, 총 비용도 60% 절감되는 6천만 장으로 절감된다.
디지털 트윈은 군집 지능, 무인 운전, 스마트 도시, 국토 안보, 산업 제조 및 기타 분야에서 중요한 가치와 중요성을 갖습니다. "Huang Hui는 Youshi의 정밀 사진 측량 기술이 드론을 사용하여 3차원 공간에 대한 완전 자동 및 독립적 탐사를 수행하고 클라우드 컴퓨팅을 실현함으로써 3차원 도시 재건의 비용과 문턱을 크게 줄일 수 있다고 말했습니다. 미래의 정밀 지능형 주행 지도, 실생활 3차원 내비게이션, 고정밀 도시 관리 정보 플랫폼 등
3차원 인식 부족으로 "로봇 목에 걸려요"
'디지털 트윈시티 산업지도 연구보고서(2022)'에서는 최근 인공지능 기술이 모델링 분야에 점차 적용되고 있으며, 사진 모델링과 영상 모델링이 향후 발전 트렌드로 자리 잡았음을 제시하고 있다. Huang Hui에 따르면 로봇 연구를 지원하기 위해 인공 지능을 적용하면 데이터 분석의 효율성이 향상되고 보다 효율적인 3차원 모델링 솔루션을 찾는 데 도움이 될 수 있습니다. 그녀는 그녀와 그녀의 팀이 지능형 로봇에 대한 연구를 더욱 발전시키기 위해 지능형 그래픽과 인공지능을 결합하는 방법을 연구하고 있다고 밝혔습니다.
지능형 그래프 인식의 과제는 ChatGPT에 비해 대규모 교육에 사용할 수 있는 데이터가 부족하다는 것입니다. Huang Hui는 ChatGPT에서 사용하는 원본 데이터는 기본적으로 수동으로 선별하고 주석을 달았으며 "깨끗하다"고 말했습니다. 그러나 이것이 3차원 공간으로 확장되면 난이도가 크게 높아질 것입니다. 한 품목의 사진을 1,000번 촬영할 수 있지만 1,000장의 사진 모두가 품목을 완전하고 정확하게 설명하지 못할 수도 있습니다. 다시 말하면, 소규모의 3차원 공간 데이터를 처리하기 위해 인공지능 모델을 훈련할 때 많은 양의 데이터를 처리해야 한다는 뜻이다.
로봇 지능이 정체되는 이유는 실제 3차원 동적 환경 능력이 부족하기 때문입니다. "왜 그렇게 어려운가요? 황휘는 일반적인 청소 로봇에 비유하여 다음과 같이 설명했습니다. 이제 청소 로봇을 평평한 표면에서 움직이게 하고, 장애물을 감지하고 피하며, 막히는 것을 방지하는 것이 쉽지 않습니다. 즉, 지능형 그래픽 인식 3차원 공간에서 사물의 형태를 판단할 수 있어야 하며, 이후 사물의 기능과 동적, 정적 관계를 판단할 수 있어야 하며, 보다 진보된 인식을 가질 수 있는 로봇 체화 지능을 부여하는 것이 필요하다. , 실제 3차원의 복잡한 동적 환경을 진정으로 직면하고 변화시킬 수 있으며, 인간처럼 "보고" 이해하여 결정과 행동을 내릴 수 있습니다.
20년 이상의 기초 연구 끝에 Huang Hui는 환경 인식, 기하학적 모델링, 의미론적 이해 및 자율적 의사 결정의 전체 체인을 통합하기 위해 팀을 이끌었습니다. 그러나 자연어 이해에 있어 상당한 진전을 이룬 ChatGPT 등 인공지능 기술에 비하면 아직 해결되지 않은 핵심 과학적 문제가 많고, “아직 갈 길이 멀다”고 한다.더 많은 콘텐츠를 보려면 21 Finance APP을 다운로드하세요
위 내용은 Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 '목이 막히는' 문제를 해결합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

산업자동화 기술 분야에서 최근 무시하기 어려운 두 핫스팟이 있는데 바로 인공지능(AI)과 엔비디아다. 원본 콘텐츠의 의미를 바꾸지 말고, 콘텐츠를 미세 조정하고, 콘텐츠를 다시 작성하고, 계속하지 마세요. “그뿐만 아니라 Nvidia가 원래 그래픽 처리 장치(GPU)에만 국한되지 않기 때문에 둘은 밀접하게 관련되어 있습니다. 엔비디아는 최근 GPU를 확장해 디지털 트윈 분야까지 확장하고 있으며, 최근 떠오르는 AI 기술과도 긴밀하게 연결돼 있다”고 말했다. Schneider Electric, Teradyne Robotics, MiR 및 Universal Robots 회사도 포함됩니다. 최근 엔비디아(Nvidia)는

기계력 보고서 편집자: 우신(Wu Xin) 국내판 휴머노이드 로봇+대형 모델팀이 옷 접기 등 복잡하고 유연한 재료의 작업 작업을 처음으로 완료했습니다. OpenAI 멀티모달 대형 모델을 접목한 Figure01이 공개되면서 국내 동종업체들의 관련 진전이 주목받고 있다. 바로 어제, 중국의 "1위 휴머노이드 로봇 주식"인 UBTECH는 Baidu Wenxin의 대형 모델과 긴밀하게 통합되어 몇 가지 흥미로운 새로운 기능을 보여주는 휴머노이드 로봇 WalkerS의 첫 번째 데모를 출시했습니다. 이제 Baidu Wenxin의 대형 모델 역량을 활용한 WalkerS의 모습은 이렇습니다. Figure01과 마찬가지로 WalkerS는 움직이지 않고 책상 뒤에 서서 일련의 작업을 완료합니다. 인간의 명령을 따르고 옷을 접을 수 있습니다.

이번 주, 오픈AI(OpenAI), 마이크로소프트(Microsoft), 베조스(Bezos), 엔비디아(Nvidia)가 투자한 로봇 회사인 FigureAI는 약 7억 달러의 자금 조달을 받았으며 내년 내에 독립적으로 걸을 수 있는 휴머노이드 로봇을 개발할 계획이라고 발표했습니다. 그리고 Tesla의 Optimus Prime은 계속해서 좋은 소식을 받았습니다. 올해가 휴머노이드 로봇이 폭발하는 해가 될 것이라는 데는 누구도 의심하지 않는다. 캐나다에 본사를 둔 로봇 회사인 SanctuaryAI는 최근 새로운 휴머노이드 로봇인 Phoenix를 출시했습니다. 관계자들은 이 로봇이 인간과 같은 속도로 자율적으로 많은 작업을 완료할 수 있다고 주장한다. 인간의 속도로 자동으로 작업을 완료할 수 있는 세계 최초의 로봇인 Pheonix는 각 물체를 부드럽게 잡고 움직이며 우아하게 왼쪽과 오른쪽에 배치할 수 있습니다. 자동으로 물체를 식별할 수 있습니다.

눈 깜짝할 사이에 로봇이 마법을 배웠다고? 먼저 테이블 위의 물숟가락을 집어서 관객들에게 아무것도 없다는 것을 증명하는 모습이 보였고... 그리고 달걀 같은 물체를 손에 쥐고 다시 물숟가락을 테이블 위에 올려 놓았습니다. 그리고 "주문을 걸기" 시작했습니다... ...다시 물숟가락을 집었을 때 기적이 일어났습니다. 원래 넣었던 알은 사라지고, 튀어나온 것은 농구공으로 변해버렸는데... 연속적인 동작을 다시 살펴보자: △ 이 애니메이션은 2배속으로 일련의 동작을 보여주며, 보기만 해도 부드럽게 흘러간다. 0.5배속으로 반복해서 영상을 보면, 마침내 단서를 발견했습니다. 내 손의 속도가 더 빨랐다면 적에게 숨길 수도 있었을 것입니다. 일부 네티즌들은 로봇의 마법 실력이 자신보다 훨씬 높다고 한탄했습니다. 이 마법을 우리를 위해 수행한 사람은 매그였습니다.

다음 10가지 휴머노이드 로봇이 우리의 미래를 형성하고 있습니다. 1. ASIMO: Honda가 개발한 ASIMO는 가장 잘 알려진 휴머노이드 로봇 중 하나입니다. 높이 4피트, 무게 119파운드의 ASIMO는 복잡한 환경을 탐색하고 인간과 상호 작용할 수 있는 고급 센서와 인공 지능 기능을 갖추고 있습니다. ASIMO의 다재다능함은 장애인 지원부터 이벤트 프레젠테이션 제공까지 다양한 작업에 적합합니다. 2. 페퍼(Pepper): 소프트뱅크 로보틱스가 만든 페퍼는 인간의 사회적 동반자가 되는 것을 목표로 한다. 표현력이 풍부한 얼굴과 감정을 인식하는 능력을 갖춘 Pepper는 대화에 참여하고, 소매업 환경을 돕고, 교육 지원도 제공할 수 있습니다. 피망

쓸고 닦는 로봇은 최근 소비자들 사이에서 가장 인기 있는 스마트 가전제품 중 하나입니다. 그것이 가져오는 조작의 편리함, 심지어 조작이 필요하지 않은 것만으로도 게으른 사람들이 손을 자유롭게 할 수 있게 되어 소비자는 일상적인 집안일에서 "해방"되고 위장된 형태로 삶의 질이 향상됩니다. 이러한 열풍에 힘입어 시중에 나와 있는 거의 모든 가전제품 브랜드가 자체적으로 청소, 물걸레 로봇을 제작하고 있어 전체 청소, 물걸레 로봇 시장이 매우 활발해지고 있습니다. 그러나 시장의 급속한 확장은 필연적으로 숨겨진 위험을 가져올 것입니다. 많은 제조업체가 더 많은 시장 점유율을 빠르게 점유하기 위해 바다의 전술을 사용할 것이며 결과적으로 업그레이드 포인트 없이 많은 신제품이 나올 것이라고도 합니다. '마트료시카' 모델이라고 해도 과언이 아닙니다. 그러나 모든 청소 및 걸레질 로봇이 그런 것은 아닙니다.

"젤다의 전설: 왕국의 눈물"은 역사상 가장 빨리 팔린 닌텐도 게임이 되었습니다. 조나브 테크놀로지는 다양한 "젤다 크리에이터" 커뮤니티 콘텐츠를 가져왔을 뿐만 아니라 미국 대학의 새로운 공학 과정이 되었습니다. 메릴랜드(UMD). Rewrite: The Legend of Zelda: Tears of the Kingdom은 Nintendo 역사상 가장 빠르게 판매된 게임 중 하나입니다. Zonav Technology는 풍부한 커뮤니티 콘텐츠를 제공할 뿐만 아니라 메릴랜드 대학의 새로운 엔지니어링 과정의 일부가 되었습니다. 올 가을 메릴랜드 대학의 부교수 Ryan D. Sochol은 "
