목차
비전을 사용하여 프롬프트 만들기
컨퍼런스 전체가 유용한 정보로 가득 차 있습니다
기술 주변기기 일체 포함 비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

Nov 26, 2023 pm 08:22 PM
idea 비전

시각적 프롬프트를 사용할 때 어떤 종류의 경험을 가져다 줄까요?

사진에 무작위로 스케치를 그리면 같은 카테고리가 즉시 표시됩니다!

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

GPT-4V에서는 심지어 미터 단위 링크도 처리하기 어렵습니다. 모든 쌀알을 찾으려면 상자를 수동으로 당기기만 하면 됩니다.

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

새로운 객체 감지 패러다임으로!

방금 끝난 IDEA 연례 회의에서 IDEA 연구소 창립 회장이자 국립 공학 아카데미 외국 학자인 Shen Xiangyang이 최신 연구 결과를 발표했습니다. -

시각 프롬프트 모델을 기반으로 한 T-Rex의 콘텐츠

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

전체 프로세스는 대화형으로 즉시 사용할 수 있으며 몇 단계만으로 완료할 수 있습니다.

이전에는 Meta의 오픈 소스 SAM이 모든 모델을 분할하여 CV 분야에서 GPT-3 시대를 직접 열었습니다. 그러나 여전히 텍스트 프롬프트 패러다임을 기반으로 하여 복잡하고 희귀한 일부 모델을 처리하기가 더 어려웠습니다. 시나리오.

이제 사진을 변경하여 문제를 쉽게 해결할 수 있습니다.

이 밖에도 Think-on-Graph 지식 기반 대형 모델, 개발자 플랫폼 MoonBit, AI 과학 연구 아티팩트 ReadPaper 업데이트 2.0, SPU 기밀 컴퓨팅 코프로세서, 제어 가능한 인물 영상 등 컨퍼런스 전체에도 유용한 정보가 가득합니다. 세대 플랫폼 HiveNet 등.

마지막으로 Shun Xiangyang은 지난 몇 년간 가장 많은 시간을 투자한 프로젝트인 저고도 경제를 공유했습니다.

저고도 경제가 비교적 성숙해지면 선전 하늘에는 매일 10만 대의 드론이 떠돌고 매일 수백만 대의 드론이 이륙할 것이라고 믿습니다.

비전을 사용하여 프롬프트 만들기

T -In 기본 단일 라운드 프롬프트 기능 외에도 Rex는 세 가지 고급 모드도 지원합니다

  • 다중 라운드 포지티브 모드

이는 다중 라운드 대화와 유사하여 더 정확한 결과를 생성하고 탐지 누락을 피할 수 있습니다

  • Positive + 네거티브 모드

는 시각적 단서가 모호하고 잘못된 감지를 유발하는 시나리오에 적합합니다.

교차 그래프 모드를 사용하면 차트를 재설계하고 레이아웃하여 데이터와 정보를 쉽게 시각화할 수 있습니다.

하나의 참조 그래프를 사용하여 다른 이미지를 감지함으로써

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

보고서에 따르면 T-Rex는 미리 정의된 카테고리에 제한을 받지 않고 다음을 수행할 수 있습니다. 시각적 예시를 사용하여 감지 대상을 지정함으로써 특정 개체가 말로 완전히 표현하기 어려운 문제를 해결하고 프롬프트 효율성을 향상시킵니다. 특히 일부 산업 현장의 복잡한 부품의 경우 그 효과가 특히 두드러집니다

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

또한 사용자와의 상호 작용을 통해 언제든지 감지 결과를 신속하게 평가하고 오류 수정이 가능합니다.

T-Rex는 주로 이미지 인코더, 힌트 인코더, 프레임 디코더의 세 가지 구성 요소로 구성됩니다.

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

이 작업은 IDEA 연구소 컴퓨터 비전 및 로봇 공학 연구 센터에서 가져온 것입니다.

팀의 이전 오픈 소스 표적 탐지 모델 DINO는 COCO 표적 탐지 목록에서 1위를 차지한 최초의 DETR 모델입니다. 제로 샘플 탐지기 Grounding DINO는 Github에서 매우 인기가 높습니다 (지금까지 11,000개의 별을 받았습니다) 모든 것을 감지하고 분할할 수 있는 접지 SAM입니다. 더 자세한 기술적 내용을 보려면 기사 마지막에 있는 링크를 클릭하세요.

컨퍼런스 전체가 유용한 정보로 가득 차 있습니다

이 외에도 IDEA 컨퍼런스에서는 여러 가지 연구 결과도 강조되었습니다.

예를 들어 Think-on-Graph 지식 기반 대형 모델은 쉽게 말하면 대형 모델과 지식 그래프를 결합한 것입니다.

대형 모델은 의도 이해와 자율 학습에 능숙한 반면, 지식 그래프는 구조화된 지식 저장 방식으로 인해 논리적 연쇄 추론에 더 좋습니다.

Think-on-Graph는 대형 모델 에이전트가 지식 그래프 위에서 '생각'하도록 유도하고, 점차적으로 최적의 답변을 검색하고 추론합니다(지식 그래프의 관련 개체를 단계별로 검색 및 추론). 추론의 모든 단계에서 대형 모델이 직접 참여하고 지식 그래프를 통해 서로의 강점과 약점을 학습합니다.

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

MoonBit은 Wasm을 기반으로 하며 클라우드 컴퓨팅 및 엣지 컴퓨팅용으로 설계된 개발자 플랫폼입니다.

이 시스템은 범용 프로그래밍 언어 설계를 제공할 뿐만 아니라 컴파일러, 빌드 시스템, 통합 개발 환경(IDE), 배포 도구 및 기타 모듈을 통합하여 개발 경험과 효율성을 향상시킵니다.

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

이전에 출시된 과학 연구 유물 ReadPaper 2.0으로 업데이트도 됐고, 기자간담회에서는 독서 부조종사, 연마 부조종사 등 새로운 기능도 시연됐다.

비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.

기자회견 말미에 Shen Xiangyang은 "저고도 경제 개발 백서(2.0) - 완전 디지털 솔루션"을 발표하여 스마트 통합 저공역 시스템(SILAS)의 시간 공간 프로세스를 제안했습니다. 프로세스) 새로운 개념.

T-Rex 링크:
https://trex-counting.github.io/

위 내용은 비전을 사용하여 메시지를 표시하세요! Shen Xiangyang은 교육이나 미세 조정이 필요하지 않고 바로 사용할 수 있는 IDEA 연구소의 새로운 모델을 선보였습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

<gum> : Bubble Gum Simulator Infinity- 로얄 키를 얻고 사용하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora : 마녀 트리의 속삭임 - Grappling Hook 잠금 해제 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Nordhold : Fusion System, 설명
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

아이디어 커뮤니티 버전과 프로페셔널 버전의 차이점 아이디어 커뮤니티 버전과 프로페셔널 버전의 차이점 Nov 07, 2023 pm 05:23 PM

IDEA Community Edition과 Professional Edition의 차이점에는 인증 방법, 기능, 지원 및 업데이트, 플러그인 지원, 클라우드 서비스 및 팀 협업, 모바일 개발 지원, 교육 및 학습, 통합 및 확장성, 오류 처리 및 디버깅, 보안 및 개인 정보 보호가 포함됩니다. 보호 등. 자세한 소개: 1. 인증 방법 커뮤니티 버전은 사용되는 운영 체제에 관계없이 모든 개발자에게 적합합니다. 전문 버전은 유료이며 상용 개발에 적합합니다. Professional 버전에는 30일 평가판 기간이 있으며, 그 이후에도 계속 사용하려면 라이센스를 구입해야 합니다.

ORB-SLAM3를 넘어! SL-SLAM: 저조도, 심한 흔들림, 약한 텍스처 장면을 모두 처리합니다. ORB-SLAM3를 넘어! SL-SLAM: 저조도, 심한 흔들림, 약한 텍스처 장면을 모두 처리합니다. May 30, 2024 am 09:35 AM

이전에 작성했던 오늘은 딥 러닝 기술이 복잡한 환경에서 비전 기반 SLAM(동시 위치 파악 및 매핑)의 성능을 향상할 수 있는 방법에 대해 논의합니다. 심층 특징 추출과 깊이 일치 방법을 결합하여 저조도 조건, 동적 조명, 질감이 약한 영역 및 심한 지터와 같은 까다로운 시나리오에서 적응을 향상하도록 설계된 다목적 하이브리드 시각적 SLAM 시스템을 소개합니다. 우리 시스템은 확장 단안, 스테레오, 단안 관성 및 스테레오 관성 구성을 포함한 여러 모드를 지원합니다. 또한 시각적 SLAM을 딥러닝 방법과 결합하여 다른 연구에 영감을 주는 방법도 분석합니다. 공개 데이터 세트 및 자체 샘플링 데이터에 대한 광범위한 실험을 통해 위치 정확도 및 추적 견고성 측면에서 SL-SLAM의 우수성을 입증합니다.

코드를 효율적으로 작성하기 위한 IntelliJ IDEA 플러그인 5개 코드를 효율적으로 작성하기 위한 IntelliJ IDEA 플러그인 5개 Jul 16, 2023 am 08:03 AM

인공지능(AI)은 현재 널리 인정받는 미래 트렌드이자 발전 방향이다. 일부 사람들은 AI가 모든 직업을 대체할 수 있다고 우려하지만 실제로는 반복성이 높고 성과가 낮은 직업만 대체할 뿐입니다. 그러므로 우리는 더 열심히 일하는 것보다 더 똑똑하게 일하는 법을 배워야 합니다. 이 기사에서는 5가지 AI 기반 Intellij 플러그인을 소개합니다. 이러한 플러그인을 사용하면 생산성을 향상하고 지루한 반복 작업을 줄이며 작업을 보다 효율적이고 편리하게 만들 수 있습니다. 1GithubCopilotGithubCopilot은 OpenAI와 GitHub가 공동 개발한 인공지능 코드 지원 도구입니다. OpenAI의 GPT 모델을 사용하여 코드 컨텍스트를 분석하고 새로운 코드를 예측 및 생성합니다.

NeRF란 무엇입니까? NeRF 기반 3D 재구성은 복셀 기반인가요? NeRF란 무엇입니까? NeRF 기반 3D 재구성은 복셀 기반인가요? Oct 16, 2023 am 11:33 AM

1 소개 NeRF(Neural Radiation Fields)는 딥 러닝 및 컴퓨터 비전 분야의 상당히 새로운 패러다임입니다. 이 기술은 ECCV2020 논문 "NeRF: Representing Scenes as Neural Radiation Fields for View Synesis"(Best Paper Award 수상)에 소개되었으며 이후 현재까지 거의 800회 인용될 정도로 인기가 높아졌습니다[1]. 이 접근 방식은 기계 학습이 3D 데이터를 처리하는 기존 방식에 큰 변화를 가져옵니다. 신경 방사선장 장면 표현 및 미분 가능한 렌더링 프로세스: 카메라 광선을 따라 5D 좌표(위치 및 시야 방향)를 샘플링하여 이미지를 합성하고 이러한 위치를 MLP에 공급하여 색상 및 체적 밀도를 생성하고 체적 렌더링 기술을 사용하여 이러한 값을 합성합니다. ; 렌더링 함수는 미분 가능하므로 전달될 수 있습니다.

자율주행의 최초 순수 시각적 정적 재구성 자율주행의 최초 순수 시각적 정적 재구성 Jun 02, 2024 pm 03:24 PM

순수한 시각적 주석 솔루션은 주로 비전과 동적 주석을 위한 GPS, IMU 및 휠 속도 센서의 일부 데이터를 사용합니다. 물론 대량 생산 시나리오의 경우 순수 비전일 필요는 없습니다. 일부 대량 생산 차량에는 고체 레이더(AT128)와 같은 센서가 장착됩니다. 대량 생산 관점에서 데이터 폐쇄 루프를 만들고 이러한 센서를 모두 사용하면 동적 개체에 라벨을 붙이는 문제를 효과적으로 해결할 수 있습니다. 그러나 우리 계획에는 고체 레이더가 없습니다. 따라서 가장 일반적인 대량 생산 라벨링 솔루션을 소개하겠습니다. 순수한 시각적 주석 솔루션의 핵심은 고정밀 포즈 재구성에 있습니다. 재구성 정확도를 보장하기 위해 SFM(Structure from Motion)의 포즈 재구성 방식을 사용합니다. 하지만 통과

여러 SpringBoot 프로젝트를 시작하는 방법 아이디어 여러 SpringBoot 프로젝트를 시작하는 방법 아이디어 May 28, 2023 pm 06:46 PM

1. 준비 Idea를 사용하여 helloworld SpringBoot 프로젝트를 빌드합니다. 개발 환경 설명: (1) SpringBoot2.7.0 (2) 아이디어: IntelliJIDEA2022.2.2 (3) OS: MacOS 환경이 약간 다릅니다. 그러나 전체적인 아이디어는 동일합니다. 2. 여러 개의 SpringBoot2.1 시작 해결 방법 1: 구성 파일의 포트 수정 SpringBoot 프로젝트에서는 구성 파일에서 포트 번호를 구성할 수 있으므로 생각할 수 있는 가장 간단한 해결책은 구성의 포트를 수정하는 것입니다. 파일 응용 프로그램.(속성/yml) 구성

Idea에서 Springboot 핫 배포가 유효하지 않은 문제를 해결하는 방법 Idea에서 Springboot 핫 배포가 유효하지 않은 문제를 해결하는 방법 May 18, 2023 pm 06:01 PM

一、开启 아이디어가 자체적으로 make를 실행합니다. 1-컴파일러에서 자동 make 활성화를 누릅니다. Ctrl+SHIFT+ATYPE: make project automatically를 누릅니다. Enter Make Project 자동 기능 활성화 2-응용 프로그램이 실행 중일 때 자동 make 활성화를 누릅니다. CTRL+SHIFT+ATYPE:Registry키 컴파일러를 찾습니다.automake.allow를 누릅니다.

3D 비전을 위해서는 포인트 클라우드 등록이 필수입니다! 하나의 기사로 모든 ​​주요 솔루션과 과제를 이해하세요 3D 비전을 위해서는 포인트 클라우드 등록이 필수입니다! 하나의 기사로 모든 ​​주요 솔루션과 과제를 이해하세요 Apr 02, 2024 am 11:31 AM

포인트의 집합체인 포인트 클라우드는 3차원 재구성, 산업검사, 로봇 운용 등을 통해 사물의 3차원(3D) 표면정보 획득과 ​​생성에 변화를 가져올 것으로 기대된다. 가장 어렵지만 필수적인 프로세스는 포인트 클라우드 등록, 즉 서로 다른 두 좌표에서 얻은 두 포인트 클라우드를 정렬하고 일치시키는 공간 변환을 얻는 것입니다. 본 리뷰에서는 포인트 클라우드 등록의 개요와 기본 원리를 소개하고, 다양한 방법을 체계적으로 분류 및 비교하며, 포인트 클라우드 등록에 존재하는 기술적 문제를 해결하고, 현장 외부의 학술 연구자와 엔지니어에게 지침을 제공하고 통일된 비전에 대한 논의를 촉진하고자 합니다. 포인트 클라우드 등록을 위해. 일반적인 포인트 클라우드 획득 방법은 능동(Active) 방식과 수동(Passive) 방식으로 구분되며, 센서에 의해 능동적으로 획득되는 포인트 클라우드는 나중에 재구성되는 방식이다.

See all articles