초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.-일체 포함-php.cn

다양한 시각적 작업을 위한 범용 인터페이스

집

기술 주변기기

일체 포함

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

PHPz

Oct 19, 2023 am 11:13 AM

ai 모델

표적 탐지를 위한 GPT-4V? 네티즌 실제 테스트 : 아직 준비되지 않았습니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

검색된 카테고리는 양호하지만 대부분의 경계 상자 위치가 잘못되었습니다.

상관없습니다. 누군가 조치를 취할 것입니다!

이미지 보기 능력에서 GPT-4를 수개월 앞선 Mini GPT-4가 업그레이드되었습니다 - MiniGPT-v2.

Δ(왼쪽이 GPT-4V로 생성되고 오른쪽이 MiniGPT-v2로 생성됨)

그리고 이는 간단한 명령입니다. [접지] 이 이미지를 자세히 설명하여 결과를 얻으세요.

그뿐만 아니라 다양한 시각적 작업도 쉽게 처리할 수 있습니다.

물체에 동그라미를 치고 프롬프트 단어 앞에 [식별]을 추가하면 모델이 물체의 이름을 직접 식별할 수 있습니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

물론 아무것도 추가하지 않고 그냥 물어보셔도 됩니다~

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

MiniGPT-v2는 MiniGPT-4(사우디아라비아의 KAUST King Abdullah 과학 기술 대학교)의 원래 팀과 5명의 팀원으로 구성되어 있습니다. Meta Joint 개발팀의 연구진입니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

지난번 MiniGPT-4가 나왔을 때 큰 관심을 받았고 한동안 서버가 압도당했습니다. 이제 GitHub 프로젝트가 별 22,000개 이상을 넘었습니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

이번 업그레이드로 일부 네티즌들은 이미 사용하기 시작했습니다~

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

다양한 시각적 작업을 위한 범용 인터페이스

다양한 텍스트 애플리케이션을 위한 범용 인터페이스로 모두가 익숙해졌습니다. 이에 영감을 받아 연구팀은 이미지 설명, 시각적 질문 답변 등 다양한 시각적 작업에 사용할 수 있는 통합 인터페이스를 구축하고자 합니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

"단일 모델 조건에서 다양한 작업을 효율적으로 완료하기 위해 간단한 다중 모드 지침을 사용하는 방법은 무엇입니까?"가 팀에서 해결해야 할 문제가 되었습니다.

간단히 말하면 MiniGPT-v2는 시각적 백본, 선형 레이어 및 대규모 언어 모델의 세 부분으로 구성됩니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

모델은 ViT 시각적 백본을 기반으로 하며 모든 훈련 단계에서 변경되지 않습니다. 4개의 인접한 시각적 출력 토큰이 ViT에서 유도되어 선형 레이어를 통해 LLaMA-2 언어 모델 공간에 투영됩니다.

팀에서는 대형 모델이 각 작업 지침을 쉽게 구별하고 각 작업의 학습 효율성을 향상시킬 수 있도록 훈련 모델에서 다양한 작업에 고유 식별자를 사용할 것을 권장합니다.

교육은 주로 사전 교육 - 다중 작업 교육 - 다중 모드 교육 조정의 세 단계로 나뉩니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

결국 MiniGPT-v2는 수많은 시각적 질문 답변 및 시각적 접지 벤치마크에서 다른 시각적 언어 일반 모델보다 뛰어난 성능을 보였습니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

궁극적으로 이 모델은 대상 객체 설명, 시각적 위치 파악, 이미지 설명, 시각적 질문 답변, 주어진 입력 텍스트에서 이미지 객체 직접 구문 분석 등 다양한 시각적 작업을 완료할 수 있습니다.

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

관심 있는 친구는 아래 데모 링크를 클릭하여 체험해 볼 수 있습니다.

https://minigpt-v2.github.io/
https://huggingface.co/spaces/Vision-CAIR/MiniGPT -v2

논문 링크: https://arxiv.org/abs/2310.09478

GitHub 링크: https://github.com/Vision-CAIR/MiniGPT-4

위 내용은 초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7665

Cakephp 튜토리얼

1393

C# 튜토리얼

1205

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

Related knowledge

Web3 Trading Platform Ranking_Web3 글로벌 교환 상위 10 개 요약 Apr 21, 2025 am 10:45 AM

Binance는 Global Digital Asset Trading Ecosystem의 대 군주이며, 그 특성에는 다음이 포함됩니다. 1. 평균 일일 거래량은 1,500 억 달러를 초과하여 주류 통화의 98%를 차지하며 500 개의 거래 쌍을 지원합니다. 2. 혁신 매트릭스는 파생 상품 시장, Web3 레이아웃 및 교육 시스템을 포함합니다. 3. 기술적 이점은 밀리 초에 일치하는 엔진이며, 최고 처리량은 초당 140 만 건의 트랜잭션입니다. 4. 규정 준수 진행 상황은 15 개국 라이센스를 보유하고 있으며 유럽과 미국에 준수 엔티티를 설립합니다.

ETH 업그레이드 후 손실을 피하는 방법 Apr 21, 2025 am 10:03 AM

ETH 업그레이드 후, 초보자는 손실을 피하기 위해 다음 전략을 채택해야합니다. 1. 숙제를하고 기본 지식과 ETH의 업그레이드 내용을 이해합니다. 2. 통제 위치, 소량으로 물을 테스트하고 투자를 다각화합니다. 3. 거래 계획을 세우고 목표를 명확하게하고 중지 손실 지점을 설정하십시오. 4. 합리적으로 프로파일 링하고 정서적 의사 결정을 피하십시오. 5. 공식적이고 안정적인 거래 플랫폼을 선택하십시오. 6. 단기 변동의 영향을 피하기 위해 장기 보유를 고려하십시오.

Top 10 Cryptocurrency Exchange 플랫폼 세계 최대의 디지털 환전 목록 Apr 21, 2025 pm 07:15 PM

거래소는 오늘날의 cryptocurrency 시장에서 중요한 역할을합니다. 그들은 투자자들이 거래 할 수있는 플랫폼 일뿐 만 아니라 시장 유동성 및 가격 발견의 중요한 원천이기도합니다. 세계 최대의 가상 환전 거래소는 상위 10 위이며, 이러한 거래소는 거래량이 훨씬 앞서있을뿐만 아니라 사용자 경험, 보안 및 혁신적인 서비스에서 고유 한 장점이 있습니다. 목록 위에있는 교환은 일반적으로 대규모 사용자 기반과 광범위한 시장 영향을 미치며 거래량 및 자산 유형은 종종 다른 거래소에서 도달하기가 어렵습니다.

크로스 체인 거래는 무엇을 의미합니까? 크로스 체인 거래는 무엇입니까? Apr 21, 2025 pm 11:39 PM

크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

환전 회계의 상위 10 개 플랫폼은 무엇입니까? Apr 21, 2025 pm 12:21 PM

최고 거래소에는 다음이 포함됩니다. 1. 세계 최대의 거래량 인 Binance는 600 개의 통화를 지원하며 스팟 취급 수수료는 0.1%입니다. 2. 균형 잡힌 플랫폼 인 OKX는 708 개의 거래 쌍을 지원하며 영구 계약 처리 수수료는 0.05%입니다. 3. Gate.io, 2700 개의 소규모 통화를 포괄하며 스팟 취급 수수료는 0.1%-0.3%입니다. 4. Coinbase, 미국 규정 준수 벤치 마크, 스팟 취급 수수료는 0.5%입니다. 5. Kraken, 최고 보안 및 정기 예약 감사.

통화에서 레버리지 교환 순위 순위 서클 통화 서클에서 상위 10 개의 레버리지 거래소의 최신 권장 사항 Apr 21, 2025 pm 11:24 PM

2025 년에 레버리지 거래, 보안 및 사용자 경험에서 뛰어난 성능을 보이는 플랫폼은 다음과 같습니다. 1. OKX, 고주파 거래자에게 적합하여 최대 100 배의 레버리지를 제공합니다. 2. Binance, 전 세계의 다중 통화 거래자에게 적합하며 125 배 높은 레버리지를 제공합니다. 3. Gate.io, 전문 파생 상품 플레이어에게 적합하며 100 배의 레버리지를 제공합니다. 4. 초보자 및 소셜 트레이더에게 적합한 Bitget, 최대 100 배의 레버리지를 제공합니다. 5. 크라켄은 꾸준한 투자자에게 적합하며 5 배의 레버리지를 제공합니다. 6. Bybit, Altcoin Explorers에 적합하며 20 배의 레버리지를 제공합니다. 7. 저비용 거래자에게 적합한 Kucoin, 10 배의 레버리지를 제공합니다. 8. 비트 피 넥스, 시니어 플레이에 적합합니다

가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? Apr 21, 2025 am 08:57 AM

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

'Black Monday Sell'은 Cryptocurrency 업계의 힘든 날입니다. Apr 21, 2025 pm 02:48 PM

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.

See all articles

초인기 미니 GPT-4의 시각적 능력이 급상승하여 중국 팀이 제작한 GitHub에서 별 20,000개를 기록했습니다.

다양한 시각적 작업을 위한 범용 인터페이스

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제