목차
경험해 보세요
Jarvis가 현실로 다가옵니다
네티즌들의 뜨거운 댓글
기술 주변기기 일체 포함 너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

Apr 10, 2023 pm 02:39 PM
ai gpt

가장 강력한 조합 HuggingFace+ChatGPT="Jarvis"가 이제 데모용으로 공개되었습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

얼마 전 절강대학교와 마이크로소프트는 대형 모델 협업 시스템인 HuggingGPT를 출시해 즉시 히트를 쳤습니다.

연구원들은 ChatGPT를 컨트롤러로 사용하여 HuggingFace 커뮤니티의 다양한 AI 모델을 연결하여 다중 모드의 복잡한 작업을 완료할 것을 제안했습니다.

전체 프로세스에서 해야 할 일은 요구사항을 자연어로 출력하는 것뿐입니다.

NVIDIA 과학자들은 이것이 제가 이번 주에 읽은 논문 중 가장 흥미로운 논문이라고 말했습니다. 그 아이디어는 앞서 언급한 "Everything App"과 매우 유사합니다. 즉, 모든 것이 App이고 정보가 AI에 의해 직접 읽혀진다는 것입니다.

경험해 보세요

이제 HuggingGPT에 Gradio 데모가 추가되었습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

프로젝트 주소 : https://github.com/microsoft/JARVIS

일부 네티즌들이 체험하기 시작했습니다. 먼저 "사진에 사람이 몇 명인지 알아보세요"?

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

HuggingGPT는 추론 결과를 바탕으로 사진 속 거리를 걷고 있는 사람이 2명이라는 결론을 내렸습니다.

구체적인 프로세스는 다음과 같습니다.

먼저 이미지를 설명하기 위해 이미지를 텍스트 모델 nlpconnect/vit-gpt2-image-captioning에 사용하고, 생성된 텍스트 "기차를 타고 거리를 걷는 두 여성" ".

다음으로, 물체 감지 모델인 facebook/detrresnet 50을 사용하여 사진 속 사람 수를 감지합니다. 모델은 7개의 물체와 2명의 사람을 감지했습니다.

그런 다음 시각적 질문 응답 모델 dandelin/vilt-b32-finetuned-vqa를 사용하여 결과를 얻으세요. 마지막으로, 시스템은 질문에 답하기 위한 상세한 답변과 모델 정보를 제공합니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

그리고 "사랑해"라는 문장의 감정을 이해하고 타밀어(타미ḻ)로 번역해보세요.

HuggingGPT는 다음 모델을 호출했습니다.

먼저 "l love you"라는 텍스트의 감정, 즉 "낭만적"을 분류하기 위해 "dslim/bert-base-NER" 모델을 사용했습니다.

그런 다음 "ChatGPT"를 사용하여 텍스트를 "Nan unnai kadalikiren"인 타밀어로 번역하세요.

추론 결과에는 생성된 이미지, 오디오 또는 비디오 파일이 없습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

MP3 파일을 텍스트로 변환하는 중에 HuggingGPT가 실패했습니다. 한 네티즌은 "입력 파일에 문제가 있는 것인지 모르겠다"고 말했다.

이미지 생성 기능을 살펴보자.

"춤추는 고양이"라는 이미지를 입력하고 "I LOVE YOU"라는 텍스트를 오버레이로 추가하세요.

HuggingGPT는 먼저 "runwayml/stable-diffusion-1-5" 모델을 사용하여 주어진 텍스트를 기반으로 "춤추는 고양이" 그림을 생성했습니다.

그런 다음, 동일한 모델을 사용하여 주어진 텍스트를 기반으로 "I LOVE YOU"라는 이미지를 생성했습니다.

마지막으로 두 사진을 병합하면 출력은 다음과 같습니다.

Jarvis가 현실로 다가옵니다

프로젝트가 공개된 지 며칠 만에 Jarvis는 이미 GitHub 포크에서 별 12.5,000개와 별 811개를 받았습니다. .

연구원들은 LLM(대형 언어 모델)의 현재 문제를 해결하는 것이 AGI를 향한 첫 번째이자 중요한 단계일 수 있다고 지적했습니다.

대규모 언어 모델의 현재 기술에는 여전히 일부 단점이 있기 때문에 AGI 시스템을 구축하는 과정에는 몇 가지 시급한 과제가 있습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

복잡한 AI 작업을 처리하려면 LLM이 외부 모델과 협력하여 해당 기능을 활용할 수 있어야 합니다.

따라서 LLM과 AI 모델을 연결하기 위해 적절한 미들웨어를 선택하는 방법이 핵심입니다.

이 연구 논문에서 연구원은 언어가 HuggingGPT의 보편적인 인터페이스라고 제안합니다. 작업 흐름은 주로 4단계로 나뉩니다:

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

문서 주소: https://arxiv.org/pdf/2303.17580.pdf

첫 번째는 사용자 요청을 구문 분석하고 변환합니다. 이를 여러 작업으로 분해하고 해당 지식을 기반으로 작업 순서와 종속성을 계획합니다.

다음으로 모델 선택을 진행합니다. LLM은 HuggingFace의 모델 설명을 기반으로 전문가 모델에 구문 분석된 작업을 할당합니다.

그런 다음 작업을 수행하세요. 전문가 모델은 추론 엔드포인트에서 할당된 작업을 실행하고 실행 정보와 추론 결과를 LLM에 기록합니다.

마지막 단계는 응답 생성입니다. LLM은 실행 프로세스 로그와 추론 결과를 요약하여 사용자에게 반환합니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

다음과 같은 요청이 있다고 가정해 보겠습니다.

책을 읽고 있는 소녀의 사진을 생성하세요. 소녀의 자세는 example.jpg의 소년과 같습니다. 그런 다음 음성을 사용하여 새 이미지를 설명하세요.

HuggingGPT가 이를 6개의 하위 작업으로 분해하고 각각 실행할 모델을 선택하여 최종 결과를 얻는 방법을 확인할 수 있습니다.

AI 모델 설명을 프롬프트에 통합함으로써 ChatGPT는 AI 모델을 관리하는 두뇌로 간주될 수 있습니다. 따라서 이 방법을 사용하면 ChatGPT가 외부 모델을 호출하여 실제 작업을 해결할 수 있습니다.

간단히 말하면 HuggingGPT는 대형 모델이 아닌 협업 시스템입니다.

그 기능은 ChatGPT와 HuggingFace를 연결하여 다양한 양식의 입력을 처리하고 많은 복잡한 인공 지능 작업을 해결하는 것입니다.

따라서 HuggingFace 커뮤니티의 모든 AI 모델은 HuggingGPT 라이브러리에 해당 모델 설명이 있으며 ChatGPT와의 연결을 설정하기 위해 프롬프트에 통합됩니다.

HuggingGPT는 ChatGPT를 두뇌로 사용하여 질문에 대한 답을 결정합니다.

지금까지 HuggingGPT는 ChatGPT를 중심으로 HuggingFace에 수백 개의 모델을 통합했으며, 이는 텍스트 분류, 대상 감지, 의미론적 분할, 이미지 생성, 질문 및 답변, 텍스트 음성 변환, 텍스트를 비디오로 변환 등 24개 작업을 포괄합니다.

실험 결과는 HuggingGPT가 다양한 형태의 복잡한 작업에서 좋은 성능을 발휘할 수 있음을 입증합니다.

네티즌들의 뜨거운 댓글

일부 네티즌들은 HuggingGPT가 이전에 Microsoft가 제안한 Visual ChatGPT와 유사하다고 말했습니다. 원래 아이디어를 사전 훈련된 대규모 모델 세트로 확장한 것 같습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

Visual ChatGPT는 ChatGPT에 직접 구축되었으며 여기에 많은 시각적 모델(VFM)을 주입합니다. 프롬프트 관리는 기사에서 제안됩니다.

PM의 도움으로 ChatGPT는 이러한 VFM을 활용하고 사용자 요구 사항이 충족되거나 최종 조건에 도달할 때까지 반복적인 방식으로 피드백을 받을 수 있습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

일부 네티즌들은 이 아이디어가 실제로 ChatGPT와 매우 유사하다고 생각합니다. LLM을 의미론적 이해 및 작업 계획의 중심으로 사용하면 LLM의 기능이 무한히 향상될 수 있습니다. LLM을 다른 기능 또는 도메인 전문가와 결합함으로써 다양한 작업과 요구 사항에 더 잘 적응할 수 있는 더욱 강력하고 유연한 AI 시스템을 만들 수 있습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

이것이 제가 AGI에 대해 항상 생각해온 것입니다. 인공 지능 모델은 복잡한 작업을 이해한 다음 더 전문적인 다른 AI 모델에 더 작은 작업을 할당할 수 있습니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

뇌와 마찬가지로 뇌도 특정 작업을 수행하기 위한 다양한 부분을 가지고 있어 매우 논리적으로 들립니다.

너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.

위 내용은 너무 멋있어서 폭발한다! HuggingGPT 온라인 시연은 놀라운 모습을 보였고, 네티즌들은 이미지 생성을 직접 테스트했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

크로스 체인 거래는 무엇을 의미합니까? 크로스 체인 거래는 무엇입니까? 크로스 체인 거래는 무엇을 의미합니까? 크로스 체인 거래는 무엇입니까? Apr 21, 2025 pm 11:39 PM

크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

Web3 Trading Platform Ranking_Web3 글로벌 교환 상위 10 개 요약 Web3 Trading Platform Ranking_Web3 글로벌 교환 상위 10 개 요약 Apr 21, 2025 am 10:45 AM

Binance는 Global Digital Asset Trading Ecosystem의 대 군주이며, 그 특성에는 다음이 포함됩니다. 1. 평균 일일 거래량은 1,500 억 달러를 초과하여 주류 통화의 98%를 차지하며 500 개의 거래 쌍을 지원합니다. 2. 혁신 매트릭스는 파생 상품 시장, Web3 레이아웃 및 교육 시스템을 포함합니다. 3. 기술적 이점은 밀리 초에 일치하는 엔진이며, 최고 처리량은 초당 140 만 건의 트랜잭션입니다. 4. 규정 준수 진행 상황은 15 개국 라이센스를 보유하고 있으며 유럽과 미국에 준수 엔티티를 설립합니다.

Worldcoin (WLD) 가격 예측 2025-2031 : WLD가 2031 년까지 4 달러에 도달 할 것인가? Worldcoin (WLD) 가격 예측 2025-2031 : WLD가 2031 년까지 4 달러에 도달 할 것인가? Apr 21, 2025 pm 02:42 PM

Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.

'Black Monday Sell'은 Cryptocurrency 업계의 힘든 날입니다. 'Black Monday Sell'은 Cryptocurrency 업계의 힘든 날입니다. Apr 21, 2025 pm 02:48 PM

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.

통화에서 레버리지 교환 순위 순위 서클 통화 서클에서 상위 10 개의 레버리지 거래소의 최신 권장 사항 통화에서 레버리지 교환 순위 순위 서클 통화 서클에서 상위 10 개의 레버리지 거래소의 최신 권장 사항 Apr 21, 2025 pm 11:24 PM

2025 년에 레버리지 거래, 보안 및 사용자 경험에서 뛰어난 성능을 보이는 플랫폼은 다음과 같습니다. 1. OKX, 고주파 거래자에게 적합하여 최대 100 배의 레버리지를 제공합니다. 2. Binance, 전 세계의 다중 통화 거래자에게 적합하며 125 배 높은 레버리지를 제공합니다. 3. Gate.io, 전문 파생 상품 플레이어에게 적합하며 100 배의 레버리지를 제공합니다. 4. 초보자 및 소셜 트레이더에게 적합한 Bitget, 최대 100 배의 레버리지를 제공합니다. 5. 크라켄은 꾸준한 투자자에게 적합하며 5 배의 레버리지를 제공합니다. 6. Bybit, Altcoin Explorers에 적합하며 20 배의 레버리지를 제공합니다. 7. 저비용 거래자에게 적합한 Kucoin, 10 배의 레버리지를 제공합니다. 8. 비트 피 넥스, 시니어 플레이에 적합합니다

가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? Apr 21, 2025 am 08:57 AM

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

Binance 전체 프로세스 전략에 대한 커널 에어 드롭 보상을받는 방법 Binance 전체 프로세스 전략에 대한 커널 에어 드롭 보상을받는 방법 Apr 21, 2025 pm 01:03 PM

암호 화폐의 번화 한 세계에서는 새로운 기회가 항상 나타납니다. 현재 Kerneldao (Kernel) 에어 드롭 활동은 많은 관심을 끌고 많은 투자자들의 관심을 끌고 있습니다. 그렇다면이 프로젝트의 기원은 무엇입니까? BNB 보유자는 어떤 이점을 얻을 수 있습니까? 걱정하지 마십시오. 다음은 당신을 위해 하나씩 공개 할 것입니다.

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 쿼럼 수의 사람들에게 도달 한 토큰 재구매를 소개하는 권장 사항입니다. Aavenomics는 AAVE 프로토콜 토큰을 수정하고 쿼럼 수의 사람들에게 도달 한 토큰 재구매를 소개하는 권장 사항입니다. Apr 21, 2025 pm 06:24 PM

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 Aavedao의 쿼럼을 구현 한 Token Repos를 소개하는 제안입니다. AAVE 프로젝트 체인 (ACI)의 설립자 인 Marc Zeller는 X에서 이것을 발표하여 계약의 새로운 시대를 표시한다고 지적했습니다. AAVE 체인 이니셔티브 (ACI)의 설립자 인 Marc Zeller는 AAVENOMICS 제안서에 AAVE 프로토콜 토큰 수정 및 토큰 리포지션 도입이 포함되어 있다고 X에서 AAVEDAO에 대한 쿼럼을 달성했다고 발표했습니다. Zeller에 따르면, 이것은 계약의 새로운 시대를 나타냅니다. Aavedao 회원국은 수요일에 주당 100 인 제안을지지하기 위해 압도적으로 투표했습니다.

See all articles