기술 주변기기 일체 포함 MetaGPT 오픈 소스 프레임워크는 GitHub에서 인기를 얻었으며 별 11,000개에 도달하여 소프트웨어 개발 프로세스를 시뮬레이션했습니다.

MetaGPT 오픈 소스 프레임워크는 GitHub에서 인기를 얻었으며 별 11,000개에 도달하여 소프트웨어 개발 프로세스를 시뮬레이션했습니다.

Aug 09, 2023 pm 10:53 PM
지능적인 오픈 소스

대형 언어 모델(LLM)이 지속적으로 개발되면서 이를 사용하여 AI 에이전트를 구축하는 것이 새로운 연구 분야가 되었습니다. 과거 연구에서는 LLM을 사용하여 다중 에이전트가 일부 작업을 자율적으로 완료하도록 유도하는 데 성공했습니다. 그러나 현재 연구는 주로 간단한 작업에 중점을 두고 있으며 복잡한 작업에 대한 탐색이 부족합니다. 이는 주로 대규모 언어 모델에 "환상" 문제가 있기 때문입니다. 특히 여러 에이전트가 상호 작용할 때 환각 문제가 더욱 심각해 복잡한 작업에 적용이 불가능해집니다

최근에는 "MetaGPT"라는 오픈 소스 프레임워크가 시도됩니다. 이 문제를 해결하기 위해. MetaGPT의 목표는 메타 프로그래밍 접근 방식으로 LLM 기반 다중 에이전트 협업에 효율적인 휴먼 워크플로를 주입하는 것입니다. MetaGPT는 온라인에 공개된 지 며칠 만에 11.1k 이상의 별을 빠르게 얻었습니다

이 프로젝트의 URL은 다음과 같습니다: https://github.com/geekan/MetaGPTMetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

간단히 말하면 MetaGPT Simulate 각 에이전트에게 역할을 할당하고 협업 프로세스를 계획해야 하는 소프트웨어 개발 회사의 워크플로우는 소프트웨어 개발 회사의 인력 배치 상황과 유사합니다

MetaGPT는 먼저 표준화된 운영 절차(SOP)를 프롬프트에 내장합니다. , 따라서 여러 에이전트의 협업 프로세스가 구조화됩니다. 이후 연구팀은 출력을 더욱 모듈화하여 인간 작업자와 동등한 에이전트 도메인 전문성을 부여하여 출력을 검증하고 복합 오류를 줄였습니다. MetaGPT는 작업 파이프라인을 통해 서로 다른 에이전트에 역할을 할당함으로써 복잡한 문제를 효과적으로 해결할 수 있는 프레임워크를 구축했습니다. 다중 에이전트 협업 문제를 해결하고 응집력을 강화MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

추천 엔진 개발을 예로 들어 연구팀은 MetaGPT 시스템 인터페이스 디자인에서 "Architect Agent"의 자체 생성 결과를 시연했습니다. 이는 매우 중요합니다. 소프트웨어 개발을 위한 단계

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

MetaGPT는 간단한 게임 소프트웨어 개발 등 다양하고 복잡한 작업이 가능하며, 작업 수행 과정을 인간 개발자의 기준과 비교할 수 있습니다. 운영 절차 간의 일대일 대응( SOP)

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

MetaGPT가 사용자 입력 요구사항을 수신한 후 에이전트는 제품 관리자의 역할을 맡아 요구사항과 타당성을 분석합니다. 그런 다음 에이전트는 건축가, 프로젝트 관리자 및 엔지니어 역할을 수행하여 소프트웨어 개발을 순차적으로 완료합니다. 마지막으로 다른 에이전트가 소프트웨어의 포괄적인 테스트를 담당합니다. 이 프로세스는 실제 개발 프로세스를 매우 잘 시뮬레이션합니다. MetaGPT가 특정 개발 작업을 완료하는 경우를 살펴보겠습니다. 사용자는 "블랙잭 게임 작성"과 같은 요구 사항만 제공하면 MetaGPT는 요구 사항 분석 및 작업 계획을 거쳐 성공적으로 게임 코드를 생성합니다

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

연구팀은 프로젝트 로드맵에 명시했습니다: MetaGPT 계획 단기간에 중간 규모 프로젝트(약 2,000줄의 코드)를 독립적으로 완료하고 궁극적으로 독립적으로 훈련, 미세 조정, 최적화, 적용 및 업데이트할 수 있는 능력을 달성하기 위해

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程


MetaGPT가 출시되었습니다. "METAGPT: META PROGRAMMING FOR MULTI-AGENT COLLABORATIVE FRAMEWORK"라는 제목의 연구 논문

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

논문은 다음 링크에서 확인할 수 있습니다: https://arxiv.org/pdf/2308.00352.pdf

관심 있는 독자는 논문을 확인하여 연구 주제에 대한 심층적인 이해를 얻을 수 있습니다.

위 내용은 MetaGPT 오픈 소스 프레임워크는 GitHub에서 인기를 얻었으며 별 11,000개에 도달하여 소프트웨어 개발 프로세스를 시뮬레이션했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

15가지 추천 오픈 소스 무료 이미지 주석 도구 15가지 추천 오픈 소스 무료 이미지 주석 도구 Mar 28, 2024 pm 01:21 PM

이미지 주석은 이미지 콘텐츠에 더 깊은 의미와 설명을 제공하기 위해 이미지에 레이블이나 설명 정보를 연결하는 프로세스입니다. 이 프로세스는 비전 모델을 훈련하여 이미지의 개별 요소를 보다 정확하게 식별하는 데 도움이 되는 기계 학습에 매우 중요합니다. 이미지에 주석을 추가함으로써 컴퓨터는 이미지 뒤의 의미와 맥락을 이해할 수 있으므로 이미지 내용을 이해하고 분석하는 능력이 향상됩니다. 이미지 주석은 컴퓨터 비전, 자연어 처리, 그래프 비전 모델 등 다양한 분야를 포괄하여 차량이 도로의 장애물을 식별하도록 지원하는 등 광범위한 애플리케이션을 보유하고 있습니다. 의료영상인식을 통한 질병진단. 이 기사에서는 주로 더 나은 오픈 소스 및 무료 이미지 주석 도구를 권장합니다. 1.마케센스

10가지 권장 오픈 소스 무료 텍스트 주석 도구 10가지 권장 오픈 소스 무료 텍스트 주석 도구 Mar 26, 2024 pm 08:20 PM

텍스트 주석은 텍스트의 특정 내용에 해당하는 레이블이나 태그를 추가하는 작업입니다. 주요 목적은 특히 인공 지능 분야에서 더 심층적인 분석 및 처리를 위해 텍스트에 추가 정보를 제공하는 것입니다. 텍스트 주석은 인공 지능 애플리케이션의 지도형 기계 학습 작업에 매우 중요합니다. 자연어 텍스트 정보를 보다 정확하게 이해하고 텍스트 분류, 감정 분석, 언어 번역 등의 작업 성능을 향상시키기 위해 AI 모델을 훈련하는 데 사용됩니다. 텍스트 주석을 통해 우리는 AI 모델이 텍스트의 개체를 인식하고, 맥락을 이해하고, 새로운 유사한 데이터가 나타날 때 정확한 예측을 하도록 가르칠 수 있습니다. 이 기사에서는 주로 더 나은 오픈 소스 텍스트 주석 도구를 권장합니다. 1.라벨스튜디오https://github.com/Hu

날아다니는 것, 입을 벌리는 것, 쳐다보는 것, 눈썹을 치켜올리는 것 등의 얼굴 특징을 AI가 완벽하게 모방할 수 있어 영상사기 예방이 불가능하다. 날아다니는 것, 입을 벌리는 것, 쳐다보는 것, 눈썹을 치켜올리는 것 등의 얼굴 특징을 AI가 완벽하게 모방할 수 있어 영상사기 예방이 불가능하다. Dec 14, 2023 pm 11:30 PM

이렇게 강력한 AI 모방 능력을 가지고 있다면, 막는 것은 사실상 불가능합니다. 이제 AI의 발전이 이 정도 수준에 이르렀나? 앞발은 이목구비를 날리게 하고, 뒷발은 쳐다보는 것, 눈썹을 치켜올리는 것, 삐죽이는 것 등 아무리 과장된 표정이라도 완벽하게 흉내낸다. 난이도를 높이고, 눈썹을 더 높이 올리고, 눈을 크게 뜨고, 입 모양까지 비뚤어지게 표현하는 등 가상 캐릭터 아바타가 표정을 완벽하게 재현할 수 있다. 왼쪽의 매개변수를 조정하면 오른쪽의 가상 아바타도 그에 따라 움직임을 변경하여 입과 눈을 클로즈업하여 모방이 완전히 동일하다고는 할 수 없으며 표정만 정확합니다. 마찬가지다(맨 오른쪽). 이 연구는 GaussianAvatars를 제안하는 뮌헨 기술 대학과 같은 기관에서 나왔습니다.

권장 사항: 우수한 JS 오픈 소스 얼굴 감지 및 인식 프로젝트 권장 사항: 우수한 JS 오픈 소스 얼굴 감지 및 인식 프로젝트 Apr 03, 2024 am 11:55 AM

얼굴 검출 및 인식 기술은 이미 상대적으로 성숙하고 널리 사용되는 기술입니다. 현재 가장 널리 사용되는 인터넷 응용 언어는 JS입니다. 웹 프런트엔드에서 얼굴 감지 및 인식을 구현하는 것은 백엔드 얼굴 인식에 비해 장점과 단점이 있습니다. 장점에는 네트워크 상호 작용 및 실시간 인식이 줄어 사용자 대기 시간이 크게 단축되고 사용자 경험이 향상된다는 단점이 있습니다. 모델 크기에 따라 제한되고 정확도도 제한됩니다. js를 사용하여 웹에서 얼굴 인식을 구현하는 방법은 무엇입니까? 웹에서 얼굴 인식을 구현하려면 JavaScript, HTML, CSS, WebRTC 등 관련 프로그래밍 언어 및 기술에 익숙해야 합니다. 동시에 관련 컴퓨터 비전 및 인공지능 기술도 마스터해야 합니다. 웹 측면의 디자인으로 인해 주목할 가치가 있습니다.

방금 출시되었습니다! 한 번의 클릭으로 애니메이션 스타일의 이미지를 생성할 수 있는 오픈 소스 모델 방금 출시되었습니다! 한 번의 클릭으로 애니메이션 스타일의 이미지를 생성할 수 있는 오픈 소스 모델 Apr 08, 2024 pm 06:01 PM

최신 AIGC 오픈소스 프로젝트인 AnimagineXL3.1을 소개하겠습니다. 이 프로젝트는 사용자에게 더욱 최적화되고 강력한 애니메이션 이미지 생성 경험을 제공하는 것을 목표로 하는 애니메이션 테마의 텍스트-이미지 모델의 최신 버전입니다. AnimagineXL3.1에서 개발 팀은 모델이 성능과 기능 면에서 새로운 수준에 도달할 수 있도록 여러 주요 측면을 최적화하는 데 중점을 두었습니다. 첫째, 이전 버전의 게임 캐릭터 데이터뿐만 아니라 다른 많은 유명 애니메이션 시리즈의 데이터도 훈련 세트에 포함하도록 훈련 데이터를 확장했습니다. 이러한 움직임은 모델의 지식 기반을 풍부하게 하여 다양한 애니메이션 스타일과 캐릭터를 더 완벽하게 이해할 수 있게 해줍니다. AnimagineXL3.1은 새로운 특수 태그 및 미학 세트를 소개합니다.

대형 모델을 이해하는 Alibaba 7B 다중 모드 문서, 새로운 SOTA 획득 대형 모델을 이해하는 Alibaba 7B 다중 모드 문서, 새로운 SOTA 획득 Apr 02, 2024 am 11:31 AM

다중 모드 문서 이해 기능을 위한 새로운 SOTA! Alibaba mPLUG 팀은 최신 오픈 소스 작업인 mPLUG-DocOwl1.5를 출시했습니다. 이 작품은 고해상도 이미지 텍스트 인식, 일반 문서 구조 이해, 지침 따르기, 외부 지식 도입이라는 4가지 주요 과제를 해결하기 위한 일련의 솔루션을 제안했습니다. 더 이상 고민하지 말고 먼저 효과를 살펴보겠습니다. 복잡한 구조의 차트도 한 번의 클릭으로 인식하고 마크다운 형식으로 변환 가능: 다양한 스타일의 차트 사용 가능: 보다 자세한 텍스트 인식 및 위치 지정도 쉽게 처리 가능: 문서 이해에 대한 자세한 설명도 제공 가능: 아시다시피, " 문서 이해"는 현재 대규모 언어 모델 구현을 위한 중요한 시나리오입니다. 시장에는 문서 읽기를 지원하는 많은 제품이 있습니다. 그 중 일부는 주로 텍스트 인식을 위해 OCR 시스템을 사용하고 텍스트 처리를 위해 LLM을 사용합니다.

1.3ms는 1.3ms가 걸립니다! Tsinghua의 최신 오픈 소스 모바일 신경망 아키텍처 RepViT 1.3ms는 1.3ms가 걸립니다! Tsinghua의 최신 오픈 소스 모바일 신경망 아키텍처 RepViT Mar 11, 2024 pm 12:07 PM

논문 주소: https://arxiv.org/abs/2307.09283 코드 주소: https://github.com/THU-MIG/RepViTRepViT는 모바일 ViT 아키텍처에서 잘 작동하며 상당한 이점을 보여줍니다. 다음으로, 본 연구의 기여를 살펴보겠습니다. 기사에서는 경량 ViT가 일반적으로 시각적 작업에서 경량 CNN보다 더 나은 성능을 발휘한다고 언급했는데, 그 이유는 주로 모델이 전역 표현을 학습할 수 있는 MSHA(Multi-Head Self-Attention 모듈) 때문입니다. 그러나 경량 ViT와 경량 CNN 간의 아키텍처 차이점은 완전히 연구되지 않았습니다. 본 연구에서 저자는 경량 ViT를 효과적인

단일 카드는 듀얼 카드보다 Llama를 70B 더 빠르게 실행합니다. Microsoft는 A100에 FP6을 넣었습니다 | 단일 카드는 듀얼 카드보다 Llama를 70B 더 빠르게 실행합니다. Microsoft는 A100에 FP6을 넣었습니다 | Apr 29, 2024 pm 04:55 PM

FP8 이하의 부동 소수점 수량화 정밀도는 더 이상 H100의 "특허"가 아닙니다! Lao Huang은 모든 사람이 INT8/INT4를 사용하기를 원했고 Microsoft DeepSpeed ​​팀은 NVIDIA의 공식 지원 없이 A100에서 FP6을 실행하기 시작했습니다. 테스트 결과에 따르면 A100에 대한 새로운 방법 TC-FPx의 FP6 양자화는 INT4에 가깝거나 때로는 더 빠르며 후자보다 정확도가 더 높은 것으로 나타났습니다. 또한 오픈 소스로 제공되고 DeepSpeed와 같은 딥 러닝 추론 프레임워크에 통합된 엔드투엔드 대규모 모델 지원도 있습니다. 이 결과는 대형 모델 가속화에도 즉각적인 영향을 미칩니다. 이 프레임워크에서는 단일 카드를 사용하여 Llama를 실행하면 처리량이 듀얼 카드보다 2.65배 더 높습니다. 하나

See all articles