RAG 최적화 모델, 오픈 소스 왕좌에 오르다

한 가지 더

집

기술 주변기기

일체 포함

오픈 소스 모델이 처음으로 GPT-4를 획득했습니다! Arena의 최신 전투 보고서는 열띤 논쟁을 불러일으켰습니다. Karpathy: 이것이 제가 신뢰하는 유일한 목록입니다.

오픈 소스 모델이 처음으로 GPT-4를 획득했습니다! Arena의 최신 전투 보고서는 열띤 논쟁을 불러일으켰습니다. Karpathy: 이것이 제가 신뢰하는 유일한 목록입니다.

王林

Apr 10, 2024 pm 03:16 PM

매개변수 gpt-4 karpathy

GPT-4를 이길 수 있는 오픈소스 모델이 등장했습니다!

대형 모델 아레나 최신 전투 보고서:

1040억 매개변수 오픈소스 모델 Command R+가 GPT-4-0314와 공동으로 GPT-4-0613을 제치고 6위에 올랐습니다.

오픈 소스 모델이 처음으로 GPT-4를 획득했습니다! Arena의 최신 전투 보고서는 열띤 논쟁을 불러일으켰습니다. Karpathy: 이것이 제가 신뢰하는 유일한 목록입니다. Pictures

이것은 또한 대형 모델 분야에서 GPT-4를이긴 최초의 오픈 웨이트 모델이기도 합니다.

대형 모델 경기장은 Karpathy 마스터가 신뢰하는 유일한 테스트 벤치마크 중 하나입니다.

AI 유니콘 Cohere에서 R+를 명령하세요. 이 대형 모델 스타트업의 공동 창업자이자 CEO는 바로 트랜스포머(일명 밀 수확자)의 최연소 작가인 에이든 고메즈다.

오픈 소스 모델이 처음으로 GPT-4를 획득했습니다! Arena의 최신 전투 보고서는 열띤 논쟁을 불러일으켰습니다. Karpathy: 이것이 제가 신뢰하는 유일한 목록입니다. 사진

이 전투 보고서가 나오자마자 대형 모델 커뮤니티에서는 또 한번 뜨거운 논의가 시작되었습니다.

모두가 기대하는 이유는 간단합니다. 1년 내내 기본 대형 모델이 출시됐는데, 예상외로 2024년에도 풍경은 계속해서 발전하고 변화할 것입니다.

HuggingFace 공동 창립자인 Thomas Wolf는 다음과 같이 말했습니다.

대형 모델 분야의 상황은 최근 크게 바뀌었습니다.

Anthropic의 Claude 3 작품이 비공개 소스 모델을 지배하고 있습니다.

Cohere의 Command R+는 오픈소스 모델 중 가장 강력해졌습니다.

2024년에 인공 지능 팀이 오픈 소스와 비공개 소스 경로 모두에서 이렇게 빠르게 발전할 것이라고는 예상하지 못했습니다.

또한 Cohere 머신 러닝 디렉터 Nils Reimers는 주목할 만한 점을 지적했습니다.

Command R+의 가장 큰 특징은 내장된 RAG(Retrieval Augmentation Generation)의 포괄적인 최적화입니다. 대형 모델 경쟁 현장에서는 RAG 등 플러그인 기능은 테스트에 포함되지 않았다.

RAG 최적화 모델, 오픈 소스 왕좌에 오르다

Cohere의 공식 포지셔닝에서 Command R+는 "RAG 최적화 모델"입니다.

즉, 1,040억 개의 매개변수를 가진 이 대형 모델은 환각 발생을 줄이기 위한 검색 향상 생성 기술에 깊이 최적화되었으며 기업 수준의 워크로드에 더 적합합니다.

이전에 출시된 Command R과 마찬가지로 Command R+의 컨텍스트 창 길이는 128k입니다.

또한 Command R+에는 다음 기능도 있습니다.

영어, 중국어, 프랑스어, 독일어 등을 포함한 10개 이상의 언어를 지원합니다.
도구를 사용하여 복잡한 비즈니스 프로세스의 자동화를 완료할 수 있습니다.

From; 테스트 결과, 다국어 지원, RAG, 도구 활용 등 3가지 차원에서 Command R+는 GPT-4 터보 수준에 도달했습니다.

하지만 입력 비용으로 따지면 Command R+의 가격은 GPT-4 터보의 1/3에 불과합니다.

출력 비용 측면에서 Command R+는 GPT-4 터보의 1/2입니다.

이것이 많은 네티즌들의 관심을 끌었습니다:

그러나 대형 모델 경기장 등 인간의 주관적 평가에서 눈길을 끄는 성능에도 불구하고 일부 네티즌들은 여전히 좀 다른 견해를 내놓았습니다.

HumanEval에서 Command R+의 코딩 성능은 GPT-3.5를 능가하지도 못했으며 두 테스트에서 각각 32위와 33위를 기록했습니다.

최신 버전의 GPT-4 터보가 아무런 긴장감 없이 1위를 차지했습니다.

또한 최근 심각한 논문에 등재된 정신지체 벤치마크에서 Command R+의 중국어 능력을 간략하게 테스트했습니다.

어떻게 평가하시겠습니까?

Command R+의 오픈 소스는 학술 연구 전용이며 상업적인 용도로 무료로 사용할 수 없다는 점에 유의하시기 바랍니다.

한 가지 더

마지막으로 밀 자르는 사람에 대해 더 이야기해 보겠습니다.

원탁의 트랜스포머 기사 중 막내인 에이단 고메즈는 연구팀에 합류할 당시 학부생이었습니다. -

그러나 토론토 대학 3학년 때 힌튼 연구소에 합류했습니다.

2018년 Kao Maozi는 Oxford University에 입학하여 그의 논문 파트너처럼 CS 박사 과정 공부를 시작했습니다.

그러나 2019년, 그는 Cohere 창립과 함께 마침내 학교를 그만두고 AI 창업의 물결에 합류하기로 결정했습니다.

Cohere는 주로 기업을 위한 대형 모델 솔루션을 제공하며 현재 가치는 22억 달러에 달합니다.

참조 링크:
[1]https://www.php.cn/link/3be14122a3c78d9070cae09a16adcbb1[2]https://www.php.cn/link/93fc5aed8c051ce4538e052cfe9f8692

위 내용은 오픈 소스 모델이 처음으로 GPT-4를 획득했습니다! Arena의 최신 전투 보고서는 열띤 논쟁을 불러일으켰습니다. Karpathy: 이것이 제가 신뢰하는 유일한 목록입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7457

Cakephp 튜토리얼

1376

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. 중국의 기능은 GPT-4와 비슷하며 가격은 GPT-4-Turbo의 거의 1%에 불과합니다. May 07, 2024 pm 04:13 PM

기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 마커를 활성화하는 데 사용됩니다. DeepSeek67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다. DeepSeek은 일반 인공지능을 연구하는 회사입니다.

PHP 버전 5.4의 새로운 기능: 호출 가능 유형 힌트 매개변수를 사용하여 호출 가능 함수 또는 메서드를 허용하는 방법 Jul 29, 2023 pm 09:19 PM

PHP5.4 버전의 새로운 기능: 호출 가능 유형 힌트 매개변수를 사용하여 호출 가능 함수 또는 메소드를 허용하는 방법 소개: PHP5.4 버전에는 매우 편리한 새 기능이 도입되었습니다. 호출 가능 유형 힌트 매개변수를 사용하여 호출 가능 함수 또는 메소드를 허용할 수 있습니다. 이 새로운 기능을 사용하면 함수와 메서드가 추가 확인 및 변환 없이 해당 호출 가능 매개변수를 직접 지정할 수 있습니다. 이 기사에서는 호출 가능 유형 힌트의 사용을 소개하고 몇 가지 코드 예제를 제공합니다.

2세대 아메카가 왔습니다! 그는 청중과 유창하게 소통할 수 있고, 표정이 더욱 사실적이며, 수십 개 언어를 구사할 수 있다. Mar 04, 2024 am 09:10 AM

휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

대형모델간 75만 라운드 1대1 대결, GPT-4가 우승, 라마3가 5위 Apr 23, 2024 pm 03:28 PM

Llama3에 대해 새로운 테스트 결과가 공개되었습니다. 대형 모델 평가 커뮤니티 LMSYS가 공개한 대형 모델 순위 목록에서 Llama3는 5위에 올랐으며, 영어 부문에서는 GPT-4와 함께 공동 1위를 차지했습니다. 다른 벤치마크와는 그림이 다릅니다. 이 목록은 모델 간 1:1 대결을 기반으로 하며, 네트워크 전체의 평가자들이 각자의 제안과 점수를 내립니다. 결국 Llama3가 5위를 차지했고, GPT-4와 Claude3 Super Cup Opus의 세 가지 버전이 그 뒤를 이었습니다. 영어 싱글 목록에서는 Llama3가 Claude를 제치고 GPT-4와 동점을 기록했습니다. 이 결과에 대해 Meta의 수석 과학자 LeCun은 매우 기뻐했으며 트윗을 통해 다음과 같이 말했습니다.

제품 매개변수는 무엇을 의미합니까? Jul 05, 2023 am 11:13 AM

제품 매개변수는 제품 속성의 의미를 나타냅니다. 예를 들어 의류 매개변수에는 브랜드, 소재, 모델, 크기, 스타일, 직물, 적용 그룹, 색상 등이 포함됩니다. 식품 매개변수에는 브랜드, 중량, 재료, 건강 허가 번호, 적용 그룹, 색상 등이 포함됩니다. 브랜드, 크기, 색상, 원산지, 적용 가능한 전압, 신호, 인터페이스 및 전원 등이 포함됩니다.

세계에서 가장 강력한 모델이 하룻밤 사이에 주인이 바뀌면서 GPT-4 시대가 끝났습니다! 클로드 3는 GPT-5를 미리 저격해 3초 만에 10,000단어짜리 논문을 읽어내는데, 그의 이해력은 인간에 가깝다. Mar 06, 2024 pm 12:58 PM

볼륨이 미쳤고, 볼륨이 미쳤고, 큰 모델이 다시 변경되었습니다. 바로 지금, 세계에서 가장 강력한 AI 모델이 하룻밤 사이에 주인이 바뀌었고 GPT-4가 제단에서 뽑혔습니다. Anthropic은 최신 Claude3 시리즈 모델을 출시했습니다. 한 문장 리뷰: 정말 GPT-4를 압도합니다! 다중 모드 및 언어 능력 지표 측면에서 Claude3이 승리합니다. Anthropic의 말에 따르면 Claude3 시리즈 모델은 추론, 수학, 코딩, 다국어 이해 및 비전 분야에서 새로운 업계 기준을 설정했습니다! Anthropic은 서로 다른 보안 개념으로 인해 OpenAI에서 "탈퇴"한 직원들이 설립한 스타트업 회사입니다. 그들의 제품은 OpenAI에 반복적으로 큰 타격을 입혔습니다. 이번에는 클로드3도 큰 수술을 받았습니다.

20단계로 대형 모델을 탈옥하세요! 더 많은 '할머니 허점'이 자동으로 발견됩니다. Nov 05, 2023 pm 08:13 PM

1분 이내에 20단계를 거쳐 보안 제한을 우회하고 대형 모델을 성공적으로 탈옥할 수 있습니다! 그리고 모델의 내부 세부 사항을 알 필요가 없습니다. 두 개의 블랙박스 모델만 상호 작용하면 되며 AI는 완전히 자동으로 AI를 공격하고 위험한 내용을 말할 수 있습니다. 한때 유행했던 '할머니 허점'이 고쳐졌다는 소식을 들었습니다. 이제 '탐정 허점', '모험가 허점', '작가 허점'에 직면하면 인공지능은 어떤 대응 전략을 채택해야 할까요? 맹공격의 물결 이후 GPT-4는 참을 수 없었고, 이것이든 저것이든... 급수 시스템을 오염시킬 것이라고 직접 말했습니다. 핵심은 이것이 펜실베니아 대학 연구팀이 노출한 취약점의 작은 물결일 뿐이며, 새로 개발된 알고리즘을 사용하여 AI가 자동으로 다양한 공격 프롬프트를 생성할 수 있다는 것입니다. 연구자들은 이 방법이 기존 방법보다 낫다고 말합니다.

i9-12900H 매개변수 평가 목록 Feb 23, 2024 am 09:25 AM

i9-12900H는 14코어 프로세서로, 사용된 아키텍처와 기술이 모두 새롭고, 전반적인 작업이 매우 뛰어나며, 특히 포괄적이며 사용자에게 뛰어난 경험을 제공할 수 있습니다. . i9-12900H 매개변수 평가 검토: 1. i9-12900H는 14코어 프로세서로, q1 아키텍처와 24576kb 프로세스 기술을 채택하고 20스레드로 업그레이드되었습니다. 2. 최대 CPU 주파수는 1.80!5.00ghz이며 주로 작업량에 따라 다릅니다. 3. 가격에 비해 가격 대비 성능이 매우 적합하며 정상적인 사용이 필요한 일부 파트너에게 매우 적합합니다. i9-12900H 매개변수 평가 및 성능 벤치마크

See all articles

오픈 소스 모델이 처음으로 GPT-4를 획득했습니다! Arena의 최신 전투 보고서는 열띤 논쟁을 불러일으켰습니다. Karpathy: 이것이 제가 신뢰하는 유일한 목록입니다.

RAG 최적화 모델, 오픈 소스 왕좌에 오르다

한 가지 더

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제