GPT-4가 정말 추월당했어요!
대형 모델 경기장에서는 Claude 3 Big Cup Opus가 새로운 왕으로 등극했으며, Elo 점수가 상위권에 올랐습니다.
Xiaobei Haiku조차도 GPT-4-0613 모델을 능가하고 GPT-3.5-turbo를 훨씬 뒤처지게 만드는 두 번째 단계에 진입했습니다.
Haiku의 입력 토큰 가격은 GPT-3.5-turbo보다 절반 저렴합니다. 출력 측면에서는 토큰 100만개당 GPT-3.5-turbo보다 거의 2위안 저렴합니다.
GPT-4와 비교하면 가격은 1/20에 불과합니다. 그리고 Haiku는 200k 컨텍스트도 지원합니다.
일부 개발자가 다음과 같이 솔직하게 말한 것도 당연합니다.
GPT-3.5는 Claude Haiku에 취약합니다.
가격이 저렴할 뿐만 아니라 하이쿠도 한 단계 더 발전했습니다.
Claude 3가 대회에 참가하기 전에는 GPT-4 계열이 거의 1년 동안 순위를 장악했습니다.
새로운 친구에게 배경 지식을 더하기 위해: LMSYS 챗봇 아레나 리더보드의 채점 기준은 인간 채점입니다. 동일한 질문을 두 모델 A와 B에게 동시에 던지며, 인간 심사위원은 둘 중 어느 것에 투표해 주세요. 당신이 생각하는 것이 최선이라고 대답하세요.
아레나의 공식 축하 메시지에서 하이쿠 모델도 특별히 강조되었습니다.
사용자 선호도에 따르면 Claude 3 Haiku GPT-4 수준에 도달했습니다.
속도, 기능 및 컨텍스트 길이는 오늘날 시장에서 독보적입니다.
일부 네티즌들은 얼마나 빠른지 직접 비교했습니다:
Bolt는 아직 100m도 완주하지 않았고, Haiku는 이미 100,000 토큰 문서를 읽었습니다...
에서 사실, 뛰어난 비용 효율성으로 Claude 3 작은 컵 Haiku는 실제로 개발자 커뮤니티에서 새로운 인기를 누리게 되었습니다.
어떤 사람들은 즉시 상상력을 발휘하여 하이쿠 효과를 대규모 Opus 수준으로 "오버클럭"할 수 있는 오픈 소스 프로젝트를 생각해 내 많은 관심을 끌었습니다.
간단히 말하면 Opus를 하이쿠의 선생님으로 삼으세요.
먼저 Opus를 사용하여 작업 수행의 예를 생성한 다음 이러한 교육 사례를 사용하여 하이쿠의 자세 수준을 향상시킵니다.
강조: Haiku의 가격은 Opus의 1/60에 불과하며 응답 속도는 Opus의 10배입니다.
gpt-prompt-engineer라는 이 프로젝트는 현재 GitHub에 총 7.3,000개의 별을 보유하고 있습니다.
Opus와 Haiku를 사용하여 “AI 주식 분석가”를 만들어 GitHub에서 직접 인기를 얻은 사람도 Matt 형제입니다.
많은 응용 제품도 처음으로 하이쿠와 연결되었습니다. 예를 들어 Vercel은 프롬프트를 기반으로 웹사이트 UI를 자동으로 생성할 수 있습니다.
그러나 클로드 3의 새로운 왕에 대한 칭찬의 목소리 중 일부 네티즌들은 다음과 같이 생각했습니다.
GPT-3.5는 '구형' 모델로 여전히 사용되고 있습니다. 오늘날 최신 모델이 경쟁하고 있는데, 이는 그 자체로 미친 짓입니다.
물론 개발자들이 가장 기대하는 것은
OpenAI, 서둘러서 굴러가세요(총독).
위 내용은 클로드 3가 GPT-4 아레나를 제치고 정상에 올랐습니다! Xiaobei Haiku는 개발자가 가장 선호하는 새로운 제품이 되었습니다: 타의 추종을 불허하는 비용 효율성의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!