> 기술 주변기기 > 일체 포함 > Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?

Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?

Joseph Gordon-Levitt
풀어 주다: 2025-03-20 15:08:11
원래의
248명이 탐색했습니다.

중국은 AI 모델로 다시 해냈으며 이번에는 타격이 더 크고 좋습니다! BAIDU - 중국 AI 회사는 최근 2 개의 대형 언어 모델 (LLMS) - Ernie 4.5 & x1을 발표했습니다. 현재까지 OpenAI의 최신 및 가장 큰 모델보다 더 잘 성능을 발휘한다고 주장하는이 모델은 DeepSeek-R1보다 비용 효율적입니다! 모델은 너무 좋아 보인다 - 가격의 일부에서 고품질을 제공합니다. 이 블로그에서는 Ernie 4.5 & X1 모델을 탐색하고 벤치 마크 결과를 평가하며 실제 응용 프로그램에서 수행하는 방법을 확인합니다. 그래서 시작하겠습니다.

목차

  • Ernie 4.5 & x1은 무엇입니까?
    • 어니 4.5
    • 어니 X1
  • Ernie 4.5 & x1에 액세스하는 방법?
  • Ernie 4.5 & x1 성능 점검
    • 작업 1 : 추론 이미지 분석
    • 작업 2 : 문서 분석 요약
    • 작업 3 : 오디오 분석
    • 작업 4 : 창의성 이미지 생성
  • Baidu의 Ernie 4.5 & x1 : 가격
  • Ernie 4.5 & x1 : 표준 벤치 마크 결과
  • 미래의 영향
  • 결론
  • 자주 묻는 질문

Ernie 4.5 & x1은 무엇입니까?

Ernie 4.5 & X1은 인터넷 서비스, 인공 지능 및 자율 주행을 전문으로하는 주요 중국 기술 회사 인 Baidu가 개발 한 두 가지 최신 멀티 모드 LLM입니다. 중국의 주요 검색 엔진과 AI 중심 혁신의 발전으로 가장 잘 알려져 있습니다. Baidu는 2021 년 12 월에 첫 번째 LLM 인 Ernie 3.0 Titan을 출시했습니다. 그 후, 더 강력한 LLM을 구축하기 위해 동시에 몇 가지 모델을 더 출시했습니다. 모든 연구와 지속적인 노력의 결과는 Ernie 4.5 & x1입니다.

어니 4.5

Ernie 4.5는 텍스트, 이미지, 오디오 및 비디오를 포함한 다양한 데이터 유형을 이해하고 통합 할 수있는 멀티 모달 기초 모델입니다. 이 다양한 모델링 접근법은 다양한 종류의 컨텐츠를 이해하고 생성하는 능력을 향상시킵니다.

Ernie 4.5의 주요 기능은 다음과 같습니다.

  • Ernie 4.5는 전임자 Ernie 4.0에 대한 이해, 세대, 추론 및 기억의 포괄적 인 개선을 보여줍니다.
  • 환각 방지, 논리적 추론 및 코딩에 큰 능력을 보여 주어 복잡한 작업을 더 높은 정확도로 처리하는 데 능숙합니다. ​
  • 이 모델은 여러 벤치 마크에서 OpenAI의 GPT-4.5보다 더 잘 수행되는 반면, GPT-4.5를 사용하는 데 드는 비용의 1%에 불과합니다!

어니 X1

Ernie X1은 멀티 모달 기능을 갖춘 깊은 생각의 추론 모델로 설계되었습니다. 바이두가 발표 한 최초의 깊은 사고 모델입니다. 주요 기능은 다음과 같습니다.

  • Ernie X1은 상황을 이해하고, 사고 과정을 계획하고, 반응을 반영하며, 시간이 지남에 따라 진화하는 데 탁월합니다.
  • 고급 검색, 이미지 이해 및 복잡한 계산과 같은 작업에 다양한 도구를 자율적으로 활용할 수 있습니다.
  • 이 모델은 DeepSeek-R1과 동등한 성능을 제공하지만 가격의 절반으로 고급 AI 기능을 원하는 기업에게 비용 효율적인 솔루션을 제공합니다.

Ernie 4.5 & x1에 액세스하는 방법?

AI 챗봇 - Ernie Bot 또는 API를 통해 Ernie 4.5 & X1에 액세스 할 수 있습니다.

봇을 통해 액세스 :

  • https://yiyan.baidu.com 으로 이동하십시오 .
  • 세부 정보를 추가하고 시작하여 계정을 만듭니다.

두 모델 모두 Baidu의 Ernie Bot 플랫폼의 개별 사용자가 자유롭게 액세스 할 수 있습니다. 그러나 Ernie Bot의 등록은 현재 중국 국민으로 제한됩니다.

API를 통한 액세스 :

  • Baidu AI Cloud의 MAAS 플랫폼 인 Qianfan 으로 향하십시오
  • 시작하려면 플랫폼에서 계정을 만듭니다.

현재 모든 사용자가 플랫폼에 액세스 할 수는 없습니다. 또한 Ernie 4.5 만 API를 통해 제공되며 Ernie X1은 곧 플랫폼에서 제공 될 예정입니다.

Ernie 4.5 & x1 성능 점검

이 섹션에서는 이러한 모델이 멀티미디어, 추론, 문서 분석 등과 관련된 작업에서 어떻게 수행되는지 알 수 있습니다. 모델 인터페이스는 중국어 만 지원하고 계정 생성은 중국 국민으로 제한되므로 사람들이 두 모델을 사용하는 방법과 그들이받은 출력에 대한 몇 가지 예를 살펴볼 것입니다. 우리는 온라인에서 찾은 Ernie 4.5 & x1의 가장 일반적인 사용 사례를 다음을 포함하여 다음을 포함합니다.

  1. 이미지 분석을 통한 추론
  2. 문서 분석 및 요약
  3. 오디오 분석
  4. 창의성과 이미지 생성

작업 1 : 추론 이미지 분석

이 작업 에서이 모델은 이미지 형태로 수학적 문제를 해결하도록 요청 받았다.

사용 된 모델 : Ernie 4.5

산출:

대부분의 다른 멀티 모달 LLM과 마찬가지로 Ernie 4.5는 비디오를 신속하게 분석하고 이미지의 문제를 해결합니다. 그것은 이미지의 모든 질문을 하나씩 가져 가고 결국 그것들을 모두 요약합니다. 성능의 속도와 정확성은 빠르고 정확한 문제 해결이 필요한 학생, 교육자, 연구원 및 전문가에게 유용한 도구입니다.

작업 2 : 문서 분석 요약

여기에서 모델에 문서가 제공되었으며 해당 문서의 특정 주제에 대한 정보를 요약해야했습니다.

사용 된 모델 : Ernie 4.5

산출:

이 모델을 사용하면 한 번에 다양한 유형의 여러 파일을 업로드 할 수 있습니다. 문서, PDF, PPT, Excel Sheets 등을 포함하여 다양한 유형의 파일을 처리 할 수 ​​있습니다. 업로드 된 파일에서 챗봇을 쿼리하려는 파일 (또는 그 이상)을 선택할 수 있으며 모델은 주제를 빠르게 요약합니다. 여러 파일을 빠르게 처리하면 연구 분석, 법적 문서 검토, 재무 데이터 추출 및 회사보고와 같은 작업에 매우 유용 할 수 있습니다.

작업 3 : 오디오 분석

이 작업을 위해이 모델은 주어진 오디오를 분석하고 소스를 찾아야했습니다.

사용 된 모델 : Ernie 4.5

산출:

오디오 분석은 인기있는 AI 챗봇 중 어느 것도 인터페이스에 통합되지 않은 기능으로, Ernie 4.5를 최초로 만들었습니다. 이 모델은 클립을 신속하게 분석하고 소스를 결정한 다음 클립의 중요성을 설명하기도합니다. 빠른 분석과 자세한 설명은 미디어, 고객 서비스, 교육 및 법 집행에 대한 실시간 전사, 음성 검색, 심해 탐지 및 감정 분석과 같은 작업을위한 귀중한 도구입니다.

작업 4 : 창의성 이미지 생성

이 작업을 위해이 모델은 방을 분석하고 전반적인 매력을 향상시킬 수있는 가능한 장식을 제안해야했습니다. 그런 다음 객실의 업데이트 된 이미지를 생성해야했습니다.

사용 된 모델 : Ernie X1

산출:

모델은 이미지를 빠르게 처리합니다. 그런 다음 전반적인 매력을 향상시키기 위해 방의 장식의 개선 가능성을 시사합니다. 마지막으로 제안 된 모든 향상된 개선 사항으로 방의 이미지를 생성합니다. 이 기능은 인테리어 디자인, 가정 개조 계획, 부동산 준비 및 가상 장식 시각화와 같은 작업에 큰 도움이됩니다.

참고 :이 게시물에서 X에서 예제를 가져 왔습니다.

Baidu의 Ernie 4.5 & x1 : 가격

Ernie 4.5 & X1은 모두 OpenAi, DeepSeek, Grok, Claude 등의 최고 모델에 비해 모든 기능을 가지고 있습니다. 여기에는 두 모델의 가격 분석이 있습니다.

모델 입력 가격 (백만 마리의 토큰) 생산 가격 (백만 마리의 토큰) 유효성
어니 4.5 $ 0.55 $ 2.20 사용 가능
어니 X1 $ 0.28 $ 1.10 아직 사용할 수 없습니다

다른 최고 모델과 비교할 때 Ernie 4.5 & X1은 상당히 저렴하여 생성 AI의 발전에 귀중한 자산이됩니다.

Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?

Ernie 4.5 & x1 : 표준 벤치 마크 결과

우리는 이미 최신 Ernie 모델의 기능, 기능 및 가격을 보았습니다. 이제 GPT-4.5, GPT-4O, DeepSeek-R1 등과 같은 최고 모델에 대한 이러한 모델의 일부 성능 수를 살펴 보겠습니다.

아래 그래프는 멀티 모달 AI 성능을 테스트하는 여러 벤치 마크에서 Ernie 4.5 및 GPT-4O를 비교합니다.

Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?

그래프는 다음을 보여줍니다.

  • Ernie 4.5는 대부분의 멀티 모달 작업에서 GPT-4O를 능가합니다.
  • Ernie 4.5의 평균 점수는 77.77로 GPT-4O의 73.92보다 높습니다.
  • Ernie 4.5는 Mathvista와 Docvqa에서 상당한 우위를 점하여 더 나은 수학 추론과 문서 기반 질문 응답 기술을 보여줍니다.
  • 두 모델 모두 OCRBENCH 및 MMMU에서 유사하게 수행하지만 Ernie 4.5는 여전히 약간의 이점이 있습니다.

다음 그래프는 텍스트 기반 추론 및 문제 해결을위한 여러 벤치 마크에서 Ernie 4.5, Deepseek V3-Chat, GPT-4O 및 GPT-4.5를 비교합니다.

Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?

다음은 그래프의 주요 테이크 아웃입니다.

  • Ernie 4.5는 평균 점수가 79.6 인 팩을 이끌며, 79.14에서 Deepseek V3 - 채팅을 좁게 능가합니다.
  • MMLU-Pro, GSM8K 및 Humaneval과 같은 일반적인 지식, 추론 및 프로그래밍 벤치 마크에서 잘 수행됩니다.
  • GPT-4O와 DeepSeek V3도 강력한 결과를 보여 주며, DeepSeek V3는 CMMLU와 같은 중국 벤치 마크에서 경쟁적으로 성과를 거두었습니다.
  • Ernie 4.5는 GSM8K (Math) 및 C-Eval (일반 추론)에서 탁월하지만 DeepSeek V3는 성능이 매우 가깝습니다.

미래의 영향

최고의 LLM이되기위한 레이스는 가열되고 Baidu의 Ernie 4.5 & X1은 OpenAi, DeepSeek, Anthropic 및 Meta와의 진지한 경쟁을 소개합니다. 중국 AI 실험실은 비용의 일부로 Western AI를 능가하거나 능가하는 모델을 제공함으로써 회사는 더 빠르게 혁신하고 경쟁력을 유지하기 위해 비용을 낮추어야합니다.

이러한 모든 발전은 마침내 다음으로 이어질 것입니다.

  • 모든 주요 AI 연구 센터에서 더 빠른 AI 발전.
  • 비즈니스 및 개발자에게 더 저렴한 AI.
  • 전통적인 텍스트 기반 AI를 넘어 확장되는 멀티 모달 AI 애플리케이션의 새로운 시대.

결론

Baidu의 Ernie 4.5 & X1 모델은 또 다른 AI 모델 세트가 아닙니다. 이들은 업계 교란 자입니다. 그들의 우수한 멀티 모드 및 추론 능력, 낮은 가격 및 중국의 디지털 생태계와의 심층 통합은 글로벌 AI 시장의 전력 변화를 시사합니다.

이러한 추세가 계속되면 다양한 산업에서 더 큰 규모의 AI 민주화와 봉사 활동을 볼 수 있습니다. 이것은 또한 많은 서구 기업들이 더 저렴한 모델을 출시하도록 강요 할 것입니다. 이는 시장에서 경쟁력을 더할뿐만 아니라 사용자가 돈에 대한 가장 많은 가치를 얻도록 할 것입니다.

자주 묻는 질문

Q1. Ernie 4.5 & x1은 무엇입니까?

A. Ernie 4.5 & X1은 Baidu가 개발 한 최신 LLM (LAGE Language Models)으로 OpenAI의 GPT-4.5 및 DeepSeek-R1과 같은 최고 AI 모델과 경쟁하도록 설계되었습니다. Ernie 4.5는 멀티 모달 파운데이션 모델이며 Ernie X1은 고급 기능을 갖춘 깊은 생각의 추론 모델입니다.

Q2. Baidu의 Ernie 4.5는 Ernie X1과 어떻게 다릅니 까?

A. Ernie 4.5는 텍스트, 이미지, 오디오 및 비디오를 처리 할 수있는 멀티 모달 이해에 최적화되어 있으며 정확도가 높습니다. 반면에 Ernie X1은 심오한 추론을 위해 설계되었으며 상황에 대한 이해, 계획 및 자기 반성으로 문제 해결이 탁월합니다.

Q3. Ernie 4.5 & X1은 OpenAI의 GPT-4.5와 어떻게 비교됩니까?

A. Baidu Ernie 4.5는 여러 벤치 마크에서 GPT-4.5, 특히 추론, 다중 모달 이해 및 환각 방지에서 GPT-4.5 가격의 1%에 불과합니다. Ernie X1은 비용의 절반으로 DeepSeek-R1 레벨 성능을 제공하여 경쟁력있는 AI 솔루션을 제공합니다.

Q4. Ernie 4.5 & x1의 가격 세부 정보는 얼마입니까?

A. Ernie 4.5 : 입력 비용은 1m 토큰 당 $ 0.55, 출력 비용은 1m 토큰 당 $ 2.20입니다.
Ernie X1 : 입력 비용은 1m 토큰 당 $ 0.28, 출력 비용은 1m 토큰 당 $ 1.10입니다.
Ernie X1 모델은 아직 API를 통해 사용할 수 없지만 곧있을 것입니다.

Q5. Ernie 4.5 & x1에 어떻게 액세스 할 수 있습니까?

A. 다음을 통해 이러한 모델에 액세스 할 수 있습니다.
1. yiyan.baidu.com의 Ernie Bot (AI Chatbot) (중국 사용자 만 사용할 수 있음).
2. API 액세스를위한 Baidu AI Cloud의 MAAS 플랫폼 인 Qianfan (현재 Ernie 4.5 만 사용할 수 있음).

위 내용은 Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿