중국은 AI 모델로 다시 해냈으며 이번에는 타격이 더 크고 좋습니다! BAIDU - 중국 AI 회사는 최근 2 개의 대형 언어 모델 (LLMS) - Ernie 4.5 & x1을 발표했습니다. 현재까지 OpenAI의 최신 및 가장 큰 모델보다 더 잘 성능을 발휘한다고 주장하는이 모델은 DeepSeek-R1보다 비용 효율적입니다! 모델은 너무 좋아 보인다 - 가격의 일부에서 고품질을 제공합니다. 이 블로그에서는 Ernie 4.5 & X1 모델을 탐색하고 벤치 마크 결과를 평가하며 실제 응용 프로그램에서 수행하는 방법을 확인합니다. 그래서 시작하겠습니다.
Ernie 4.5 & X1은 인터넷 서비스, 인공 지능 및 자율 주행을 전문으로하는 주요 중국 기술 회사 인 Baidu가 개발 한 두 가지 최신 멀티 모드 LLM입니다. 중국의 주요 검색 엔진과 AI 중심 혁신의 발전으로 가장 잘 알려져 있습니다. Baidu는 2021 년 12 월에 첫 번째 LLM 인 Ernie 3.0 Titan을 출시했습니다. 그 후, 더 강력한 LLM을 구축하기 위해 동시에 몇 가지 모델을 더 출시했습니다. 모든 연구와 지속적인 노력의 결과는 Ernie 4.5 & x1입니다.
Ernie 4.5는 텍스트, 이미지, 오디오 및 비디오를 포함한 다양한 데이터 유형을 이해하고 통합 할 수있는 멀티 모달 기초 모델입니다. 이 다양한 모델링 접근법은 다양한 종류의 컨텐츠를 이해하고 생성하는 능력을 향상시킵니다.
Ernie 4.5의 주요 기능은 다음과 같습니다.
Ernie X1은 멀티 모달 기능을 갖춘 깊은 생각의 추론 모델로 설계되었습니다. 바이두가 발표 한 최초의 깊은 사고 모델입니다. 주요 기능은 다음과 같습니다.
AI 챗봇 - Ernie Bot 또는 API를 통해 Ernie 4.5 & X1에 액세스 할 수 있습니다.
봇을 통해 액세스 :
두 모델 모두 Baidu의 Ernie Bot 플랫폼의 개별 사용자가 자유롭게 액세스 할 수 있습니다. 그러나 Ernie Bot의 등록은 현재 중국 국민으로 제한됩니다.
API를 통한 액세스 :
현재 모든 사용자가 플랫폼에 액세스 할 수는 없습니다. 또한 Ernie 4.5 만 API를 통해 제공되며 Ernie X1은 곧 플랫폼에서 제공 될 예정입니다.
이 섹션에서는 이러한 모델이 멀티미디어, 추론, 문서 분석 등과 관련된 작업에서 어떻게 수행되는지 알 수 있습니다. 모델 인터페이스는 중국어 만 지원하고 계정 생성은 중국 국민으로 제한되므로 사람들이 두 모델을 사용하는 방법과 그들이받은 출력에 대한 몇 가지 예를 살펴볼 것입니다. 우리는 온라인에서 찾은 Ernie 4.5 & x1의 가장 일반적인 사용 사례를 다음을 포함하여 다음을 포함합니다.
이 작업 에서이 모델은 이미지 형태로 수학적 문제를 해결하도록 요청 받았다.
사용 된 모델 : Ernie 4.5
산출:
대부분의 다른 멀티 모달 LLM과 마찬가지로 Ernie 4.5는 비디오를 신속하게 분석하고 이미지의 문제를 해결합니다. 그것은 이미지의 모든 질문을 하나씩 가져 가고 결국 그것들을 모두 요약합니다. 성능의 속도와 정확성은 빠르고 정확한 문제 해결이 필요한 학생, 교육자, 연구원 및 전문가에게 유용한 도구입니다.
여기에서 모델에 문서가 제공되었으며 해당 문서의 특정 주제에 대한 정보를 요약해야했습니다.
사용 된 모델 : Ernie 4.5
산출:
이 모델을 사용하면 한 번에 다양한 유형의 여러 파일을 업로드 할 수 있습니다. 문서, PDF, PPT, Excel Sheets 등을 포함하여 다양한 유형의 파일을 처리 할 수 있습니다. 업로드 된 파일에서 챗봇을 쿼리하려는 파일 (또는 그 이상)을 선택할 수 있으며 모델은 주제를 빠르게 요약합니다. 여러 파일을 빠르게 처리하면 연구 분석, 법적 문서 검토, 재무 데이터 추출 및 회사보고와 같은 작업에 매우 유용 할 수 있습니다.
이 작업을 위해이 모델은 주어진 오디오를 분석하고 소스를 찾아야했습니다.
사용 된 모델 : Ernie 4.5
산출:
오디오 분석은 인기있는 AI 챗봇 중 어느 것도 인터페이스에 통합되지 않은 기능으로, Ernie 4.5를 최초로 만들었습니다. 이 모델은 클립을 신속하게 분석하고 소스를 결정한 다음 클립의 중요성을 설명하기도합니다. 빠른 분석과 자세한 설명은 미디어, 고객 서비스, 교육 및 법 집행에 대한 실시간 전사, 음성 검색, 심해 탐지 및 감정 분석과 같은 작업을위한 귀중한 도구입니다.
이 작업을 위해이 모델은 방을 분석하고 전반적인 매력을 향상시킬 수있는 가능한 장식을 제안해야했습니다. 그런 다음 객실의 업데이트 된 이미지를 생성해야했습니다.
사용 된 모델 : Ernie X1
산출:
모델은 이미지를 빠르게 처리합니다. 그런 다음 전반적인 매력을 향상시키기 위해 방의 장식의 개선 가능성을 시사합니다. 마지막으로 제안 된 모든 향상된 개선 사항으로 방의 이미지를 생성합니다. 이 기능은 인테리어 디자인, 가정 개조 계획, 부동산 준비 및 가상 장식 시각화와 같은 작업에 큰 도움이됩니다.
참고 :이 게시물에서 X에서 예제를 가져 왔습니다.
Ernie 4.5 & X1은 모두 OpenAi, DeepSeek, Grok, Claude 등의 최고 모델에 비해 모든 기능을 가지고 있습니다. 여기에는 두 모델의 가격 분석이 있습니다.
모델 | 입력 가격 (백만 마리의 토큰) | 생산 가격 (백만 마리의 토큰) | 유효성 |
어니 4.5 | $ 0.55 | $ 2.20 | 사용 가능 |
어니 X1 | $ 0.28 | $ 1.10 | 아직 사용할 수 없습니다 |
다른 최고 모델과 비교할 때 Ernie 4.5 & X1은 상당히 저렴하여 생성 AI의 발전에 귀중한 자산이됩니다.
우리는 이미 최신 Ernie 모델의 기능, 기능 및 가격을 보았습니다. 이제 GPT-4.5, GPT-4O, DeepSeek-R1 등과 같은 최고 모델에 대한 이러한 모델의 일부 성능 수를 살펴 보겠습니다.
아래 그래프는 멀티 모달 AI 성능을 테스트하는 여러 벤치 마크에서 Ernie 4.5 및 GPT-4O를 비교합니다.
그래프는 다음을 보여줍니다.
다음 그래프는 텍스트 기반 추론 및 문제 해결을위한 여러 벤치 마크에서 Ernie 4.5, Deepseek V3-Chat, GPT-4O 및 GPT-4.5를 비교합니다.
다음은 그래프의 주요 테이크 아웃입니다.
최고의 LLM이되기위한 레이스는 가열되고 Baidu의 Ernie 4.5 & X1은 OpenAi, DeepSeek, Anthropic 및 Meta와의 진지한 경쟁을 소개합니다. 중국 AI 실험실은 비용의 일부로 Western AI를 능가하거나 능가하는 모델을 제공함으로써 회사는 더 빠르게 혁신하고 경쟁력을 유지하기 위해 비용을 낮추어야합니다.
이러한 모든 발전은 마침내 다음으로 이어질 것입니다.
Baidu의 Ernie 4.5 & X1 모델은 또 다른 AI 모델 세트가 아닙니다. 이들은 업계 교란 자입니다. 그들의 우수한 멀티 모드 및 추론 능력, 낮은 가격 및 중국의 디지털 생태계와의 심층 통합은 글로벌 AI 시장의 전력 변화를 시사합니다.
이러한 추세가 계속되면 다양한 산업에서 더 큰 규모의 AI 민주화와 봉사 활동을 볼 수 있습니다. 이것은 또한 많은 서구 기업들이 더 저렴한 모델을 출시하도록 강요 할 것입니다. 이는 시장에서 경쟁력을 더할뿐만 아니라 사용자가 돈에 대한 가장 많은 가치를 얻도록 할 것입니다.
A. Ernie 4.5 & X1은 Baidu가 개발 한 최신 LLM (LAGE Language Models)으로 OpenAI의 GPT-4.5 및 DeepSeek-R1과 같은 최고 AI 모델과 경쟁하도록 설계되었습니다. Ernie 4.5는 멀티 모달 파운데이션 모델이며 Ernie X1은 고급 기능을 갖춘 깊은 생각의 추론 모델입니다.
Q2. Baidu의 Ernie 4.5는 Ernie X1과 어떻게 다릅니 까?A. Ernie 4.5는 텍스트, 이미지, 오디오 및 비디오를 처리 할 수있는 멀티 모달 이해에 최적화되어 있으며 정확도가 높습니다. 반면에 Ernie X1은 심오한 추론을 위해 설계되었으며 상황에 대한 이해, 계획 및 자기 반성으로 문제 해결이 탁월합니다.
Q3. Ernie 4.5 & X1은 OpenAI의 GPT-4.5와 어떻게 비교됩니까?A. Baidu Ernie 4.5는 여러 벤치 마크에서 GPT-4.5, 특히 추론, 다중 모달 이해 및 환각 방지에서 GPT-4.5 가격의 1%에 불과합니다. Ernie X1은 비용의 절반으로 DeepSeek-R1 레벨 성능을 제공하여 경쟁력있는 AI 솔루션을 제공합니다.
Q4. Ernie 4.5 & x1의 가격 세부 정보는 얼마입니까? A. Ernie 4.5 : 입력 비용은 1m 토큰 당 $ 0.55, 출력 비용은 1m 토큰 당 $ 2.20입니다.
Ernie X1 : 입력 비용은 1m 토큰 당 $ 0.28, 출력 비용은 1m 토큰 당 $ 1.10입니다.
Ernie X1 모델은 아직 API를 통해 사용할 수 없지만 곧있을 것입니다.
A. 다음을 통해 이러한 모델에 액세스 할 수 있습니다.
1. yiyan.baidu.com의 Ernie Bot (AI Chatbot) (중국 사용자 만 사용할 수 있음).
2. API 액세스를위한 Baidu AI Cloud의 MAAS 플랫폼 인 Qianfan (현재 Ernie 4.5 만 사용할 수 있음).
위 내용은 Baidu의 Ernie 4.5 & X1이 GPT-4.5 및 DeepSeek-R1을 대체할까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!