불과 몇 달 전, DeepSeek의 V3, R1 및 Janus 모델은 AI 커뮤니티에서 파도를 만들었습니다. 이제 Elon Musk의 Grok 3은 경기장에 들어가서 "지구상에서 가장 Smart AI"라는 제목을 자랑했습니다. Xai의 초기 벤치 마크는 인상적이었으며 Grok 3은 다양한 테스트에서 경쟁 업체를 능가했습니다. 그러나 일상적인 작업에서 어떻게 수행됩니까? $ 40 x 프리미엄 구독이 그만한 가치가 있습니까? 이 기사는 Grok 3과 Deepseek R1을 5 개의 다양한 프롬프트에서 비교합니다.
목차 :
작업 1 : 파이썬 코드 생성
관찰 : Grok 3은 올바른 코드를 생성하기 위해 고군분투했습니다. DeepSeek R1은 느리지 만 정확하고 기능적인 코드를 제공했습니다 평결 : Grok 3 ❌ Deepseek r1 작업 4 : 이미지 분석 (체스)
프롬프트 : "이 체스 판 위치를 분석하십시오. 흰색이 검은 색을 확인하고 추론을 설명하는 최선의 움직임을 제안하십시오.">. (원본 이미지 비교 유지.)
관찰 : 두 모델 모두 checkmate를 올바르게 식별하지 못했습니다평결 : Grok 3 ❌ Deepseek r1 작업 5 : 논리적 추론 (Zebra Puzzle)
프롬프트 : "이 얼룩말 퍼즐을 해결하십시오. 테이블의 출력을주세요.". (원본 이미지 비교 유지.) 관찰 :
Deepseek r1은 퍼즐을 올바르게 해결했습니다. 그로크 3은 그렇지 않았다.평결 : Grok 3 ❌ Deepseek r1
Grok 3 vs. DeepSeek R1 : 결과 (원래 테이블을 유지하십시오.) 결론Grok 3의 "Smart AI"라는 마케팅 주장은이 실제 테스트에 의해 뒷받침되지 않았습니다. DeepSeek R1은 정확성, 구조 및 검증 가능성에서 Grok 3을 지속적으로 능가했습니다. Grok 3은 일부 지역에서 잠재력을 보여 주었지만 논리적 추론의 약점과 복잡한 문제 해결은 중요합니다. 미래의 업데이트가 개선 될지 여부는 여전히 남아 있습니다. 결과는 Xai가 훈련 방법을 상당히 개선해야한다고 제안합니다. (원래 통화 동작 및 블로그 링크 유지.)
위 내용은 Grok 3 vs Deepseek R1 : 어느 것이 더 낫습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!