Grok 3 Action : 게임 개발, 추론 등-일체 포함-php.cn

Xai의 Grok-3의 초기 액세스 단계에서 AI 애호가, 개발자 및 연구원들은 한계를 뛰어 넘고 능력을 탐색하는 데 시간을 낭비하지 않았습니다. 게임 개발에서 추론 테스트에 이르기까지 첫 번째 인상은 Grok-3이 AI 공간의 심각한 경쟁자이며 OpenAi의 최고 계층 모델, DeepSeek-R1 및 Google의 Gemini와 경쟁하고 있음을 시사합니다.

그러나 그로크가 다른 AI 모델과 다른 점은 무엇입니까? 그리고 왜 그렇게 많은 관심을 받고 있습니까? Grok 3 Action : 게임 개발, 추론 등 목차

grok-3 성능 : 파리에서의 게임 개발

Grok-3 성능 : 추론 및 문제 해결 : 진정한 "사고"ai?

Andrej Karpathy의 "Vibe Check": angrok-3 ai

연구 및 실제 검색 쿼리를위한 AI
수학 및 논리 추론

grok-3 성능 : 실제 물리 시뮬레이션

강점

약점

결론

Grok : 개방적이고 제한되지 않은 ai
에 대한 Xai의 비전 Grok은 Elon Musk가 설립 한 인공 지능 회사 인 Xai가 개발 한 고급 AI 모델입니다. 많은 주류 언어 모델과 달리 Grok은 Chatgpt (Openai) 또는 Claude (Anthropic)에 비해 덜 제한적이고 응답이 더 열려 있도록 설계되었습니다. 편견없는 진실을 찾는 AI 경험을 제공하여 오늘날 가장 강력하고 독특한 대형 언어 모델 (LLM) 중 하나입니다. 의 출시와 함께,이 비전은 이제 현실이되고 있습니다. Grok의 기원 : Openai에서 Xai 까지 Grok이 왜 존재하는지 이해하려면 Openai의 초기를 되돌아보아야합니다. Sam Altman, Greg Brockman 등의 공동 창립자 중 한 명인 Elon Musk에 의해 Openai가 처음에 형성되었음을 알게 된 사람은 거의 없습니다.
Musk는 Openai의 초기 연구의 주요 투자자였으며, 개발에 자금을 지원하고 오픈 소스 비영리 단체 접근법을 옹호했습니다. 그러나 OpenAi는 영리의 폐쇄 소스 회사로 전환함에 따라 Musk는 이러한 변화에 동의하지 않고 조직과의 일부를 나누었습니다.
. 이것은 AI 연구에서 차이를 남겼습니다. AI가 인류의 미래를 정의 할 5 가지 핵심 기술 중 하나라는 그의 신념을 감안할 때, 머스크는 실망 스러웠습니다.
머스크의 컴백 : Xai & Grok의 탄생 Chatgpt의 폭발적인 성공을 목격 한 후 Musk는 자신이 행동해야한다는 것을 알았습니다. 2023 년 3 월, 그는 공식적으로 Xai를 출시하여 그의 재입국을 AI 개발에 표시했습니다.
2024 년에 Xai는 19 일 만에 세계 최대의 AI 슈퍼 컴퓨터를 구축함으로써 역사를 만들었습니다. Nvidia의 CEO 인 Jensen Huang이“SuperHuman”이라고 불렀습니다. Xai는 거기서 멈추지 않았습니다. 그들은 이제 컴퓨팅 전력을 200,000 GPU로 확장하여 AI 인프라에서 앞서 나가도록합니다.
이 놀라운 획기적인 획기적인 획기적인 혁신으로, 이제 Grok-3은 지금까지 생성 된 가장 강력한 AI 모델 중 하나로 떠오르고 있습니다. Grok의 핵심 약속 : 바이어스가없는 ai Chatgpt 및 Claude와 같은 기존의 많은 AI 모델은 종종“깨어 났거나 지나치게 정치적으로 정확하다는 비판을받습니다. 어떤 사람들은 그들의 내장 편견이 위험하거나 오해의 소지가있는 결론으로 이어질 수 있다고 주장합니다. Grok에 대한 Elon Musk의 비전은 다릅니다
그는 사회적 또는 정치적 이야기에 맞게 정보를 필터링하거나 부드럽게하지 않고 객관적인 사실을 전달하는“진실을 추구하는”AI를 구상합니다. 진실이 불편하거나 논란의 여지가 있는지 여부, Grok은 실리콘 밸리 회사의 가치를 반영하는 경쟁사와는 달리 경쟁자와는 달리 그것을 추구하도록 설계되었습니다.
이 필터링되지 않은 현실 기반 접근 방식은 AI 윤리 및 정보 보급에서 게임 체인저로서 Grok을 차별화 할 수 있습니다. 전문가의 말을 보자 : Grok-3 성능 : 파리에서의 게임 개발
Grok 3이 방금 석방되었습니다. 당신은 그것을 믿지 않을 것입니다, 나는 이미 게임을 만들었습니다.

(오늘 아침에 일찍 액세스 할 수있었습니다). 이 게임은 Grok에 의해 100%로 만들어졌으며, 방금 내가 원하는 것을 말하고 코드를 올바른 장소에 넣었습니다. 나는 그냥 조정을 계속 요청하고 계속 침을 뱉고… “방금 내가 원하는 것을 말했고 게임을 만들었습니다.”
가장 눈에 띄는 초기 사용 사례 중 하나는 Penny2X에서 나온다. Penny2X는 접근 후 몇 시간 내에 Grok-3 만 사용하여 전체 게임을 처음부터 구축했다.
“이 게임은 100% Grok에 의해 만들어졌습니다. 방금 내가 원하는 것을 말했고 코드를 올바른 위치에 넣었습니다. 나는 조정을 계속 요구하고 실행할 수있는 단일 파일로 게임을 계속 뱉어냅니다.” 이것은 개발자에게 엄청납니다. AI 생성 게임 코드는 새로운 것이 아니지만 Grok-3이 API 통합없이이를 완벽하게 수행한다는 사실은 GPT-4O 및 Sonet과 같은 모델과 비슷합니다. Grok-3이 개발자 워크 플로에 더 잘 통합 될 수 있다면 인디 개발자와 스튜디오가 게임을 만드는 방식을 바꿀 수 있습니다.
내 테이크 이것은 흥미로운 이정표입니다. Grok-3의 실시간 조정 및 실행 가능한 게임 코드를 생성하는 능력은 개발자에게 더 빠른 프로토 타이핑을 의미 할 수 있습니다. XAI가 생산 사용을 위해 API를 최적화하면 AI-ASSISTED 게임 개발의 주요 변화를 볼 수 있습니다.Grok-3 성능 : 추론 및 문제 해결 : 진정한“사고”ai? 나는 오늘 일찍 Grok 3에 일찍 접근 할 수 있었는데, 나는 빠른 분위기 점검을 실행할 수있는 최초의 몇 사람 중 한 명을 생각하게 만들었습니다.

먼저, Grok 3은 예술적 사고 모델 ( "생각"버튼) 주위에 분명히 내 정착민의 Catan에서 상자를 펼쳤습니다. (@karpathy) 2025 년 2 월 18 일

Andrej Karpathy의 "Vibe Check": Grok-3을 생각할 수 있습니까? ai 개척자 Andrej Karpathy는 복잡한 추론과 문제 해결 작업으로 Grok-3을 테스트에 넣었습니다. 그의 가장 큰 테이크 아웃? Grok-3의 "Think"모드는 게임 체인저입니다.

“Grok 3에는 주변의 최첨단 사고 모델 (“Think”버튼)이 분명히 있으며, 내 정착민의 Catan 질문에 대해 상자에서 훌륭했습니다. 이 모델을 믿을 수 없게하는 모델은 거의 없습니다. 최상위 Openai 모델 (O1-Pro, $ 200/월)은 Deepseek-R1, Gemini 2.0 Flash Thinking 및 Claude는 그렇지 않습니다. 그는 또한 논리 퍼즐, TIC-TAC-TOE 보드 생성 및 수학적 추정 (GPT-2의 훈련 플롭 계산)을 테스트했습니다. 깊은 추론이 필요한 작업에서 Grok-3은 GPT-4O 및 O1-PRO를 능가했으며, 이는 자체 추론 기능으로도 추정 작업에 실패했습니다.
“내가 얻은 인상은 Grok-3이 O1-Pro 기능에 어딘가에 있고 DeepSeek-R1보다 앞서 있다는 것입니다.” 그러나 Grok-3은 완벽하지 않습니다. 그것은 퍼즐 생성 작업, 이모티콘 인코딩 도전 과제로 어려움을 겪었지만 여전히 정보 검색에 환각이 가끔 있습니다.
.
내 테이크 "생각"모드는 Grok-3의 가장 큰 강점 중 하나 인 것으로 보입니다. 대부분의 챗봇이 실시간 문제 해결으로 어려움을 겪고있는 시대에 Grok-3의 복잡한 쿼리를 논리적으로 "일하는"능력 (단지 답변을 되풀이하지 않고)은 많은 경쟁자들보다 앞서 있습니다. 그러나 Karpathy가 언급 한 것처럼 실제 벤치 마크와 평가는 전체 이야기를 들려 줄 것입니다. 도 읽으십시오 : Andrej Karpathy의 첫 번째 Grok 3! Grok-3 vs. 다른 AI 모델 : 어떻게 쌓인가?

단지 추론을 넘어서, Grok-3은 지식 검색, 깊은 검색, 유머 및 윤리적 의사 결정에 대한 주요 모델에 대해 테스트되었습니다. 깊은 검색 : 연구 및 실제 쿼리를위한 AI Karpathy는 Grok-3의 "Deep Search"기능이 OpenAi의 Deep Research 및 Perplexity의 검색 모델과 비교하여 다음과 같은 실시간 쿼리에서 잘 수행된다고 언급했습니다.