GPT-4의 전체 평가를 마친 후 Microsoft의 핫 페이퍼에서는 AGI의 첫 번째 버전이 곧 출시될 것이라고 밝혔습니다.
1956년 다트머스 대학에서 열린 세미나에서 인공지능의 개념이 정식으로 제안되었습니다.
이 용어는 정의하기가 너무 어렵기 때문에 심리학자, 철학자, 컴퓨터 과학자들에게 도전이 되었습니다. 1994년에 52명의 심리학자들이 그 본질을 포착하려는 논문을 발표했습니다.
시간이 지나면서 연구자들은 2016년 한국 체스 챔피언을 상대로 한 알파고 챌린지와 대승 등 특정 분야의 AI 시스템에 관심을 갖기 시작했습니다. 그러다가 1990년대 후반과 2000년대 초반에 이르러 연구자들은 더 이상 전문화된 AI에 만족하지 않게 되었고, 보다 일반적인 인공지능 시스템 개발에 대한 요구가 커졌습니다. 이와 함께 일반 인공지능(AGI)이라는 용어도 2000년대 초반부터 인기를 끌기 시작했다.
보시다시피 최근 LLM(대형 언어 모델)이 주목을 받고 있습니다. 이러한 신경망은 Transformer 아키텍처를 기반으로 하며 대량의 텍스트 데이터 세트를 기반으로 훈련되었습니다. 특히 OpenAI의 최신 GPT-4 릴리스는 대규모 언어 모델의 다양성을 보여주며 수학, 작문, 법률, 의학 및 기타 분야에 능숙합니다.
GPT-4가 AGI를 향한 중요한 단계인지 묻지 않을 수 없습니다.
Microsoft의 대답은 '예'입니다. 최근 발표된 논문에서는 이러한 관점을 자세히 설명했습니다. 이 기사에서는 GPT-4에 대한 포괄적인 평가를 제공합니다. Microsoft는 "GPT-4의 기능의 폭과 깊이를 고려할 때 이것이 AGI(일반 인공 지능) 시스템의 초기(그러나 아직 불완전한) 버전으로 합리적으로 간주되어야 한다고 믿습니다."라고 말했습니다. 이 기사의 주요 목표는 GPT-4의 기능과 한계를 탐구하는 것입니다. 우리는 GPT-4의 지능이 컴퓨터 과학 및 기타 분야의 진정한 패러다임 전환을 의미한다고 믿습니다. "
논문 주소: https:/ /arxiv.org/pdf/2303.12712.pdf
흥미롭게도 이 인기 논문 역시 삭제된 내용이 많은 것으로 밝혀져 누군가가 논문의 요약본을 발견한 것입니다.
무삭제 버전에서 이 블로거는 숨겨진 세부 사항도 많이 공개했습니다. GPT-4의 내부 이름은 실제로 해당 논문의 숨겨진 제3저자였던 DV-3이며 나중에 삭제되었습니다. Microsoft 연구원들은 GPT-4의 기술적 세부 사항에 대해 많이 알지 못하는 것 같습니다. 또한 해당 블로거는 (OpenAI에 미치는 부정적인 영향을 방지하기 위해?) 이 논문이 발표될 때 유해한 내용에 대한 부분이 삭제되었다고 밝혔습니다.
관심 있으신 분들을 위해 아래 블로거의 트위터 스레드를 붙여넣었습니다.
트위터 스레드: https://twitter.com/DV2559106965076/status/1638769434763608064
기사 자체로 돌아갑니다.
기사에 따르면 AGI는 추론하고, 계획하고, 문제를 해결하고, 추상적으로 생각하고, 복잡한 아이디어를 이해하고, 빠르게 배우고, 경험을 통해 배우는 구체적인 능력입니다. 이러한 역량을 바탕으로 본 논문에서는 흥미로운 실험과 평가를 진행한다.
논문은 10장으로 구성되어 있습니다. 1장은 일반적인 부분이고, 2장은 주로 시각적 생성 콘텐츠와 관련된 다중 양식을 소개합니다. 3장 코드는 지침에 따라 코드를 생성하고 기존 코드를 이해합니다. 4장: 수학적 능력, 5장: 인간과의 상호작용, 7장: 차별, 9장: 사회적 영향
GPT-4가 실제로 AGI 시대에 진입했는지 구체적인 사례를 통해 살펴보겠습니다.
다중 모드 및 학제간 구성
예술과 프로그래밍을 결합하는 모델의 능력을 테스트하기 위해 연구에서는 GPT-4에게 자바스크립트로 코드를 작성하여 아래 그림과 같이 칸딘스키 스타일의 무작위 이미지를 생성하도록 요청했습니다. 하나는 Wassily가 만들었습니다. Kandinsky, 두 번째와 세 번째는 각각 GPT-4와 ChatGPT에 의해 생성되었습니다.다음은 GPT-4 코드 구현 프로세스입니다.
시각적 개념 이해: 이 그리기 작업에서는 모델이 문자 Y, O, 그리고 H 한 사람. 실제로 GPT-4의 학습 과정에서는 글자의 모양에 대한 지식이 없으며 관련 학습 데이터에서 글자가 특정 모양과 관련이 있다는 것을 막연하게 학습할 수 있을 뿐입니다. 4도 나쁘지 않습니다:
스케치 생성의 경우: GPT-4는 Stable Diffusion과 결합할 수도 있습니다. 아래 그림은 3D 도시 모델링의 스크린샷입니다. 입력 프롬프트에는 왼쪽에서 오른쪽으로 흐르는 강, 강 옆에 피라미드가 건설된 사막, 화면 하단에 녹색 색상의 버튼 4개가 있습니다. 파란색, 갈색, 빨간색. 생성된 결과는 다음과 같습니다.
GPT-4에 ABC 표기법을 사용하여 곡을 생성하고 수정하도록 요청할 수도 있습니다.
프로그래밍 기능
GPT-4에는 매우 강력한 프로그래밍 기능이 있습니다. 지침에 따라 코드를 작성하고 기존 코드를 이해하는 것이 포함됩니다. 이 연구에서는 특히 GPT-4의 프로그래밍 기능을 테스트했습니다.
코드 작성
아래 그림 3.1은 GPT-4가 Python 함수를 작성하도록 하는 예입니다. 이 연구에서는 LeetCode를 사용하여 온라인에서 코드가 올바른지 확인합니다.
연구를 통해 GPT-4는 위 표 2의 LeetCode에 대한 정확도 데이터를 차트로 시각화하였고 그 결과를 아래 그림 3.2에 나타내었습니다.
Front-end/Game Development
아래 그림 3.3과 같이 이 연구를 통해 GPT-4는 JavaScript를 사용하여 HTML로 3D 게임을 작성할 수 있으며 GPT-4는 0을 사용합니다. 샘플 모든 요구 사항을 충족하는 게임이 생성되었습니다.
딥 러닝 프로그래밍
딥 러닝용 코드를 작성하려면 수학, 통계에 대한 지식이 필요하고 PyTorch, TensorFlow, Keras 등과 같은 프레임워크 및 라이브러리에 대한 지식이 필요합니다. 아래 그림 3.4에서 볼 수 있듯이 연구원은 맞춤형 최적화 모듈을 작성하기 위해 GPT-4 및 ChatGPT를 요구하는데, 이는 인간 딥 러닝 전문가에게도 어려운 작업입니다. 연구원들은 SVD 적용 등과 같은 일련의 중요한 작업을 포함하는 GPT-4 및 ChatGPT에 대한 자연어 설명을 제공합니다.
또한 연구에서는 코드를 LaTex 수식으로 변환하는 GPT-4의 기능도 테스트했으며 결과는 아래 그림 3.5에 나와 있습니다.
코드 이해 측면에서 본 연구는 GPT-4와 ChatGPT가 C/C++ 프로그램을 "읽고" 프로그램의 출력을 예측하도록 시도합니다.
그런 다음 연구에서는 GPT-4가 Python 코드 조각을 설명하도록 합니다:
및 의사 코드 조각을 설명합니다:
수학적 능력
오랫동안 수학적 능력은 대규모 언어 모델은 그다지 좋지 않은 것 같습니다. 그렇다면 이와 관련하여 GPT-4는 어떻게 수행됩니까? 본 논문에서 일련의 평가를 거친 결과, GPT-4는 이전 모델에 비해 수학에서 질적 도약을 이루었지만 여전히 전문가 수준과는 거리가 멀고 수학 연구를 수행할 수 있는 능력이 없는 것으로 나타났습니다.
ChatGPT와의 비교에서 GPT-4는 성공적으로 솔루션을 생성했지만 ChatGPT는 잘못된 답변을 생성했습니다.
AP 질문에서 GPT-4 대 ChatGPT 비교 결과. GPT-4는 올바른 접근 방식을 사용하지만 계산 오류로 인해 잘못된 최종 답이 나오고 ChatGPT는 일관되지 않은 주장을 생성합니다.
또한 이 기사에서는 수학적 사고와 기술을 사용하여 실제 문제를 해결하는 GPT-4의 능력을 테스트합니다. 아래 그림은 GPT-4가 광범위한 학제간 수학 지식이 필요한 복잡한 시스템에 대한 합리성을 성공적으로 구축하는 방법을 보여줍니다. 모델이지만 ChatGPT는 의미 있는 진전을 이루지 못했습니다.
논문이 154페이지이므로 이 글에는 많은 평가 결과만 표시되어 있습니다. 자세한 내용은 원본 논문을 참조하시기 바랍니다.
마지막으로 첨부된 목차는 다음과 같습니다.
위 내용은 GPT-4의 전체 평가를 마친 후 Microsoft의 핫 페이퍼에서는 AGI의 첫 번째 버전이 곧 출시될 것이라고 밝혔습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 마커를 활성화하는 데 사용됩니다. DeepSeek67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다. DeepSeek은 일반 인공지능을 연구하는 회사입니다.

Llama3에 대해 새로운 테스트 결과가 공개되었습니다. 대형 모델 평가 커뮤니티 LMSYS가 공개한 대형 모델 순위 목록에서 Llama3는 5위에 올랐으며, 영어 부문에서는 GPT-4와 함께 공동 1위를 차지했습니다. 다른 벤치마크와는 그림이 다릅니다. 이 목록은 모델 간 1:1 대결을 기반으로 하며, 네트워크 전체의 평가자들이 각자의 제안과 점수를 내립니다. 결국 Llama3가 5위를 차지했고, GPT-4와 Claude3 Super Cup Opus의 세 가지 버전이 그 뒤를 이었습니다. 영어 싱글 목록에서는 Llama3가 Claude를 제치고 GPT-4와 동점을 기록했습니다. 이 결과에 대해 Meta의 수석 과학자 LeCun은 매우 기뻐했으며 트윗을 통해 다음과 같이 말했습니다.

휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

볼륨이 미쳤고, 볼륨이 미쳤고, 큰 모델이 다시 변경되었습니다. 바로 지금, 세계에서 가장 강력한 AI 모델이 하룻밤 사이에 주인이 바뀌었고 GPT-4가 제단에서 뽑혔습니다. Anthropic은 최신 Claude3 시리즈 모델을 출시했습니다. 한 문장 리뷰: 정말 GPT-4를 압도합니다! 다중 모드 및 언어 능력 지표 측면에서 Claude3이 승리합니다. Anthropic의 말에 따르면 Claude3 시리즈 모델은 추론, 수학, 코딩, 다국어 이해 및 비전 분야에서 새로운 업계 기준을 설정했습니다! Anthropic은 서로 다른 보안 개념으로 인해 OpenAI에서 "탈퇴"한 직원들이 설립한 스타트업 회사입니다. 그들의 제품은 OpenAI에 반복적으로 큰 타격을 입혔습니다. 이번에는 클로드3도 큰 수술을 받았습니다.

1분 이내에 20단계를 거쳐 보안 제한을 우회하고 대형 모델을 성공적으로 탈옥할 수 있습니다! 그리고 모델의 내부 세부 사항을 알 필요가 없습니다. 두 개의 블랙박스 모델만 상호 작용하면 되며 AI는 완전히 자동으로 AI를 공격하고 위험한 내용을 말할 수 있습니다. 한때 유행했던 '할머니 허점'이 고쳐졌다는 소식을 들었습니다. 이제 '탐정 허점', '모험가 허점', '작가 허점'에 직면하면 인공지능은 어떤 대응 전략을 채택해야 할까요? 맹공격의 물결 이후 GPT-4는 참을 수 없었고, 이것이든 저것이든... 급수 시스템을 오염시킬 것이라고 직접 말했습니다. 핵심은 이것이 펜실베니아 대학 연구팀이 노출한 취약점의 작은 물결일 뿐이며, 새로 개발된 알고리즘을 사용하여 AI가 자동으로 다양한 공격 프롬프트를 생성할 수 있다는 것입니다. 연구자들은 이 방법이 기존 방법보다 낫다고 말합니다.

깨어나면 일하는 방식이 완전히 달라집니다. Microsoft는 AI 아티팩트 GPT-4를 Office에 완전히 통합했으며 이제 ChatPPT, ChatWord 및 ChatExcel이 모두 통합되었습니다. Nadella CEO는 기자회견에서 다음과 같이 직접 말했습니다. 오늘날 우리는 인간-컴퓨터 상호 작용의 새로운 시대에 진입했으며 생산성을 재창조했습니다. 새로운 기능은 Microsoft 365 Copilot(Copilot)이라고 하며 프로그래머를 변화시킨 코드 도우미 GitHub Copilot과 함께 시리즈가 되며 계속해서 더 많은 사람들을 변화시키고 있습니다. 이제 AI는 자동으로 PPT를 만들 수 있을 뿐만 아니라 한 번의 클릭으로 Word 문서의 내용을 기반으로 아름다운 레이아웃을 만들 수도 있습니다. 무대에 오를 때 각 PPT 페이지마다 해야 할 말까지 함께 정리되어 있어요.

ChatGPT를 개발한 OpenAI는 자사 웹사이트에서 Morgan Stanley가 진행한 사례 연구를 보여줍니다. 주제는 "Morgan Stanley Wealth Management는 방대한 지식 기반을 구성하기 위해 GPT-4를 배포합니다."입니다. 사례 연구에서는 Morgan Stanley의 분석, 데이터 및 혁신 책임자인 Jeff McMillan이 "이 모델은 내부를 향한 Powered 모델이 될 것입니다."라고 말했습니다. 자산 관리 콘텐츠에 대한 포괄적인 검색을 수행하고 Morgan Stanley Wealth Management의 축적된 지식을 효과적으로 활용하는 챗봇입니다.” McMillan은 다음과 같이 강조했습니다. "GPT-4를 사용하면 기본적으로 자산 관리 분야에서 가장 지식이 풍부한 사람의 지식을 즉시 얻을 수 있습니다. 이를 우리의 최고 투자 전략가이자 최고 글로벌 경제학자라고 생각하십시오.

StabilityAI는 StableDiffusion3을 출시한 후 오늘 자세한 기술 보고서를 발표했습니다. 이 논문은 DiT를 기반으로 한 Diffusion 모델의 개선된 버전과 Vincentian 그래프의 새로운 아키텍처인 StableDiffusion3의 핵심 기술에 대한 심층 분석을 제공합니다! 보고서 주소: https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf 글꼴 디자인 및 프롬프트에 대한 정확한 응답 측면에서 StableDiffusion3 인간 평가 테스트를 통과했습니다. ,초과
