다시 한 번 'AI' 세계를 변화시킬 GPT-4가 오랫동안 기다려왔습니다.-일체 포함-php.cn

다시 한 번 'AI' 세계를 변화시킬 GPT-4가 오랫동안 기다려왔습니다.

최근 인공지능 챗봇인 ChatGPT가 인터넷을 휩쓸었고 네티즌들은 그 초고감도 지능과 엄청난 힘에 열광하고 있습니다. 대학 입시를 치르고, 코드를 수정하고, 소설을 구상하는 등 대다수 네티즌의 '제안'에 따라 계속해서 돌파하고 있으며 전체 프로그램을 사용하여 강아지를 엮을 수도 있습니다. 이러한 스킬은 GPT-3.5를 기반으로만 개발되었으며, 지난 3월 15일 AI 세계가 다시 업데이트되었으며 OpenAI에서도 최신 버전의 GPT-4가 출시되었습니다.

GPT-4는 이전에 비해 더욱 강력한 언어 이해 능력을 보여줄 뿐만 아니라 이미지 콘텐츠 처리도 가능하며 시험 점수도 인간의 90%를 능가할 수 있습니다. 그렇다면 이러한 "저항하는" GPT-4에는 어떤 다른 기능이 있습니까? 어떻게 만들어지나요?

믿을 수 없는 GPT-4

GPT-4 출시 이후 OpenAI 공식 홈페이지가 일시적으로 혼잡해졌고, 많은 사용자들이 소셜 미디어를 통해 즉시 플러스 서비스에 가입했다고 밝혔습니다. GPT-4가 출시된 후 'GPT-4'라는 용어는 미국, 일본 및 기타 지역의 핫 리스트는 물론 국내 웨이보 핫 검색 리스트, Douyin 핫 소셜 리스트 등에 빠르게 등장했습니다.

OpenAI의 공식 소개에 따르면 GPT-4는 이미지와 텍스트를 입력받아 텍스트를 출력할 수 있는 대형 멀티모달 모델입니다. 많은 실제 시나리오에서는 인간보다 능력이 떨어지지만 다양한 전문적, 학문적 벤치마크에서 인간 수준의 성능을 보여줍니다. 예를 들어, GPT-4는 모의 SAT(American Scholastic Aptitude Test)를 통과하고 상위 10%에 도달할 수 있는 반면, GPT-3.5는 하위 10%에 도달할 수 있습니다.

再一次改变“AI”世界 GPT-4千呼万唤始出来

공식 시연 영상에서 Open AI 사장이자 공동 창업자인 Greg Brockman이 사용자들에게 아직 공개되지 않은 최신 버전의 시스템의 이미지 인식 기능을 미리 엿볼 수 있는 것을 보았습니다. Be My Eyes 회사 테스트라는 회사에서만 개발되었습니다. 이 기능을 사용하면 GPT-4가 프롬프트와 함께 제출된 이미지를 분석 및 응답하고 질문에 답하거나 해당 이미지를 기반으로 작업을 수행할 수 있습니다. "GPT-4는 단순한 언어 모델이 아니라 비전 모델입니다."라고 Brockman은 말했습니다. "문서처럼 이미지와 텍스트가 임의로 삽입된 입력을 수용할 수 있는 유연성이 있습니다." 데모에서 Greg Brockman은 손 그림 사진과 예비 웹사이트 스케치를 GPT-4에 제출했고 시스템은 그림을 기반으로 작동하는 웹사이트를 만들었습니다.

再一次改变“AI”世界 GPT-4千呼万唤始出来

再一次改变“AI”世界 GPT-4千呼万唤始出来 업계에서는 ChatGPT-4가 GPT-3보다 571배 더 강력하다고 믿고 있습니다. 이 최신 성과로 가장 큰 혜택을 받는 세 가지 주요 직업은 작가, 마케팅 담당자 및 기업가입니다. 업계 관계자들은 두 가지 비교를 토대로 GPT-4가 더 많은 훈련 데이터, 더 다양하고 창의적인 반응, 1초로 더 짧은 반응 시간 등 다른 장점도 가지고 있다고 지적했다.

再一次改变“AI”世界 GPT-4千呼万唤始出来 이 업그레이드에 반영된 주요 트렌드 중 하나는 다중 양식입니다. 모델이 더욱 복잡해지고 커져 주변 환경에 대해 더 정확한 예측을 할 수 있습니다. 환경과 현실 세계에 대한 이해가 좋습니다.

또한 GPT-4는 다국어 측면에서도 우월성을 보여줍니다. 테스트된 26개 언어 중 GPT-4는 라트비아어, 웨일스어 등 일부 저자원 언어를 포함해 24개 언어에서 GPT-3.5 등 다른 대규모 언어 모델의 영어 성능보다 더 나은 성능을 보였습니다. 중국 환경에서 GPT-4는 80.1%의 정확도를 달성할 수 있습니다.

그러나 OpenAI는 공식 웹사이트에도 GPT-4의 단점을 나열했습니다. 여전히 사회적 편견, 사실 조작, 대립 생성 등의 한계가 알려져 있습니다. OpenAI는 사회가 AI 모델을 수용함에 따라 투명성을 높이고, 사용자 교육과 광범위한 인공지능 활용 능력을 장려 및 장려하며, AI 모델 육성에 있어 사람들의 입력 채널을 확대하기 위해 노력할 것이라고 밝혔습니다.

GPT-4는 상용화 준비가 완료되었습니다

GPT-4의 개발을 통해 우리는 GPT-4의 성능이 많은 실제 시나리오에서 인간보다 열등하지만 다양한 전문 및 학술 벤치마크에서 인간과 비슷한 성능을 보여주었다는 사실을 발견했습니다. 이는 GPT-4가 실제로 상용화에서 한 단계 더 나아갔다는 의미이기도 합니다.

이전에는 전문 분야에서 GPT-3의 성능이 만족스럽지 못한 것으로 간주되었습니다. 미국의 통일 변호사 시험(MBE+MEE+MPT)에서 GPT-3.5는 하위 10%에 속할 수 있지만 GPT는 - 4점은 이미 상위 10%에 속합니다. 전문 분야에서 GPT-4의 역량은 크게 향상되었으며, 일부 전문 분야에서는 점차 인간에 접근하거나 심지어 이를 뛰어넘어 많은 ToB 비즈니스 분야에서 GPT-4에 더 많은 가능성을 제공합니다.

예를 들어, 전문 기술 보조 도구, 지식 검색 애플리케이션, 직업 교육 및 훈련 등과 같은 분야에서 GPT-4가 가져오는 기능은 혁신적일 수 있습니다.

GPT-4가 출시된 후 Microsoft는 즉시 다음과 같이 말했습니다. "지난 5주 동안 언제든지 새로운 Bing 미리 보기 버전을 사용해 본 적이 있다면 이미 OpenAI 최신 모델의 강력한 기능을 미리 이해한 것입니다." 이는 New Bing이 이미 GPT-4를 사용했음을 의미합니다. 지난 몇 주 동안 많은 사람들이 GPT-4로 강화된 Bing을 경험했으며 텍스트 기능만 사용할 수 있게 되었습니다. Microsoft는 이를 설명하기 위해 "세계 초연"이라는 단어를 사용하지 않았지만 결국 Microsoft는 OpenAPI에 130억 달러(약 900억 위안)를 투자했으며 그에 따른 대우는 합리적입니다.

Microsoft의 New Bing 외에도 언어 학습 도구 소프트웨어인 Duolingo, 시각 장애 사용자를 돕는 소프트웨어인 BeMyEyes, 모바일 결제 회사인 Stripe, 국제 금융 서비스 회사인 Morgan Stanley 등 많은 회사가 현재 GPT-4를 제품에 통합하고 있습니다. .

그러나 GPT-4가 대형 모델을 구현할 수 있는 상용화 시나리오를 크게 확대했음에도 불구하고 컴퓨팅 성능과 R&D 비용은 여전히 많은 사람들이 대형 모델 구현에서 극복하기 어려운 장애물로 간주하고 있다는 점을 인정해야 합니다. 결국, 현재 대형 모델에 대한 R&D 및 컴퓨팅 전력 비용은 엄청나게 높은 것 같습니다. 이전에는 ChatGPT가 공개한 단일 교육 및 일일 운영 비용이 수백만 달러에 달했기 때문에 단기적으로 상업적 사용 비용을 통제하기 어려울 수 있습니다. 용어.

GPT 개발 역사

우리 모두 알고 있듯이 ChatGPT는 OpenAI가 개발한 대규모 자연어 처리 모델이지만, 그 개발 역사가 2015년까지 거슬러 올라간다는 사실을 많은 사람들이 모르고 있습니다. OpenAI는 2015년 Tesla의 Musk, Sam Altman 및 기타 투자자들이 첨단 인공지능 기술을 통해 인공지능 분야의 발전을 촉진하는 것을 목표로 공동 창립했습니다. 머스크는 회사 발전 방향의 차이로 인해 2018년 회사를 떠났다.

이전 OpenAI는 자연어 처리 모델 GPT 시리즈를 출시한 것으로 유명했습니다. OpenAI는 2018년부터 기사, 코드, 기계 번역, Q&A 등 다양한 콘텐츠를 생성하는 데 사용할 수 있는 생성적 사전 훈련된 언어 모델 GPT(Generative Pre-trained Transformer)를 출시하기 시작했습니다.

GPT 모델의 각 세대 매개변수 수가 폭발적으로 증가했습니다. 2019년 2월에 출시된 GPT-2의 매개변수 수는 2020년 5월에 GPT-3을 출시했을 때 이미 업계에서 가장 발전된 모델이었습니다. 세계 자연어 생성 모델. GPT-3에는 1,750억 개의 매개변수가 있습니다.

GPT-3가 등장했을 때는 비지도 모델(현재는 자기 지도 모델이라고도 함)로 문제 지향 검색, 독해, 의미 추론, 기계 번역 등 자연어 처리의 대부분 작업을 거의 완료할 수 있었습니다. , 기사 생성 및 자동 질문 및 답변 등

또한 모델은 프랑스어-영어 및 독일어-영어 기계 번역 작업에서 현재 최고 수준에 도달하는 등 많은 작업에서 잘 수행됩니다. 자동으로 생성된 기사는 인간과 기계를 거의 구별할 수 없습니다. 더욱 놀라운 점은 두 자리 덧셈과 뺄셈 작업에서 거의 100%의 정확도를 달성할 수 있으며 작업 설명을 기반으로 자동으로 코드를 생성할 수도 있다는 것입니다. 비지도 모델은 다양한 기능과 좋은 효과를 가지고 있어 사람들에게 일반 인공지능에 대한 희망을 주는 것 같습니다. 이것이 GPT-3가 그토록 큰 영향을 미치는 주된 이유일 것입니다.

2021년 OpenAI는 이미지 생성이 가능한 인공지능 기술인 "DALL-E"라는 새로운 이름을 출시할 것이라고 발표했습니다. 동시에 OpenAI는 더욱 발전된 자연어 처리 기술도 개발하고 있습니다.

그 이후의 이야기는 다들 아시리라 믿습니다. 2022년 말, GPT-3.5 기반의 ChatGPT는 빛의 속도로 전 세계를 휩쓸며 지금까지 GPT-4의 출시로 세계 최대 규모의 '기술적 붕괴'가 되었습니다. 많은 국가에서 인기 검색 목록에 올랐습니다.

再一次改变“AI”世界 GPT-4千呼万唤始出来