ChatGPT vs. GPT-3 vs. GPT-4는 챗봇 계열 간의 내부 싸움일 뿐입니다.

青灯夜游
풀어 주다: 2023-03-31 22:39:11
앞으로
2087명이 탐색했습니다.

소민의 광고 카피 및 배너 생성 기능을 설명할 때 사람들은 GPT-3가 ChatGPT로 대체되었는지, 아니면 여전히 오래된 모드로 실행되고 있는지 묻는 경우가 많습니다.

소민의 광고 카피와 배너 생성 기능을 설명할 때 사람들이 GPT-3가 ChatGPT로 대체되었는지, 아니면 여전히 오래된 모드로 실행되고 있는지 묻는 경우가 많습니다. OpenAI가 출시한 챗봇인 ChatGPT가 호황을 누리고 있음에도 불구하고 소민 대변인은 “우리는 그렇게 하지 않았고 앞으로도 그렇게 할 계획이 없다”고 답했다. 이는 고객을 놀라게 하는 경우가 많으므로 고객이 그런 대답을 하는 이유를 설명합니다.

ChatGPT vs. GPT-3 vs. GPT-4는 챗봇 계열 간의 내부 싸움일 뿐입니다.

인공지능 모델에 자리잡다

GPT-2, GPT-3, ChatGPT 그리고 최근 출시된 GPT-4는 모두 동일한 유형의 인공지능 모델인 Transformer에 속합니다. 즉, 이전 세대 기계 학습 모델과 달리 보다 균일한 작업을 완료하도록 훈련되었으므로 실행 가능한 결과를 생성하기 위해 각 특정 작업에 대해 재훈련할 필요가 없습니다. 후자는 엄청난 크기(GPT-3의 경우 1,750억 개의 매개변수)를 설명하는 반면, 모델은 사용자 입력을 기반으로 서로 다른 데이터 조각 간에 전환할 수 있을 만큼 유연하려면 "전체 인터넷을 기억"해야 할 수도 있습니다. 그런 다음 모델은 사용자가 쿼리 질문, 작업 설명 및 몇 가지 예(예: 사서에게 관심 있는 책을 요청하는 경우)를 입력하면 결과를 생성할 수 있습니다. 이 접근 방식을 "퓨샷 학습"이라고 하며 최근 최신 Transformer 모델에 입력을 제공하는 추세가 되었습니다.

하지만 현재 작업을 완료하려면 항상 인터넷에 대한 모든 것을 알아야 합니까? 물론 그렇지 않습니다. ChatGPT와 같은 많은 경우에는 대규모(수백만)개의 작업별 데이터 샘플이 필요합니다. 이러한 샘플을 사용하면 모델을 사용할 수 있습니다. "인간 피드백을 통한 강화 학습(RLHF)" 프로세스를 시작합니다. 결과적으로 RLHF는 AI와 인간 간의 협업 훈련 프로세스를 도출하여 AI 모델을 더욱 훈련시켜 인간과 같은 대화를 생성할 것입니다. 따라서 ChatGPT는 챗봇 시나리오에서 탁월할 뿐만 아니라 사람들이 간단한 용어 또는 간단한 용어로 신속하게 답변을 받아야 할 때 짧은 형식의 콘텐츠(예: 시 또는 가사) 또는 긴 형식의 콘텐츠(예: 에세이)를 작성하는 데 도움이 됩니다. 심층적인 지식 복잡한 주제를 설명하고 창의적인 프로세스에 도움이 되는 브레인스토밍, 새로운 주제 및 아이디어를 제공하고 응답할 이메일 생성과 같은 맞춤형 커뮤니케이션을 통해 영업 부서를 지원합니다.

대형 Transformer 모델이 이러한 작업을 수행하려고 시도하는 것이 기술적으로 가능하지만 ChatGPT 또는 GPT-4에서는 이를 수행할 가능성이 거의 없습니다. 이는 ChatGPT 및 기타 OpenAI Transformers에서 무슨 일이 일어나고 있는지에 대한 지식이 매우 제한되어 있기 때문입니다. 왜냐하면 사전 훈련된 모델이기 때문에 모델 재훈련에 필요한 계산량이 매우 높기 때문에 데이터가 자주 업데이트되지 않기 때문입니다. 이는 아마도 현재까지 OpenAI(그리고 실제로는 다른 모든 사람)가 생산한 모든 사전 훈련된 모델의 가장 큰 단점일 것입니다. 더 큰 문제는 ChatGPT에 있습니다. GPT-3과 달리 매우 집중적인 대화 데이터세트에 대해 교육을 받았기 때문에 ChatGPT가 이전 제품보다 뛰어난 것은 대화 작업에서만 가능하며, 생산성 작업에 있어서는 다른 작업을 완료하는 것입니다. 덜 발전했습니다.

대규모로 성장하는 언어 모델 제품군

사람들은 이제 ChatGPT가 GPT-3의 더 작고 보다 구체적인 버전이라는 것을 알고 있습니다. 그러나 이것은 가까운 미래에 이러한 모델이 더 많아질 것이라는 것을 의미합니까? MarGPT 마케팅을 위해, 디지털 광고용 AdGPT, 의학적 질문에 대한 답변용 MedGPT

가능하며 그 이유는 다음과 같습니다. SoMin 회사가 GPT-3 베타에 액세스하기 위해 신청서를 제출했을 때 현재 소프트웨어에 대해 자세히 설명하는 긴 신청서를 작성하세요. 하지만 모델이 매일 어떻게 사용되었는지와 결과에 대한 피드백을 제공하는 데 동의해 달라는 요청을 받았습니다. OpenAI 회사가 이를 수행한 이유는 주로 연구 프로젝트였고 모델의 최상의 응용 프로그램에 대한 상업적 통찰력이 필요했으며 이 위대한 인공 지능 혁명에 참여할 기회를 대가로 크라우드 펀딩을 했기 때문입니다. 챗봇 앱이 가장 인기 있는 것 중 하나인 것 같아서 ChatGPT가 먼저 등장합니다. ChatGPT는 더 작을 뿐만 아니라(200억 개의 매개변수 대 1,750억 개의 매개변수) 대화 작업을 해결하는 데 있어 GPT-3보다 빠르고 정확합니다. 저비용/고품질 AI 제품입니다. 나에게 이것은 완벽한 사업입니다. 사례.

그렇다면 생성 AI의 경우 클수록 더 좋다는 것일까요? 대답은 '그렇습니다'입니다. 많은 작업을 완료할 수 있는 일반 학습 모델을 구축할 때 대답은 '예'입니다. GPT-2 및 기타 이전 버전에 비해 GPT-3의 장점이 입증되었듯이 클수록 좋습니다. 그러나 ChatGPT의 챗봇처럼 특정 작업을 잘 수행하려면 모델과 데이터 크기보다 데이터 집중과 적절한 교육 프로세스가 훨씬 더 중요합니다. 그렇기 때문에 SoMin에서는 ChatGPT를 사용하여 카피와 배너를 생성하는 대신 특정 디지털 광고 관련 데이터를 사용하여 GPT-3가 아직 보지 못한 새로운 광고에 대한 더 나은 콘텐츠를 만들 수 있도록 안내합니다.

그렇다면 생성 AI의 미래는 어떻게 발전할 것인가? OpenAI CEO인 Sam Altman이 연설에서 언급한 것처럼 다중 모드는 다가오는 GPT-4에서 사람들이 보게 될 피할 수 없는 발전 중 하나가 될 것입니다. 동시에 Altman은 모델에 100조 개의 매개변수가 있다는 소문도 깨뜨렸습니다. 따라서 사람들은 이런 종류의 인공 지능 모델에서 더 크다고 해서 항상 더 나은 것을 의미하는 것은 아니라는 것을 알고 있습니다.

위 내용은 ChatGPT vs. GPT-3 vs. GPT-4는 챗봇 계열 간의 내부 싸움일 뿐입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿