정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.-일체 포함-php.cn

미세 조정 프로세스" >미세 조정 프로세스

출시 준비

런칭 후 피드백

집

기술 주변기기

일체 포함

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 11, 2023 pm 09:34 PM

ai 모델

이 회사는 4차 산업 혁명을 촉발할 수 있는 제품을 만들었지만 왜 그들의 제품이 그렇게 인기가 있는지 의아해합니다.

그냥, 정말 베르사유는 아니네요.

최근 MIT Technology Review에서는 ChatGPT의 여러 개발자를 인터뷰하여 이 인기 있는 AI 제품 뒤에 숨겨진 이야기를 자세히 살펴보았습니다.

방어가 전혀 없을 정도로 인기가 많습니다

OpenAI가 2022년 11월 말 조용히 ChatGPT를 출시했을 때 스타트업은 큰 기대를 하지 않았습니다.

OpenAI 직원들은 자신의 모델이 최고의 모델로 성장할 것이라고는 전혀 생각하지 못했습니다.

ChatGPT가 하룻밤 사이에 인기를 끌면서 대규모 언어 모델에 대한 글로벌 골드 러시를 촉발한 것 같습니다. 그러나 OpenAI는 전혀 준비가 되어 있지 않으며 서둘러 상위 모델을 따라잡고 기회를 잡으려고 노력할 뿐입니다.

OpenAI에서 정책 작업을 하는 Sandhini Agarwal은 OpenAI 내에서 ChatGPT는 항상 "연구 미리 보기"로 간주되어 왔다고 말했습니다. 이는 2년 된 기술의 보다 완전한 버전이며 더 중요한 것은 회사는 모델의 일부 단점을 제거하기 위해 공개 피드백을 전달하려고 노력하고 있습니다.

이런 '미리보기' 제품이 우연히 데뷔 후 인기를 끌 것이라고 누가 생각이나 했을까요.

OpenAI의 과학자들은 이에 대해 매우 혼란스러워하고 있으며, 외부 세계의 꽃과 박수도 잘 알고 있습니다.

ChatGPT 개발에 참여한 OpenAI 과학자 Liam Fedus는 "우리는 이것을 엄청난 근본적인 진전이라고 과장하고 싶지 않습니다."라고 말했습니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChatGPT 팀원 중 5명이 2023년 AI 2000 글로벌 인공지능 학자로 선정되었습니다

이 때문에 MIT Technology Review 기자인 Will Douglas Heaven이 합작 투자 회사인 Will Douglas Heaven과 인터뷰했습니다. OpenAI 창립자 John Schulman, 개발자 Agarwal 및 Fedus, 정렬 팀 Jan Leike 리더.

ChatGPT가 왜 그렇게 인기가 있는지조차 이해가 되지 않습니다

창립자 John Schulman은 ChatGPT가 출시된 지 며칠 후 가끔씩 Twitter를 확인한다고 말했습니다. Twitter 피드가 ChatGPT의 스크린샷으로 가득 차던 시절이 있었습니다.

이 제품이 사용자에게 매우 직관적인 제품이라고 생각했고, 팬도 있을 것이라고 생각했지만, 이 정도로 주류가 될 것이라고는 예상하지 못했습니다.

Jan Leike는 모든 것이 너무 갑작스러워서 모두가 놀랐으며 ChatGPT의 인기를 따라잡기 위해 열심히 노력했다고 말했습니다. 폭발적인 인기를 끌었던 비하인드 스토리가 궁금했다. 결국 OpenAI 자체는 ChatGPT가 왜 그렇게 인기가 있는지 파악하지 못합니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

Liam Fedus는 왜 그렇게 놀랐는지 설명했습니다. 왜냐하면 ChatGPT는 최초의 범용 챗봇이 아니며 많은 사람들이 이전에 시도해 본 적이 있기 때문에 Liam Fedus는 가능성이 크지 않다고 느낍니다. 그러나 비공개 베타 버전은 그에게 자신감을 주기도 했습니다. 아마도 이 A는 사용자가 정말 좋아할 것입니다.

Sandhini Agarwal은 ChatGPT의 즉각적인 성공이 모두에게 놀라운 일이라고 결론지었습니다. 이 모델에 대해 너무 많은 작업이 수행되었기 때문에 회사 외부의 일반 대중에게 이 모델이 얼마나 놀라운지 잊어버렸습니다.

실제로 ChatGPT에 포함된 대부분의 기술은 새로운 것이 아닙니다. OpenAI가 ChatGPT보다 몇 달 전에 출시한 GPT-3.5의 미세 조정 버전입니다. GPT-3.5 자체는 2020년에 등장한 GPT-3의 업데이트 버전입니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChatGPT 팀의 이전 7개 기술 R&D에 참여한 인원 수

OpenAI는 웹사이트에서 이러한 모델을 애플리케이션 프로그래밍 인터페이스 또는 API 형식으로 제공하며, 다른 개발자는 자신의 코드에 모델을 쉽게 삽입할 수 있습니다.

2022년 1월 OpenAI는 GPT-3.5의 이전 미세 조정 버전인 InstructGPT도 출시했습니다. 그러나 이러한 기술은 대중에게 홍보되지 않습니다.

미세 조정 프로세스

Liam Fedus의 소개에 따르면 ChatGPT 모델은 InstructGPT와 동일한 언어 모델에서 미세 조정되었으며 사용된 미세 조정 방법도 유사합니다. 연구원들은 일부 대화 데이터를 추가하고 훈련 과정을 일부 조정했습니다. 그래서 그들은 그것을 엄청난 근본적인 진보라고 과장하고 싶지 않습니다.

ChatGPT에서 큰 역할을 하는 것은 바로 대화 데이터인 것으로 밝혀졌습니다.

표준 벤치마크 평가에 따르면 실제로 두 모델 간의 원시 기술 성능에는 큰 차이가 없습니다. ChatGPT의 가장 큰 차이점은 구하고 사용하기가 더 쉽다는 것입니다.

Jan Leike는 어떤 의미에서 ChatGPT는 OpenAI가 한동안 갖고 있던 AI 시스템의 버전으로 이해될 수 있다고 설명했습니다. ChatGPT는 더 이상 기능이 없습니다. ChatGPT가 출시되기 전 거의 1년 동안 동일한 기본 모델이 API에서 사용되었습니다.

연구자들의 개선 사항은 어떤 의미에서는 인간이 사용하려는 목적에 더 부합하도록 요약할 수 있습니다. 대화를 통해 사용자와 대화하는 채팅 인터페이스이며 쉽게 액세스할 수 있습니다. 이를 통해 의도를 더 쉽게 추론할 수 있으며 사용자는 원하는 것을 달성하기 위해 앞뒤로 실험할 수 있습니다.

비결은 RLHF(Reinforcement Learning with Human Feedback) 기술입니다. 이는 InstructGPT의 훈련 방법과 매우 유사합니다. 즉, 인간 사용자가 실제로 좋아하는 것을 가르치는 것입니다.

Jan Leike는 많은 사람들에게 ChatGPT의 프롬프트와 응답을 읽은 다음 두 응답 중 하나를 선택하여 모두가 더 좋다고 생각하는 응답을 확인하도록 요청했다고 말했습니다. 그런 다음 이 모든 데이터가 하나의 훈련 세션으로 결합됩니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

대부분 InstructGPT에서 수행하는 작업과 동일합니다. 도움이 되기를 바라는 것처럼, 그것이 사실이기를 바라며, 그것이 사악하지 않기를 바랍니다.

몇 가지 세부 사항도 있습니다. 예를 들어 사용자의 쿼리가 명확하지 않은 경우 후속 질문을 통해 이를 개선해야 합니다. 또한 그것이 인공 지능 시스템이며, 갖고 있지 않은 정체성을 가정하거나 소유하지 않은 기능을 가지고 있다고 주장해서는 안 된다는 점을 명확히 해야 합니다. 사용자가 해서는 안 되는 작업을 수행하도록 요청하면 명시적으로 거부해야 합니다.

즉, 인간 평가자가 모델의 순위를 매기기 위해 가져야 하는 다양한 기준 목록(예: 진위성)이 있습니다. 그러나 그들은 또한 AI가 인간인 척하지 않는 것과 같은 특정 관행을 선호할 것입니다.

출시 준비

일반적으로 ChatGPT는 OpenAI가 이미 사용한 기술을 사용하기 때문에 팀에서는 이 모델을 대중에게 출시할 준비를 할 때 특별한 조치를 취하지 않았습니다. 그들의 견해로는 이전 모델에 설정된 표준은 충분했고 GPT-3.5는 충분히 안전했습니다.

ChatGPT의 인간 선호도 훈련에서 거부 행동을 스스로 학습하고 많은 요청을 거부했습니다.

OpenAI는 ChatGPT를 위해 일부 "가수"를 모았습니다. 회사의 모든 구성원이 앉아서 모델을 깨려고 했습니다. 같은 일을 하는 외부 그룹도 있습니다. 신뢰할 수 있는 초기 사용자도 피드백을 제공합니다.

Sandhini Agarwal은 원치 않는 출력이 생성되는 것을 발견했다고 말했지만 이는 GPT-3.5에서도 생성되는 것입니다. 따라서 위험만 본다면 ChatGPT는 "연구 미리보기"로 충분합니다.

John Schulman도 시스템을 출시하기 전에 시스템이 100% 완벽할 때까지 기다리는 것은 불가능하다고 말했습니다. 그들은 몇 달 동안 초기 버전을 베타 테스트해 왔으며 베타 테스터는 ChatGPT에 깊은 인상을 받았습니다.

OpenAI가 가장 걱정하는 것은 사실 사실 문제입니다. ChatGPT는 조작하는 것을 너무 좋아하기 때문입니다. 그러나 이러한 문제는 InstructGPT 및 기타 대규모 언어 모델에 존재하므로 연구원의 눈에는 ChatGPT가 사실성 및 기타 보안 문제에 대한 모델보다 우수하다면 충분합니다.

그리고 제한된 평가에 따르면 출시 전 ChatGPT가 다른 모델보다 더 현실적이고 안전하다는 것을 확인할 수 있었기 때문에 OpenAI는 출시를 계속하기로 결정했습니다.

런칭 후 피드백

ChatGPT가 출시된 후 OpenAI는 사용자가 어떻게 사용하는지 관찰해 왔습니다.

수천만 명의 사용자에게 대규모 언어 모델이 제공되는 것은 이번이 처음입니다.

사용자들도 열광하고 있으며 ChatGPT의 한계와 버그가 어디에 있는지 테스트하고 싶어합니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChaatGPT의 인기로 인해 편견 문제, 프롬프트를 통해 유발되는 문제 등 많은 문제가 발생했습니다.

Jan Leike는 트위터에서 입소문이 난 것 중 일부가 실제로 OpenAI에 의해 조용히 처리되었다고 말했습니다.

예를 들어 탈옥 문제는 확실히 해결해야 할 문제입니다. 사용자는 약간의 우여곡절을 통해 모델이 나쁜 말을 하게 만드는 것을 좋아합니다. 이는 OpenAI의 예상 범위 내에 있으며 또한 갈 수 있는 유일한 방법이기도 합니다.

탈옥이 발견되면 OpenAI는 이러한 조건을 교육 및 테스트 데이터에 추가하고 모든 데이터는 향후 모델에 통합됩니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

Jan Leike는 더 나은 모델이 있을 때마다 그것을 꺼내 테스트하고 싶어할 것이라고 말했습니다.

그들은 일부 표적화된 적대 훈련이 탈옥 상황을 크게 개선할 수 있다고 매우 낙관하고 있습니다. 이러한 문제가 완전히 사라질지는 확실하지 않지만, 그들은 많은 탈옥을 어렵게 만들 수 있다고 믿습니다.

시스템이 "공식적으로 데뷔"할 때 실제로 일어날 모든 일을 예측하기는 어렵습니다.

그래서 그들은 사람들이 시스템을 어떤 용도로 사용하는지 모니터링하고 무슨 일이 일어나는지 확인한 다음 이에 반응하는 데에만 집중할 수 있습니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

이제 Microsoft는 많은 사람들이 OpenAI가 공식적으로 발표하지 않은 GPT-4 버전이라고 믿고 있는 Bing Chat을 출시했습니다.

이 전제하에 산디니 아가르왈은 그들이 지금 직면하고 있는 상황은 확실히 6개월 전보다 훨씬 높지만 1년이 지난 수준보다는 여전히 낮다고 말했습니다.

이러한 모델이 사용되는 맥락은 매우 중요합니다.

구글, 마이크로소프트 같은 대기업의 경우, 한 가지 사실이 아니더라도 검색엔진 그 자체이기 때문에 큰 문제가 됩니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

Gmail을 만든 Google의 23번째 직원인 Paul Buchheit는 Google에 대해 비관적인 태도를 가지고 있습니다.

검색 엔진을 위한 대규모 언어 모델로서 단지 재미를 위한 챗봇과는 완전히 다릅니다. OpenAI 연구원들은 또한 다양한 용도 사이를 이동하고 사용자에게 진정으로 유용한 것을 만드는 방법을 알아내기 위해 열심히 노력하고 있습니다.

John Schulman은 OpenAI가 ChatGPT에서 사람들이 정치적 문제에 관심을 갖는 정도를 과소평가했다고 인정했습니다. 이를 위해 그들은 훈련 데이터를 수집할 때 이 영역의 문제를 줄이기 위해 더 나은 결정을 내리기를 희망합니다.

Jan Leike는 자신의 관점에서 ChatGPT가 종종 실패한다고 말했습니다. 해결해야 할 문제가 너무 많지만 OpenAI는 이를 해결하지 않습니다. 그는 이를 솔직하게 인정했다.

언어 모델이 등장한지는 꽤 되었지만 아직 초기 단계입니다.

다음으로 OpenAI는 더 많은 일을 해야 합니다.

위 내용은 정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7489

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

phpmyadmin은 데이터 테이블을 만듭니다 Apr 10, 2025 pm 11:00 PM

phpmyadmin을 사용하여 데이터 테이블을 만들려면 다음 단계가 필수적입니다. 데이터베이스에 연결하고 새 탭을 클릭하십시오. 테이블의 이름을 지정하고 저장 엔진을 선택하십시오 (InnoDB 권장). 열 이름, 데이터 유형, NULL 값 허용 여부 및 기타 속성을 포함하여 열 추가 버튼을 클릭하여 열 디테일을 추가하십시오. 기본 키로 하나 이상의 열을 선택하십시오. 저장 버튼을 클릭하여 테이블과 열을 만듭니다.

Oracle 데이터베이스 작성 방법 Oracle 데이터베이스 작성 방법 Apr 11, 2025 pm 02:33 PM

Oracle 데이터베이스를 만드는 것은 쉽지 않으므로 기본 메커니즘을 이해해야합니다. 1. 데이터베이스 및 Oracle DBMS의 개념을 이해해야합니다. 2. SID, CDB (컨테이너 데이터베이스), PDB (Pluggable Database)와 같은 핵심 개념을 마스터합니다. 3. SQL*Plus를 사용하여 CDB를 생성 한 다음 PDB를 만들려면 크기, 데이터 파일 수 및 경로와 같은 매개 변수를 지정해야합니다. 4. 고급 응용 프로그램은 문자 세트, 메모리 및 기타 매개 변수를 조정하고 성능 튜닝을 수행해야합니다. 5. 디스크 공간, 권한 및 매개 변수 설정에주의를 기울이고 데이터베이스 성능을 지속적으로 모니터링하고 최적화하십시오. 그것을 능숙하게 마스터 함으로써만 지속적인 연습이 필요합니다. Oracle 데이터베이스의 생성 및 관리를 진정으로 이해할 수 있습니다.

Oracle 데이터베이스 생성 방법 Oracle 데이터베이스를 만드는 방법 Apr 11, 2025 pm 02:36 PM

Oracle 데이터베이스를 만들려면 일반적인 방법은 DBCA 그래픽 도구를 사용하는 것입니다. 단계는 다음과 같습니다. 1. DBCA 도구를 사용하여 데이터베이스 이름을 지정하기 위해 DBNAME을 설정하십시오. 2. SySpassword 및 SystemPassword를 강력한 암호로 설정하십시오. 3. Al32UTF8로 문자 세트 및 NationalCharacterset을 세트; 4. 실제 요구에 따라 조정하도록 메모리 크기 및 테이블 스페이스 크기를 설정하십시오. 5. 로그 파일 경로를 지정하십시오. 고급 메소드는 SQL 명령을 사용하여 수동으로 생성되지만 더 복잡하고 오류가 발생하기 쉽습니다. 비밀번호 강도, 문자 세트 선택, 테이블 스페이스 크기 및 메모리에주의하십시오.

Oracle Database 문을 작성하는 방법 Apr 11, 2025 pm 02:42 PM

Oracle SQL 문의 핵심은 다양한 조항의 유연한 적용뿐만 아니라 선택, 삽입, 업데이트 및 삭제입니다. 인덱스 최적화와 같은 진술의 실행 메커니즘을 이해하는 것이 중요합니다. 고급 사용에는 하위 쿼리, 연결 쿼리, 분석 기능 및 PL/SQL이 포함됩니다. 일반적인 오류에는 구문 오류, 성능 문제 및 데이터 일관성 문제가 포함됩니다. 성능 최적화 모범 사례에는 적절한 인덱스를 사용하고 선택 *을 피하고 조항을 최적화하고 바운드 변수를 사용하는 것이 포함됩니다. Oracle SQL을 마스터하려면 코드 쓰기, 디버깅, 사고 및 기본 메커니즘 이해를 포함한 연습이 필요합니다.

MySQL 데이터 테이블 필드 작동 안내서를 추가, 수정 및 삭제하는 방법 Apr 11, 2025 pm 05:42 PM

MySQL의 현장 작동 안내서 : 필드를 추가, 수정 및 삭제합니다. 필드 추가 : Alter Table_Name ADD CORMEN_NAME DATA _TYPE [NOT NOT NORN NOT] [DEFAULT DEFAULT_VALUE] [기본 키] [기본 키] [AUTO_INCREMENT] 수정 필드 : ALTER TABLE_NAME COLUME_NAME DATY_TYPE [NOT NOT NOT NOT NOT DEFAULT_VALUE] [기본 키]

Oracle 데이터베이스 테이블의 무결성 제약 조건은 무엇입니까? Apr 11, 2025 pm 03:42 PM

Oracle 데이터베이스의 무결성 제약 조건은 다음을 포함하여 데이터 정확도를 보장 할 수 있습니다. NULL : NULL 값은 금지됩니다. 고유 : 독창성을 보장하고 단일 널 값을 허용합니다. 기본 키 : 기본 키 제약 조건, 고유 한 강화 및 널 값을 금지합니다. 외국 키 : 테이블 간의 관계 유지, 외국 키는 기본 테이블 기본 키를 나타냅니다. 점검 : 조건에 따라 열 값을 제한합니다.

MySQL 데이터베이스의 중첩 쿼리 인스턴스에 대한 자세한 설명 Apr 11, 2025 pm 05:48 PM

중첩 쿼리는 한 쿼리에 다른 쿼리를 포함시키는 방법입니다. 주로 복잡한 조건을 충족하고 여러 테이블을 연관시키고 요약 값 또는 통계 정보를 계산하는 데이터를 검색하는 데 사용됩니다. 예로는 평균 임금 이상의 직원 찾기, 특정 범주에 대한 주문 찾기 및 각 제품의 총 주문량 계산이 있습니다. 중첩 쿼리를 작성할 때는 다음을 따라야합니다. 하위 쿼리를 작성하고 결과를 외부 쿼리 (별명 또는 클로시로 참조)에 작성하고 쿼리 성능 (색인 사용)을 최적화하십시오.

Tomcat Logs가 메모리 누출 문제 해결에 도움이되는 방법 Apr 12, 2025 pm 11:42 PM

Tomcat 로그는 메모리 누출 문제를 진단하는 열쇠입니다. Tomcat 로그를 분석하면 메모리 사용 및 가비지 수집 (GC) 동작에 대한 통찰력을 얻을 수 있으며 메모리 누출을 효과적으로 찾아서 해결할 수 있습니다. 다음은 Tomcat 로그를 사용하여 메모리 누출 문제를 해결하는 방법입니다. 1. GC 로그 분석 먼저 자세한 GC 로깅을 활성화하십시오. 다음 JVM 옵션을 Tomcat 시작 매개 변수에 추가하십시오. -xx : printgcdetails-xx : printgcdatestamps-xloggc : gc. 분석 gc.log

See all articles

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChatGPT가 왜 그렇게 인기가 있는지조차 이해가 되지 않습니다

미세 조정 프로세스

출시 준비

런칭 후 피드백

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제