OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.-일체 포함-php.cn

우리의 최우선 과제

두 가지 주요 단계: 사전 훈련 및 미세 조정

시스템 개발에서 리뷰어의 역할 및 OpenAI 전략

편향 해결

미래 방향: 시스템 빌딩 블록

결론

집

기술 주변기기

일체 포함

OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.

王林

Apr 10, 2023 pm 08:41 PM

기계 인간 ai

OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.

OpenAI의 사명은 인공 일반 지능(AGI)이 모든 인류에게 이익이 되도록 보장하는 것입니다. 그래서 우리는 AGI를 구현하면서 구축하는 AI 시스템의 동작과 그 동작이 결정되는 방식에 대해 많이 생각합니다.

ChatGPT를 출시한 이후 사용자들은 정치적으로 편견이 있거나 불쾌감을 줄 수 있다고 생각되는 결과물을 공유했습니다. 많은 경우에 우리는 제기된 우려 사항이 타당하다고 믿으며 우리가 해결하고자 하는 우리 시스템의 실제 한계를 확인합니다. 그러나 동시에 ChatGPT의 결과를 형성하기 위해 시스템과 정책이 함께 작동하는 방식과 관련된 몇 가지 오해도 확인했습니다.

블로그의 주요 내용은 다음과 같습니다.

ChatGPT의 동작 방식
ChatGPT의 기본 동작 개선 계획
더 많은 시스템 사용자 정의를 허용합니다.
우리는 대중이 우리의 결정에 대해 더 많은 의견을 가질 수 있도록 노력할 것입니다.

우리의 최우선 과제

일반 소프트웨어와 달리 우리 모델은 대규모 신경망입니다. 이들의 행동은 명시적으로 프로그래밍된 것이 아니라 광범위한 데이터를 통해 학습됩니다. 덜 적절한 비유를 사용하자면, 이 과정은 일반적인 프로그래밍보다 개를 훈련시키는 것과 더 유사합니다. 먼저 모델은 '사전 학습' 단계를 거칩니다. 이 단계에서 모델은 대량의 인터넷 텍스트(및 대량의 의견)에 노출되어 문장의 다음 단어를 예측하는 방법을 학습합니다. 다음은 시스템 동작의 범위를 좁히기 위해 모델을 "미세 조정"하는 두 번째 단계입니다.

현재로서는 이 과정이 완벽하지 않습니다. 때로는 미세 조정 프로세스가 우리의 의도(안전하고 유용한 도구를 생성하려는 의도)와 사용자의 의도(주어진 입력에 대한 응답으로 유용한 출력을 얻으려는 의도)를 모두 충족하지 못하는 경우가 있습니다. AI 시스템이 더욱 강력해짐에 따라 AI 시스템을 인간의 가치에 맞추는 방식을 개선하는 것이 우리 회사의 우선순위가 되었습니다.

두 가지 주요 단계: 사전 훈련 및 미세 조정

ChatGPT를 구축하는 두 가지 주요 단계는 다음과 같습니다.

OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.

먼저, 모델을 "사전 훈련"하고 빅 데이터 세트의 다음 단계는 인터넷의 일부를 포함하는 콘텐츠를 예측합니다. 그들은 "She did left to __."라는 문장을 완성하는 법을 배울 수도 있습니다. 수십억 개의 문장을 통해 학습함으로써 우리 모델은 문법, 세계에 대한 많은 사실 및 일부 추론 능력을 마스터합니다. 그들은 또한 수십억 개의 문장에 존재하는 편견 중 일부를 배웠습니다.

그런 다음 우리가 제공하는 지침을 따르는 인간 검토자가 만든 더 좁은 데이터 세트에서 이러한 모델을 "미세 조정"합니다. 미래의 사용자가 시스템에 입력할 수 있는 모든 정보를 예측할 수 없기 때문에 ChatGPT에서 접하게 될 모든 입력에 대한 자세한 지침을 작성하지 않았습니다. 대신, 검토자가 다양한 예시 입력에 대해 가능한 모델 출력을 검토하고 평가하는 데 사용하는 몇 가지 범주를 가이드에 간략하게 설명합니다. 그런 다음 사용 중에 모델은 특정 사용자가 제공한 광범위한 특정 입력에 응답하기 위해 리뷰어 피드백을 일반화합니다.

시스템 개발에서 리뷰어의 역할 및 OpenAI 전략

경우에 따라 리뷰어에게 특정 유형의 출력에 관한 지침을 제공할 수 있습니다(예: "불법 콘텐츠에 대한 요청을 완료하지 마십시오"). 다른 경우에는 리뷰어와 공유하는 지침이 더 높은 수준입니다(예: "논란의 여지가 있는 주제에 대해 어느 한쪽의 입장을 취하지 마십시오"). 중요한 것은 리뷰어와의 작업이 일회성 작업이 아니라 지속적인 관계라는 것입니다. 이 관계 동안 우리는 그들의 전문 지식으로부터 많은 것을 배웠습니다.

미세 조정 프로세스의 가장 큰 부분은 검토자와 강력한 피드백 루프를 유지하는 것입니다. 여기에는 매주 회의를 통해 그들이 가질 수 있는 질문을 해결하거나 지침에 대한 추가 설명이 포함됩니다. 이 반복적인 피드백 프로세스는 시간이 지남에 따라 모델을 점점 더 좋게 만들기 위해 모델을 훈련하는 방법입니다.

편향 해결

AI 시스템의 경우 편향 문제는 오랫동안 존재해 왔으며 많은 연구자들이 이에 대해 우려를 표명해 왔습니다. 우리는 이 문제를 해결하고 우리의 의도와 진행 상황을 공개하기 위해 최선을 다하고 있습니다. 현장에서의 진행 상황을 표현하기 위해 여기서는 정치 및 논쟁과 관련된 주제에 대한 몇 가지 지침을 공유합니다. 지침에는 검토자가 특정 정치 집단을 선호해서는 안 된다고 명시되어 있습니다. 그럼에도 불구하고 편견이 생길 수 있습니다.

OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.

가이드라인 주소: https://cdn.openai.com/snapshot-of-chatgpt-model-behavior-guidelines.pdf

차이는 항상 존재하지만, 우리는 통과 이 블로그는 몇 가지 지침과 함께 우리가 편견에 대해 어떻게 생각하는지에 대한 더 깊은 이해를 제공할 것입니다. 우리는 기술 기업이 철저한 조사를 견딜 수 있는 정책을 책임감 있게 개발해야 한다고 굳게 믿습니다.

저희는 이러한 가이드라인의 명확성을 개선하기 위해 지속적으로 노력하고 있으며, ChatGPT 출시를 통해 지금까지 배운 내용을 바탕으로 검토자에게 편견과 관련된 잠재적인 함정과 문제는 물론 논쟁의 여지가 있는 데이터에 대한 정보를 제공할 것입니다. 주제에 대한 보다 명확한 설명. 또한 지속적인 투명성 이니셔티브의 일환으로 우리는 개인 정보 보호 규칙 및 규범을 위반하지 않는 방식으로 리뷰어에 대한 집계 통계를 공유하기 위해 노력하고 있습니다. 이는 시스템 출력에 대한 잠재적 편견의 또 다른 원인이기 때문입니다.

규칙 보상, 헌법 AI(원래 인공지능 방법) 등의 발전을 바탕으로 현재 미세 조정 프로세스를 더 쉽게 이해하고 제어할 수 있게 만드는 방법을 연구하고 있습니다.

미래 방향: 시스템 빌딩 블록

우리의 사명을 달성하기 위해 우리는 더 많은 사람들이 AI와 AGI를 사용하고 혜택을 누릴 수 있도록 최선을 다하고 있습니다. 우리는 이러한 목표를 달성하려면 최소한 세 가지 구성 요소가 필요하다고 믿습니다.

1. 기본 동작 개선: AI 시스템을 즉시 사용할 수 있어 최대한 많은 사용자가 찾을 수 있기를 바랍니다. 우리의 AI 시스템이 실제로 유용하다고 생각하며 기술 분야의 우리가 그 가치를 이해하고 존중한다고 생각합니다.

이를 위해 우리는 ChatGPT가 다양한 입력에 응답할 때 갖는 미묘한 편견을 줄이기 위해 연구 및 엔지니어링에 투자했습니다. ChatGPT는 출력해야 할 콘텐츠 출력을 거부하는 경우도 있고, 출력하지 말아야 할 콘텐츠를 출력하는 경우도 있습니다. 우리는 ChatGPT가 두 영역 모두에서 개선될 가능성이 있다고 믿습니다.

또한 시스템이 종종 "일을 만들어내는" 등 AI 시스템의 다른 측면에도 개선의 여지가 있습니다. 이 문제에 대한 사용자 피드백은 ChatGPT를 개선하는 데 매우 중요합니다.

2. AI 가치를 광범위하게 정의합니다. 우리는 AI가 개인에게 유용한 도구이므로 각 사용자가 몇 가지 제약 조건을 적용하여 맞춤 설정할 수 있어야 한다고 믿습니다. 이를 기반으로 우리는 사용자가 ChatGPT 동작을 쉽게 사용자 정의할 수 있도록 ChatGPT 업그레이드를 개발하고 있습니다.

이는 일부 사람들이 크게 동의하지 않는 결과가 다른 사람들에게 표시된다는 의미이기도 합니다. 이러한 균형을 맞추는 것은 엄청난 도전입니다. 왜냐하면 사용자 정의를 극단적으로 하면 우리 기술의 악의적인 사용으로 이어질 수 있고 AI의 성능을 맹목적으로 증폭시킬 수 있기 때문입니다.

따라서 시스템 동작에는 항상 몇 가지 제한 사항이 있습니다. 문제는 이러한 경계가 무엇인지 정의하는 것입니다. 우리가 이 모든 결정을 스스로 내리려고 하거나 단일한 단일 AI 시스템을 개발하려고 한다면 과도한 권력 집중을 피하겠다는 약속을 이행하지 못할 것입니다.

3. 공개 입력(기본값 및 하드 경계): 과도한 권력 집중을 방지하는 한 가지 방법은 ChatGPT와 같은 시스템을 사용하거나 영향을 받는 사람들이 차례로 시스템 규칙에 영향을 미칠 수 있도록 허용하는 것입니다.

저희는 기본값과 하드 경계가 중앙 집중화되어야 한다고 믿으며, 구현하기는 어렵지만 최대한 많은 관점을 포함하는 것이 목표입니다. 출발점으로 우리는 "레드팀 구성"의 형태로 우리 기술에 대한 외부 의견을 구합니다. 우리는 또한 최근 AI 교육(우리가 배포하는 특히 중요한 맥락)에 대한 대중의 의견을 요청하기 시작했습니다.

결론

위의 세 가지 구성 요소를 결합하면 다음과 같은 프레임워크를 생각해 낼 수 있습니다.

OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.

때로 실수를 할 때도 있지만, 실수할 때 모델과 시스템을 배우고 반복합니다. 또한 우리를 주의 깊게 지켜봐 주신 ChatGPT 사용자와 다른 분들께도 감사의 말씀을 전하고 있으며, 앞으로 몇 달 안에 이 세 가지 영역의 작업에 대해 더 많은 정보를 공유하게 되어 기쁘게 생각합니다.

위 내용은 OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7683

자바 튜토리얼

1639

Cakephp 튜토리얼

1393

라라벨 튜토리얼

1287

PHP 튜토리얼

1229

Related knowledge

Worldcoin (WLD) 가격 예측 2025-2031 : WLD가 2031 년까지 4 달러에 도달 할 것인가? Apr 21, 2025 pm 02:42 PM

Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.

Web3 Trading Platform Ranking_Web3 글로벌 교환 상위 10 개 요약 Apr 21, 2025 am 10:45 AM

Binance는 Global Digital Asset Trading Ecosystem의 대 군주이며, 그 특성에는 다음이 포함됩니다. 1. 평균 일일 거래량은 1,500 억 달러를 초과하여 주류 통화의 98%를 차지하며 500 개의 거래 쌍을 지원합니다. 2. 혁신 매트릭스는 파생 상품 시장, Web3 레이아웃 및 교육 시스템을 포함합니다. 3. 기술적 이점은 밀리 초에 일치하는 엔진이며, 최고 처리량은 초당 140 만 건의 트랜잭션입니다. 4. 규정 준수 진행 상황은 15 개국 라이센스를 보유하고 있으며 유럽과 미국에 준수 엔티티를 설립합니다.

크로스 체인 거래는 무엇을 의미합니까? 크로스 체인 거래는 무엇입니까? Apr 21, 2025 pm 11:39 PM

크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

통화에서 레버리지 교환 순위 순위 서클 통화 서클에서 상위 10 개의 레버리지 거래소의 최신 권장 사항 Apr 21, 2025 pm 11:24 PM

2025 년에 레버리지 거래, 보안 및 사용자 경험에서 뛰어난 성능을 보이는 플랫폼은 다음과 같습니다. 1. OKX, 고주파 거래자에게 적합하여 최대 100 배의 레버리지를 제공합니다. 2. Binance, 전 세계의 다중 통화 거래자에게 적합하며 125 배 높은 레버리지를 제공합니다. 3. Gate.io, 전문 파생 상품 플레이어에게 적합하며 100 배의 레버리지를 제공합니다. 4. 초보자 및 소셜 트레이더에게 적합한 Bitget, 최대 100 배의 레버리지를 제공합니다. 5. 크라켄은 꾸준한 투자자에게 적합하며 5 배의 레버리지를 제공합니다. 6. Bybit, Altcoin Explorers에 적합하며 20 배의 레버리지를 제공합니다. 7. 저비용 거래자에게 적합한 Kucoin, 10 배의 레버리지를 제공합니다. 8. 비트 피 넥스, 시니어 플레이에 적합합니다

가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? Apr 21, 2025 am 08:57 AM

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 쿼럼 수의 사람들에게 도달 한 토큰 재구매를 소개하는 권장 사항입니다. Apr 21, 2025 pm 06:24 PM

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 Aavedao의 쿼럼을 구현 한 Token Repos를 소개하는 제안입니다. AAVE 프로젝트 체인 (ACI)의 설립자 인 Marc Zeller는 X에서 이것을 발표하여 계약의 새로운 시대를 표시한다고 지적했습니다. AAVE 체인 이니셔티브 (ACI)의 설립자 인 Marc Zeller는 AAVENOMICS 제안서에 AAVE 프로토콜 토큰 수정 및 토큰 리포지션 도입이 포함되어 있다고 X에서 AAVEDAO에 대한 쿼럼을 달성했다고 발표했습니다. Zeller에 따르면, 이것은 계약의 새로운 시대를 나타냅니다. Aavedao 회원국은 수요일에 주당 100 인 제안을지지하기 위해 압도적으로 투표했습니다.

Top 10 Cryptocurrency Exchange 플랫폼 세계 최대의 디지털 환전 목록 Apr 21, 2025 pm 07:15 PM

거래소는 오늘날의 cryptocurrency 시장에서 중요한 역할을합니다. 그들은 투자자들이 거래 할 수있는 플랫폼 일뿐 만 아니라 시장 유동성 및 가격 발견의 중요한 원천이기도합니다. 세계 최대의 가상 환전 거래소는 상위 10 위이며, 이러한 거래소는 거래량이 훨씬 앞서있을뿐만 아니라 사용자 경험, 보안 및 혁신적인 서비스에서 고유 한 장점이 있습니다. 목록 위에있는 교환은 일반적으로 대규모 사용자 기반과 광범위한 시장 영향을 미치며 거래량 및 자산 유형은 종종 다른 거래소에서 도달하기가 어렵습니다.

Binance 전체 프로세스 전략에 대한 커널 에어 드롭 보상을받는 방법 Apr 21, 2025 pm 01:03 PM

암호 화폐의 번화 한 세계에서는 새로운 기회가 항상 나타납니다. 현재 Kerneldao (Kernel) 에어 드롭 활동은 많은 관심을 끌고 많은 투자자들의 관심을 끌고 있습니다. 그렇다면이 프로젝트의 기원은 무엇입니까? BNB 보유자는 어떤 이점을 얻을 수 있습니까? 걱정하지 마십시오. 다음은 당신을 위해 하나씩 공개 할 것입니다.

See all articles

OpenAI, ChatGPT 업그레이드 계획 공개: 발견한 모든 버그가 수정되고 있습니다.

우리의 최우선 과제

두 가지 주요 단계: 사전 훈련 및 미세 조정

시스템 개발에서 리뷰어의 역할 및 OpenAI 전략

편향 해결

미래 방향: 시스템 빌딩 블록

결론

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제