미국 현지 시간 4월 6일 수요일, OpenAI는 보안 평가 수행, 출시 후 보호 조치 개선 등 AI의 안전을 보장하는 방법을 자세히 설명하는 게시물을 게시했습니다. , 아동 보호 및 사생활 존중 등 회사는 AI 시스템이 안전하게 구축, 배포 및 사용되도록 보장하는 것이 사명을 달성하는 데 중요하다고 말했습니다.
OpenAI 게시물 전문은 다음과 같습니다.
OpenAI는 가능한 한 많은 사람들에게 혜택을 줄 수 있는 강력한 AI 보안을 보장하기 위해 최선을 다하고 있습니다. 우리는 AI 도구가 오늘날 사람들에게 많은 도움을 제공한다는 것을 알고 있습니다. 전 세계 사용자들은 ChatGPT가 생산성을 향상하고 창의성을 향상하며 맞춤형 학습 경험을 제공하는 데 도움이 된다고 말했습니다. 그러나 우리는 모든 기술과 마찬가지로 이러한 도구와 관련된 실제 위험이 있다는 점도 인식하고 있습니다. 따라서 우리는 모든 시스템 수준에서 보안을 보장하기 위해 열심히 노력하고 있습니다.
더 안전한 AI 시스템
새로운 AI 시스템을 출시하기 전에 엄격한 테스트를 실시하고 외부 전문가의 의견을 수렴하며 수동으로 피드백 강화 학습과 같은 기술을 사용합니다. 모델 성능을 향상시킵니다. 동시에 우리는 광범위한 보안 및 모니터링 시스템도 구축했습니다.
최신 모델인 GPT-4를 예로 들어보겠습니다. 교육을 마친 후 공개 출시 전에 더욱 안전하고 신뢰할 수 있는지 확인하기 위해 최대 6개월 동안 전사적 테스트를 실시했습니다.
우리는 강력한 인공 지능 시스템이 엄격한 보안 평가를 거쳐야 한다고 믿습니다. 이러한 관행이 널리 채택되도록 하려면 규제가 필요합니다. 따라서 우리는 정부와 적극적으로 협력하여 최선의 규제 형태를 논의합니다.
실제 사용 사례를 통해 배우고 안전 장치를 개선하세요
시스템 배포 전에 예측 가능한 위험을 방지하기 위해 최선을 다하지만 실험실에서의 학습은 항상 제한됩니다. 우리는 광범위하게 연구하고 테스트하지만 사람들이 우리 기술을 어떻게 사용하거나 오용할지 예측할 수 없습니다. 따라서 우리는 실제 사용을 통해 학습하는 것이 점점 더 안전한 AI 시스템을 만들고 출시하는 데 중요한 구성 요소라고 믿습니다.
우리는 실질적인 보호 장치를 갖춘 새로운 AI 시스템을 점진적으로 대중에게 신중하게 출시하고, 우리가 배운 교훈을 바탕으로 지속적으로 개선하고 있습니다.
우리는 개발자가 기술을 자신의 애플리케이션에 직접 통합할 수 있도록 자체 서비스와 API에서 가장 강력한 모델을 제공합니다. 이를 통해 우리는 학대를 모니터링하고 이에 대한 조치를 취하고 대응책을 개발할 수 있습니다. 이렇게 하면 우리는 어떻게 해야 할지 이론적으로 상상하기보다는 실제적인 조치를 취할 수 있습니다.
실제 사용 경험을 통해 우리는 사람들에게 실제 위험을 초래하는 행동을 해결하는 동시에 기술을 보다 유익한 방식으로 사용할 수 있도록 점점 더 세분화된 정책을 개발하게 되었습니다.
우리는 사회가 점점 더 강력해지는 인공 지능에 적응하려면 더 많은 시간이 필요하며, 이에 영향을 받는 모든 사람이 인공 지능의 발전에 발언권을 가져야 한다고 믿습니다. 반복적 배포는 다양한 이해관계자가 AI 기술에 대한 대화에 보다 효과적으로 참여하는 데 도움이 되며 이러한 도구를 직접 사용하는 경험을 갖는 것이 중요합니다.
어린이 보호
우리 안전 작업의 초점 중 하나는 어린이 보호입니다. 인공 지능 도구를 사용하는 사람은 18세 이상이거나 부모의 동의가 있는 13세 이상이어야 합니다. 현재 검증 기능을 개발 중입니다.
우리는 증오, 괴롭힘, 폭력 또는 성인용 콘텐츠를 생성하는 데 우리의 기술을 사용하는 것을 허용하지 않습니다. 최신 GPT-4는 GPT-3.5에 비해 제한된 콘텐츠 요청에 응답할 가능성이 82% 낮습니다. 우리는 남용을 모니터링하기 위한 강력한 시스템을 갖추고 있습니다. GPT-4는 이제 ChatGPT Plus 구독자에게 제공되며 시간이 지남에 따라 더 많은 사람들이 이를 경험할 수 있기를 바랍니다.
우리는 모델이 어린이에게 유해한 콘텐츠를 제작할 가능성을 최소화하기 위해 중요한 조치를 취했습니다. 예를 들어, 사용자가 이미지 생성 도구에 아동에게 안전한 학대 자료를 업로드하려고 시도하면 당사는 이를 차단하고 해당 문제를 미국 국립실종착취아동센터에 신고합니다.
기본 보안 보호 외에도 비영리 단체인 Khan Academy와 같은 개발 조직과 협력하여 보안 조치를 맞춤화합니다. 칸아카데미(Khan Academy)는 학생을 위한 가상 교사, 교사를 위한 교실 조교 역할을 할 수 있는 인공지능 조수를 개발했습니다. 또한 개발자가 모델 출력에 대해 더 엄격한 표준을 설정하여 이러한 기능이 필요한 개발자와 사용자를 더 효과적으로 지원할 수 있는 기능을 개발 중입니다.
개인 정보 보호
당사의 대규모 언어 모델은 공개적으로 사용 가능한 콘텐츠, 라이선스가 부여된 콘텐츠, 검토자가 생성한 콘텐츠를 포함한 광범위한 텍스트 모음에 대해 훈련되었습니다. 우리는 이 데이터를 서비스나 광고 판매에 사용하지 않으며 프로필 작성에도 사용하지 않습니다. 우리는 사람들과 더 많은 대화를 함으로써 ChatGPT를 더욱 지능적으로 만드는 등 사람들을 돕는 모델을 개선하기 위해 이 데이터를 사용합니다.
교육 데이터의 대부분에는 공개 웹에서 사용할 수 있는 개인 정보가 포함되어 있지만, 우리는 모델이 개인이 아닌 세계 전체에 대해 학습하기를 원합니다. 따라서 당사는 가능한 경우 교육 데이터 세트에서 개인 정보를 제거하고 모델을 미세 조정하여 개인 정보에 대한 쿼리 요청을 거부하고 당사 시스템에서 개인 정보를 삭제하려는 개인의 요청에 응답하기 위해 최선을 다하고 있습니다. 이러한 조치는 우리 모델이 개인 정보가 포함된 응답을 생성할 가능성을 최소화합니다.
사실적 정확성 향상
오늘날의 대규모 언어 모델은 이전 패턴과 사용자가 입력한 텍스트를 기반으로 다음에 사용될 가능성이 높은 단어를 예측할 수 있습니다. 그러나 어떤 경우에는 다음으로 가능성이 가장 높은 단어가 실제로는 사실이 아닐 수도 있습니다.
사실의 정확성을 높이는 것은 OpenAI 및 기타 여러 AI 연구 조직의 초점 중 하나이며 우리는 진전을 이루고 있습니다. 기본 데이터 소스로 잘못된 것으로 표시된 ChatGPT 출력에 대한 사용자 피드백을 활용하여 GPT-4의 사실적 정확성을 향상했습니다. GPT-3.5와 비교하여 GPT-4는 40% 향상된 사실적 콘텐츠를 생성할 가능성이 더 높습니다.
ChatGPT에서 잘못된 응답을 방지하기 위해 사용자가 도구를 사용하기 위해 가입할 때 최대한 투명하게 하기 위해 노력하고 있습니다. 그러나 우리는 오해 가능성을 더욱 줄이고 이러한 AI 도구의 현재 한계에 대해 대중에게 교육하기 위해 수행해야 할 작업이 더 많다는 것을 인식했습니다.
지속적인 연구 및 참여
AI 보안 문제를 해결하는 실용적인 방법은 효과적인 완화 및 보정 기술에 더 많은 시간과 자원을 투자하고 이러한 기술이 오용될 수 있는 실제 상황을 대상으로 테스트를 수행하는 것이라고 믿습니다. .
중요하게, 우리는 AI의 안전성과 역량 향상이 동시에 이루어져야 한다고 믿습니다. 현재까지 우리의 최고의 보안 작업은 가장 유능한 모델을 사용하여 작업한 결과입니다. 사용자의 지침을 더 잘 따르고 이를 활용하거나 "안내"하기가 더 쉽기 때문입니다.
우리는 더 많은 주의를 기울여 더 많은 유능한 모델을 만들고 배포할 것이며 AI 시스템이 발전함에 따라 안전 예방 조치를 계속 강화할 것입니다.
GPT-4의 기능, 이점 및 위험을 더 잘 이해하기 위해 배포하는 데 6개월 이상을 기다렸지만 때로는 AI 시스템의 보안을 개선하는 데 더 오랜 시간이 걸릴 수 있습니다. 따라서 정책 입안자와 AI 개발자는 누구도 앞서가기 위해 지름길을 택하지 않도록 AI의 개발 및 배포가 전 세계적으로 효과적으로 규제되도록 해야 합니다. 이는 기술적, 제도적 혁신이 필요한 어려운 도전이지만, 우리는 기꺼이 기여하고 싶습니다.
AI 안전 문제를 해결하려면 AI 시스템의 작동 방식에 대한 경계 설정을 포함하여 광범위한 토론, 실험 및 참여가 필요합니다. 우리는 보다 안전한 AI 생태계를 만들기 위해 이해관계자들 간의 협력과 열린 대화를 계속해서 장려해 왔으며 앞으로도 그럴 것입니다.
위 내용은 AI 안전을 보장하는 방법에 대한 OpenAI 게시물: 정부 규제가 필요합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!