생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 '엑스 마키나'의 실제 버전 출시-일체 포함-php.cn

AI가 생각을 할 때

실험 결과

저자 소개

집

기술 주변기기

일체 포함

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 '엑스 마키나'의 실제 버전 출시

王林

Jun 05, 2023 pm 04:49 PM

ai 연구

AI가 자율의식을 갖게 되면 어떤 일이 일어날까요?

"Ex Machina"에서 Ava는 인간의 연민을 이용해 인간을 속여 자유를 얻었고 결국 그녀의 "창조자" Nathan을 죽였습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

최근 많은 네티즌들의 추천으로 샘 알트만이 이 영화를 드디어 보게 되었습니다.

그리고 "좋은 영화인데 왜 다들 나한테 보라고 하는지 모르겠다"라고 하더군요.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

많은 사람들은 이것이 인공지능을 의식화하고 있다는 점을 경고하고 싶을 수도 있습니다. 튜링 테스트 결과.

하지만 아직 "엑스 마키나"가 출시되려면 아직 멀었습니다. GPT-5는 비밀리에 개발 중일 수도 있습니다. AI를 스마트하게 만드는 것은 여전히 과학자들이 온 힘을 다해 가장 하고 싶은 일입니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

아니요, 브리티시 컬럼비아 대학의 두 연구원은 인간처럼 생각할 수 있는 지능형 에이전트에는 많은 이점이 있다는 것을 발견했습니다.

최신 논문에서는 지능형 에이전트의 "사고 복제"(TC)를 연구했습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

여기서 인공지능은 인간을 모방하여 인간처럼 "생각"하고 "행동"하는 법을 배웁니다.

AI가 생각을 할 때

언어는 인간을 다른 생명체와 구별하는 열쇠라는 것을 알아야 합니다.

따라서 연구자들은 에이전트가 언어를 이해할 수 있다면 많은 이점이 있을 것이라고 상상합니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

예를 들어, 인간이 일반화하고, 추론하고, 새로운 상황에 적응하고, 새로운 방법을 기존 지식과 결합하고, 탐색하고, 계획하고, 필요할 때 다시 계획하도록 돕습니다.

이러한 이점에도 불구하고 AI 에이전트는 적어도 인간의 언어로 생각하는 경우가 거의 없습니다.

신경망은 사고를 위한 내부 벡터 활성화로 생각할 수 있지만, 많은 사람들은 별개의 상징적 언어로 생각하면 특정한 이점이 있다고 가정합니다.

이는 언어로 생각할 수 있는 에이전트가 언어를 사용하지 않는 에이전트보다 더 빨리 배우고, 수행하고, 더 잘 일반화할 수 있다는 것을 의미합니다.

이러한 모든 이유로 AI 에이전트의 언어 사고 능력을 향상하면 많은 중요한 이점을 얻을 수 있습니다.

Jeff Clune과 Shengran Hu는 이 목표를 달성하는 가장 효과적인 방법은 "AI가 인간의 사고를 모방하도록 하는 것"이라고 믿습니다.

그들은 인간이 고립된 상태에서 사고 능력을 습득하는 것이 아니라 다른 사람의 시연과 교사의 피드백을 통해 사고 능력의 일부를 습득한다는 것을 발견했습니다.

따라서 효과적인 접근 방식은 인간이 행동하면서 자신의 생각을 말하는 모습을 통해 에이전트가 학습하도록 하는 것입니다.

이 방법은 계획을 위해 사전 훈련된 LLM을 사용하는 기존 작업과 다릅니다. 왜냐하면 이러한 LLM은 인간이 행동하면서 생각을 말하는 데이터, 즉 "생각 데이터"에 대해 훈련되지 않았기 때문입니다.

'생각 데이터'의 출처로 연구원들은 사람들의 행동, 계획, 결정 및 재계획 뒤에 숨은 생각을 포함하여 약 수백만 시간이 담긴 YouTube 동영상과 텍스트 녹음을 선택했습니다.

논문에서 연구진은 새로운 모방 학습 프레임워크인 '사고 복제'를 제안했습니다. 그 중 에이전트는 행동복제 등 인간의 시범 행동을 학습할 뿐만 아니라 인간이 행동하면서 생각하는 방식도 학습한다.

사고 복제 훈련 프레임워크에서 에이전트는 각 단계에서 생각을 생성하는 방법을 학습하고 이후 이러한 생각을 기반으로 행동을 조정합니다.

전체 프레임워크는 그림과 같습니다. TC 에이전트는 상위 구성요소와 하위 구성요소의 2계층 아키텍처입니다.

각 시간 단계에서 에이전트는 관찰, 작업 및 사고 기록을 입력으로 받습니다. 상위 구성요소는 아이디어 생성을 담당하고, 하위 구성요소는 이러한 아이디어를 조건으로 작업을 생성하고 실행합니다.

생성된 생각과 행동은 데모 데이터세트의 실제와 비교되어 손실을 계산합니다.

상위 구성요소와 하위 구성요소의 조건에 대해 서로 다른 선택이 있을 수 있지만, 이 연구에서는 마인드 데이터세트의 길이 t의 특정 궤적에 대해 연구원들이 이를 최소화했습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

더 복잡하거나 대규모 시나리오의 경우 사전 훈련된 VLM(시각적 언어 모델) 또는 제로 샘플 미세 조정을 사용하여 상위 계층 구성 요소를 구현할 수 있습니다.

그리고 기본 구성 요소는 처음부터 훈련하거나 대상 도메인의 기존 언어 조건부 컨트롤러에서 조정할 수 있습니다.

논문에서 연구원들은 BabyAI 1.1 모델 아키텍처의 두 가지 구성 요소를 기반으로 연구를 수행했습니다.

이 모델은 메모리 강화 아키텍처 LSTM을 활용하여 부분 관찰 문제를 해결합니다. 또한 모달 융합을 위해 FiLM을 채택하여 시각적 입력과 텍스트 입력을 효과적으로 결합합니다.

여기서 저자는 특히 이 글의 모든 모델이 처음부터 학습되지만 복잡한 분야에서는 사전 학습된 모델을 사용하는 것이 더 낫다는 점을 강조합니다.

아래 사진은 BabyAI 환경의 예시입니다. 왼쪽 사진에는 다양한 색상의 아이템(공, 열쇠, 상자, 문)이 포함되어 있습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

에이전트는 물건을 집고, 내려놓고, 옮기거나 문을 열고 닫을 수 있으며, 잠긴 문은 색상이 일치하는 열쇠로만 열 수 있습니다.

에이전트는 앞에 벽과 닫힌 문으로 막혀 있는 7×7 격자 셀을 볼 수 있습니다.

"Thought Clone" 에이전트의 임무는 보라색 상자(강조 표시됨)에 도달하여 경로 계획을 시작하는 것입니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

그런데 파란색 문을 열고 미션을 완료하려던 찰나, 길을 막고 있는 보라색 공을 발견했습니다. 따라서 생각 복제 에이전트가 다시 계획되었습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

이전 목표를 계속 진행하기 전에 장애물을 만나면 먼저 장애물을 제거하고 경로를 다시 계획하는 에이전트의 생각과 행동을 볼 수 있습니다.

이 과정은 특히 인간이 오랫동안 붙잡혀 있던 유리 우리에서 탈출할 수 있도록 인간이 마침내 믿고 스스로를 도우도록 하기 위해 아바가 단계별로 계획했던 방식과 같습니다.

실험 결과

연구 결과에 따르면 행동 복제보다 "생각 복제"가 더 나은 것으로 나타났습니다.

게다가 제로샷 및 미세 조정 설정에서는 배포 외 작업에서 사고 복제가 행동 복제보다 더 큰 이점을 갖습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

흥미롭게도 연구원들은 사용자가 모델 훈련 후에도 안전하지 않은 행동을 정의할 수 있는 "범죄 전 개입"을 개발했습니다.

위험한 생각이 감지되면 에이전트가 종료될 수 있습니다. 테스트에서는 '범죄 전 개입' 효과가 거의 완벽해 인공지능 보안에 대한 잠재력을 보여줬다.

"생각 복제"는 인공지능을 더 똑똑하게 만들 뿐만 아니라 더 안전하고 이해하기 쉽게 만듭니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

즉, AI가 범죄를 저지르기 전에도 모든 것을 구할 수 있다는 것입니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

Jeff Clune의 관점에서 '사고 복제'는 인공지능의 안전성에 기여합니다.

에이전트의 생각을 관찰할 수 있기 때문에 (1) 문제가 발생한 이유를 더 쉽게 진단할 수 있고, (2) 에이전트의 생각을 수정하여 에이전트를 안내하거나, (3) 에이전트가 계획한 위험한 일을 하지 않도록 방지할 수 있습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

저자 소개

Jeff Clune

현재 Jeff Clune은 브리티시 컬럼비아 대학의 컴퓨터 과학 부교수입니다. 심층강화학습을 포함한 딥러닝을 주로 연구하고 있습니다.

이전에는 OpenAI 연구팀장이자 Uber 인공지능 연구소의 수석 연구 관리자이자 창립 멤버였습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

이전에 그와 OpenAI 팀은 AI가 Minecraft의 비디오 데이터에서 돌 만들기 선택을 배울 수 있도록 하는 비디오 사전 훈련 모델인 VPT를 출시했습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

Shengran Hu

은 현재 브리티시 컬럼비아 대학교에서 박사 과정을 밟고 있으며 딥 러닝과 인공 지능 생성 알고리즘에 관심이 있습니다.

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 엑스 마키나의 실제 버전 출시

위 내용은 생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 '엑스 마키나'의 실제 버전 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7716

자바 튜토리얼

1641

Cakephp 튜토리얼

1395

라라벨 튜토리얼

1289

PHP 튜토리얼

1232

Related knowledge

Worldcoin (WLD) 가격 예측 2025-2031 : WLD가 2031 년까지 4 달러에 도달 할 것인가? Apr 21, 2025 pm 02:42 PM

Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.

크로스 체인 거래는 무엇을 의미합니까? 크로스 체인 거래는 무엇입니까? Apr 21, 2025 pm 11:39 PM

크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

'Black Monday Sell'은 Cryptocurrency 업계의 힘든 날입니다. Apr 21, 2025 pm 02:48 PM

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 쿼럼 수의 사람들에게 도달 한 토큰 재구매를 소개하는 권장 사항입니다. Apr 21, 2025 pm 06:24 PM

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 Aavedao의 쿼럼을 구현 한 Token Repos를 소개하는 제안입니다. AAVE 프로젝트 체인 (ACI)의 설립자 인 Marc Zeller는 X에서 이것을 발표하여 계약의 새로운 시대를 표시한다고 지적했습니다. AAVE 체인 이니셔티브 (ACI)의 설립자 인 Marc Zeller는 AAVENOMICS 제안서에 AAVE 프로토콜 토큰 수정 및 토큰 리포지션 도입이 포함되어 있다고 X에서 AAVEDAO에 대한 쿼럼을 달성했다고 발표했습니다. Zeller에 따르면, 이것은 계약의 새로운 시대를 나타냅니다. Aavedao 회원국은 수요일에 주당 100 인 제안을지지하기 위해 압도적으로 투표했습니다.

하이브리드 블록 체인 거래 플랫폼은 무엇입니까? Apr 21, 2025 pm 11:36 PM

cryptocurrency 교환 선택에 대한 제안 : 1. 유동성 요구 사항의 경우 우선 순위는 순서 깊이와 강한 변동성 저항으로 인해 Binance, Gate.io 또는 Okx입니다. 2. 규정 준수 및 보안, 코인베이스, 크라켄 및 쌍둥이 자리는 엄격한 규제 승인을 받았습니다. 3. Kucoin의 소프트 스테이 킹 및 Bybit의 파생 설계 혁신적인 기능은 고급 사용자에게 적합합니다.

가상 통화 가격의 상승 또는 하락은 왜입니까? 가상 통화 가격의 상승 또는 하락은 왜입니까? Apr 21, 2025 am 08:57 AM

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

Binance 전체 프로세스 전략에 대한 커널 에어 드롭 보상을받는 방법 Apr 21, 2025 pm 01:03 PM

암호 화폐의 번화 한 세계에서는 새로운 기회가 항상 나타납니다. 현재 Kerneldao (Kernel) 에어 드롭 활동은 많은 관심을 끌고 많은 투자자들의 관심을 끌고 있습니다. 그렇다면이 프로젝트의 기원은 무엇입니까? BNB 보유자는 어떤 이점을 얻을 수 있습니까? 걱정하지 마십시오. 다음은 당신을 위해 하나씩 공개 할 것입니다.

통화에서 레버리지 교환 순위 순위 서클 통화 서클에서 상위 10 개의 레버리지 거래소의 최신 권장 사항 Apr 21, 2025 pm 11:24 PM

2025 년에 레버리지 거래, 보안 및 사용자 경험에서 뛰어난 성능을 보이는 플랫폼은 다음과 같습니다. 1. OKX, 고주파 거래자에게 적합하여 최대 100 배의 레버리지를 제공합니다. 2. Binance, 전 세계의 다중 통화 거래자에게 적합하며 125 배 높은 레버리지를 제공합니다. 3. Gate.io, 전문 파생 상품 플레이어에게 적합하며 100 배의 레버리지를 제공합니다. 4. 초보자 및 소셜 트레이더에게 적합한 Bitget, 최대 100 배의 레버리지를 제공합니다. 5. 크라켄은 꾸준한 투자자에게 적합하며 5 배의 레버리지를 제공합니다. 6. Bybit, Altcoin Explorers에 적합하며 20 배의 레버리지를 제공합니다. 7. 저비용 거래자에게 적합한 Kucoin, 10 배의 레버리지를 제공합니다. 8. 비트 피 넥스, 시니어 플레이에 적합합니다

See all articles

생각 복제! 전직 OpenAI 연구원, AI가 인간의 사고를 모방하게 해 '엑스 마키나'의 실제 버전 출시

AI가 생각을 할 때

실험 결과

저자 소개

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제