대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려-일체 포함-php.cn

집

기술 주변기기

일체 포함

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 08, 2023 pm 11:13 PM

데이터 연구

수년 동안 우리는 인공 지능이 어떻게 결정을 내리고 출력을 생성하는지 이해할 수 없었습니다.

모델 개발자는 알고리즘과 데이터만 결정하고 최종적으로 모델의 출력과 중간 부분만 얻을 수 있습니다. 모델은 이러한 알고리즘과 데이터 출력 결과를 기반으로 눈에 보이지 않는 "블랙 박스"가 됩니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

그래서 "모델 트레이닝은 연금술과 같다"는 농담이 있죠.

그런데 이제 드디어 모형 블랙박스 해석이 가능해졌습니다!

Anthropic 연구팀은 모델의 신경망에서 가장 기본적인 단위 뉴런의 해석 가능한 특징을 추출했습니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

이것은 인류가 AI 블랙박스를 밝히는 획기적인 진전이 될 것입니다.

흥미롭게 표현된 인류학:

"모델의 신경망이 어떻게 작동하는지 이해할 수 있다면 모델의 실패 모드를 진단하고 설계를 수정할 수 있으며 모델을 기업과 사회에서 안전하게 채택할 수 있습니다. 그것은 현실이 될 것입니다!”

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

Anthropic의 최신 연구 보고서 "단일의미성: 사전 학습을 통한 언어 모델 분해"에서 연구자들은 사전 학습 방법을 사용하여 512개의 뉴런 층을 더 많은 뉴런으로 분해했습니다. 4000개 이상의 해석 가능한 기능

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

연구 보고서 주소: https://transformer-circuits.pub/2023/monosemantic-features/index.html

이러한 기능은 DNA 서열, 법적 언어, HTTP 요청, 히브리어 텍스트 및 영양 사실 설명 등

단일 뉴런의 활성화를 분리하여 보면 이러한 모델 속성의 대부분을 볼 수 없습니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

대부분의 뉴런은 "다의미적"입니다.

예를 들어 소규모 언어 모델에서 단일 뉴런 Meta는 학술 인용, 영어 대화, HTTP 요청 및 한국어 텍스트를 포함하여 관련 없는 여러 컨텍스트에서 활성화됩니다.

그리고 고전적인 비전 모델에서는 단일 뉴런이 고양이의 얼굴과 자동차의 앞면에 반응합니다.

다양한 맥락에서 많은 연구에서 뉴런의 활성화가 다른 의미를 가질 수 있음이 입증되었습니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

한 가지 잠재적인 이유는 뉴런의 다의미적 특성이 중첩 효과 때문이라는 것입니다. 이는 신경망이 각 특징에 고유한 뉴런의 선형 조합을 할당하여 데이터의 독립적인 특징을 나타내고 이러한 특징의 수가 뉴런의 수를 초과한다는 가설적인 현상입니다.

각 특징이 벡터를 뉴런에 추가하면 특징 세트는 네트워크 뉴런의 활성화를 위해 지나치게 완전한 선형 기반을 형성합니다.

Anthropic의 이전 Toy Models of Superposition("중첩 장난감 모델") 논문에서 희소성은 신경망 훈련에서 모호성을 제거하여 모델이 특징 간의 관계를 더 잘 이해하도록 돕고 활성화를 줄이는 데 도움이 된다는 것이 입증되었습니다. 벡터의 소스 특성은 모델의 예측과 결정을 더욱 신뢰할 수 있게 만듭니다.

이 개념은 신호의 희박성을 통해 제한된 관찰에서 완전한 신호를 복원할 수 있다는 압축 감지의 아이디어와 유사합니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

그러나 Toy Models of Superposition에서 제안된 세 가지 전략 중:

(1) 중첩 없이 모델을 생성하여 아마도 활성화 희소성을 장려함

(2) 중첩 표시 상태 모델에서 사전 학습 지나치게 완전한 기능을 찾는 데 사용됩니다.

(3) 두 가지를 결합한 하이브리드 방법을 사용합니다.

다시 작성해야 할 점은 방법 (1)은 모호성 문제를 해결할 수 없고 방법 (2)는 심각한 과적합에 취약하다는 점입니다

따라서 이번에 인류 연구자들은 희소(sparse)라는 약한 사전 학습 알고리즘을 사용했습니다. 오토인코더는 모델 뉴런 자체보다 단일 의미 분석 단위를 제공하는 훈련된 모델로부터 학습된 특징을 생성합니다.

구체적으로 연구원들은 512개의 뉴런이 있는 MLP 단일 레이어 변환기를 채택하고 80억 개의 데이터 포인트 기능에서 MLP 활성화에 대한 희소 자동 인코더를 훈련하여 MLP 활성화를 상대적으로 해석 가능한 것으로 분해했습니다. 확장 계수 범위는 1에서 1까지입니다. ×(512개 기능) ~ 256×(131,072개 기능)

본 연구에서 발견된 특징이 모델의 뉴런보다 해석 가능성이 더 높은지 확인하기 위해 블라인드 검토 평가를 실시했으며 인간 평가자가 해석 가능성을 평가하도록 했습니다.

볼 수 있으며 특징(빨간색)이 훨씬 더 높습니다. 뉴런(청록색)보다 점수가 높습니다.

연구원들이 발견한 특징은 모델 내부의 뉴런에 비해 이해하기 쉽다는 것이 입증되었습니다

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

또한 연구원들은 대형을 사용하여 "자동 해석 가능성" 방법을 채택했습니다. 언어 모델은 작은 모델의 기능에 대한 간단한 설명을 생성하고 기능 활성화를 예측하는 능력을 기반으로 다른 모델이 해당 설명에 점수를 매길 수 있도록 합니다.

마찬가지로 특징은 뉴런보다 점수가 높으며, 특징의 활성화와 모델 동작에 대한 다운스트림 효과에 대한 일관된 해석을 보여줍니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

게다가 이렇게 추출된 특징은 모델을 안내하는 타겟 방법도 제공합니다.

아래 그림과 같이 기능을 인위적으로 활성화하면 모델 동작이 예측 가능한 방식으로 변경될 수 있습니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

다음은 추출된 해석 가능성 특징을 시각화한 것입니다.

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

왼쪽의 특징 목록을 클릭하면 신경망의 특징 공간을 대화형으로 탐색할 수 있습니다.

연구 보고서 요약

Anthropic, Towards Monosemantic: Decomposing Language Models With Dictionary Learning의 이 연구 보고서는 네 부분으로 나눌 수 있습니다.

문제 설정에서 연구자들은 연구 동기를 소개하고 훈련된 트랜스포머와 희소 오토인코더에 대해 자세히 설명했습니다.

개별 특징에 대한 자세한 조사를 통해 연구에서 발견된 여러 특징이 기능적으로 특정한 인과 단위임을 입증했습니다.

글로벌 분석을 통해 우리는 일반적인 특징을 해석할 수 있으며 MLP 계층의 중요한 구성 요소를 설명할 수 있다는 결론을 내렸습니다.

특징 세분화, 보편성 속성, 복잡한 행동을 달성하기 위해 "유한 상태 오토마타"와 유사한 시스템을 형성하는 방법.

결론은 다음과 같습니다. 7:

Sparse 오토인코더는 상대적으로 단일한 의미 특징을 추출하는 능력이 있습니다

스파스 오토인코더는 뉴런 기반에서 실제로 보이지 않는 해석 가능한 특징을 생성할 수 있습니다

3. 스파스 오토인코더는 변환기 생성에 개입하고 안내하는 데 사용될 수 있습니다.

4. 희소 자동 인코더는 비교적 일반적인 기능을 생성할 수 있습니다.

오토인코더의 크기가 증가함에 따라 기능이 "분할"되는 경향이 있습니다. 재작성 후: 오토인코더의 크기가 증가함에 따라 기능은 "분할"되는 경향을 보입니다

6. 512개의 뉴런만 수천 개의 기능을 나타낼 수 있습니다

7. "유한 상태 자동 장치"는 아래 그림과 같이 복잡한 동작을 달성합니다

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

자세한 내용은 보고서를 참조하세요.

Anthropic은 이 연구 보고서의 작은 모델의 성공을 더 큰 모델로 재현하기 위해 미래에 우리가 직면하는 과제는 더 이상 과학적인 문제가 아니라 공학적 문제가 될 것이라고 믿습니다

이를 달성하려면 대규모 모델에서 해석 가능성은 모델 복잡성과 규모로 인한 문제를 극복하기 위해 엔지니어링 분야에서 더 많은 노력과 자원이 필요합니다.

모델 복잡성과 데이터 규모 문제에 대처하기 위한 새로운 도구, 기술 및 방법의 개발을 포함합니다. 또한 대규모 모델의 요구 사항을 수용할 수 있는 확장 가능한 해석 프레임워크 및 도구를 구축하는 것도 포함됩니다.

이것은 해석적 인공지능과 대규모 딥러닝 연구 분야의 최신 트렌드가 될 것입니다

위 내용은 대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7486

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

ddrescue를 사용하여 Linux에서 데이터 복구 Mar 20, 2024 pm 01:37 PM

DDREASE는 하드 드라이브, SSD, RAM 디스크, CD, DVD 및 USB 저장 장치와 같은 파일 또는 블록 장치에서 데이터를 복구하기 위한 도구입니다. 한 블록 장치에서 다른 블록 장치로 데이터를 복사하여 손상된 데이터 블록은 남겨두고 양호한 데이터 블록만 이동합니다. ddreasue는 복구 작업 중에 간섭이 필요하지 않으므로 완전히 자동화된 강력한 복구 도구입니다. 게다가 ddasue 맵 파일 덕분에 언제든지 중지하고 다시 시작할 수 있습니다. DDREASE의 다른 주요 기능은 다음과 같습니다. 복구된 데이터를 덮어쓰지 않지만 반복 복구 시 공백을 채웁니다. 그러나 도구에 명시적으로 지시된 경우에는 잘릴 수 있습니다. 여러 파일이나 블록의 데이터를 단일 파일로 복구

오픈 소스! ZoeDepth를 넘어! DepthFM: 빠르고 정확한 단안 깊이 추정! Apr 03, 2024 pm 12:04 PM

0. 이 글은 어떤 내용을 담고 있나요? 우리는 다재다능하고 빠른 최첨단 생성 단안 깊이 추정 모델인 DepthFM을 제안합니다. DepthFM은 전통적인 깊이 추정 작업 외에도 깊이 인페인팅과 같은 다운스트림 작업에서 최첨단 기능을 보여줍니다. DepthFM은 효율적이며 몇 가지 추론 단계 내에서 깊이 맵을 합성할 수 있습니다. 이 작품을 함께 읽어보아요~ 1. 논문 정보 제목: DepthFM: FastMoncularDepthEstimationwithFlowMatching 저자: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

여러 조건으로 Excel 필터 기능을 사용하는 방법 Feb 26, 2024 am 10:19 AM

Excel에서 여러 기준으로 필터링을 사용하는 방법을 알아야 하는 경우 다음 자습서에서는 데이터를 효과적으로 필터링하고 정렬할 수 있는 단계를 안내합니다. Excel의 필터링 기능은 매우 강력하며 많은 양의 데이터에서 필요한 정보를 추출하는 데 도움이 될 수 있습니다. 이 기능을 사용하면 설정한 조건에 따라 데이터를 필터링하고 조건에 맞는 부분만 표시하여 데이터 관리를 더욱 효율적으로 할 수 있습니다. 필터 기능을 사용하면 대상 데이터를 빠르게 찾을 수 있어 데이터 검색 및 정리에 드는 시간을 절약할 수 있습니다. 이 기능은 단순한 데이터 목록에만 적용할 수 있는 것이 아니라, 여러 조건에 따라 필터링하여 필요한 정보를 보다 정확하게 찾을 수 있도록 도와줍니다. 전반적으로 Excel의 필터링 기능은 매우 실용적입니다.

Google은 열광하고 있습니다. JAX 성능이 Pytorch와 TensorFlow를 능가합니다! GPU 추론 훈련을 위한 가장 빠른 선택이 될 수 있습니다. Apr 01, 2024 pm 07:46 PM

Google이 추진하는 JAX의 성능은 최근 벤치마크 테스트에서 Pytorch와 TensorFlow를 능가하여 7개 지표에서 1위를 차지했습니다. 그리고 JAX 성능이 가장 좋은 TPU에서는 테스트가 이루어지지 않았습니다. 개발자들 사이에서는 여전히 Tensorflow보다 Pytorch가 더 인기가 있습니다. 그러나 앞으로는 더 큰 모델이 JAX 플랫폼을 기반으로 훈련되고 실행될 것입니다. 모델 최근 Keras 팀은 기본 PyTorch 구현을 사용하여 세 가지 백엔드(TensorFlow, JAX, PyTorch)와 TensorFlow를 사용하는 Keras2를 벤치마킹했습니다. 첫째, 그들은 주류 세트를 선택합니다.

iPhone의 느린 셀룰러 데이터 인터넷 속도: 수정 사항 May 03, 2024 pm 09:01 PM

지연이 발생하고 iPhone의 모바일 데이터 연결 속도가 느립니까? 일반적으로 휴대폰의 셀룰러 인터넷 강도는 지역, 셀룰러 네트워크 유형, 로밍 유형 등과 같은 여러 요소에 따라 달라집니다. 더 빠르고 안정적인 셀룰러 인터넷 연결을 얻기 위해 할 수 있는 일이 몇 가지 있습니다. 수정 1 – iPhone 강제 다시 시작 때로는 장치를 강제로 다시 시작하면 셀룰러 연결을 포함한 많은 항목이 재설정됩니다. 1단계 – 볼륨 높이기 키를 한 번 눌렀다가 놓습니다. 그런 다음 볼륨 작게 키를 눌렀다가 다시 놓습니다. 2단계 - 프로세스의 다음 부분은 오른쪽에 있는 버튼을 누르는 것입니다. iPhone이 다시 시작되도록 하세요. 셀룰러 데이터를 활성화하고 네트워크 속도를 확인하세요. 다시 확인하세요 수정 2 – 데이터 모드 변경 5G는 더 나은 네트워크 속도를 제공하지만 신호가 약할 때 더 잘 작동합니다

초지능의 생명력이 깨어난다! 하지만 자동 업데이트 AI가 등장하면서 엄마들은 더 이상 데이터 병목 현상을 걱정할 필요가 없습니다. Apr 29, 2024 pm 06:55 PM

세상은 미친 듯이 큰 모델을 만들고 있습니다. 인터넷의 데이터만으로는 충분하지 않습니다. 훈련 모델은 '헝거게임'처럼 생겼고, 전 세계 AI 연구자들은 이러한 데이터를 탐식하는 사람들에게 어떻게 먹이를 줄지 고민하고 있습니다. 이 문제는 다중 모드 작업에서 특히 두드러집니다. 아무것도 할 수 없던 시기에, 중국 인민대학교 학과의 스타트업 팀은 자체 새로운 모델을 사용하여 중국 최초로 '모델 생성 데이터 피드 자체'를 현실화했습니다. 또한 이해 측면과 생성 측면의 두 가지 접근 방식으로 양측 모두 고품질의 다중 모드 새로운 데이터를 생성하고 모델 자체에 데이터 피드백을 제공할 수 있습니다. 모델이란 무엇입니까? Awaker 1.0은 중관촌 포럼에 최근 등장한 대형 멀티모달 모델입니다. 팀은 누구입니까? 소폰 엔진. 런민대학교 힐하우스 인공지능대학원 박사과정 학생인 Gao Yizhao가 설립했습니다.

다섯 개의 유연한 손가락과 초인적인 속도를 갖춘 인간 작업을 자율적으로 완료하는 최초의 로봇 등장, 가상 공간 훈련을 지원하는 대형 모델 Mar 11, 2024 pm 12:10 PM

이번 주, 오픈AI(OpenAI), 마이크로소프트(Microsoft), 베조스(Bezos), 엔비디아(Nvidia)가 투자한 로봇 회사인 FigureAI는 약 7억 달러의 자금 조달을 받았으며 내년 내에 독립적으로 걸을 수 있는 휴머노이드 로봇을 개발할 계획이라고 발표했습니다. 그리고 Tesla의 Optimus Prime은 계속해서 좋은 소식을 받았습니다. 올해가 휴머노이드 로봇이 폭발하는 해가 될 것이라는 데는 누구도 의심하지 않는다. 캐나다에 본사를 둔 로봇 회사인 SanctuaryAI는 최근 새로운 휴머노이드 로봇인 Phoenix를 출시했습니다. 관계자들은 이 로봇이 인간과 같은 속도로 자율적으로 많은 작업을 완료할 수 있다고 주장한다. 인간의 속도로 자동으로 작업을 완료할 수 있는 세계 최초의 로봇인 Pheonix는 각 물체를 부드럽게 잡고 움직이며 우아하게 왼쪽과 오른쪽에 배치할 수 있습니다. 자동으로 물체를 식별할 수 있습니다.

미 공군이 주목할만한 최초의 AI 전투기를 선보였습니다! 전 과정에 걸쳐 장관이 직접 간섭 없이 테스트를 진행했고, 10만 줄의 코드를 21차례 테스트했다. May 07, 2024 pm 05:00 PM

최근 군계는 미군 전투기가 이제 AI를 활용해 완전 자동 공중전을 완수할 수 있다는 소식에 충격을 받았다. 네, 얼마 전 미군의 AI 전투기가 최초로 공개되면서 그 미스터리가 드러났습니다. 이 전투기의 정식 명칭은 VISTA(Variable Stability Flight Simulator Test Aircraft)로 미 공군 장관이 직접 조종해 일대일 공중전을 모의 실험한 것이다. 5월 2일, 미 공군 장관 프랭크 켄달(Frank Kendall)이 X-62AVISTA를 타고 에드워드 공군 기지에서 이륙했습니다. 1시간의 비행 동안 모든 비행 작업은 AI에 의해 자동으로 완료되었습니다. Kendall은 "지난 수십 년 동안 우리는 자율 공대공 전투의 무한한 잠재력에 대해 생각해 왔지만 항상 도달할 수 없는 것처럼 보였습니다."라고 말했습니다. 그러나 지금은,

See all articles

대형모델의 블랙박스를 깨고 뉴런을 완벽하게 분해해보세요! OpenAI 라이벌 Anthropic, 설명할 수 없는 AI 장벽 무너뜨려

연구 보고서 요약

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제