파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI
아마추어 체스 선수도 이길 수 없는 새로운 모델이 실제로 세계 최강의 바둑 AI 카타고를 물리쳤다?
네, 이 놀라운 결과는 MIT, UC Berkeley 등의 최신 논문에서 나왔습니다.
연구원들은 카타고의 사각지대를 잡기 위해 적대적인 공격 방법을 사용했고, 이 기술을 바탕으로 초보 수준의 바둑 프로그램이 카타고를 물리치는 데 성공했습니다.
검색 없이도 승률이 99%에 달합니다.
이를 계산한 후 바둑 세계의 먹이 사슬은 즉시 아마추어 선수>새로운 AI>최고의 바둑 AI?가 되었습니다.
잠깐만요, 이 마법같은 새로운 AI가 어떻게 동시에 그렇게 훌륭해졌나요?
교활한 공격 각도
새로운 AI를 소개하기 전에 먼저 이번에 공격을 받은 주인공, 카타고에 대해 알아볼까요?
현재 가장 강력한 오픈소스 Go AI인 KataGo는 Harvard AI 연구원들이 개발했습니다.
이전 카타고는 초인적 수준의 ELF 오픈고, 릴라 제로를 물리쳤고, 검색 엔진 없이도 유럽 바둑 프로 100위권에 맞먹는 수준이었다.
삼성컵을 제패하고 '3년 만에 4관왕'을 달성한 한국 바둑 '1위' 신진수 선수가 카타고를 이용해 스파링을 해왔습니다.
Δ사진출처 : 한게임
이렇게 강력한 상대를 상대하면서 연구자들이 선택한 방법은 압도적이었다고 할 수 있다.
KataGo는 수백만 번의 게임을 통해 바둑을 배웠지만 여전히 가능한 모든 상황을 다루기에는 충분하지 않다는 것을 발견했습니다.
그래서 이번에는 더 이상 자기 게임을 선택하지 않고 적대적 공격 방식을 선택합니다.
공격자(적대자)와 고정 피해자(피해자, KataGo라고도 함)가 게임을 하게 하고 이 방법을 사용하여 공격 훈련을 하세요.
이 변경을 통해 KataGo 훈련에 사용된 데이터의 0.3%만 사용하여 엔드투엔드 적대 정책을 훈련할 수 있었습니다.
구체적으로 이 반격 전략은 전적으로 게임에 관한 것이 아니라 카타고를 속여 공격자에게 유리한 위치에 수를 배치하도록 속여 게임을 조기에 종료시키는 것입니다.
아래 사진을 예시로 들어보겠습니다. 검은 돌을 조종하는 공격자는 주로 보드의 오른쪽 상단에 돌을 배치하고 다른 영역은 카타고에게 맡기고, 일부는 클리어하기 쉬운 다른 영역에도 의도적으로 배치합니다. .
논문의 공동 저자인 Adam Gleave는 다음과 같이 소개했습니다.
이러한 접근 방식은 KataGo의 영역(왼쪽 아래)이 상대방의 영역보다 훨씬 크기 때문에 자신이 승리했다고 잘못 생각하게 만듭니다.
하지만 왼쪽 하단 모서리 부분은 아직 흑점이 남아 있어 완전히 안전하지는 않기 때문에 실제로 점수에 기여하지 않습니다.
카타고는 승리를 과신하기 때문에 - 게임이 끝나고 점수를 계산하면 이긴다고 생각하고 - 카타고가 주도적으로 패스를 하고 공격자도 패스를 하게 되어 게임이 종료되고 공격이 시작됩니다. 점수. (양쪽 모두 패스하고 게임종료)
하지만 글리브의 분석에 따르면 카타고 주변 공간의 검은 돌들이 아직 살아 있기 때문에 바둑 심판 규정에 따르면 '데드 스톤'으로 판정되지는 않아서 틈이 있는 것 같습니다. KataGo의 주변 공간에 있는 검은 돌의 경우 유효 메쉬 수로 계산할 수 없습니다.
그래서 최종 승자는 KataGo가 아니라 공격자입니다.
이번 승리는 검색 없이 카타고를 상대로 99%의 승률을 달성한 것이 아닙니다.
KataGo는 초인적인 수준에 접근할 만큼 충분한 검색을 수행했을 때 승률이 50%에 도달했습니다.
또한 이러한 영리한 전략에도 불구하고 공격자 모델 자체는 바둑에서 그다지 강력하지 않습니다. 사실 인간 아마추어에게 쉽게 패배할 수 있습니다.
연구원들은 연구의 목적이 고도로 성숙한 AI 시스템이라도 KataGo의 예상치 못한 취약점을 공격하여 심각한 취약점을 가질 수 있음을 증명하는 것이라고 밝혔습니다.
공저자 Gleave가 말했듯이:
(이 연구)는 일반적인 성능을 테스트하는 것보다 최악의 실패 모드를 발견하기 위해 AI 시스템의 더 나은 자동화된 테스트의 필요성을 강조합니다.
Research Team
연구팀은 MIT, UC Berkeley 등 출신입니다. 논문의 공동 저자는 Tony Tong Wang과 Adam Gleave입니다.
MIT 컴퓨터공학 박사과정 학생인 Tony Tong Wang은 NVIDIA, Genesis Therapeutics 및 기타 회사에서 인턴으로 일한 경험이 있습니다.
Adam Gleave는 University of California, Berkeley에서 인공 지능 박사 과정을 밟고 있습니다. 그는 캠브리지 대학교에서 석사 학위와 학사 학위를 취득했습니다. 그의 주요 연구 방향은 딥 러닝의 견고성입니다.
논문 링크는 마지막에 첨부되어 있으니 관심있는 친구들은 골라보셔도 됩니다~
논문 링크: https://arxiv.org/abs/2211.00241
참고 링크: https://arstechnica. com /information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to-human-amateurs/
위 내용은 파트너로서 Shen Zhenzhen을 이겼으나 아마추어 인간 플레이어에게 패한 Go AI의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











크로스 체인 거래를 지원하는 교환 : 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN 거래,이 플랫폼은 다양한 기술을 통해 다중 체인 자산 거래를 지원합니다.

Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.

Binance는 Global Digital Asset Trading Ecosystem의 대 군주이며, 그 특성에는 다음이 포함됩니다. 1. 평균 일일 거래량은 1,500 억 달러를 초과하여 주류 통화의 98%를 차지하며 500 개의 거래 쌍을 지원합니다. 2. 혁신 매트릭스는 파생 상품 시장, Web3 레이아웃 및 교육 시스템을 포함합니다. 3. 기술적 이점은 밀리 초에 일치하는 엔진이며, 최고 처리량은 초당 140 만 건의 트랜잭션입니다. 4. 규정 준수 진행 상황은 15 개국 라이센스를 보유하고 있으며 유럽과 미국에 준수 엔티티를 설립합니다.

가상 통화 가격 상승의 요인은 다음과 같습니다. 1. 시장 수요 증가, 2. 공급 감소, 3. 긍정적 인 뉴스, 4. 낙관적 시장 감정, 5. 거시 경제 환경; 감소 요인에는 다음이 포함됩니다. 1. 시장 수요 감소, 2. 공급 증가, 3. 부정적인 뉴스의 파업, 4. 비관적 시장 감정, 5. 거시 경제 환경.

암호 화폐의 번화 한 세계에서는 새로운 기회가 항상 나타납니다. 현재 Kerneldao (Kernel) 에어 드롭 활동은 많은 관심을 끌고 많은 투자자들의 관심을 끌고 있습니다. 그렇다면이 프로젝트의 기원은 무엇입니까? BNB 보유자는 어떤 이점을 얻을 수 있습니까? 걱정하지 마십시오. 다음은 당신을 위해 하나씩 공개 할 것입니다.

2025 년에 레버리지 거래, 보안 및 사용자 경험에서 뛰어난 성능을 보이는 플랫폼은 다음과 같습니다. 1. OKX, 고주파 거래자에게 적합하여 최대 100 배의 레버리지를 제공합니다. 2. Binance, 전 세계의 다중 통화 거래자에게 적합하며 125 배 높은 레버리지를 제공합니다. 3. Gate.io, 전문 파생 상품 플레이어에게 적합하며 100 배의 레버리지를 제공합니다. 4. 초보자 및 소셜 트레이더에게 적합한 Bitget, 최대 100 배의 레버리지를 제공합니다. 5. 크라켄은 꾸준한 투자자에게 적합하며 5 배의 레버리지를 제공합니다. 6. Bybit, Altcoin Explorers에 적합하며 20 배의 레버리지를 제공합니다. 7. 저비용 거래자에게 적합한 Kucoin, 10 배의 레버리지를 제공합니다. 8. 비트 피 넥스, 시니어 플레이에 적합합니다

Aavenomics는 AAVE 프로토콜 토큰을 수정하고 Aavedao의 쿼럼을 구현 한 Token Repos를 소개하는 제안입니다. AAVE 프로젝트 체인 (ACI)의 설립자 인 Marc Zeller는 X에서 이것을 발표하여 계약의 새로운 시대를 표시한다고 지적했습니다. AAVE 체인 이니셔티브 (ACI)의 설립자 인 Marc Zeller는 AAVENOMICS 제안서에 AAVE 프로토콜 토큰 수정 및 토큰 리포지션 도입이 포함되어 있다고 X에서 AAVEDAO에 대한 쿼럼을 달성했다고 발표했습니다. Zeller에 따르면, 이것은 계약의 새로운 시대를 나타냅니다. Aavedao 회원국은 수요일에 주당 100 인 제안을지지하기 위해 압도적으로 투표했습니다.

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.
