구조화된 데이터를 기반으로 한 이상 탐지 재고: 어떤 종류의 그래프 신경망이 필요합니까?
문서 주소: https://arxiv.org/abs/2205.15508
코드 주소: https://github.com/squareRoot3/Rethinking-Anomaly-Detection
구조적 그래프 데이터에 대한 이상 탐지: 배경 및 과제
이상 탐지는 데이터 마이닝의 고전적인 작업 중 하나입니다. 비정상적인 데이터를 분석하면 기업이나 사용자가 그 뒤에 있는 형성 메커니즘을 이해하여 해당 결정을 내리고 손실을 방지하는 데 도움이 될 수 있습니다. 인터넷의 발달과 함께 구조화된 데이터에 대한 이상 탐지, 즉 그래프 이상 탐지가 점점 주목을 받고 있다.
그래프 이상 탐지는 그래프에서 대부분의 다른 개체와 분포 패턴이 다른 소수의 개체(노드, 가장자리, 하위 그래프 등)를 찾는 것으로 구체적으로 정의할 수 있습니다. 이 글은 그래프에서 비정상적인 노드를 탐지하는 작업에 초점을 맞췄습니다. 기존의 이상 탐지 방법과 비교하여 그래프 이상 탐지는 서로 다른 엔터티 간의 관련 정보를 활용하여 네트워크 보안, 사기 탐지, 트롤 탐지, 금융 위험 제어 및 오류 모니터링과 같은 실제 시나리오를 더 잘 제공할 수 있습니다.
아래 그림은 기존 이상 탐지 작업과 그래프 기반 이상 탐지 작업의 차이점을 시각적으로 비교한 것입니다.
그림 1: 기존 이상 탐지 작업과 그래프 기반 이상 탐지 작업의 비교.
최근 몇 년 동안 그래프 신경망은 구조화된 데이터를 분석하고 처리하는 강력한 도구가 되었습니다. 그래프 신경망은 노드 자체 특성과 이웃 정보가 포함된 내장 표현을 학습하여 분류, 재구성, 회귀와 같은 다운스트림 작업을 더 잘 완료할 수 있습니다.
그러나 일반 그래프 신경망(예: 컨볼루셔널 네트워크 등)은 주로 정상 데이터를 위해 설계되었으며 이상 탐지 작업에서 "over-smoothing" 문제, 즉 비정상적인 노드의 표현과 정상 노드 구별이 어려워 이상 탐지 정확도에 영향을 미칩니다. 예를 들어 금융사기 적발의 실제 적용에서 비정상 계좌는 의심을 줄이기 위해 다수의 정상 계좌와 정상 거래를 하는 방식으로 위장한 후 불법 거래를 하는 경우가 많다. 이러한 "관계 사기"는 그래프 이상 탐지의 어려움을 더욱 증가시킵니다.
위의 어려움을 해결하기 위해 연구원들은 (1) 주의 메커니즘을 사용하여 여러 뷰에서 이웃 정보를 집계하고 (2) 리샘플링 방법을 사용하여 다양한 항목을 집계하는 등 이상 탐지 작업을 위한 그래프 신경망 모델을 특별히 제안했습니다. 카테고리 주변 정보 (3) 그래프 신경망 등의 학습을 지원하기 위한 추가 손실 함수를 설계합니다. 이들 방법은 주로 공간 영역의 관점에서 이상 현상을 처리하기 위한 그래프 신경망을 설계하지만, 스펙트럼 영역의 관점에서 이 문제를 고려한 사람은 아무도 없습니다.
다른 스펙트럼 필터를 선택하면 그래프 신경망의 표현 능력에 영향을 미치고 결과적으로 성능 차이가 발생하는 것으로 나타났습니다.
새로운 접근 방식: 스펙트럼 도메인 관점에서 그래프 이상 탐지
기존 연구의 격차를 메우기 위해 이 기사에서는 이상 탐지를 위해 그래프 신경망용 스펙트럼 필터를 어떻게 맞춤화할 것인가?라는 질문에 대답하고자 합니다.
이 기사에서는 처음으로 스펙트럼 영역 관점에서 그래프의 비정상적인 데이터를 분석하려고 시도하고 관찰합니다. 비정상적인 데이터로 인해 스펙트럼 에너지가 "오른쪽으로 이동"합니다. 낮은 주파수에는 덜 집중되고 높은 주파수에는 더 집중됩니다.
이 오른쪽 이동 현상을 시각화하기 위해 연구원들은 먼저 500개의 노드가 있는 Barabási-Albert 그래프(BA 그래프)를 무작위로 생성하고 그래프의 정상 노드와 비정상 노드의 속성이 두 가지 다른 가우스 분포를 따른다고 가정했습니다. 비정상적인 노드의 분산이 더 큰 경우.
그림의 위쪽 부분은 BA 차트에서 다양한 이상 수준을 포함하는 데이터의 분포를 보여주고, 아래쪽 부분은 해당 스펙트럼 에너지 분포를 보여줍니다. 그 중 히스토그램은 해당 스펙트럼 구간의 에너지 비율을 나타내고, 선 그래프는 0부터 해당 지점까지의 주파수 영역 에너지의 누적 비율을 나타냅니다.
그림 2: 스펙트럼 에너지의 "오른쪽 이동" 현상 시각화.
위 그림에서 알 수 있듯이 비정상 데이터의 비율이 0%일 때 대부분의 에너지는 저주파 부분(λ
실제 시나리오에서 비정상적인 데이터는 일반적으로 더 복잡한 분포를 따릅니다. 연구진은 4개의 대규모 그래프 이상 탐지 데이터 세트에서도 '오른쪽 이동' 현상이 존재함을 확인했습니다. 아래 그림에 설정된 Amazon 비정상 사용자 감지 데이터는 데이터의 비정상 노드 중 일부가 삭제되면 스펙트럼의 저주파 에너지가 크게 증가하는 반면 그에 따라 고주파 에너지는 감소합니다. 동일한 수의 무작위 노드를 삭제하면 스펙트럼의 에너지 분포는 거의 변하지 않습니다. 이는 비정상적인 데이터가 스펙트럼 에너지의 "오른쪽 이동"에 대한 핵심임을 추가로 확인합니다.
그림 3: Amazon 비정상 사용자 감지 데이터 세트의 스펙트럼 에너지 분포에 대한 여러 노드 삭제의 영향: 원본 사진(The Original), 무작위 노드 삭제(Drop-Random), 비정상 노드 삭제(Drop) -이상)
그래프 이상 탐지를 위한 새로운 도구: 베타 웨이블릿 그래프 신경망
이전 섹션의 분석을 통해 그래프 이상 탐지 시 "오른쪽 이동" 효과에 주의해야 함을 알 수 있습니다. 예를 들어 위의 Amazon 데이터 세트에서 고유값 λ=1 근처의 스펙트럼 정보는 비정상적인 데이터와 밀접한 관련이 있습니다. 비정상적인 정보를 더 잘 포착하기 위해 그래프 신경망은 대역 통과 필터의 특성을 가져야 하며, λ=1 근처의 신호만 유지하고 나머지 신호는 필터링합니다.
안타깝게도 기존 그래프 신경망의 대부분은 저역통과 필터나 적응형 필터로 대역통과 특성을 보장할 수 없습니다. 적응형 필터는 어떤 기능에도 적합할 수 있지만 이상 탐지에서는 저역 통과 필터로 변질될 수도 있습니다. 이는 전체 데이터 세트에서 비정상적인 데이터에 해당하는 고주파 정보가 상대적으로 작은 비율을 차지하고 스펙트럼 에너지의 대부분은 여전히 저주파에 집중되어 있기 때문입니다.
비정상 데이터로 인한 "오른쪽 이동"을 더 잘 처리하기 위해 연구원들은 새로운 그래프 이상 탐지 방법인 베타 웨이블릿 그래프 신경망(BWGNN)을 제안했습니다. Hammond의 그래프 웨이블릿 이론을 활용하여 그래프 신경망의 스펙트럼 필터로서 베타 함수를 기반으로 하는 새로운 웨이블릿 커널을 설계했습니다.
일반적으로 사용되는 열 커널 함수와 비교하여 웨이블릿 커널인 베타 함수는 대역 통과 필터의 요구 사항을 충족할 뿐만 아니라 더 나은 주파수 영역 집약성과 공간 영역 집약성을 갖습니다. 아래 그림은 써모커널 웨이블릿과 베타 커널 웨이블릿의 차이점을 비교한 것입니다.
그림 4: 스펙트럼 영역(왼쪽)과 공간 영역(오른쪽)에서 열 커널 웨이블릿과 베타 커널 웨이블릿의 비교 베타 함수는 더 나은 대역 통과 및 로컬 속성을 갖습니다.
이 기사는 4개의 대규모 그래프 이상 탐지 데이터세트에서 BWGNN의 성능을 검증합니다. 그 중 Yelp 데이터 세트는 디앤핑 사이트의 비정상 댓글 탐지에 사용되고, Amazon 데이터 세트는 전자상거래 플랫폼의 비정상 사용자 탐지에 사용되고, T-Finance 데이터 세트는 거래 네트워크의 비정상 사용자 탐지에 사용되고, T-Social 데이터 세트는 최대 5백만 개의 노드와 7천만 개의 엣지를 포함하는 소셜 네트워크에서 비정상적인 사용자를 탐지하는 데 사용됩니다.
아래 표에서 볼 수 있듯이 BWGNN은 기존 분류 모델, 일반 그래프 신경망 및 특수 그래프 이상 탐지 모델과 비교하여 40% 훈련 데이터와 1% 훈련 데이터(반지도) 시나리오 모두에서 더 나은 성능을 달성했습니다. ). 좋은 결과. 운영 효율성 측면에서 BWGNN은 대부분의 일반적인 그래프 신경망의 시간 소모에 가깝고 다른 그래프 이상 탐지 모델보다 더 효율적입니다.
요약
이 기사에서 연구원들은 그래프에 비정상적인 노드가 나타나면 스펙트럼 에너지가 "오른쪽으로 이동"하여 구조화된 데이터에 대한 이상 탐지에 대한 새로운 관점을 제공한다는 사실을 발견했습니다. 이 결과를 바탕으로 본 논문에서는 그래프 이상 탐지를 위한 새로운 도구인 BWGNN(Beta Wavelet Graph Neural Network)을 제안합니다. 특별히 설계된 대역 통과 필터를 통해 "오른쪽 이동"으로 생성된 고주파 이상 정보를 캡처하고 여러 데이터 세트에서 최적의 결과를 얻습니다.
실제 구현에서 그래프 이상 탐지는 일반적으로 복잡한 시스템 엔지니어링이지만 적절한 그래프 신경망을 선택하는 것은 시스템 성능에 영향을 미치는 핵심 요소입니다. 연구진이 제안한 BWGNN은 간소화된 디자인, 낮은 복잡성 및 교체가 용이한 그래프 신경망을 위한 새로운 선택입니다.
위 내용은 구조화된 데이터를 기반으로 한 이상 탐지 재고: 어떤 종류의 그래프 신경망이 필요합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











DDREASE는 하드 드라이브, SSD, RAM 디스크, CD, DVD 및 USB 저장 장치와 같은 파일 또는 블록 장치에서 데이터를 복구하기 위한 도구입니다. 한 블록 장치에서 다른 블록 장치로 데이터를 복사하여 손상된 데이터 블록은 남겨두고 양호한 데이터 블록만 이동합니다. ddreasue는 복구 작업 중에 간섭이 필요하지 않으므로 완전히 자동화된 강력한 복구 도구입니다. 게다가 ddasue 맵 파일 덕분에 언제든지 중지하고 다시 시작할 수 있습니다. DDREASE의 다른 주요 기능은 다음과 같습니다. 복구된 데이터를 덮어쓰지 않지만 반복 복구 시 공백을 채웁니다. 그러나 도구에 명시적으로 지시된 경우에는 잘릴 수 있습니다. 여러 파일이나 블록의 데이터를 단일 파일로 복구

0. 이 글은 어떤 내용을 담고 있나요? 우리는 다재다능하고 빠른 최첨단 생성 단안 깊이 추정 모델인 DepthFM을 제안합니다. DepthFM은 전통적인 깊이 추정 작업 외에도 깊이 인페인팅과 같은 다운스트림 작업에서 최첨단 기능을 보여줍니다. DepthFM은 효율적이며 몇 가지 추론 단계 내에서 깊이 맵을 합성할 수 있습니다. 이 작품을 함께 읽어보아요~ 1. 논문 정보 제목: DepthFM: FastMoncularDepthEstimationwithFlowMatching 저자: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Excel에서 여러 기준으로 필터링을 사용하는 방법을 알아야 하는 경우 다음 자습서에서는 데이터를 효과적으로 필터링하고 정렬할 수 있는 단계를 안내합니다. Excel의 필터링 기능은 매우 강력하며 많은 양의 데이터에서 필요한 정보를 추출하는 데 도움이 될 수 있습니다. 이 기능을 사용하면 설정한 조건에 따라 데이터를 필터링하고 조건에 맞는 부분만 표시하여 데이터 관리를 더욱 효율적으로 할 수 있습니다. 필터 기능을 사용하면 대상 데이터를 빠르게 찾을 수 있어 데이터 검색 및 정리에 드는 시간을 절약할 수 있습니다. 이 기능은 단순한 데이터 목록에만 적용할 수 있는 것이 아니라, 여러 조건에 따라 필터링하여 필요한 정보를 보다 정확하게 찾을 수 있도록 도와줍니다. 전반적으로 Excel의 필터링 기능은 매우 실용적입니다.

Google이 추진하는 JAX의 성능은 최근 벤치마크 테스트에서 Pytorch와 TensorFlow를 능가하여 7개 지표에서 1위를 차지했습니다. 그리고 JAX 성능이 가장 좋은 TPU에서는 테스트가 이루어지지 않았습니다. 개발자들 사이에서는 여전히 Tensorflow보다 Pytorch가 더 인기가 있습니다. 그러나 앞으로는 더 큰 모델이 JAX 플랫폼을 기반으로 훈련되고 실행될 것입니다. 모델 최근 Keras 팀은 기본 PyTorch 구현을 사용하여 세 가지 백엔드(TensorFlow, JAX, PyTorch)와 TensorFlow를 사용하는 Keras2를 벤치마킹했습니다. 첫째, 그들은 주류 세트를 선택합니다.

지연이 발생하고 iPhone의 모바일 데이터 연결 속도가 느립니까? 일반적으로 휴대폰의 셀룰러 인터넷 강도는 지역, 셀룰러 네트워크 유형, 로밍 유형 등과 같은 여러 요소에 따라 달라집니다. 더 빠르고 안정적인 셀룰러 인터넷 연결을 얻기 위해 할 수 있는 일이 몇 가지 있습니다. 수정 1 – iPhone 강제 다시 시작 때로는 장치를 강제로 다시 시작하면 셀룰러 연결을 포함한 많은 항목이 재설정됩니다. 1단계 – 볼륨 높이기 키를 한 번 눌렀다가 놓습니다. 그런 다음 볼륨 작게 키를 눌렀다가 다시 놓습니다. 2단계 - 프로세스의 다음 부분은 오른쪽에 있는 버튼을 누르는 것입니다. iPhone이 다시 시작되도록 하세요. 셀룰러 데이터를 활성화하고 네트워크 속도를 확인하세요. 다시 확인하세요 수정 2 – 데이터 모드 변경 5G는 더 나은 네트워크 속도를 제공하지만 신호가 약할 때 더 잘 작동합니다

세상은 미친 듯이 큰 모델을 만들고 있습니다. 인터넷의 데이터만으로는 충분하지 않습니다. 훈련 모델은 '헝거게임'처럼 생겼고, 전 세계 AI 연구자들은 이러한 데이터를 탐식하는 사람들에게 어떻게 먹이를 줄지 고민하고 있습니다. 이 문제는 다중 모드 작업에서 특히 두드러집니다. 아무것도 할 수 없던 시기에, 중국 인민대학교 학과의 스타트업 팀은 자체 새로운 모델을 사용하여 중국 최초로 '모델 생성 데이터 피드 자체'를 현실화했습니다. 또한 이해 측면과 생성 측면의 두 가지 접근 방식으로 양측 모두 고품질의 다중 모드 새로운 데이터를 생성하고 모델 자체에 데이터 피드백을 제공할 수 있습니다. 모델이란 무엇입니까? Awaker 1.0은 중관촌 포럼에 최근 등장한 대형 멀티모달 모델입니다. 팀은 누구입니까? 소폰 엔진. 런민대학교 힐하우스 인공지능대학원 박사과정 학생인 Gao Yizhao가 설립했습니다.

최근 군계는 미군 전투기가 이제 AI를 활용해 완전 자동 공중전을 완수할 수 있다는 소식에 충격을 받았다. 네, 얼마 전 미군의 AI 전투기가 최초로 공개되면서 그 미스터리가 드러났습니다. 이 전투기의 정식 명칭은 VISTA(Variable Stability Flight Simulator Test Aircraft)로 미 공군 장관이 직접 조종해 일대일 공중전을 모의 실험한 것이다. 5월 2일, 미 공군 장관 프랭크 켄달(Frank Kendall)이 X-62AVISTA를 타고 에드워드 공군 기지에서 이륙했습니다. 1시간의 비행 동안 모든 비행 작업은 AI에 의해 자동으로 완료되었습니다. Kendall은 "지난 수십 년 동안 우리는 자율 공대공 전투의 무한한 잠재력에 대해 생각해 왔지만 항상 도달할 수 없는 것처럼 보였습니다."라고 말했습니다. 그러나 지금은,

이번 주, 오픈AI(OpenAI), 마이크로소프트(Microsoft), 베조스(Bezos), 엔비디아(Nvidia)가 투자한 로봇 회사인 FigureAI는 약 7억 달러의 자금 조달을 받았으며 내년 내에 독립적으로 걸을 수 있는 휴머노이드 로봇을 개발할 계획이라고 발표했습니다. 그리고 Tesla의 Optimus Prime은 계속해서 좋은 소식을 받았습니다. 올해가 휴머노이드 로봇이 폭발하는 해가 될 것이라는 데는 누구도 의심하지 않는다. 캐나다에 본사를 둔 로봇 회사인 SanctuaryAI는 최근 새로운 휴머노이드 로봇인 Phoenix를 출시했습니다. 관계자들은 이 로봇이 인간과 같은 속도로 자율적으로 많은 작업을 완료할 수 있다고 주장한다. 인간의 속도로 자동으로 작업을 완료할 수 있는 세계 최초의 로봇인 Pheonix는 각 물체를 부드럽게 잡고 움직이며 우아하게 왼쪽과 오른쪽에 배치할 수 있습니다. 자동으로 물체를 식별할 수 있습니다.
