Table des matières
Anomalie pour les données graphiques structurées Détection : Contexte et défis
Une nouvelle approche : Détection des anomalies graphiques du point de vue du domaine spectral
Un nouvel outil pour la détection des anomalies graphiques : le réseau neuronal des graphiques d'ondelettes bêta
Résumé
Maison Périphériques technologiques IA Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Apr 13, 2023 pm 01:43 PM
数据 结构

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Adresse papier : https://arxiv.org/abs/2205.15508

Adresse code : https://github.com/squareRoot3/Rethinking-Anomaly-Detection

Anomalie pour les données graphiques structurées Détection : Contexte et défis

La détection d'anomalies est l'une des tâches classiques du data mining. L'analyse de données anormales peut aider les entreprises ou les utilisateurs à comprendre le mécanisme de formation qui les sous-tend, afin de prendre les décisions correspondantes et d'éviter les pertes. Avec le développement d'Internet, la détection d'anomalies pour les données structurées, à savoir la détection d'anomalies graphiques, fait l'objet de plus en plus d'attention.

La détection d'anomalies graphiques peut être spécifiquement définie comme : trouver un petit nombre d'objets sur le graphique (nœuds, arêtes, sous-graphes, etc.), qui ont des modèles de distribution différents de la plupart des autres objets. Cet article se concentre sur la tâche de détection des nœuds anormaux sur le graphique. Par rapport aux méthodes traditionnelles de détection d'anomalies, la détection d'anomalies graphiques peut utiliser les informations associées entre différentes entités pour mieux servir des scénarios réels tels que la sécurité du réseau, la détection des fraudes, la détection des trolls, le contrôle des risques financiers et la surveillance des pannes.

La figure ci-dessous compare visuellement la différence entre les tâches de détection d'anomalies traditionnelles et les tâches de détection d'anomalies orientées graphique.

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Figure 1 : Comparaison des tâches de détection d'anomalies traditionnelles et des tâches de détection d'anomalies orientées graphiques.

Ces dernières années, les réseaux de neurones graphiques sont devenus un outil puissant d'analyse et de traitement de données structurées. Les réseaux de neurones graphiques peuvent mieux accomplir les tâches en aval telles que la classification, la reconstruction et la régression en apprenant des représentations intégrées qui contiennent les propres caractéristiques du nœud et les informations sur les voisins.

Cependant, les réseaux de neurones graphiques généraux (tels que les réseaux convolutifs, etc.) sont principalement conçus pour des données normales et sont susceptibles de rencontrer le problème du « sur-lissage » dans les tâches de détection d'anomalies, c'est-à-dire l'expression de nœuds anormaux et nœuds normaux Il est difficile à distinguer, ce qui affecte la précision de la détection des anomalies. Par exemple, dans l'application pratique de la détection de la fraude financière, les comptes anormaux se déguisent généralement en effectuant des transactions normales avec plusieurs comptes normaux afin de réduire leur suspicion, puis en effectuant des transactions illégales. Cette « fraude relationnelle » augmente encore la difficulté de détection des anomalies graphiques.

Afin de résoudre les difficultés ci-dessus, les chercheurs ont spécialement proposé un Modèle de réseau neuronal graphique pour les tâches de détection d'anomalies, notamment (1) l'utilisation du mécanisme d'attention pour agréger les informations de quartier à partir de plusieurs vues (2) l'utilisation de la méthode de rééchantillonnage pour agréger différentes ; catégories Informations de voisinage ; (3) Concevoir des fonctions de perte supplémentaires pour aider à la formation des réseaux de neurones graphiques, etc. Ces méthodes conçoivent principalement des réseaux de neurones graphiques pour gérer les anomalies du point de vue du domaine spatial, mais personne n'a envisagé ce problème du point de vue du domaine spectral.

Il s'avère que le choix de différents filtres spectraux affectera la capacité d'expression du réseau neuronal graphique, provoquant ainsi des différences de performances.

Une nouvelle approche : Détection des anomalies graphiques du point de vue du domaine spectral

Afin de combler le vide dans les recherches existantes, cet article espère répondre à une telle question : Comment adapter un filtre spectral pour les réseaux de neurones graphiques pour la détection d'anomalies ?

Cet article tente pour la première fois d'analyser les données anormales sur le graphique du point de vue du domaine spectral, et observe que : les données anormales entraîneront un "décalage de l'énergie spectrale vers la droite", c'est-à-dire que l'énergie est moins concentré dans les basses fréquences et plus concentré dans les hautes fréquences.

Afin de visualiser ce phénomène de décalage vers la droite, les chercheurs ont d'abord généré de manière aléatoire un graphe de Barabási-Albert (graphe BA) avec 500 nœuds, et ont supposé que les attributs des nœuds normaux et des nœuds anormaux sur le graphique suivent deux distributions gaussiennes différentes. où la variance des nœuds anormaux est plus grande.

La partie supérieure de l'image montre la distribution des données contenant différents degrés d'anomalies sur la carte BA, tandis que la partie inférieure montre la distribution d'énergie spectrale correspondante. Parmi eux, l'histogramme représente la proportion d'énergie de l'intervalle spectral correspondant, et le graphique linéaire représente la proportion cumulée d'énergie du domaine fréquentiel de zéro à ce point.

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Figure 2 : Visualisation du phénomène de « décalage à droite » de l'énergie spectrale.

Comme le montre la figure ci-dessus, lorsque la proportion de données anormales est de 0 %, la majeure partie de l'énergie est concentrée dans la partie basse fréquence (λ

Dans des scénarios réels, les données anormales suivent généralement une distribution plus complexe. Sur quatre ensembles de données de détection d’anomalies graphiques à grande échelle, les chercheurs ont également confirmé l’existence du phénomène de « décalage à droite ». L'ensemble de données de détection d'utilisateurs anormaux d'Amazon présenté ci-dessous est un exemple. Après la suppression de certains nœuds anormaux dans les données, l'énergie basse fréquence sur le spectre augmente considérablement, tandis que l'énergie haute fréquence diminue en conséquence. Si le même nombre de nœuds aléatoires est supprimé, la distribution d’énergie du spectre ne change pratiquement pas. Cela vérifie en outre que les données anormales sont la clé du « bon décalage » de l’énergie spectrale.

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Figure 3 : L'impact de la suppression de différents nœuds sur la distribution d'énergie du spectre sur l'ensemble de données de détection d'utilisateurs anormaux d'Amazon : image originale (The Original), suppression de nœuds aléatoires (Drop-Random), suppression de nœuds anormaux (Drop -Anomaly)

Un nouvel outil pour la détection des anomalies graphiques : le réseau neuronal des graphiques d'ondelettes bêta

L'analyse de la section précédente montre que nous devons prêter attention à l'effet "décalage à droite" lors de la détection des anomalies graphiques. Par exemple, dans l'ensemble de données Amazon ci-dessus, les informations spectrales proches de la valeur propre λ = 1 sont étroitement liées aux données anormales. Afin de mieux capturer les informations anormales, le réseau neuronal graphique doit avoir les propriétés d'un filtre passe-bande, ne retenant que les signaux proches de λ = 1 tout en filtrant les signaux restants.

Malheureusement, la plupart des réseaux de neurones graphiques existants sont des filtres passe-bas ou des filtres adaptatifs, qui ne peuvent garantir les propriétés passe-bande. Bien que le filtre adaptatif ait la capacité de s’adapter à n’importe quelle fonction, il peut également dégénérer en filtre passe-bas lors de la détection d’anomalies. En effet, dans l’ensemble des données, les informations haute fréquence correspondant aux données anormales représentent une proportion relativement faible, alors que la majeure partie de l’énergie spectrale est encore concentrée dans les basses fréquences.

Afin de mieux gérer le « décalage à droite » provoqué par des données anormales, les chercheurs ont proposé une nouvelle méthode de détection des anomalies graphiques - Beta Wavelet Graph Neural Network (BWGNN). En s'appuyant sur la théorie des ondelettes graphiques de Hammond, ils ont conçu un nouveau noyau d'ondelettes basé sur la fonction Beta comme filtre spectral pour le réseau neuronal graphique.

Par rapport à la fonction de noyau thermique couramment utilisée, la fonction bêta en tant que noyau d'ondelettes répond non seulement aux exigences d'un filtre passe-bande, mais a également une meilleure localité du domaine fréquentiel et une meilleure localité du domaine spatial. La figure ci-dessous compare la différence entre l'ondelette du thermonoyau et l'ondelette du noyau bêta.

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Figure 4 : Comparaison de l'ondelette du noyau thermique et de l'ondelette du noyau bêta dans le domaine spectral (à gauche) et le domaine spatial (à droite). La fonction bêta a de meilleures propriétés passe-bande et locales.

Cet article vérifie les performances de BWGNN sur quatre ensembles de données de détection d'anomalies graphiques à grande échelle. Parmi eux, l'ensemble de données Yelp est utilisé pour détecter les commentaires anormaux sur les sites Web de Dianping, l'ensemble de données Amazon est utilisé pour détecter les utilisateurs anormaux sur les plateformes de commerce électronique, l'ensemble de données T-Finance est utilisé pour détecter les utilisateurs anormaux sur les réseaux de transaction, et l'ensemble de données T-Social est utilisé pour détecter les utilisateurs anormaux sur les réseaux sociaux, comprenant jusqu'à cinq millions de nœuds et 70 millions de bords.

Comme le montre le tableau ci-dessous, par rapport aux modèles de classification traditionnels, aux réseaux neuronaux de graphes généraux et aux modèles spécialisés de détection d'anomalies de graphes, BWGNN a obtenu de meilleures performances dans les deux scénarios de 40 % de données d'entraînement et de 1 % de données d'entraînement (semi-supervisé). ). De bons résultats. En termes d'efficacité opérationnelle, BWGNN est proche de la consommation de temps de la plupart des réseaux neuronaux de graphes généraux et est plus efficace que les autres modèles de détection d'anomalies de graphes.

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Repenser la détection des anomalies basée sur des données structurées : de quel type de réseau neuronal graphique avons-nous besoin ?

Résumé

Dans cet article, les chercheurs ont découvert que l'apparition de nœuds anormaux sur le graphique entraînerait un « déplacement de l'énergie du spectre vers la droite », offrant une nouvelle perspective pour la détection d'anomalies pour les données structurées. Sur la base de ces résultats, cet article propose un nouvel outil pour la détection des anomalies graphiques : le réseau neuronal bêta Wavelet Graph (BWGNN). Il capture les informations sur les anomalies haute fréquence générées par le « décalage vers la droite » via un filtre passe-bande spécialement conçu et obtient des résultats optimaux sur plusieurs ensembles de données.

Dans la mise en œuvre réelle, la détection des anomalies graphiques est généralement une ingénierie système complexe, mais le choix d'un réseau neuronal graphique approprié est un facteur clé affectant les performances du système. Le BWGNN proposé par les chercheurs a une conception simplifiée, une faible complexité et est facile à remplacer. Il s'agit d'un nouveau choix pour les réseaux de neurones graphiques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Utilisez ddrescue pour récupérer des données sous Linux Utilisez ddrescue pour récupérer des données sous Linux Mar 20, 2024 pm 01:37 PM

DDREASE est un outil permettant de récupérer des données à partir de périphériques de fichiers ou de blocs tels que des disques durs, des SSD, des disques RAM, des CD, des DVD et des périphériques de stockage USB. Il copie les données d'un périphérique bloc à un autre, laissant derrière lui les blocs corrompus et ne déplaçant que les bons blocs. ddreasue est un puissant outil de récupération entièrement automatisé car il ne nécessite aucune interruption pendant les opérations de récupération. De plus, grâce au fichier map ddasue, il peut être arrêté et repris à tout moment. Les autres fonctionnalités clés de DDREASE sont les suivantes : Il n'écrase pas les données récupérées mais comble les lacunes en cas de récupération itérative. Cependant, il peut être tronqué si l'outil est invité à le faire explicitement. Récupérer les données de plusieurs fichiers ou blocs en un seul

Open source! Au-delà de ZoeDepth ! DepthFM : estimation rapide et précise de la profondeur monoculaire ! Open source! Au-delà de ZoeDepth ! DepthFM : estimation rapide et précise de la profondeur monoculaire ! Apr 03, 2024 pm 12:04 PM

0. À quoi sert cet article ? Nous proposons DepthFM : un modèle d'estimation de profondeur monoculaire génératif de pointe, polyvalent et rapide. En plus des tâches traditionnelles d'estimation de la profondeur, DepthFM démontre également des capacités de pointe dans les tâches en aval telles que l'inpainting en profondeur. DepthFM est efficace et peut synthétiser des cartes de profondeur en quelques étapes d'inférence. Lisons ce travail ensemble ~ 1. Titre des informations sur l'article : DepthFM : FastMonocularDepthEstimationwithFlowMatching Auteur : MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Comment utiliser la fonction de filtre Excel avec plusieurs conditions Comment utiliser la fonction de filtre Excel avec plusieurs conditions Feb 26, 2024 am 10:19 AM

Si vous avez besoin de savoir comment utiliser le filtrage avec plusieurs critères dans Excel, le didacticiel suivant vous guidera à travers les étapes pour vous assurer que vous pouvez filtrer et trier efficacement vos données. La fonction de filtrage d'Excel est très puissante et peut vous aider à extraire les informations dont vous avez besoin à partir de grandes quantités de données. Cette fonction peut filtrer les données en fonction des conditions que vous définissez et afficher uniquement les pièces qui remplissent les conditions, rendant la gestion des données plus efficace. En utilisant la fonction de filtre, vous pouvez trouver rapidement des données cibles, ce qui vous fait gagner du temps dans la recherche et l'organisation des données. Cette fonction peut non seulement être appliquée à de simples listes de données, mais peut également être filtrée en fonction de plusieurs conditions pour vous aider à localiser plus précisément les informations dont vous avez besoin. Dans l’ensemble, la fonction de filtrage d’Excel est très utile

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

La vitalité de la super intelligence s'éveille ! Mais avec l'arrivée de l'IA qui se met à jour automatiquement, les mères n'ont plus à se soucier des goulots d'étranglement des données. La vitalité de la super intelligence s'éveille ! Mais avec l'arrivée de l'IA qui se met à jour automatiquement, les mères n'ont plus à se soucier des goulots d'étranglement des données. Apr 29, 2024 pm 06:55 PM

Je pleure à mort. Le monde construit à la folie de grands modèles. Les données sur Internet ne suffisent pas du tout. Le modèle de formation ressemble à « The Hunger Games », et les chercheurs en IA du monde entier se demandent comment nourrir ces personnes avides de données. Ce problème est particulièrement important dans les tâches multimodales. À une époque où rien ne pouvait être fait, une équipe de start-up du département de l'Université Renmin de Chine a utilisé son propre nouveau modèle pour devenir la première en Chine à faire de « l'auto-alimentation des données générées par le modèle » une réalité. De plus, il s’agit d’une approche à deux volets, du côté compréhension et du côté génération, les deux côtés peuvent générer de nouvelles données multimodales de haute qualité et fournir un retour de données au modèle lui-même. Qu'est-ce qu'un modèle ? Awaker 1.0, un grand modèle multimodal qui vient d'apparaître sur le Forum Zhongguancun. Qui est l'équipe ? Moteur Sophon. Fondé par Gao Yizhao, doctorant à la Hillhouse School of Artificial Intelligence de l’Université Renmin.

Vitesse Internet lente des données cellulaires sur iPhone : correctifs Vitesse Internet lente des données cellulaires sur iPhone : correctifs May 03, 2024 pm 09:01 PM

Vous êtes confronté à un décalage et à une connexion de données mobile lente sur iPhone ? En règle générale, la puissance de l'Internet cellulaire sur votre téléphone dépend de plusieurs facteurs tels que la région, le type de réseau cellulaire, le type d'itinérance, etc. Vous pouvez prendre certaines mesures pour obtenir une connexion Internet cellulaire plus rapide et plus fiable. Correctif 1 – Forcer le redémarrage de l'iPhone Parfois, le redémarrage forcé de votre appareil réinitialise simplement beaucoup de choses, y compris la connexion cellulaire. Étape 1 – Appuyez simplement une fois sur la touche d’augmentation du volume et relâchez-la. Ensuite, appuyez sur la touche de réduction du volume et relâchez-la à nouveau. Étape 2 – La partie suivante du processus consiste à maintenir le bouton sur le côté droit. Laissez l'iPhone finir de redémarrer. Activez les données cellulaires et vérifiez la vitesse du réseau. Vérifiez à nouveau Correctif 2 – Changer le mode de données Bien que la 5G offre de meilleures vitesses de réseau, elle fonctionne mieux lorsque le signal est plus faible

L'US Air Force présente son premier avion de combat IA de grande envergure ! Le ministre a personnellement effectué l'essai routier sans intervenir pendant tout le processus, et 100 000 lignes de code ont été testées 21 fois. L'US Air Force présente son premier avion de combat IA de grande envergure ! Le ministre a personnellement effectué l'essai routier sans intervenir pendant tout le processus, et 100 000 lignes de code ont été testées 21 fois. May 07, 2024 pm 05:00 PM

Récemment, le milieu militaire a été submergé par la nouvelle : les avions de combat militaires américains peuvent désormais mener des combats aériens entièrement automatiques grâce à l'IA. Oui, tout récemment, l’avion de combat IA de l’armée américaine a été rendu public pour la première fois, dévoilant ainsi son mystère. Le nom complet de ce chasseur est Variable Stability Simulator Test Aircraft (VISTA). Il a été personnellement piloté par le secrétaire de l'US Air Force pour simuler une bataille aérienne en tête-à-tête. Le 2 mai, le secrétaire de l'US Air Force, Frank Kendall, a décollé à bord d'un X-62AVISTA à la base aérienne d'Edwards. Notez que pendant le vol d'une heure, toutes les actions de vol ont été effectuées de manière autonome par l'IA ! Kendall a déclaré : "Au cours des dernières décennies, nous avons réfléchi au potentiel illimité du combat air-air autonome, mais cela a toujours semblé hors de portée." Mais maintenant,

Le premier robot capable d'accomplir de manière autonome des tâches humaines apparaît, avec cinq doigts flexibles et rapides, et de grands modèles prennent en charge l'entraînement dans l'espace virtuel Le premier robot capable d'accomplir de manière autonome des tâches humaines apparaît, avec cinq doigts flexibles et rapides, et de grands modèles prennent en charge l'entraînement dans l'espace virtuel Mar 11, 2024 pm 12:10 PM

Cette semaine, FigureAI, une entreprise de robotique investie par OpenAI, Microsoft, Bezos et Nvidia, a annoncé avoir reçu près de 700 millions de dollars de financement et prévoit de développer un robot humanoïde capable de marcher de manière autonome au cours de la prochaine année. Et l’Optimus Prime de Tesla a reçu à plusieurs reprises de bonnes nouvelles. Personne ne doute que cette année sera celle de l’explosion des robots humanoïdes. SanctuaryAI, une entreprise canadienne de robotique, a récemment lancé un nouveau robot humanoïde, Phoenix. Les responsables affirment qu’il peut accomplir de nombreuses tâches de manière autonome, à la même vitesse que les humains. Pheonix, le premier robot au monde capable d'accomplir des tâches de manière autonome à la vitesse d'un humain, peut saisir, déplacer et placer avec élégance chaque objet sur ses côtés gauche et droit. Il peut identifier des objets de manière autonome

See all articles