


Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?
Papieradresse: https://arxiv.org/abs/2205.15508
Codeadresse: https://github.com/squareRoot3/Rethinking-Anomaly-Detection
Anomalie für strukturierte Diagrammdatenerkennung: Hintergrund und Herausforderungen
Die Erkennung von Anomalien ist eine der klassischen Aufgaben des Data Mining. Die Analyse abnormaler Daten kann Unternehmen oder Benutzern helfen, den dahinter stehenden Entstehungsmechanismus zu verstehen, um entsprechende Entscheidungen zu treffen und Verluste zu vermeiden. Mit der Entwicklung des Internets hat die Anomalieerkennung für strukturierte Daten, insbesondere die Erkennung von Diagrammanomalien, immer mehr Aufmerksamkeit erhalten.
Die Erkennung von Diagrammanomalien kann konkret definiert werden als: Finden einer kleinen Anzahl von Objekten im Diagramm (Knoten, Kanten, Unterdiagramme usw.), die andere Verteilungsmuster als die meisten anderen Objekte aufweisen. Dieser Artikel konzentriert sich auf die Erkennungsaufgabe abnormaler Knoten im Diagramm. Im Vergleich zu herkömmlichen Methoden zur Erkennung von Anomalien kann die Erkennung von Diagrammanomalien die zugehörigen Informationen zwischen verschiedenen Einheiten nutzen, um tatsächliche Szenarien wie Netzwerksicherheit, Betrugserkennung, Trollerkennung, finanzielle Risikokontrolle und Fehlerüberwachung besser zu bedienen.
Die folgende Abbildung vergleicht visuell den Unterschied zwischen herkömmlicher Anomalieerkennung und diagrammorientierten Anomalieerkennungsaufgaben.
Abbildung 1: Vergleich traditioneller Anomalieerkennungs- und diagrammorientierter Anomalieerkennungsaufgaben.
In den letzten Jahren haben sich graphische neuronale Netze zu einem leistungsstarken Werkzeug zur Analyse und Verarbeitung strukturierter Daten entwickelt. Graphische neuronale Netze können nachgelagerte Aufgaben wie Klassifizierung, Rekonstruktion und Regression besser erledigen, indem sie eingebettete Darstellungen lernen, die die eigenen Eigenschaften und Nachbarinformationen des Knotens enthalten.
Allgemeine graphische neuronale Netze (z. B. Faltungsnetze usw.) sind jedoch hauptsächlich für normale Daten konzipiert und neigen dazu, bei Anomalieerkennungsaufgaben auf das Problem der „Überglättung“ zu stoßen, d Normale Knoten sind schwer zu unterscheiden, was die Genauigkeit der Anomalieerkennung beeinträchtigt. In der praktischen Anwendung der Erkennung von Finanzbetrug beispielsweise tarnen sich abnormale Konten normalerweise, indem sie normale Transaktionen mit mehreren normalen Konten durchführen, um ihren Verdacht zu verringern, und führen dann illegale Transaktionen durch. Dieser „Beziehungsbetrug“ erhöht die Schwierigkeit der Erkennung von Diagrammanomalien zusätzlich.
Um die oben genannten Schwierigkeiten zu lösen, haben Forscher speziell ein „Graph Neural Network Model“ für Anomalieerkennungsaufgaben vorgeschlagen, einschließlich (1) der Verwendung des Aufmerksamkeitsmechanismus zur Aggregation von Nachbarschaftsinformationen aus mehreren Ansichten; (2) der Verwendung der Resampling-Methode zur Aggregation verschiedener Kategorien Nachbarschaftsinformationen; (3) Entwerfen Sie zusätzliche Verlustfunktionen, um das Training von graphischen neuronalen Netzen usw. zu unterstützen. Diese Methoden entwerfen hauptsächlich graphische neuronale Netze, um Anomalien aus der Perspektive des räumlichen Bereichs zu behandeln, aber niemand hat dieses Problem aus der Perspektive des Spektralbereichs betrachtet. Es stellt sich heraus, dass die Wahl verschiedener Spektralfilter die Ausdrucksfähigkeit des graphischen neuronalen Netzwerks beeinflusst und somit zu Leistungsunterschieden führt.
Ein neuer Ansatz: Graphanomalieerkennung aus der Perspektive des Spektralbereichs
Um die Lücken in der bestehenden Forschung zu schließen, möchte dieser Artikel diese Frage beantworten: Wie kann ein Spektralfilter für graphische neuronale Netze zur Anomalieerkennung angepasst werden?
In diesem Artikel wird zum ersten Mal versucht, die abnormalen Daten im Diagramm aus der Perspektive des
Spektralbereichszu analysieren, und es wird festgestellt, dass: abnormale Daten dazu führen, dass sich die Spektrumsenergie „nach rechts verschiebt“, d. h. die Energie beträgt weniger konzentriert auf niedrige Frequenzen und stärker auf hohe Frequenzen. Um dieses Rechtsverschiebungsphänomen zu visualisieren, erstellten die Forscher zunächst zufällig ein Barabási-Albert-Diagramm (BA-Diagramm) mit 500 Knoten und gingen davon aus, dass die Attribute normaler Knoten und abnormaler Knoten im Diagramm zwei verschiedenen Gaußschen Verteilungen folgen. wobei die Varianz abnormaler Knoten größer ist.
Der obere Teil des Bildes zeigt die Verteilung von Daten mit unterschiedlichen Graden von Anomalien auf dem BA-Diagramm, während der untere Teil die entsprechende spektrale Energieverteilung zeigt. Unter diesen stellt das Histogramm den Energieanteil des entsprechenden Spektrumintervalls dar, und das Liniendiagramm stellt den kumulativen Anteil der Frequenzdomänenenergie von Null bis zu diesem Punkt dar.
Wie aus der obigen Abbildung ersichtlich ist, konzentriert sich die meiste Energie im Niederfrequenzteil (λ
In realen Szenarien folgen abnormale Daten normalerweise einer komplexeren Verteilung. Anhand von vier groß angelegten Datensätzen zur Erkennung von Graphanomalien bestätigten die Forscher auch die Existenz des Phänomens der „Rechtsverschiebung“. Der Amazon-Datensatz zur Erkennung abnormaler Benutzer in der folgenden Abbildung ist ein Beispiel. Wenn ein Teil der abnormalen Knoten in den Daten gelöscht wird, erhöht sich die niederfrequente Energie im Spektrum erheblich, während die hochfrequente Energie entsprechend abnimmt. Wenn die gleiche Anzahl zufälliger Knoten gelöscht wird, ändert sich die Energieverteilung des Spektrums kaum. Dies bestätigt weiter, dass abnormale Daten der Schlüssel zur „richtigen Verschiebung“ der Spektrumsenergie sind.
Abbildung 3: Die Auswirkung des Löschens verschiedener Knoten auf die Spektrumenergieverteilung auf den Amazon-Datensatz zur Erkennung abnormaler Benutzer: Originalbild (The Original), Löschen zufälliger Knoten (Drop-Random), Löschen abnormaler Knoten (Drop -Anomalie)
Ein neues Tool zur Erkennung von Graphanomalien: Beta-Wavelet-Graph-Neuronales Netzwerk
Die Analyse im vorherigen Abschnitt zeigt, dass wir bei der Erkennung von Graphanomalien auf den Effekt der „Rechtsverschiebung“ achten müssen. Beispielsweise stehen im obigen Amazon-Datensatz die Spektrumsinformationen in der Nähe des Eigenwerts λ=1 in engem Zusammenhang mit abnormalen Daten. Um abnormale Informationen besser erfassen zu können, muss das graphische neuronale Netzwerk über die Eigenschaften eines Bandpassfilters verfügen, der nur Signale in der Nähe von λ=1 zurückhält und die übrigen Signale filtert.
Leider handelt es sich bei den meisten vorhandenen graphischen neuronalen Netzen um Tiefpassfilter oder adaptive Filter, die keine Bandpasseigenschaften garantieren können. Obwohl der adaptive Filter in der Lage ist, sich jeder Funktion anzupassen, kann er bei der Anomalieerkennung auch zu einem Tiefpassfilter degenerieren. Dies liegt daran, dass im gesamten Datensatz die Hochfrequenzinformationen, die den abnormalen Daten entsprechen, einen relativ geringen Anteil ausmachen, während der größte Teil der Spektrumsenergie immer noch in niedrigen Frequenzen konzentriert ist.
Um die durch abnormale Daten verursachte „Rechtsverschiebung“ besser bewältigen zu können, haben Forscher eine neue Methode zur Erkennung von Graphanomalien vorgeschlagen – Beta Wavelet Graph Neural Network (BWGNN). Indem sie sich auf Hammonds Graph-Wavelet-Theorie stützten, entwarfen sie einen neuen Wavelet-Kernel, der auf der Beta-Funktion als Spektralfilter für das graphische neuronale Netzwerk basiert.
Im Vergleich zur häufig verwendeten Wärmekernfunktion erfüllt die Beta-Funktion als Wavelet-Kernel nicht nur die Anforderungen eines Bandpassfilters, sondern weist auch eine bessere Lokalität im Frequenzbereich und in der räumlichen Domäne auf. Die folgende Abbildung vergleicht den Unterschied zwischen Thermokernel-Wavelet und Beta-Kernel-Wavelet.
Abbildung 4: Vergleich von thermischem Kernel-Wavelet und Beta-Kernel-Wavelet im Spektralbereich (links) und im räumlichen Bereich (rechts). Die Beta-Funktion weist bessere Bandpass- und lokale Eigenschaften auf.
Dieser Artikel überprüft die Leistung von BWGNN anhand von vier großen Datensätzen zur Erkennung von Diagrammanomalien. Unter anderem wird der Yelp-Datensatz verwendet, um abnormale Kommentare auf Dianping-Websites zu erkennen, der Amazon-Datensatz wird verwendet, um abnormale Benutzer auf E-Commerce-Plattformen zu erkennen, der T-Finance-Datensatz wird verwendet, um abnormale Benutzer in Transaktionsnetzwerken zu erkennen Der T-Social-Datensatz wird verwendet, um abnormale Benutzer in sozialen Netzwerken zu erkennen, darunter bis zu fünf Millionen Knoten und 70 Millionen Kanten.
Wie aus der folgenden Tabelle ersichtlich ist, hat BWGNN im Vergleich zu herkömmlichen Klassifizierungsmodellen, allgemeinen grafischen neuronalen Netzen und speziellen Modellen zur Erkennung von Diagrammanomalien in beiden Szenarien mit 40 % Trainingsdaten und 1 % Trainingsdaten (halbüberwacht) eine bessere Leistung erzielt ). Gute Ergebnisse. In Bezug auf die Betriebseffizienz liegt BWGNN nahe am Zeitverbrauch der meisten allgemeinen graphischen neuronalen Netze und ist effizienter als andere Modelle zur Erkennung von Graphanomalien.
Zusammenfassung
In diesem Artikel stellten Forscher fest, dass das Erscheinen abnormaler Knoten im Diagramm dazu führt, dass sich die Spektrumsenergie „nach rechts verschiebt“, was eine neue Perspektive für die Anomalieerkennung für strukturierte Daten bietet. Basierend auf dieser Erkenntnis schlägt dieser Artikel ein neues Tool zur Erkennung von Graphanomalien vor – das Beta Wavelet Graph Neural Network (BWGNN). Es erfasst die durch „Rechtsverschiebung“ erzeugten hochfrequenten Anomalieinformationen durch einen speziell entwickelten Bandpassfilter und erzielt optimale Ergebnisse bei mehreren Datensätzen.
In der tatsächlichen Implementierung ist die Erkennung von Graphanomalien normalerweise eine komplexe Systemtechnik, aber die Auswahl eines geeigneten graphischen neuronalen Netzwerks ist ein Schlüsselfaktor für die Systemleistung. Das von den Forschern vorgeschlagene BWGNN hat ein optimiertes Design, eine geringe Komplexität und ist leicht zu ersetzen. Es ist eine neue Wahl für graphische neuronale Netze.
Das obige ist der detaillierte Inhalt vonAnomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



DDREASE ist ein Tool zum Wiederherstellen von Daten von Datei- oder Blockgeräten wie Festplatten, SSDs, RAM-Disks, CDs, DVDs und USB-Speichergeräten. Es kopiert Daten von einem Blockgerät auf ein anderes, wobei beschädigte Blöcke zurückbleiben und nur gute Blöcke verschoben werden. ddreasue ist ein leistungsstarkes Wiederherstellungstool, das vollständig automatisiert ist, da es während der Wiederherstellungsvorgänge keine Unterbrechungen erfordert. Darüber hinaus kann es dank der ddasue-Map-Datei jederzeit gestoppt und fortgesetzt werden. Weitere wichtige Funktionen von DDREASE sind: Es überschreibt die wiederhergestellten Daten nicht, füllt aber die Lücken im Falle einer iterativen Wiederherstellung. Es kann jedoch gekürzt werden, wenn das Tool explizit dazu aufgefordert wird. Stellen Sie Daten aus mehreren Dateien oder Blöcken in einer einzigen wieder her

0.Was bewirkt dieser Artikel? Wir schlagen DepthFM vor: ein vielseitiges und schnelles generatives monokulares Tiefenschätzungsmodell auf dem neuesten Stand der Technik. Zusätzlich zu herkömmlichen Tiefenschätzungsaufgaben demonstriert DepthFM auch hochmoderne Fähigkeiten bei nachgelagerten Aufgaben wie dem Tiefen-Inpainting. DepthFM ist effizient und kann Tiefenkarten innerhalb weniger Inferenzschritte synthetisieren. Lassen Sie uns diese Arbeit gemeinsam lesen ~ 1. Titel der Papierinformationen: DepthFM: FastMonocularDepthEstimationwithFlowMatching Autor: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Wenn Sie wissen müssen, wie Sie die Filterung mit mehreren Kriterien in Excel verwenden, führt Sie das folgende Tutorial durch die Schritte, um sicherzustellen, dass Sie Ihre Daten effektiv filtern und sortieren können. Die Filterfunktion von Excel ist sehr leistungsstark und kann Ihnen dabei helfen, aus großen Datenmengen die benötigten Informationen zu extrahieren. Diese Funktion kann Daten entsprechend den von Ihnen festgelegten Bedingungen filtern und nur die Teile anzeigen, die die Bedingungen erfüllen, wodurch die Datenverwaltung effizienter wird. Mithilfe der Filterfunktion können Sie Zieldaten schnell finden und so Zeit beim Suchen und Organisieren von Daten sparen. Diese Funktion kann nicht nur auf einfache Datenlisten angewendet werden, sondern auch nach mehreren Bedingungen gefiltert werden, um Ihnen dabei zu helfen, die benötigten Informationen genauer zu finden. Insgesamt ist die Filterfunktion von Excel sehr praktisch

Die von Google geförderte Leistung von JAX hat in jüngsten Benchmark-Tests die von Pytorch und TensorFlow übertroffen und belegt bei 7 Indikatoren den ersten Platz. Und der Test wurde nicht auf der TPU mit der besten JAX-Leistung durchgeführt. Obwohl unter Entwicklern Pytorch immer noch beliebter ist als Tensorflow. Aber in Zukunft werden möglicherweise mehr große Modelle auf Basis der JAX-Plattform trainiert und ausgeführt. Modelle Kürzlich hat das Keras-Team drei Backends (TensorFlow, JAX, PyTorch) mit der nativen PyTorch-Implementierung und Keras2 mit TensorFlow verglichen. Zunächst wählen sie eine Reihe von Mainstream-Inhalten aus

Stehen Sie vor einer Verzögerung oder einer langsamen mobilen Datenverbindung auf dem iPhone? Normalerweise hängt die Stärke des Mobilfunk-Internets auf Ihrem Telefon von mehreren Faktoren ab, wie z. B. der Region, dem Mobilfunknetztyp, dem Roaming-Typ usw. Es gibt einige Dinge, die Sie tun können, um eine schnellere und zuverlässigere Mobilfunk-Internetverbindung zu erhalten. Fix 1 – Neustart des iPhone erzwingen Manchmal werden durch einen erzwungenen Neustart Ihres Geräts viele Dinge zurückgesetzt, einschließlich der Mobilfunkverbindung. Schritt 1 – Drücken Sie einfach einmal die Lauter-Taste und lassen Sie sie los. Drücken Sie anschließend die Leiser-Taste und lassen Sie sie wieder los. Schritt 2 – Der nächste Teil des Prozesses besteht darin, die Taste auf der rechten Seite gedrückt zu halten. Lassen Sie das iPhone den Neustart abschließen. Aktivieren Sie Mobilfunkdaten und überprüfen Sie die Netzwerkgeschwindigkeit. Überprüfen Sie es erneut. Fix 2 – Datenmodus ändern 5G bietet zwar bessere Netzwerkgeschwindigkeiten, funktioniert jedoch besser, wenn das Signal schwächer ist

Ich weine zu Tode. Die Daten im Internet reichen überhaupt nicht aus. Das Trainingsmodell sieht aus wie „Die Tribute von Panem“, und KI-Forscher auf der ganzen Welt machen sich Gedanken darüber, wie sie diese datenhungrigen Esser ernähren sollen. Dieses Problem tritt insbesondere bei multimodalen Aufgaben auf. Zu einer Zeit, als sie ratlos waren, nutzte ein Start-up-Team der Abteilung der Renmin-Universität von China sein eigenes neues Modell, um als erstes in China einen „modellgenerierten Datenfeed selbst“ in die Realität umzusetzen. Darüber hinaus handelt es sich um einen zweigleisigen Ansatz auf der Verständnisseite und der Generierungsseite. Beide Seiten können hochwertige, multimodale neue Daten generieren und Datenrückmeldungen an das Modell selbst liefern. Was ist ein Modell? Awaker 1.0, ein großes multimodales Modell, das gerade im Zhongguancun-Forum erschienen ist. Wer ist das Team? Sophon-Motor. Gegründet von Gao Yizhao, einem Doktoranden an der Hillhouse School of Artificial Intelligence der Renmin University.

Kürzlich wurde die Militärwelt von der Nachricht überwältigt: US-Militärkampfflugzeuge können jetzt mithilfe von KI vollautomatische Luftkämpfe absolvieren. Ja, erst kürzlich wurde der KI-Kampfjet des US-Militärs zum ersten Mal der Öffentlichkeit zugänglich gemacht und sein Geheimnis gelüftet. Der vollständige Name dieses Jägers lautet „Variable Stability Simulator Test Aircraft“ (VISTA). Er wurde vom Minister der US-Luftwaffe persönlich geflogen, um einen Eins-gegen-eins-Luftkampf zu simulieren. Am 2. Mai startete US-Luftwaffenminister Frank Kendall mit einer X-62AVISTA auf der Edwards Air Force Base. Beachten Sie, dass während des einstündigen Fluges alle Flugaktionen autonom von der KI durchgeführt wurden! Kendall sagte: „In den letzten Jahrzehnten haben wir über das unbegrenzte Potenzial des autonomen Luft-Luft-Kampfes nachgedacht, aber es schien immer unerreichbar.“ Nun jedoch,

Diese Woche gab FigureAI, ein Robotikunternehmen, an dem OpenAI, Microsoft, Bezos und Nvidia beteiligt sind, bekannt, dass es fast 700 Millionen US-Dollar an Finanzmitteln erhalten hat und plant, im nächsten Jahr einen humanoiden Roboter zu entwickeln, der selbstständig gehen kann. Und Teslas Optimus Prime hat immer wieder gute Nachrichten erhalten. Niemand zweifelt daran, dass dieses Jahr das Jahr sein wird, in dem humanoide Roboter explodieren. SanctuaryAI, ein in Kanada ansässiges Robotikunternehmen, hat kürzlich einen neuen humanoiden Roboter auf den Markt gebracht: Phoenix. Beamte behaupten, dass es viele Aufgaben autonom und mit der gleichen Geschwindigkeit wie Menschen erledigen kann. Pheonix, der weltweit erste Roboter, der Aufgaben autonom in menschlicher Geschwindigkeit erledigen kann, kann jedes Objekt sanft greifen, bewegen und elegant auf der linken und rechten Seite platzieren. Es kann Objekte autonom identifizieren
