Heim Computer-Tutorials Computerwissen Dragon Lizard System Operation and Maintenance Alliance: Wie Kindling-OriginX die Daten von DeepFlow integriert, um die Erklärung von Netzwerkfehlern zu verbessern

Dragon Lizard System Operation and Maintenance Alliance: Wie Kindling-OriginX die Daten von DeepFlow integriert, um die Erklärung von Netzwerkfehlern zu verbessern

Feb 22, 2024 pm 02:16 PM
网络 网络问题 deepflow Yunwei

龙蜥系统运维联盟:Kindling-OriginX 如何集成 DeepFlow 的数据增强网络故障的解释力

Anmerkung des Herausgebers: Im Jahr 2023 gründete die Dragon Lizard Community offiziell eine Allianz für Systembetrieb und -wartung, die aus der Akademie für Informations- und Kommunikationstechnologie, Alibaba Cloud, ZTE, der Fudan-Universität, der Tsinghua-Universität, der Zhejiang-Universität, Yunguan Qiuhao und Chengyun Digital besteht , Yunshan Network, wurde von 12 Einheiten mitgesponsert, darunter Inspur Information, Tongxin Software und China Unicom Software Institute. Dieser Artikel stammt von Yun Guan Qiu Hao und stellt Kindling-OriginX vor, ein Mitglied der System Operation and Maintenance Alliance, das durch die Kombination der vollständigen Netzwerkdatenfunktionen von DeepFlow automatisch interpretierbare Fehlerursachenberichte generiert.

DeepFlow ist ein Open-Source-Projekt, das die eBPF-Technologie nutzt, um eine hohe Beobachtbarkeit für komplexe Cloud-Infrastrukturen und Cloud-native Anwendungen bereitzustellen. Durch die eBPF-Technologie sammelt DeepFlow feine Link-Tracking-Daten sowie Netzwerk- und Anwendungsleistungsindikatoren mit vollständiger Linkabdeckung und umfassenden TCP-Leistungsindikatoren. Diese Funktionen bieten professionellen Benutzern und Netzwerkexperten leistungsstarke Unterstützung bei der Fehlerbehebung und Problemlokalisierung.

Kindling-OriginX ist ein Produkt zur Ableitung von Fehlerursachen. Ziel ist es, Benutzern einen interpretierbaren Fehlerursachenbericht bereitzustellen, der es Benutzern ermöglicht, die Grundursache des Fehlers direkt zu verstehen und den Argumentationsprozess der Grundursache zu überprüfen Genauigkeit der Grundursache. Es reicht nicht aus, den Benutzern einfach zu sagen, welches Netzwerksegment Probleme aufweist, um ihnen zu helfen, besser zu verstehen, welche Fehler im Netzwerk aufgetreten sind.

In diesem Artikel wird Kindling-OriginX vorgestellt, das die vollständigen Netzwerkdatenfunktionen von DeepFlow kombiniert, um automatisch interpretierbare Fehlerursachenberichte zu erstellen.

Soma-Chaos simuliert Netzwerkausfall

  • Fügen Sie einen 200 ms verzögerten Netzwerksimulationsfehler in den Sitzdienst ein.

  • Als nächstes verwenden wir zunächst DeepFlow, um 200-ms-Netzwerkausfälle zu identifizieren und entsprechende Maßnahmen zu ergreifen.

Manueller, vereinfachter Fehlerbehebungsprozess

Schritt 1: Verwenden Sie das Trace-System, um den Umfang einzugrenzen

Wenn in einer Microservice-Umgebung ein Leistungsproblem an einer Schnittstelle auftritt, besteht der erste Schritt darin, mithilfe des Tracking-Systems zu überprüfen, welcher Link die Langsamkeit verursacht, und die spezifische Leistung zu verstehen.

Mit dem Tracing-System können Benutzer bestimmte Traces genau lokalisieren. Nach der Analyse der Ablaufverfolgung wurde festgestellt, dass die Ausführungszeit des Sitzdienstes lang war und gleichzeitig ein langer Aufruf des Konfigurationsdienstes stattfand. In diesem Fall helfen verknüpfte Netzwerkindikatoren dabei, die Ursache des Netzwerkproblems zu ermitteln.

Schritt 2: Verwenden Sie das DeepFlow-Flammendiagramm, um zu bestimmen, in welchem ​​Netzwerksegment der Fehler auftritt

Geben Sie die Trace-ID des Fehlerrepräsentanten in DeepFlow in das Flammendiagramm ein, ermitteln Sie die Leistung von Trace auf Netzwerkebene und analysieren Sie dann das Flammendiagramm eingehend Die menschliche Analyse ergab, dass dieser Fehler beim Anrufer, dem Seat-Service, aufgetreten sein sollte und das Problem während des Zeitraums aufgetreten ist, in dem der Systemaufruf an die Netzwerkkarte gesendet wurde Das heißt, es gab ein Problem im Container-Netzwerkzeitraum (was mit der Fehlerinjektion übereinstimmt).

(Bild/DeepFlow-Netzwerkflammendiagramm)

Schritt 3: Bestimmen Sie, welche Netzwerkindikatoren im Containernetzwerk abnormal sind

Basierend auf der Erfahrung bei der Fehlerbehebung müssen Benutzer die Netzwerkindikatoren der Pods von Seat-Service und Config-Service überprüfen. Zu diesem Zeitpunkt muss der Benutzer zur Netzwerkanzeigeseite auf Pod-Ebene von DeepFlow springen. Auf dieser Seite können Benutzer eine Verzögerungsänderung von 200 ms beim Verbindungsaufbau und eine Änderung im RTT-Indikator anzeigen.

(Anzeigen zur Überwachung des Bild-/DeepFlow-Pod-Füllstands)

(Anzeigen zur Überwachung des Bild-/DeepFlow-Pod-Füllstands)

Schritt 4: Mögliche Störfaktoren beseitigen

Wenn die CPU und die Bandbreite des Hosts voll sind, kommt es erfahrungsgemäß auch im virtuellen Netzwerk zu Paketverlusten und Verzögerungen. Daher ist es erforderlich, die CPU- und Knotenebenenbandbreite des Knotens zu überprüfen, auf dem sich der Sitzdienst und der Konfigurationsdienst befinden Stellen Sie sicher, dass die Ressourcen auf Knotenebene nicht ausgelastet sind.

Bestätigen Sie mit dem Befehl k8s den Knoten, auf dem sich die beiden Pods befinden, und gehen Sie dann zur Knotenindikator-Überwachungsseite von DeepFlow, um die entsprechenden Indikatoren zu überprüfen. Es wurde festgestellt, dass die BPS, PPS und andere Indikatoren des Knotens innerhalb eines angemessenen Bereichs liegen Reichweite.

(Bilden/Suchen Sie den Knoten, auf dem sich der Pod befindet, mit dem Befehl k8s)

(Überwachungsindikatoren für Bild-/DeepFlow-Knotenebene (Client))

(Bild-/DeepFlow-Knoten-Überwachungsindikatoren (Server))

Da es keine offensichtliche Anomalie bei den Netzwerkindikatoren auf Knotenebene gab, wurde schließlich festgestellt, dass der RTT-Indikator des Sitzdienstes auf Pod-Ebene abnormal war.

Zusammenfassung der manuellen Fehlerbehebung

Nach einer Reihe von Fehlerbehebungsprozessen kann der Endbenutzer das Problem beheben, es werden jedoch folgende Anforderungen an den Benutzer gestellt:

  • Sehr umfangreiches Netzwerkwissen

  • Umfassendes Verständnis des Netzwerk-Flammendiagramms

  • Kompetenter Umgang mit relevanten Werkzeugen

Wie Kindling-OriginX DeepFlow-Metriken kombiniert, um erklärbare Fehlerberichte zu erstellen

Kindling-OriginX Basierend auf unterschiedlichen Benutzerbedürfnissen und Nutzungsszenarien verarbeitet und präsentiert Kindling-OriginX DeepFlow-Daten.

In Analogie zum manuellen, vereinfachten Fehlerbehebungsprozess ist der Fehlerbehebungsprozess mit Kindling-OriginX wie folgt:

Analysieren Sie automatisch jede Spur

Angesichts des Fehlers zu diesem Zeitpunkt wird jeder Trace automatisch analysiert und die aufgelisteten Traces werden nach Fehlerknoten gruppiert. Reiseservice wird durch kaskadierende Fehler verursacht. Dieser Artikel konzentriert sich nicht auf kaskadierende Fehler. Wenn Sie interessiert sind, können Sie sich auf den Umgang mit kaskadierenden Fehlern bei Microservices beziehen.

Überprüfen Sie den Fehlerstammbericht, bei dem der Fehlerknoten Sitz-Service ist

Schlussfolgerung zur Fehlerursache:

Für die Unteranforderung 10.244.1.254:50332->10.244.5.79:15679 RTT-Indikator gibt es eine Verzögerung von etwa 200 ms.

Fehlerbegründung und -überprüfung

Da Kindling-OriginX festgestellt hat, dass es ein Problem mit dem Netzwerk gibt, bei dem Seat-Service Config-Service aufruft, muss es dem Benutzer nicht alle Daten des DeepFlow-Flammendiagramms vollständig präsentieren. Es muss lediglich eine Verbindung mit DeepFlow hergestellt werden Holen Sie sich nur den Sitzdienst, um die Konfiguration aufzurufen. Die Daten, die sich auf den Netzwerkaufruf des Dienstes beziehen, reichen aus.

Unter Verwendung des DeepFlow-Sitzdienstes zum Aufrufen von Konfigurationsdienstdaten wurde automatisch analysiert, dass das Containernetzwerk des Client-Pods eine Verzögerung von 201 ms aufwies.

Kindling-OriginX simuliert Expertenanalyseerfahrungen und korreliert die Neuübertragungsindikatoren und RTT-Indikatoren von DeepFlow weiter, um zu bestimmen, was die Verzögerung beim Aufruf des Konfigurationsdienstes durch den Sitzdienst verursacht.

Kindling-OriginX integriert außerdem die CPU-Auslastung und Bandbreitenindikatoren des Knotens, um Störfaktoren zu beseitigen.

Kindling-OriginX vervollständigt die gesamte Fehlerbegründung in einem einseitigen Bericht, und jede Datenquelle ist vertrauenswürdig und überprüfbar.

Zusammenfassung

Kindling-OriginX und DeepFlow nutzen beide die eBPF-Technologie und sind bestrebt, flexible und effiziente Lösungen für Benutzer mit unterschiedlichen Anforderungen in unterschiedlichen Szenarien bereitzustellen. Wir freuen uns auch darauf, in Zukunft weitere inländische Produkte mit ergänzenden Funktionen zu sehen.

DeepFlow kann sehr vollständige Basisdaten des Full-Link-Netzwerks bereitstellen, wodurch Cloud-native Anwendungen umfassend beobachtbar werden und ist sehr nützlich für die Fehlerbehebung bei Netzwerkproblemen.

Kindling-OriginX verwendet eBPF, um North Star-Indikatoren zur Fehlerbehebung, KI-Algorithmen und Expertenerfahrungen zu sammeln, um eine Fehlerbeurteilungs-Engine zu erstellen, die Benutzern interpretierbare Ursachenberichte liefert.

—— Ende ——

Das obige ist der detaillierte Inhalt vonDragon Lizard System Operation and Maintenance Alliance: Wie Kindling-OriginX die Daten von DeepFlow integriert, um die Erklärung von Netzwerkfehlern zu verbessern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Chat -Befehle und wie man sie benutzt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Warum kann ich mich nicht bei der Bitget Wallet-Börse registrieren? Warum kann ich mich nicht bei der Bitget Wallet-Börse registrieren? Sep 06, 2024 pm 03:34 PM

Es gibt verschiedene Gründe dafür, dass Sie sich nicht für die BitgetWallet-Börse registrieren können, darunter Kontobeschränkungen, nicht unterstützte Regionen, Netzwerkprobleme, Systemwartung und technische Ausfälle. Um sich für die BitgetWallet-Börse zu registrieren, besuchen Sie bitte die offizielle Website, geben Sie die Informationen ein, stimmen Sie den Bedingungen zu, schließen Sie die Registrierung ab und bestätigen Sie Ihre Identität.

Was tun, wenn bei Eureka Exchange ein Netzwerkfehler auftritt? Was tun, wenn bei Eureka Exchange ein Netzwerkfehler auftritt? Jul 17, 2024 pm 04:25 PM

Wenn ein Fehler im Netzwerk der EEX-Börse auftritt, können Sie ihn mit den folgenden Schritten beheben: Überprüfen Sie Ihre Internetverbindung. Browser-Cache leeren. Versuchen Sie es mit einem anderen Browser. Deaktivieren Sie Browser-Plugins. Kontaktieren Sie den Ouyi-Kundendienst.

Warum kann ich mich nicht auf der offiziellen Website von MEXC (Matcha) anmelden? Warum kann ich mich nicht auf der offiziellen Website von MEXC (Matcha) anmelden? Dec 07, 2024 am 10:50 AM

Der Grund dafür, dass Sie sich nicht auf der MEXC (Matcha)-Website anmelden können, können Netzwerkprobleme, Website-Wartung, Browserprobleme, Kontoprobleme oder andere Gründe sein. Zu den Lösungsschritten gehören die Überprüfung Ihrer Netzwerkverbindung, die Überprüfung von Website-Ankündigungen, die Aktualisierung Ihres Browsers, die Überprüfung Ihrer Anmeldeinformationen und die Kontaktaufnahme mit dem Kundendienst.

Beim Anmelden mit okx kann kein Bestätigungscode empfangen werden Beim Anmelden mit okx kann kein Bestätigungscode empfangen werden Jul 23, 2024 pm 10:43 PM

Zu den Gründen, warum Sie den Bestätigungscode beim Anmelden bei OKX nicht erhalten können, gehören: Netzwerkprobleme, Probleme mit den Mobiltelefoneinstellungen, Unterbrechung des SMS-Dienstes, ausgelasteter Server und Einschränkungen bei der Anforderung von Bestätigungscodes. Die Lösungen lauten: Warten Sie mit einem erneuten Versuch, wechseln Sie das Netzwerk und wenden Sie sich an den Kundendienst.

Beim Anmelden bei Ouyiokex kann kein Bestätigungscode empfangen werden Beim Anmelden bei Ouyiokex kann kein Bestätigungscode empfangen werden Jul 25, 2024 pm 02:43 PM

Gründe und Lösungen für den fehlgeschlagenen Erhalt des OKEx-Login-Bestätigungscodes: 1. Netzwerkprobleme: Überprüfen Sie die Netzwerkverbindung oder wechseln Sie das Netzwerk. 2. Mobiltelefoneinstellungen: Aktivieren Sie den SMS-Empfang oder setzen Sie OKEx auf die Whitelist. Einschränkungen: Versuchen Sie es später noch einmal 4. Serverüberlastung: Versuchen Sie es später erneut oder verwenden Sie in Spitzenzeiten andere Anmeldemethoden. 5. Kontosperre: Wenden Sie sich zur Lösung an den Kundendienst. Andere Methoden: 1. Sprachbestätigungscode; 2. Bestätigungscode-Plattform eines Drittanbieters; 3. Wenden Sie sich an den Kundendienst.

Warum kann ich mich nicht auf der offiziellen Website von gate.io anmelden? Warum kann ich mich nicht auf der offiziellen Website von gate.io anmelden? Aug 19, 2024 pm 04:58 PM

Zu den Gründen, warum Gate.io sich nicht auf seiner offiziellen Website anmelden kann, gehören: Netzwerkprobleme, Website-Wartung, Browserprobleme, Sicherheitseinstellungen usw. Die Lösungen sind: Überprüfen Sie die Netzwerkverbindung, warten Sie, bis die Wartung beendet ist, leeren Sie den Browser-Cache, deaktivieren Sie Plug-Ins, überprüfen Sie die Sicherheitseinstellungen und wenden Sie sich an den Kundendienst.

Warum kann ich mich nicht auf der offiziellen Website von Huobi anmelden? Warum kann ich mich nicht auf der offiziellen Website von Huobi anmelden? Aug 12, 2024 pm 04:09 PM

Zu den Gründen dafür, dass Sie sich nicht auf der offiziellen Huobi-Website anmelden können, gehören: Überprüfen der Netzwerkverbindung und Löschen des Browser-Cache. Die Website wird möglicherweise gewartet oder aktualisiert. Aufgrund von Sicherheitsproblemen (z. B. blockierte IP-Adresse oder eingefrorenes Konto). Die eingegebene Website-Adresse ist falsch. Möglicherweise in Ihrer Region eingeschränkt. Andere technische Probleme.

Wie löste ich das Problem des Fehlers 'Undefined Array Key '' 'Fehler beim Aufrufen von Alipay EasysDK mithilfe von PHP? Wie löste ich das Problem des Fehlers 'Undefined Array Key '' 'Fehler beim Aufrufen von Alipay EasysDK mithilfe von PHP? Mar 31, 2025 pm 11:51 PM

Problembeschreibung beim Aufrufen von Alipay EasysDK mithilfe von PHP nach dem Ausfüllen der Parameter gemäß dem offiziellen Code wurde während des Betriebs eine Fehlermeldung gemeldet: "undefiniert ...

See all articles