Heim Betrieb und Instandhaltung Sicherheit Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Dec 25, 2019 pm 01:08 PM
ip 域名 提取 词法分析

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Hintergrund

Bei der Analyse der Protokolle habe ich festgestellt, dass einige Protokollparameter andere URLs enthielten, zum Beispiel:

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Extrahieren Sie die URL (xss.ha.ckers.org) in den Anforderungsparametern und vergleichen Sie sie dann mit der Threat Intelligence-Datenbank. Wenn sie auf die schwarze Liste gelangt, wird sie auf die schwarze Liste gesetzt. Wenn es nicht auf der Blacklist oder Whitelist des Unternehmens steht, können Sie es zuerst markieren und sich später auf die Analyse konzentrieren.

URL extrahieren

Im Internet gibt es viele Artikel zum Thema URL-Extraktion, von denen die meisten reguläre Ausdrücke verwenden. Die Methode ist einfach, aber nicht sehr genau. Ich stelle hier eine Methode zur Verfügung: Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren. Die Idee ist diesem Artikel entlehnt: https://blog.csdn.net/breaksoftware/article/details/7009209 Wenn Sie interessiert sind, können Sie es sich anhand der Fakten ansehen verbessert wirklich Ihre Körperhaltung.

Der Originaltext ist in C++-Version. Hier habe ich zu Ihrer Information einen ähnlichen Text in Python geschrieben.

Gemeinsame URL-Klassifizierungen

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Beobachtung zeigt, dass die URL-Struktur in IP-Form am einfachsten ist: 4 Zahlen kleiner als 255 werden durch . geteilt; Domain-Formularvergleich Komplex, aber eines haben sie gemeinsam: Sie alle tragen den Top-Level-Domainnamen .com.

Definieren Sie zulässige Zeichen:

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Liste der Top-Level-Domainnamen:

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Formular für Domainnamen Extraktion: wie www.baidu.com.

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

IP-Formularextraktion: wie 192.168.1.1.

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v1 = True
                reti = i            if i < len(z) and z[i] == &#39;.&#39;:
                i = i + 1
                reti = i            else:
                tokenType = TK_OTHER
                reti = 1while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v2 = True
            if i < len(z) and z[i] == &#39;.&#39;:
                i = i + 1
            else:                if tokenType != TK_DOMAIN:
                    tokenType = TK_OTHER
                    reti = 1while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v3 = True
            if i < len(z) and z[i] == &#39;.&#39;:
                i = i + 1
            else:                if tokenType != TK_DOMAIN:
                    tokenType = TK_OTHER
                    reti = 1while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v4 = True

            if i < len(z) and z[i] == &#39;:&#39;:
                i = i + 1
            while (i < len(z) and z[i].isdigit()):
                i = i + 1

            if ip_v1 and ip_v2 and ip_v3 and ip_v4:                
                self.urls.append(z[0:i])                
                return reti, tokenType            
            else:                
                if tokenType != TK_DOMAIN:
                    tokenType = TK_OTHER
                    reti = 1
Nach dem Login kopieren

Gemischte Formextraktion: wie 1234.com.
Scannen Sie die erste Hälfte von 1234, die den Merkmalen des IP-Formulars entspricht. Es wurde jedoch festgestellt, dass der Code eine Ausnahme meldet, sodass das IP-Verarbeitungscodesegment hinzugefügt werden muss, um festzustellen, ob das Suffix ist ​ein Top-Level-Domain-Name:

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Ergebnistest

Testdaten:

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Wird ausgeführt Ergebnis:

Verwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren

Dies ist nur eine vorläufige Version. Bitte korrigieren Sie mich, wenn es Fehler gibt.

Fazit

Früher habe ich Code einfach mit gesenktem Kopf geschrieben und die Überlegungen und die Zusammenfassung danach ignoriert. Jetzt versuche ich, etwas zu ändern und es zu verfeinern und zusammenzufassen.

Code-Portal:

https://github.com/skskevin/UrlDetect/blob/master/tool/domainExtract/domainExtract.py

Empfohlene verwandte Artikel und Tutorials: Webserver-Sicherheit

Das obige ist der detaillierte Inhalt vonVerwenden Sie die lexikalische Analyse, um Domänennamen und IPs zu extrahieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie legen Websites über Nginx IP-Beschränkungen für die Black-/Whitelist sowie IP-Zugriffsbeschränkungen für Länder und Städte fest? Wie legen Websites über Nginx IP-Beschränkungen für die Black-/Whitelist sowie IP-Zugriffsbeschränkungen für Länder und Städte fest? Jun 01, 2023 pm 05:27 PM

1. Black/White-List-IP-Einschränkungskonfiguration Nginx bietet mehrere Möglichkeiten, Black- und White-Lists zu konfigurieren. Hier sind nur zwei häufig verwendete Methoden. 1. Die erste Methode: Die Anweisungen „allow“, „denydeny“ und „allow“ gehören zu ngx_http_access_module. Nginx lädt dieses Modul standardmäßig, sodass es direkt verwendet werden kann. Diese Methode ist die einfachste und direkteste. Die Einstellung ähnelt der Firewall iptable. Verwendung: Fügen Sie direkt zur Konfigurationsdatei hinzu: #Whitelist-Einstellungen, gefolgt von „Zulassen ist zugänglich“ IPlocation/{allow123.13.123.12;allow23.53.32.1/100;denyall;}# Blacklist-Einstellungen,

Was bedeutet das Binden von IP und Mac? Was bedeutet das Binden von IP und Mac? Mar 09, 2023 pm 04:44 PM

Unter IP- und Mac-Bindung versteht man die Zuordnung einer bestimmten IP-Adresse zu einer bestimmten MAC-Adresse, sodass nur das Gerät, das die MAC-Adresse verwendet, die IP-Adresse für die Netzwerkkommunikation verwenden kann. Durch das Binden von IP und Mac kann verhindert werden, dass die IP-Adresse des gebundenen Hosts gefälscht wird. Voraussetzungen: 1. Die MAC-Adresse ist eindeutig und kann nicht gefälscht werden. Sie kann nur an Hosts im Netzwerk gebunden werden, die direkt mit dem Router verbunden sind. Das Gateway des Hosts befindet sich auf dem Router.

Das angeforderte Steuerelement ist ungültig. NET HELPMSG 2191: 2 einfache Korrekturen Das angeforderte Steuerelement ist ungültig. NET HELPMSG 2191: 2 einfache Korrekturen Apr 15, 2023 am 09:13 AM

In der TCP/IP-Protokollsuite ist Domain Name System eines der Protokolle, das Namensauflösungsdienste für die Zuordnung von Computernamen zu IP-Adressen bereitstellt. Manchmal kommt es jedoch zu Fehlfunktionen, was zu Fehlern wie „Das angeforderte Steuerelement ist für diesen Dienst nicht gültig“ NETHELPMSG2191 führt. DNS-Clients und -Server arbeiten zusammen, um Namensauflösungsdienste für die Zuordnung von Computernamen zu IP-Adressen für Computer und Benutzer bereitzustellen. Nach der Installation von Windows ist der Client-Dienst in den Client- und Serverversionen des Betriebssystems standardmäßig aktiviert. Sobald Sie die IP-Adresse des Servers in Ihrer TCP/IP-Netzwerkkonfiguration angeben, fragt der DNS-Client den Server ab, um Domänencontroller zu erkennen und Computernamen in IP-Adressen aufzulösen. nur im Dienst

So überprüfen Sie die IP-Adresse auf WeChat So überprüfen Sie die IP-Adresse auf WeChat May 31, 2023 am 09:16 AM

So überprüfen Sie die IP-Adresse auf WeChat: 1. Melden Sie sich bei der Computerversion von WeChat an, klicken Sie mit der rechten Maustaste auf die Taskleiste am unteren Bildschirmrand und klicken Sie auf „Task-Manager“. 2. Wenn der Task-Manager angezeigt wird, klicken Sie auf „; Details“ in der unteren linken Ecke; 3. Aufgabenverwaltung Geben Sie die Option „Leistung“ des Browsers ein und klicken Sie auf „Ressourcenmonitor öffnen“; 4. Wählen Sie „Netzwerk“ und überprüfen Sie den WeChat-Prozess „Wechat.exe“; 5. Klicken Sie auf „ TCP-Verbindung“ unten, um die IP-bezogene Situation des WeChat-Netzwerks zu überwachen. Wenn Sie eine Nachricht senden und eine Antwort erhalten, wird die IP-Adresse der anderen Person angezeigt.

So legen Sie die Verzeichnis-Whitelist und die IP-Whitelist in Nginx fest So legen Sie die Verzeichnis-Whitelist und die IP-Whitelist in Nginx fest May 18, 2023 pm 03:52 PM

1. Legen Sie die Verzeichnis-Whitelist fest: Es gibt keine Einschränkung für den angegebenen Anforderungspfad. Wenn es keine Einschränkung für den Anforderungspfad zum API-Verzeichnis gibt, kann er als server{location/app{proxy_passhttp://192.168.1.111 geschrieben werden: 8095/app ;limit_connconn20;limit_rate500k;limit_reqzone=fooburst=5nodelay;}location/app/api{proxy_passhttp://192.168.1.111:8095/app/api}}#Weil Nginx der genauen Übereinstimmung Priorität einräumt

So extrahieren Sie RAR-Dateien auf dem iPhone So extrahieren Sie RAR-Dateien auf dem iPhone Jul 12, 2023 pm 07:53 PM

Oftmals ist es schwierig, sehr große Dateien zwischen Geräten, insbesondere Smartphones und dergleichen, zu teilen. Daher werden diese Dateien zunächst in RAR-Dateien archiviert/komprimiert und dann zur Freigabe an ein anderes Gerät gesendet. Das Problem ist jedoch, dass RAR-Dateien auf dem iPhone nicht einfach zu extrahieren sind. Um eine ZIP-Datei zu extrahieren, ist nur ein Fingertipp erforderlich. Nicht viele Menschen kennen den Prozess zum Extrahieren von RAR-Dateien auf dem iPhone und für Anfänger können die Schritte verwirrend sein. Dies kann über die Standard-Apps auf Ihrem iPhone namens Shortcuts erfolgen. Hier erklären wir Schritt für Schritt, wie Sie mit der Shortcuts-App eine beliebige RAR-Datei auf dem iPhone extrahieren. So extrahieren Sie RAR-Dateien auf dem iPhone Schritt 1: Zuerst Sie

Wie zählt NGINX PV, UV und unabhängige IP der Website? Wie zählt NGINX PV, UV und unabhängige IP der Website? May 19, 2023 am 09:13 AM

Konzept: uv (uniquevisitor): eindeutiger Besucher, jeder unabhängige mit dem Internet verbundene Computer (basierend auf Cookies) wird als Besucher betrachtet und die Anzahl der Besucher, die Ihre Website innerhalb eines Tages (00:00–24:00 Uhr) besuchen. Besuche desselben Cookies innerhalb eines Tages werden nur einmal gezählt. PV (Seitenaufruf): Besuche, also Seitenaufrufe oder Klicks, jeder Besuch der Website durch den Benutzer wird einmal erfasst. Wenn ein Benutzer dieselbe Seite mehrmals besucht, wird die Gesamtzahl der Besuche gezählt: Die gleiche IP-Adresse wird nur einmal zwischen 00:00 und 24:00 Uhr gezählt Ich gebe zunächst die Umgebung an, in der Nginx Version 1.7 ausgeführt wird. Das Backend Tomcat läuft dynamisch

Was soll ich tun, wenn mein WLAN keine IP-Zuweisung anzeigt? Was soll ich tun, wenn mein WLAN keine IP-Zuweisung anzeigt? Aug 30, 2023 am 11:58 AM

Lösung für WLAN, bei dem keine IP-Zuweisung angezeigt wird: 1. Starten Sie das Gerät und den Router neu, schalten Sie die WLAN-Verbindung auf dem Gerät aus, schalten Sie das Gerät aus, schalten Sie den Router aus, warten Sie einige Minuten und öffnen Sie dann den Router erneut, um eine Verbindung zum WLAN herzustellen 2. Überprüfen Sie die Router-Einstellungen und starten Sie DHCP neu. 3. Setzen Sie die Netzwerkeinstellungen zurück, wodurch alle gespeicherten WLAN-Netzwerke und Passwörter gelöscht werden. 4. Aktualisieren Sie Nachdem Sie die Router-Firmware installiert haben, melden Sie sich bei der Router-Verwaltungsschnittstelle an, suchen Sie nach den Optionen für die Firmware-Aktualisierung und befolgen Sie die Anweisungen.

See all articles