採用詞法分析擷取網域名稱和IP-安全-PHP中文網

首頁

運維

安全

採用詞法分析擷取網域名稱和IP

王林

Dec 25, 2019 pm 01:08 PM

ip 網域提取詞法分析

採用詞法分析擷取網域名稱和IP

背景

在分析日誌的時候發現有些日誌中參數包含其他的URL，例如：

採用詞法分析擷取網域名稱和IP

提取請求參數中的URL(xss.ha.ckers.org)，再對比威脅情報資料庫，如果命中黑名單直接標黑。如果不在黑名單，也不在公司的白名單裡可以先做個標記，後續著重分析。

提取URL

關於URL的提取網路上有很多文章，大部分都是使用正規表示式，方法簡單但是不太準確。我在這裡提供一個方法：採用詞法分析，提取網域和IP。想法借鑒了這篇文章：https://blog.csdn.net/breaksoftware/article/details/7009209，有興趣的可以去看看，事實證明跟著大神確實漲姿勢。

原文是用C 版本，這裡我用Python寫了一個類似的，供大家參考。

常見的URL分類

採用詞法分析擷取網域名稱和IP

觀察可以見得：IP形式的URL結構最為簡單：4個小於255的數字被.分割；domain形式比較複雜，但是它們有共通點：都具有頂級域名.com。

定義合法字元：

採用詞法分析擷取網域名稱和IP

頂級網域清單：

採用詞法分析擷取網域名稱和IP

網域形式擷取：如www.baidu.com。

採用詞法分析擷取網域名稱和IP

IP形式擷取：如192.168.1.1。

採用詞法分析擷取網域名稱和IP

while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v1 = True
                reti = i            if i < len(z) and z[i] == &#39;.&#39;:
                i = i + 1
                reti = i            else:
                tokenType = TK_OTHER
                reti = 1while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v2 = True
            if i < len(z) and z[i] == &#39;.&#39;:
                i = i + 1
            else:                if tokenType != TK_DOMAIN:
                    tokenType = TK_OTHER
                    reti = 1while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v3 = True
            if i < len(z) and z[i] == &#39;.&#39;:
                i = i + 1
            else:                if tokenType != TK_DOMAIN:
                    tokenType = TK_OTHER
                    reti = 1while (i < len(z) and z[i].isdigit()):
                i = i + 1
                ip_v4 = True

            if i < len(z) and z[i] == &#39;:&#39;:
                i = i + 1
            while (i < len(z) and z[i].isdigit()):
                i = i + 1

            if ip_v1 and ip_v2 and ip_v3 and ip_v4:                
                self.urls.append(z[0:i])                
                return reti, tokenType            
            else:                
                if tokenType != TK_DOMAIN:
                    tokenType = TK_OTHER
                    reti = 1

登入後複製

混合形式擷取：如1234.com。
掃描前半部1234，符合IP形式的特徵，但是發現代碼會報異常，所以需要IP處理代碼段添加判斷:判斷後綴是否是頂級域名：

採用詞法分析擷取網域名稱和IP

結果測試

測試資料：

採用詞法分析擷取網域名稱和IP

運行結果：

採用詞法分析擷取網域名稱和IP

##這只是初步的版本，如果有BUG歡迎大家指正。

結束語

以前只顧著悶著頭的寫程式碼，忽略了事後的思考和總結。現在試著改變一下，一邊工作，一邊提煉和總結，遇到感覺不錯的，嘗試寫成工具開源出來，與大家共勉。

程式碼傳送門：

https://github.com/skskevin/UrlDetect/blob/master/tool/domainExtract/domainExtract.py

#相關文章教學推薦：

web伺服器安全性

以上是採用詞法分析擷取網域名稱和IP的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7798

Java教學

1644

CakePHP 教程

1402

Laravel 教程

1299

PHP教程

1234

Related knowledge

網站怎麼透過nginx設定黑/白名單IP限制及國家城市IP存取限制 Jun 01, 2023 pm 05:27 PM

一、黑/白名單IP限制存取配置nginx配置黑白名單有好幾種方式，這裡只介紹常用的兩種方法。 1.第一種方法：allow、denydeny和allow指令屬於ngx_http_access_module，nginx預設載入此模組，所以可直接使用。這種方式，最簡單，最直接。設定類似防火牆iptable，使用方法：直接設定檔中新增：#白名單設置，allow後面為可存取IPlocation/{allow123.13.123.12;allow23.53.32.1/100;denyall;}#黑名單設置，

ip與mac綁定什麼意思 Mar 09, 2023 pm 04:44 PM

ip與mac綁定是指將特定的IP位址與特定的MAC位址關聯起來，使得只有使用該MAC位址的設備才能夠使用該IP位址進行網路通訊。 ip與mac綁定可以防止被綁定的主機的IP位址不被假冒，前提條件：1、MAC位址是唯一的，且不可假冒；只能綁定與路由器直接相連的網路上的主機（也就是主機的網關在路由器上）。

請求的控制項無效 NET HELPMSG 2191：2 個簡單修復 Apr 15, 2023 am 09:13 AM

在TCP/IP協定套件中，網域名稱系統是提供電腦名稱到IP位址對映名稱解析服務的協定之一。但是，有時它會發生故障，從而導致錯誤，例如請求的控制權對此服務NETHELPMSG2191無效。 DNS用戶端和伺服器協同工作，為電腦和使用者提供電腦名稱到IP位址對映名稱解析服務。安裝Windows後，客戶端和伺服器版本的作業系統預設啟用客戶端服務。一旦您在TCP/IP網路配置中指定了伺服器的IP位址，DNS用戶端就會查詢伺服器以發現網域控制站並將電腦名稱解析為IP位址。只有在服務

nginx如何設定目錄白名單和ip白名單 May 18, 2023 pm 03:52 PM

1.設定目錄白名單：對指定請求路徑不設定限制，如對請求路徑為api目錄下的請求不做限制，則可寫為server{location/app{proxy_passhttp://192.168.1.111:8095/app ;limit_connconn20;limit_rate500k;limit_reqzone=fooburst=5nodelay;}location/app/api{proxy_passhttp://192.168.1.111:8095/app/api}}#因比率

微信怎麼查看ip位址 May 31, 2023 am 09:16 AM

微信查看ip位址的方法：1、登入電腦版微信，右鍵點選螢幕下方的工作欄，點選「工作管理員」；2、彈出工作管理員時，點選左下角的「詳細資料」；3、工作管理器進入“性能”選項，點擊“打開資源監視器”；4、選擇“網絡”，勾選微信進程“Wechat.exe”；5、點擊下面的“TCP連接”即可監視微信網絡IP相關情況，發送訊息得到回覆就會顯示他人的IP位址。

如何在iPhone上提取RAR文件 Jul 12, 2023 pm 07:53 PM

很多時候，非常大的文件很難在設備之間共享，尤其是智慧型手機等。因此，這些文件首先被存檔/壓縮成RAR文件，然後發送到另一個設備進行共用。但問題是RAR檔案不容易在iPhone上提取。要提取zip文件，只需輕點一下即可。沒有多少人知道在iPhone上提取RAR檔案的過程，對於初學者來說，這些步驟可能會令人困惑。可以使用iPhone上稱為快捷方式的預設應用程式來完成此操作。我們在這裡逐步解釋如何使用快捷方式應用程式在iPhone上提取任何RAR檔案。如何在iPhone上提取RAR檔案步驟1：首先，您

NGINX怎麼統計網站的PV、UV、獨立IP May 19, 2023 am 09:13 AM

概念：uv(uniquevisitor)：獨立訪客，將每台獨立上網電腦（以cookie為依據）視為一位訪客，一天之內（00:00-24:00），造訪您網站的訪客數量。一天之內相同cookie的訪問只被計算1次pv（pageview）：訪問量,即頁面瀏覽量或點擊量,用戶每次對網站的訪問均被記錄1次。用戶對同一頁面的多次訪問，訪問量值累計統計獨立ip：00:00-24:00內相同ip地址只被計算一次,做網站優化的朋友最關心這個先聲明下環境，此次運行的nginx版本1.7，後端tomcat運行的是動

wifi顯示無ip分配怎麼辦 Aug 30, 2023 am 11:58 AM

wifi顯示無ip分配的解決方案：1、重新啟動設備和路由器，關閉設備上的Wi-Fi連接，關閉設備，關閉路由器，等待幾分鐘，然後重新打開路由器鏈接wifi；2、檢查路由器設置，重啟DHCP，確保DHCP功能已啟用；3、重置網路設置，將刪除所有已儲存的WiFi網路和密碼，在執行此操作之前，請確保已備份；4、更新路由器韌體，登入路由器管理介面，查找韌體更新選項，並按照提示進行操作。

See all articles

採用詞法分析擷取網域名稱和IP

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題