目錄
基本概念
p2p架構
DHT
#如何實現
KRPC Protocol
首頁 Java java教程 如何用java實作一個p2p種子搜尋的功能

如何用java實作一個p2p種子搜尋的功能

Apr 15, 2019 am 10:20 AM
java

本篇文章帶給大家的內容是關於如何用java實現一個p2p種子搜尋的功能,有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。

很多年前對p2p就有很大的興趣,不過都是停留在理論上,一直沒有機會去真正的實踐。最近把這個東西實現了一下,從剛開始入手到現在,我覺得有些東西可以分享。進入正題吧那就

基本概念

再講p2p之前,我想先講一下我們是如何進行下載檔的。我列舉一下幾種文件下載的方式

1.使用http協議下載,使用的最多的可能就是透過瀏覽器進行文件的下載。

2.使用ftp下載,ftp有兩種模式,一種是port(主動)模式,這種模式用戶端會在本地開啟一個端口N(>1023)建立ftp連接,然後發送給ftp伺服器N 1監聽埠用來資料傳輸,當有防火牆或客戶端被nat的情況下就無法下載。另外一種方式是被動模式(passive),這種模式ftp服務端除了21端口以外會開啟一個另外大於1023的端口,也就是說客戶端會主動發起ftp連接和數據傳輸連接,只要ftp伺服器開放了這個端口那就不會有問題。

上面兩種方式可以統稱為cs架構,這種架構下面,資源都集中在服務端,當資料量大到一定程度的時候就會出現問題。為了解決這個問題,我們可能會想到分散式去中心化,於是p2p應運而生,p2p即 peer to peer,這是一種對等架構,每個節點既是客服端又是服務端。

p2p架構

當把資源都儲存在每個節點上面的時候,我們可能會想,當我下載一個資源的時候,那我怎麼知道這個檔案在那些機器上面能下載呢?

早期的p2p架構中存在一個tracker的角色,這個tracker負責儲存檔案的元資料資訊。那麼現在檔案會保存在每個peer上面,然後透過tracker取得檔案資訊。

這種架構下面我們所有的文件都分佈式了,只是tracker會負責存儲所有文件的元數據信息,所以tracker只需要存儲少量數據,相對於存在文件會相對輕鬆很多了。

但是一旦出現tracker伺服器掛了或服務不可用那麼就會導致所有的檔案都無法下載,因為它還沒有完全的分散式,為了完全的去中心化,後面出來一種trackerless架構,

這時候不在存在tracker這個東西,所有的檔案包含檔案的元資料資訊都分散式儲存。

DHT

DHT(Distributed Hash Table)分散式雜湊表,它是用來取代tracker。實作dht的演算法很多,例如Kademlia演算法等等。
幾個概念:

1.nodeid 在dht網路中每個nodeid都是160bit

2.XOR 兩個節點之間的距離使用異或來計算

3.routting table路由表

這裡的話還是主要講實現所以原理這部分的話網上也有很多資料大家可以參考看看

#如何實現

實現種子搜尋分為兩步,第一步是爬蟲,用來爬取網上的種子信息,第二步是加入搜尋。

需要具備以下知識:種子,bittorrent dht 協議,bencoded

提到p2p不得不提種子,就是那種.torrent結果的那種文件,大家可能都是用過bt種子下載過文件,下載文件使用的是bittorrent協定。那麼要如何收集網路上面的種子呢?

bt種子包含的主要欄位:戳:https://segmentfault.com/a/1190000000681331

在dht中取得的種子叫trackerless torrent,沒有announce這個屬性,但會有nodes屬性來代替。官方建議不要router.bittorrent.com把這個加到種子裡面,不要加到路由表。

1.如何從dht中獲取種子

如果想要得到種子信息,那麼必須要對DHT Protocol深入了解,bep_0005描述了DHT Protocol

具體可以戳這裡http://www.bittorrent.org/beps/bep_0005.html

如何實作一個路由表:

路由表覆蓋了所有Node的id,從0到2的160次方。路由表可以由bucket組成,每個bucket都涵蓋了所有node的一部分。

剛開始一個路由表只有一個bucket,覆蓋了所有的nodeid。每個bucket,只能hold最多K個nodes,目前這個K值是8。如果bucket已經滿了,而且裡面的node都是好的,而且自身的nodeid不在這個bucket裡面,那麼就講原來的bucket分成兩個新的bucket,分別覆蓋0..2159和2159..2160

當一個bucket已經滿了的時候,新node很容易被丟棄,如果這裡面的node掉線了,那麼就會被replace。如果一個節點最近15分鐘都沒有ping過,那就對這個節點發起ping,如果沒有回傳response,那麼這個節點也會被replace。

每一個bucket應該有一個last changed屬性,用來表示這個bucket的活躍度。這幾種情況會更新這個字段:

1.bucket裡面的node被ping了並且有response

2.一個node加到了這個bucket裡面

3. bucket裡面的node被replace了

bucket在15分鐘內沒有更新這個字段的話,那麼就會隨機選取一個在該bucket範圍內的id,做find_node操作。

KRPC Protocol

dht網路中透過KRPC Protocol來傳遞訊息。

1.ping

ping查詢主要用來心跳檢查

2.find_node

查找一個節點,對方會從自己的路由表中查詢最近的N個節點返回,一般是8個

#3.get_peers

##根據infohash查找擁有該infohash的peer,如果查到返回peers,沒有查找到返回nodes

4.announce_peer

告訴其他的peers,自己也擁有infohash。

注意以上四個都會刷新路由表

#一開始路由表裡面沒有任何節點,所以需要從超級節點(例如

dht.transmissionbt.com等等)透過find_node請求來尋找並新增節點,返回的節點在進行find_node。

我自己實作的路由表稍微和上面描述的不太一樣。

dht網路中採用udp進行資料傳輸,所以我只用開啟一個upd埠不斷的發送find_node請求建立路由表,然後透過get_peers和announce_peer來取得種子的infohash。

當我們加入dht網路後,透過上面介紹的四個方法只能得到種子檔案的infohash,所以我們還需要透過infohash來下載種子,具體可以參考bep_009http:/ /www.bittorrent.org/beps/bep_0009.html

我們主要透過bep_009來取得種子的名字字段,取得了檔案名稱段就可以根據名字和infohash來建立索引提供搜尋。 (

這裡主要建立磁力鏈接,有了磁力鏈接就可以去迅雷,百度網盤等去下載資源啦

大部分磁力鏈接格式:magnet:?xt=urn: btih:infohash

上面介紹的方式是透過取得infohash來建立磁力鏈接,再藉助第三方軟體下載,當然也可以自己透過BitTorrent Protocol來下載,有興趣的可以自行研究。

好了,上面只是簡單的介紹了一些實現的步驟,很多細節和具體實現的話沒有提到,我自己的話,參考了一些github dht的項目,然後自己實現了一下具體地址如下:https://github.com/mistletoe9527/dht-spider

以上是如何用java實作一個p2p種子搜尋的功能的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Java 中的完美數 Java 中的完美數 Aug 30, 2024 pm 04:28 PM

Java 完美數指南。這裡我們討論定義,如何在 Java 中檢查完美數?

Java中的Weka Java中的Weka Aug 30, 2024 pm 04:28 PM

Java 版 Weka 指南。這裡我們透過範例討論簡介、如何使用 weka java、平台類型和優點。

Java 中的史密斯數 Java 中的史密斯數 Aug 30, 2024 pm 04:28 PM

Java 史密斯數指南。這裡我們討論定義,如何在Java中檢查史密斯號?帶有程式碼實現的範例。

Java Spring 面試題 Java Spring 面試題 Aug 30, 2024 pm 04:29 PM

在本文中,我們保留了最常被問到的 Java Spring 面試問題及其詳細答案。這樣你就可以順利通過面試。

突破或從Java 8流返回? 突破或從Java 8流返回? Feb 07, 2025 pm 12:09 PM

Java 8引入了Stream API,提供了一種強大且表達力豐富的處理數據集合的方式。然而,使用Stream時,一個常見問題是:如何從forEach操作中中斷或返回? 傳統循環允許提前中斷或返回,但Stream的forEach方法並不直接支持這種方式。本文將解釋原因,並探討在Stream處理系統中實現提前終止的替代方法。 延伸閱讀: Java Stream API改進 理解Stream forEach forEach方法是一個終端操作,它對Stream中的每個元素執行一個操作。它的設計意圖是處

Java 中的時間戳至今 Java 中的時間戳至今 Aug 30, 2024 pm 04:28 PM

Java 中的時間戳記到日期指南。這裡我們也結合範例討論了介紹以及如何在java中將時間戳記轉換為日期。

Java程序查找膠囊的體積 Java程序查找膠囊的體積 Feb 07, 2025 am 11:37 AM

膠囊是一種三維幾何圖形,由一個圓柱體和兩端各一個半球體組成。膠囊的體積可以通過將圓柱體的體積和兩端半球體的體積相加來計算。本教程將討論如何使用不同的方法在Java中計算給定膠囊的體積。 膠囊體積公式 膠囊體積的公式如下: 膠囊體積 = 圓柱體體積 兩個半球體體積 其中, r: 半球體的半徑。 h: 圓柱體的高度(不包括半球體)。 例子 1 輸入 半徑 = 5 單位 高度 = 10 單位 輸出 體積 = 1570.8 立方單位 解釋 使用公式計算體積: 體積 = π × r2 × h (4

如何在Spring Tool Suite中運行第一個春季啟動應用程序? 如何在Spring Tool Suite中運行第一個春季啟動應用程序? Feb 07, 2025 pm 12:11 PM

Spring Boot簡化了可靠,可擴展和生產就緒的Java應用的創建,從而徹底改變了Java開發。 它的“慣例慣例”方法(春季生態系統固有的慣例),最小化手動設置

See all articles