目錄
种子文件结构
References
首頁 資料庫 mysql教程 常见P2P协议之BitTorrent 分析

常见P2P协议之BitTorrent 分析

Jun 07, 2016 pm 03:30 PM
BitTorrent p2p 分析 協定 常見 時間

这段时间在研究BT数据流如何突破防火墙的,但是最后好像有点拦截的意思,反了:(,还是把它总结一下,欢迎讨论,wengpingbo@gmail.com BitTorrent 协议介绍 BitTorrent 是一种 P2P 协议。用于在对等网络中,用户群和用户群 (peer-to-peer) 之间的文件分享。并

这段时间在研究BT数据流如何突破防火墙的,但是最后好像有点拦截的意思,反了:(,还是把它总结一下,欢迎讨论,wengpingbo@gmail.com

BitTorrent协议介绍

BitTorrent是一种P2P协议。用于在对等网络中,用户群和用户群(peer-to-peer)之间的文件分享。并且,对于一个文件,用户群越大,下载速度就越快。BitTorrent协议能够减少服务端和网络环境对分享大文件的影响,由于是分布式节点互传数据,某一部分的网络拥堵或服务器宕机并不会对整个传输链路造成太大的影响。

BitTorrent协议是由程序员Bram Cohen在2001年四月份设计的,最终版本在2008年确定。有很多客户端实现了BitTorrent协议,最常见的有VuzeμTorrent、BitTorrentBitCometTransmissionXunlei

BitTorrent协议组成部分

一个BitTorrent文件传输过程,通常需要由以下几个部分组成:

  •  WEB服务器
  •  文件元信息(metainfo,种子)
  •  BitTorrent Tracker
  •  原始下载者(发布资源者)
  •  终端用户浏览器(下载.torrent种子)
  •  终端用户下载者

种子文件结构

一个种子文件,通常是以.torrent后缀结尾。BitTorrent协议规定,torrent文件本身,内容必须是utf8编码格式,并且其中的字段结构采用bencoding编码格式。

Torrent种子文件由两部分组成:announcetracker url)和文件信息。

下面以一个正常的torrent文件来分析种子文件的结构。

该种子文件的一部分如下:

d8:announce78:http://www.chinahdtv.org/announce.php?passkey=6e7a1c7ca4164d87e9b0e00ec63aa74910:created by13:uTorrent/204013:creation datei1369699038e8:encoding5:UTF-84:infod5:filesld6:lengthi158784e4:pathl53:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn.srteed6:lengthi107117e4:pathl54:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn1.srteed6:lengthi93644e4:pathl54:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn2.srteed6:lengthi4272200020e4:pathl49:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.mkveee4:name56:钢铁侠3.Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x26412:piece lengthi4194304e6:pieces20380:012ef......:privatei1e6:source23:[hd.gg] CNHD  ChinaHDTVee

根据bencoding编码格式,把这段字符解码还原后,就是如下内容:

announce:http://www.chinahdtv.org/announce.php?passkey=6e7a1c7ca4164d87e9b0e00ec63aa749

created by:uTorrent/2040

creation date:1369699038

encoding:UTF-8

info:

{files:[

{length:158784,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn.srt]}, {length:107117,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn1.srt]}, {length:93644,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn2.srt]},

{length:4272200020,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.mkv]}],

name:钢铁侠3.Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264,

piece length:4194304,

pieces:P1,P2,P3...P1019

private:1

source:[hd.gg] CNHD ChinaHDTV

}

关于具体bencoding编码,请参考引用中的链接。从上面的结果可以看出,一个torrent种子文件有点类似于XML格式的文件,包含如下组成部分:

  •  tracker地址,这里就是announce后面的url
  •  种子创建软件及其版本号,这里是uTorrent软件创建的,版本号为2040
  •  创建日期,这里是1369699038,这个数字显示的是从UTC 1970-1-1 00:00:00到到现在所经历的秒数,如果你用工具转换一下,你会发现创建的时间是2013-5-28 7:57:18
  •  编码格式,这里是UTF-8
  •  info区,这里指定的是该种子有几个文件,文件有多长,目录结构,以及目录和文件的名字,从上面的结果,可以看出这个种子有4个文件,3个字幕,一个视频文件
  •  Name字段,指定顶层目录名字
  •  每个段的大小,Bittorrent协议是把一个文件分成很多个小段,然后分段下载的,这个地方就是指定每个段的大小,单位是字节,这里每个段的大小大约为4MB
  •  段哈希值,就是整个种子中,每个段的SHA1哈希值拼在一起,后面的那个省略号是全部段的SHA1哈希值,很长,这里用省略号代替。每个段的哈希长度是固定的,20个字符,所以pieces后面跟的那个数字20380其实是段数量*20,如果你用20380除以20,就会发现这个种子段数量为1019,乘上前面的段大小,这个种子大概有4GB大小,也就是说你把这个种子下载完后,占硬盘4GB空间
  •  private值,这个属性主要显示这个种子是私有的,还是公有的。一般那些各大PT站就是私有的。私有的种子会禁掉DHT(distributed hash table),因为如果你的client开这个功能,那就会跳过tracker来和其他peer进行数据交换,在很多PT内站(CHDbits,CMCT,CNHD)把这种行为称为作弊,会直接ban掉你在PT站上的帐号。关于DHT的具体信息,请参考引用中的链接。
  •  源,显示该种子的来源,这里是CNHD

注意,以上的每个属性并不是必须的,有的属性属于BitTorrent Enhancement Proposals (BEPs),就是BitTorrent协议的扩展,虽然不属于正式标准的一部分,但是很多客户端都支持这种格式

BitTorrent通信流程与网络包结构

BitTorrent协议支持基于TCPUTP网络协议进行数据传输,但是由于TCP协议是有连接的,需要先进行握手。在进行数据传输的过程中,每个种子会占有大量的TCP连接,从而占有大量的用户带宽。这给其他需要高实时性的应用造成很大的网络压力。

于是BitTorrent又支持UTP协议用来进行数据传输,这也是当前大部分BT下载客户端所采用的实现方式。UTP(uTorrent Transport Protocol)是基于UDP网络协议的,也就是无连接协议,采用这种协议进行数据交换,可以很容易进行带宽控制,不会造成网络拥堵。

下面主要分析BitTorrent中的UTP协议,因为这个常用嘛!

UTP协议的包结构如下:(不包含UDP header

常见P2P协议之BitTorrent 分析

Fig. 1 UTP包结构(来自bittorrent.org)

  •  type:数据包类型,0--带负载数据包,就是通常在连接建立后,上传数据或下载数据的包;1--连接结束数据包,结束一个连接;2--数据回应包,当一个peer收到一个带负载数据包后,会回一个ACK包,来表示这个包已正确接收,有点类似于TCPSYN的感觉,但是这个是在UDP包的数据段做连接控制;3--重置连接;4--开始一个连接
  •  ver:协议版本,通常为1
  •  extension:扩展段,用于支持BEPs
  •  connection_id:连接id,同一个连接id的数据包属于一个连接,一般每两个peer之间会开两个连接,一个用于发,一个用于收
  •  timestamp_microseconds:包的发送时间
  •  timestamp_difference_microseconds:对于当前连接,最近收到的包时间和当前要发送的包之间的时间间隔
  •  wnd_size:发送方当前剩余窗口大小,用于进行速度和带宽控制。BitTorrent协议中每一个发出去的数据包,都要求接收方回一个ACK包。而一个peer的窗口大小是指当前发送出去,但还没有收到回应的包的总大小,单位为字节。每一个peer都一个最大窗口值和一个窗口大小上限值。当wnd_size小于最小UTP包大小的时候,发送方会停止发送数据包,或调整每个数据包的数据负载大小
  •  seq_nr:相对于一个连接,数据包的序列号,以一个包为计数单位
  •  ack_nr:发送方最近接收到的包的序列号

可能说这么多,有点混乱了,下面以一个具体的UTP包做说明。

数据包内容如下:

0000   78 ac c0 55 45 4a 00 0c 86 23 b8 00 08 00 45 00

0010   00 30 2f e7 00 00 66 11 a4 23 01 a4 60 2e db f6

0020   42 ea 8f b9 cf 46 00 1c 00 00 21 00 19 a2 ec 07

0030   ea 27 c3 62 4a be 00 37 f5 10 11 89 32 d4

其中0x00-0x29UDP header,这里不再分析。咱来看一下它的数据部分:

210019a2ec07ea27c3624abe0037f510118932d4

可以看出来:

  •  0x2type字段,代表这是一个数据回应包
  •  0x1是它的协议版本号
  •  0x00是它的扩展字段
  •  00代表该包没有扩展信息
  •  0x19a2是该包的连接id,这是一个随机数
  •  0xec07ea27是该包的发送时间
  •  0xc3624abe是这个包的发送方最近一次接收包到这次发生包之间的间隔,间隔这么长,表示当前网络环境不行,数据传输速度不是很快
  •  0x0037f510是发送方的窗口大小,也就是说当前发送方还可以接收3.5MB的数据
  •  0x1189是该数据包的序列包,也就意味着发送方在这个连接上已经发送了4489个包
  •  0x32d4是该发送方最近接受到的包序列号

BitTorrent数据包的特征与识别

由于BitTorrent数据包是应用层协议,所以必须要通过DPI技术,才能识别这种协议的流量。识别这种流量有两种方法:

一是检测两个peer之间的大流量连接。如果发现两个ip之间出现大量异常udp数据包,可以采取丢包的方式,来限制传输速率。

另外一种方法,就是运用DPI技术,读取UDP数据部分,如果发现大量的UDP包的负载前几个字节是0x0100,则判断为BitTorrent流量,并采取相应的措施。

References

1. http://en.wikipedia.org/wiki/BitTorrent_client

2. http://en.wikipedia.org/wiki/BitTorrent

3. http://www.bittorrent.org/beps/bep_0000.html

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1324
25
PHP教程
1272
29
C# 教程
1251
24
抖音10級燈牌多少錢? 10級粉絲燈牌需要幾天? 抖音10級燈牌多少錢? 10級粉絲燈牌需要幾天? Mar 11, 2024 pm 05:37 PM

在抖音平台上,許多用戶都渴望獲得等級認證,其中10級燈牌更是展示用戶在抖音上的影響力和認可度。本文將深入探討抖音10級燈牌的價格以及達到此等級所需的時間,以幫助使用者更了解此過程。一、抖音10級燈牌多少錢?抖音10級燈牌的價格會受市場波動和供需情況的影響而有所差異,一般價格在幾千元到萬元之間。這個價格主要包括燈牌本身的成本和可能的服務費用。用戶可透過抖音官方管道或第三方服務機構購買10級燈牌,但在購買時要留意選擇合法管道,以免遭遇虛假或詐欺交易。二、10級粉絲燈牌要幾天?達到10級燈牌

艾爾登法環通關需要多久 艾爾登法環通關需要多久 Mar 11, 2024 pm 12:50 PM

玩家在艾爾登法環中進行遊戲時可以體驗遊戲主線劇情,以及收集遊戲成就,有很多玩家不知道艾爾登法環通關需要多久,玩家的通關流程在30個小時。艾爾登法環通關需要多久答:30小時。 1、這個30小時的通關時長指的雖然不是高手般的速通,但也省略了許多的流程。 2.如果你想獲得更好的遊戲體驗或是體驗完整的劇情,那麼時長上肯定要花費更多的時間。 3.如果玩家是全收集大約要100-120小時。 4.如果是只走主線刷BOSS大約:50-60小時。 5.如果是想全部體驗:150小時打底。

小紅書發佈作品時間怎麼設定?發布作品時間準確嗎? 小紅書發佈作品時間怎麼設定?發布作品時間準確嗎? Mar 24, 2024 pm 01:31 PM

小紅書,一個充滿生活氣息與知識分享的平台,讓越來越多的創作者在這裡暢所欲言。要想在小紅書上獲得更多的關注和點贊,除了內容品質之外,發布作品的時間也是至關重要的。那麼,如何設定小紅書發布作品的時間呢?一、小紅書發布作品時間怎麼設定? 1.了解用戶活躍時間首先,需要先明確小紅書用戶的活躍時間。通常來說,晚上8點到10點以及週末下午是用戶活躍度較高的時段。然而,這個時段也會受到受眾群體和地理等因素的影響而有所不同。因此,為了更能掌握用戶活躍時段,建議對不同族群的行為習慣進行更詳細的分析。透過了解用戶的活

Linux 檔案時間查看技巧詳解 Linux 檔案時間查看技巧詳解 Feb 21, 2024 pm 01:15 PM

Linux檔案時間檢視技巧詳解在Linux系統中,檔案的時間資訊對於檔案管理和追蹤變更非常重要。 Linux系統透過三種主要時間屬性來記錄檔案的變更訊息,分別是存取時間(atime)、修改時間(mtime)和變更時間(ctime)。本文將詳細介紹如何查看和管理這些文件時間信息,並提供具體的程式碼範例。 1.查看文件時間資訊透過使用ls指令結合參數-l可以列出文

gshock手錶怎麼調時間 gshock手錶怎麼調時間 Feb 21, 2024 pm 09:04 PM

許多用戶不太清楚該怎麼調整gshock手錶的時間,整體的方法還是比較簡單的,下面就給大家具體介紹一下gshock手錶的調整的方法,不知道該怎麼操作的用戶可以參考一下。 gshock手錶怎麼調時間1、先按照ABCD把這幾個按鍵給標註出來。 A鍵:可以理解成退出鍵,通常是和C鍵一起用的。 B鍵和D鍵可以理解成:加減鍵,也就是調節的鍵,例如現在是13點,調整到14點就按一下D鍵。 C鍵是模式鍵,按一下就可以切換模式,一般手錶的模式鍵都是在左下角的,會有mode這個英文。操作方法1、首先我們需要把手錶調整到計

命運方舟困夢什麼時候出 命運方舟困夢什麼時候出 Mar 14, 2024 pm 03:00 PM

許多玩家想問命運方舟困夢什麼時候出,困夢將在3月13日與我們見面,其次還有全新職業格鬥家男、全新大陸羅溫、神選英雄武器、新增BOSS等內容,具體內容一起來看看這篇命運方舟困夢上線時間介紹。命運方舟攻略大全命運方舟困夢何時出答:3月13日道具等級要求關卡1-關卡3需要道具等級達到:1540關卡4需要道具等級達到:1560掉落物品:夢幻之念、夢幻標誌、墜落絕望之角。全新職業格鬥家男1、特性:修羅能量,積攢修羅能量進入【拳王態勢】2、職業屬性:近戰職業3、職業武器:重臂鎧。全新大陸羅溫1、開啟方法

電腦時間調整後仍不準確 電腦時間調整後仍不準確 Feb 19, 2024 pm 05:28 PM

電腦時間不准校正後還是不准在日常使用電腦的過程中,我們可能會遇到一個非常常見的問題,那就是電腦時間不準確。雖然我們可以透過校正電腦時間來解決這個問題,但有時即使校正過後,電腦的時間仍然不準確。究竟是什麼原因導致了電腦時間的不準確呢?首先,讓我們來了解一下電腦時間的來源。大部分的電腦時間都是透過連接網路時自動同步網路時間伺服器來取得的。這些時間伺服器會與原子鐘

織夢CMS二級目錄打不開的原因分析 織夢CMS二級目錄打不開的原因分析 Mar 13, 2024 pm 06:24 PM

標題:解析織夢CMS二級目錄打不開的原因及解決方案織夢CMS(DedeCMS)是一款功能強大的開源內容管理系統,被廣泛應用於各類網站建設中。然而,有時在搭建網站過程中可能會遇到二級目錄無法開啟的情況,這給網站的正常運作帶來了困擾。在本文中,我們將分析二級目錄打不開的可能原因,並提供具體的程式碼範例來解決這個問題。一、可能的原因分析:偽靜態規則配置問題:在使用

See all articles