목차
种子文件结构
References
데이터 베이스 MySQL 튜토리얼 常见P2P协议之BitTorrent 分析

常见P2P协议之BitTorrent 分析

Jun 07, 2016 pm 03:30 PM
BitTorrent p2p 분석하다 규약 흔한 시간

这段时间在研究BT数据流如何突破防火墙的,但是最后好像有点拦截的意思,反了:(,还是把它总结一下,欢迎讨论,wengpingbo@gmail.com BitTorrent 协议介绍 BitTorrent 是一种 P2P 协议。用于在对等网络中,用户群和用户群 (peer-to-peer) 之间的文件分享。并

这段时间在研究BT数据流如何突破防火墙的,但是最后好像有点拦截的意思,反了:(,还是把它总结一下,欢迎讨论,wengpingbo@gmail.com

BitTorrent协议介绍

BitTorrent是一种P2P协议。用于在对等网络中,用户群和用户群(peer-to-peer)之间的文件分享。并且,对于一个文件,用户群越大,下载速度就越快。BitTorrent协议能够减少服务端和网络环境对分享大文件的影响,由于是分布式节点互传数据,某一部分的网络拥堵或服务器宕机并不会对整个传输链路造成太大的影响。

BitTorrent协议是由程序员Bram Cohen在2001年四月份设计的,最终版本在2008年确定。有很多客户端实现了BitTorrent协议,最常见的有VuzeμTorrent、BitTorrentBitCometTransmissionXunlei

BitTorrent协议组成部分

一个BitTorrent文件传输过程,通常需要由以下几个部分组成:

  •  WEB服务器
  •  文件元信息(metainfo,种子)
  •  BitTorrent Tracker
  •  原始下载者(发布资源者)
  •  终端用户浏览器(下载.torrent种子)
  •  终端用户下载者

种子文件结构

一个种子文件,通常是以.torrent后缀结尾。BitTorrent协议规定,torrent文件本身,内容必须是utf8编码格式,并且其中的字段结构采用bencoding编码格式。

Torrent种子文件由两部分组成:announcetracker url)和文件信息。

下面以一个正常的torrent文件来分析种子文件的结构。

该种子文件的一部分如下:

d8:announce78:http://www.chinahdtv.org/announce.php?passkey=6e7a1c7ca4164d87e9b0e00ec63aa74910:created by13:uTorrent/204013:creation datei1369699038e8:encoding5:UTF-84:infod5:filesld6:lengthi158784e4:pathl53:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn.srteed6:lengthi107117e4:pathl54:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn1.srteed6:lengthi93644e4:pathl54:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn2.srteed6:lengthi4272200020e4:pathl49:Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.mkveee4:name56:钢铁侠3.Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x26412:piece lengthi4194304e6:pieces20380:012ef......:privatei1e6:source23:[hd.gg] CNHD  ChinaHDTVee

根据bencoding编码格式,把这段字符解码还原后,就是如下内容:

announce:http://www.chinahdtv.org/announce.php?passkey=6e7a1c7ca4164d87e9b0e00ec63aa749

created by:uTorrent/2040

creation date:1369699038

encoding:UTF-8

info:

{files:[

{length:158784,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn.srt]}, {length:107117,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn1.srt]}, {length:93644,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.chn2.srt]},

{length:4272200020,path:[Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264.mkv]}],

name:钢铁侠3.Iron.Man.3.2013.HDSCR.ULTRA.EDiTiON.720p.x264,

piece length:4194304,

pieces:P1,P2,P3...P1019

private:1

source:[hd.gg] CNHD ChinaHDTV

}

关于具体bencoding编码,请参考引用中的链接。从上面的结果可以看出,一个torrent种子文件有点类似于XML格式的文件,包含如下组成部分:

  •  tracker地址,这里就是announce后面的url
  •  种子创建软件及其版本号,这里是uTorrent软件创建的,版本号为2040
  •  创建日期,这里是1369699038,这个数字显示的是从UTC 1970-1-1 00:00:00到到现在所经历的秒数,如果你用工具转换一下,你会发现创建的时间是2013-5-28 7:57:18
  •  编码格式,这里是UTF-8
  •  info区,这里指定的是该种子有几个文件,文件有多长,目录结构,以及目录和文件的名字,从上面的结果,可以看出这个种子有4个文件,3个字幕,一个视频文件
  •  Name字段,指定顶层目录名字
  •  每个段的大小,Bittorrent协议是把一个文件分成很多个小段,然后分段下载的,这个地方就是指定每个段的大小,单位是字节,这里每个段的大小大约为4MB
  •  段哈希值,就是整个种子中,每个段的SHA1哈希值拼在一起,后面的那个省略号是全部段的SHA1哈希值,很长,这里用省略号代替。每个段的哈希长度是固定的,20个字符,所以pieces后面跟的那个数字20380其实是段数量*20,如果你用20380除以20,就会发现这个种子段数量为1019,乘上前面的段大小,这个种子大概有4GB大小,也就是说你把这个种子下载完后,占硬盘4GB空间
  •  private值,这个属性主要显示这个种子是私有的,还是公有的。一般那些各大PT站就是私有的。私有的种子会禁掉DHT(distributed hash table),因为如果你的client开这个功能,那就会跳过tracker来和其他peer进行数据交换,在很多PT内站(CHDbits,CMCT,CNHD)把这种行为称为作弊,会直接ban掉你在PT站上的帐号。关于DHT的具体信息,请参考引用中的链接。
  •  源,显示该种子的来源,这里是CNHD

注意,以上的每个属性并不是必须的,有的属性属于BitTorrent Enhancement Proposals (BEPs),就是BitTorrent协议的扩展,虽然不属于正式标准的一部分,但是很多客户端都支持这种格式

BitTorrent通信流程与网络包结构

BitTorrent协议支持基于TCPUTP网络协议进行数据传输,但是由于TCP协议是有连接的,需要先进行握手。在进行数据传输的过程中,每个种子会占有大量的TCP连接,从而占有大量的用户带宽。这给其他需要高实时性的应用造成很大的网络压力。

于是BitTorrent又支持UTP协议用来进行数据传输,这也是当前大部分BT下载客户端所采用的实现方式。UTP(uTorrent Transport Protocol)是基于UDP网络协议的,也就是无连接协议,采用这种协议进行数据交换,可以很容易进行带宽控制,不会造成网络拥堵。

下面主要分析BitTorrent中的UTP协议,因为这个常用嘛!

UTP协议的包结构如下:(不包含UDP header

常见P2P协议之BitTorrent 分析

Fig. 1 UTP包结构(来自bittorrent.org)

  •  type:数据包类型,0--带负载数据包,就是通常在连接建立后,上传数据或下载数据的包;1--连接结束数据包,结束一个连接;2--数据回应包,当一个peer收到一个带负载数据包后,会回一个ACK包,来表示这个包已正确接收,有点类似于TCPSYN的感觉,但是这个是在UDP包的数据段做连接控制;3--重置连接;4--开始一个连接
  •  ver:协议版本,通常为1
  •  extension:扩展段,用于支持BEPs
  •  connection_id:连接id,同一个连接id的数据包属于一个连接,一般每两个peer之间会开两个连接,一个用于发,一个用于收
  •  timestamp_microseconds:包的发送时间
  •  timestamp_difference_microseconds:对于当前连接,最近收到的包时间和当前要发送的包之间的时间间隔
  •  wnd_size:发送方当前剩余窗口大小,用于进行速度和带宽控制。BitTorrent协议中每一个发出去的数据包,都要求接收方回一个ACK包。而一个peer的窗口大小是指当前发送出去,但还没有收到回应的包的总大小,单位为字节。每一个peer都一个最大窗口值和一个窗口大小上限值。当wnd_size小于最小UTP包大小的时候,发送方会停止发送数据包,或调整每个数据包的数据负载大小
  •  seq_nr:相对于一个连接,数据包的序列号,以一个包为计数单位
  •  ack_nr:发送方最近接收到的包的序列号

可能说这么多,有点混乱了,下面以一个具体的UTP包做说明。

数据包内容如下:

0000   78 ac c0 55 45 4a 00 0c 86 23 b8 00 08 00 45 00

0010   00 30 2f e7 00 00 66 11 a4 23 01 a4 60 2e db f6

0020   42 ea 8f b9 cf 46 00 1c 00 00 21 00 19 a2 ec 07

0030   ea 27 c3 62 4a be 00 37 f5 10 11 89 32 d4

其中0x00-0x29UDP header,这里不再分析。咱来看一下它的数据部分:

210019a2ec07ea27c3624abe0037f510118932d4

可以看出来:

  •  0x2type字段,代表这是一个数据回应包
  •  0x1是它的协议版本号
  •  0x00是它的扩展字段
  •  00代表该包没有扩展信息
  •  0x19a2是该包的连接id,这是一个随机数
  •  0xec07ea27是该包的发送时间
  •  0xc3624abe是这个包的发送方最近一次接收包到这次发生包之间的间隔,间隔这么长,表示当前网络环境不行,数据传输速度不是很快
  •  0x0037f510是发送方的窗口大小,也就是说当前发送方还可以接收3.5MB的数据
  •  0x1189是该数据包的序列包,也就意味着发送方在这个连接上已经发送了4489个包
  •  0x32d4是该发送方最近接受到的包序列号

BitTorrent数据包的特征与识别

由于BitTorrent数据包是应用层协议,所以必须要通过DPI技术,才能识别这种协议的流量。识别这种流量有两种方法:

一是检测两个peer之间的大流量连接。如果发现两个ip之间出现大量异常udp数据包,可以采取丢包的方式,来限制传输速率。

另外一种方法,就是运用DPI技术,读取UDP数据部分,如果发现大量的UDP包的负载前几个字节是0x0100,则判断为BitTorrent流量,并采取相应的措施。

References

1. http://en.wikipedia.org/wiki/BitTorrent_client

2. http://en.wikipedia.org/wiki/BitTorrent

3. http://www.bittorrent.org/beps/bep_0000.html

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Douyin 레벨 10 조명 표지판의 가격은 얼마입니까? 레벨 10 팬사인회 제작에는 며칠이 소요되나요? Douyin 레벨 10 조명 표지판의 가격은 얼마입니까? 레벨 10 팬사인회 제작에는 며칠이 소요되나요? Mar 11, 2024 pm 05:37 PM

Douyin 플랫폼에서는 많은 사용자가 레벨 인증을 받기를 열망하고 있으며 레벨 10 표시등은 Douyin에 대한 사용자의 영향력과 인식을 보여줍니다. 이 기사에서는 사용자가 프로세스를 더 잘 이해할 수 있도록 Douyin의 레벨 10 라이트 보드 가격과 이 레벨에 도달하는 데 걸리는 시간을 자세히 살펴보겠습니다. 1. 레벨 10 Douyin 라이트 사인의 가격은 얼마입니까? Douyin의 10단계 전광판 가격은 시장 변동과 수요 공급에 따라 달라질 수 있으며, 일반적인 가격은 수천 위안에서 만 위안까지 다양합니다. 이 가격에는 주로 조명 사인 자체 비용과 가능한 서비스 수수료가 포함됩니다. 사용자는 Douyin의 공식 채널이나 제3자 서비스 대행사를 통해 레벨 10 조명 간판을 구매할 수 있지만, 허위 또는 사기 거래를 피하기 위해 구매 시 법적 채널에 주의해야 합니다. 2. 레벨 10 팬사인을 만드는데 며칠이 걸리나요? 레벨 10 신호등에 도달하세요

엘든 링을 클리어하는 데 얼마나 걸리나요? 엘든 링을 클리어하는 데 얼마나 걸리나요? Mar 11, 2024 pm 12:50 PM

플레이어는 Elden's Circle에서 플레이할 때 게임의 주요 줄거리를 경험하고 게임 성과를 수집할 수 있습니다. 많은 플레이어는 Elden's Circle을 클리어하는 데 시간이 얼마나 걸리는지 모릅니다. 엘든 링을 클리어하는데 얼마나 걸리나요? 답변: 30시간. 1. 이 30시간 통관시간은 마스터급 스피드패스를 의미하지는 않지만, 많은 과정을 생략하기도 합니다. 2. 더 나은 게임 경험을 원하거나 전체 줄거리를 경험하고 싶다면 반드시 지속 시간에 더 많은 시간을 할애해야 합니다. 3. 모두 모으는 데에는 약 100~120시간 정도 소요됩니다. 4. 본선만 타고 BOSS 브러싱을 하면 50~60시간 정도 소요됩니다. 5. 모든 것을 경험하고 싶다면: 기본 시간 150시간.

Xiaohongshu에 작품 출판 시간을 설정하는 방법은 무엇입니까? 작품 출판 시기는 정확합니까? Xiaohongshu에 작품 출판 시간을 설정하는 방법은 무엇입니까? 작품 출판 시기는 정확합니까? Mar 24, 2024 pm 01:31 PM

생활과 지식 공유가 가득한 플랫폼 샤오홍슈를 통해 점점 더 많은 창작자들이 자유롭게 자신의 의견을 표현할 수 있게 되었습니다. Xiaohongshu에 대한 관심과 좋아요를 더 많이 얻으려면 콘텐츠의 질뿐만 아니라 작품을 출판하는 시기도 중요합니다. 그렇다면 Xiaohongshu의 작품 출판 시간은 어떻게 설정합니까? 1. 소홍서 작품 출판 시기는 어떻게 정하나요? 1. 사용자의 활동시간을 이해한다. 먼저 Xiaohongshu 사용자의 활동시간을 명확히 할 필요가 있다. 일반적으로 오후 8시부터 10시까지와 주말 오후는 사용자 활동이 많은 시간입니다. 그러나 이 기간은 잠재고객 세그먼트 및 지역과 같은 요인에 따라 달라질 수도 있습니다. 따라서 사용자의 활동 기간을 더 잘 파악하기 위해서는 그룹별 행동 습관에 대한 보다 자세한 분석을 수행하는 것이 좋습니다. 사용자의 삶을 이해함으로써

Linux 파일 시간 보기 기술에 대한 자세한 설명 Linux 파일 시간 보기 기술에 대한 자세한 설명 Feb 21, 2024 pm 01:15 PM

Linux 파일 시간 보기 기술에 대한 자세한 설명 Linux 시스템에서 파일 시간 정보는 파일 관리 및 변경 사항 추적에 매우 중요합니다. Linux 시스템은 액세스 시간(atime), 수정 시간(mtime), 변경 시간(ctime)이라는 세 가지 주요 시간 속성을 통해 파일 변경 정보를 기록합니다. 이 문서에서는 이 파일 시간 정보를 보고 관리하는 방법을 자세히 설명하고 특정 코드 예제를 제공합니다. 1. ls 명령과 -l 매개변수를 함께 사용하여 파일 목록을 확인하여 파일 시간 정보를 확인합니다.

Ark of Destiny Dreams는 언제 출시되나요? Ark of Destiny Dreams는 언제 출시되나요? Mar 14, 2024 pm 03:00 PM

많은 플레이어들이 슬리피드림의 방주가 3월 13일에 출시될지 궁금해하고 있습니다. 또한 새로운 프로 파이터 지아난, 신의 선택을 받은 영웅 무기, 새로운 BOSS 및 기타 구체적인 콘텐츠도 있을 예정입니다. 세부정보 Ark of Destiny Sleepy Dreams 출시 시기에 대한 소개 내용을 살펴보겠습니다. Ark of Destiny 가이드: Ark of Destiny Dreams는 언제 출시되나요? 답변: 3월 13일. 아이템 레벨 요구 사항: 1레벨~3레벨 요구 사항: 1540. 레벨 4 도달 요구 사항: 1560. 드롭된 아이템: Dream 생각, 드림마크, 절망에 빠진다. 새로운 프로 파이터 남성 1. 특성: 슈라 에너지, 슈라 에너지를 축적하여 [복싱 챔피언 자격]에 진입 2. 전문 특성: 근접 직업 3. 전문 무기: 중팔 갑옷. 신대륙 로완 1. 개봉방법

gshock 시계에서 시간을 조정하는 방법 gshock 시계에서 시간을 조정하는 방법 Feb 21, 2024 pm 09:04 PM

많은 사용자들이 gshock 시계의 시간 조정 방법을 잘 모릅니다. 전체적인 방법은 비교적 간단합니다. gshock 시계의 조정 방법에 대한 자세한 소개는 다음과 같습니다. gshock 시계의 시간을 조정하는 방법 1. 먼저 ABCD에 따라 이 버튼에 라벨을 붙입니다. A 키: 일반적으로 C 키와 함께 사용되는 종료 키로 이해될 수 있습니다. B 키와 D 키는 조정 키인 플러스 및 마이너스 키로 이해될 수 있습니다. 예를 들어 지금이 13시라면 14시에 도달하면 D 키를 누릅니다. C 키는 모드 키입니다. 일반적으로 시계의 모드 키는 왼쪽 하단에 있으며 영어로 "mode"라는 단어가 있습니다. 작동 방법 1. 먼저 시계를 원하는 상태로 조정해야 합니다.

조정 후에도 컴퓨터 시간이 여전히 부정확합니다. 조정 후에도 컴퓨터 시간이 여전히 부정확합니다. Feb 19, 2024 pm 05:28 PM

컴퓨터 시간은 수정 후에도 여전히 부정확합니다. 컴퓨터를 매일 사용하는 과정에서 우리는 매우 흔한 문제, 즉 컴퓨터 시간이 부정확할 수 있습니다. 컴퓨터 시간을 수정하면 이 문제를 해결할 수 있지만, 수정 후에도 컴퓨터 시간이 여전히 부정확한 경우가 있습니다. 컴퓨터 시간이 부정확해지는 원인은 정확히 무엇입니까? 먼저, 컴퓨터 시간이 어디서 나오는지 이해해 봅시다. 대부분의 컴퓨터는 인터넷에 연결되면 네트워크 시간 서버와 자동으로 동기화되어 시간을 얻습니다. 이 시간 서버는 원자 시계와 상호 작용합니다.

DreamWeaver CMS의 보조 디렉토리를 열 수 없는 이유 분석 DreamWeaver CMS의 보조 디렉토리를 열 수 없는 이유 분석 Mar 13, 2024 pm 06:24 PM

제목: DreamWeaver CMS의 보조 디렉터리를 열 수 없는 이유와 해결 방법 분석 Dreamweaver CMS(DedeCMS)는 다양한 웹 사이트 구축에 널리 사용되는 강력한 오픈 소스 콘텐츠 관리 시스템입니다. 그러나 때로는 웹사이트를 구축하는 과정에서 보조 디렉토리를 열 수 없는 상황이 발생할 수 있으며, 이로 인해 웹사이트의 정상적인 작동에 문제가 발생할 수 있습니다. 이 기사에서는 보조 디렉터리를 열 수 없는 가능한 이유를 분석하고 이 문제를 해결하기 위한 구체적인 코드 예제를 제공합니다. 1. 예상 원인 분석: 의사 정적 규칙 구성 문제: 사용 중

See all articles