Heim Backend-Entwicklung PHP-Tutorial 自定义HTTP抓包跟过滤

自定义HTTP抓包跟过滤

Jun 13, 2016 pm 12:11 PM
function gt http nbsp this

自定义HTTP抓包和过滤
定义一个http抓包类,发送数据到一个自定义的接受脚本,可以发送成功,并收取数据,但是发送到外网,却不行,分析过在浏览器下发送HTTP请求时的request header 信息,通过模拟请求,但超时...

<br />//定义一个HTTP抓包类,其实也可以用curl。。。。。<br /><br /><?php <br />ini_set('error_reporting', E_ALL);<br />class Httpwrap<br />{<br />	private $hostInfo=null;<br />	<br />	private $requestLine=null;<br />	private $requestHeader=null;<br />	private $emptyLine="\r\n";<br />	private $requestBody=null;<br />	private $requestEntity=null;<br />	<br />	private $responseEntity=null;<br />	private $responseHeader=null;<br />	private $responseBody=null;<br />	private $emptyLinePos=null;<br />	<br />	private $connect=null;<br />	private $errNo=null;<br />	private $errStr=null;<br />	<br />	<br />	public function __construct($url)<br />	{<br />		$this->hostInfo=parse_url($url);<br />		$this->setRequestHeader(array('Host' => $this->hostInfo['host']));<br />		$this->setRequestHeader(array('Connection' => 'keep-alive'));<br />	}<br />	//设置HTTP请求行信息,例如: GET /resources  HTTP/1.1<br />	//但为了避免漏掉url中?开始的查询信息,有必要进行判断<br />	public function setRequestLine($method)<br />	{<br />		//如果是POST请求,则自动添加content-type头信息<br />		if(strtolower($method)=='post')<br />		{<br />			$this->setRequestHeader(array('Content-type' => 'application/x-www-form-urlencoded'));<br />		}<br />		if(!empty($this->hostInfo['query']))<br />		{<br />			$this->requestLine=strtoupper($method)."  ".$this->hostInfo['path']."?".$this->hostInfo['query']."  HTTP/1.1 \r\n";<br />		}<br />		else<br />		{<br />			$this->requestLine=strtoupper($method)."  ".$this->hostInfo['path']."  HTTP/1.1 \r\n";<br />		}<br />	}<br />	//设置HTTP请求头。<br />	//接收参数是数组类型,通过迭代拼接key:value,并换行<br />	public function setRequestHeader($header)<br />	{<br />		foreach($header as $key => $value)<br />		{<br />			$this->requestHeader .=$key.":".$value."\r\n";<br />		}<br />	}<br />	//设置HTTP请求体<br />	//接收参数是数组类型,通过迭代拼接key=value,因为最后一席拼接会有一个多余的&,所以有必要去掉<br />	public function setRequestBody($body)<br />	{<br />		foreach($body as $key => $value)<br />		{<br />			$this->requestBody .=$key.'='.$value.'&';<br />		}<br />		$offset=strrpos($this->requestBody, '&');<br />		$this->requestBody=substr($this->requestBody, 0, $offset);<br />	}<br />	//组装  请求行+请求头+请求体,并根据请求体的长度,自动填充请求头的content-length字段<br />	public function setRequestEntity()<br />	{<br />		if(!empty($this->requestBody))<br />		{<br />			$contentLength=strlen($this->requestBody);<br />			$this->setRequestHeader(array('Content-length' => $contentLength));<br />			<br />			$this->requestEntity=$this->requestLine.$this->requestHeader."\r\n".$this->requestBody;<br />		}<br />		else<br />		{<br />			$this->requestEntity=$this->requestLine.$this->requestHeader."\r\n";<br />		}<br />	}<br />	//解析主机名的函数,暂时没有用上.......<br />	public function parseHost($url)<br />	{<br />		$pat='#http://([^/]+)#i';<br />		if(preg_match($pat, $url, $match))<br />		{<br />			return $match[1];<br />		}<br />		else<br />		{<br />			echo '匹配主机信息失败<br />';<br />		}<br />	}<br />	//创建到主机的连接<br />	public function createConnect()<br />	{<br />		$this->connect=fsockopen($this->hostInfo['host'], 80, $this->errNo, $this->errStr) or die('连接主机失败'.$this->errStr);<br />	}<br />	//发送请求<br />	public function sendRequest()<br />	{<br />		$this->setRequestEntity();<br />		echo $this->requestEntity;<br />		exit();<br />		$this->createConnect();<br />		$entityLength=strlen($this->requestEntity);<br />		if($entityLength != fwrite($this->connect, $this->requestEntity, $entityLength))<br />		{<br />			die('写入数据失败<br />');<br />		}<br />		else<br />		{<br />			$this->receiveResponse();<br />		}<br />	}<br />	//接受请求,并依次拼接响应体<br />	public function receiveResponse()<br />	{<br />		while(!feof($this->connect))<br />		{<br />			$this->responseEntity .= fread($this->connect, 1024);<br />		}<br />	}<br />	//计算响应头与响应体之间的空行的位置<br />	public function calculateEmptyLinePos()<br />	{<br />		$this->emptyLinePos=strpos($this->responseEntity,"\r\n\r\n",0);<br />	}<br />	//接受响应体的头部....<br />	public function receiveResponseHeader()<br />	{<br />		$this->calculateEmptyLinePos();<br />		$this->responseHeader=substr($this->responseEntity, 0, $this->emptyLinePos);<br />		echo $this->responseHeader;<br />	}<br />	//接收响应体的body部分<br />	public function receiveResponseBody()<br />	{<br />		$this->calculateEmptyLinePos();<br />		$this->responseBody=substr($this->responseEntity, $this->emptyLinePos);<br />	}<br />	//返回请求结果<br />	public function getResponse()<br />	{<br />		return $this->responseEntity;<br />	}<br />	<br /><br />	public function parseResponse()<br />	{}<br />	public function __destruct()<br />	{<br />		//fclose($this->connect);<br />	} <br />}<br />set_time_limit(60);<br />$http=new Httpwrap("http://www.mmkao.com/Beautyleg/");<br />//设置HTTP请求行<br />$http->setRequestLine("get");<br />//设置HTTP头<br />$http->setRequestHeader(array("Accept" => "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"));<br />$http->setRequestHeader(array("Accept-Language" => "zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3"));<br />$http->setRequestHeader(array("Accept-Encoding" => "gzip, deflate"));<br />$http->setRequestHeader(array("User-Agent" => "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.101 Safari/537.36"));<br />//$http->setRequestHeader(array("Cookie" => "BAIDU_DUP_lcr=http://www.baidu.com/s?wd=beautyleg&rsv_spt=1&issp=1&f=3&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=1&rsv_sug3=6&rsv_sug4=415&rsv_sug1=3&oq=beauty&rsv_sug2=0&rsp=0&inputT=2363; safedog-flow-item=8471BA510DA33350ED344AC374D3044A; bdshare_firstime=1415165097782; cscpvrich_fidx=6; AJSTAT_ok_pages=2; AJSTAT_ok_times=2; CNZZDATA3811623=cnzz_eid%3D253823549-1415164312-http%253A%252F%252Fwww.baidu.com%252F%26ntime%3D1415169712"));<br />//发送数据<br />$http->sendRequest();<br />//$http->receiveResponseHeader();<br /><br />?><br /><br />通过这个类给领一个自定义的脚本,可以发送和接收数据,领一个脚本如下:<br /><br /><?php <br />if(!empty($_POST))<br />{<br />	$str=implode(',',$_POST);<br />	file_put_contents('./post.txt', $str,FILE_APPEND);<br />	echo $str;<br />}<br /><br />?><br />但是给这个网站发送请求时,却超时:网站是:<br />http://www.mmkao.com/Beautyleg/<br />通过chrome给这个网站首页发送请求时的header头信息:<br />Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8<br />Accept-Encoding:gzip,deflate,sdch<br />Accept-Language:zh,en;q=0.8,zh-TW;q=0.6,zh-CN;q=0.4,ja;q=0.2<br />Cache-Control:max-age=0<br />Connection:keep-alive<br />Cookie:BAIDU_DUP_lcr=http://www.baidu.com/s?wd=beautyleg&rsv_spt=1&issp=1&f=3&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=1&rsv_sug3=6&rsv_sug4=415&rsv_sug1=3&oq=beauty&rsv_sug2=0&rsp=0&inputT=2363; safedog-flow-item=8471BA510DA33350ED344AC374D3044A; bdshare_firstime=1415165097782; cscpvrich_fidx=7; AJSTAT_ok_pages=3; AJSTAT_ok_times=2; CNZZDATA3811623=cnzz_eid%3D253823549-1415164312-http%253A%252F%252Fwww.baidu.com%252F%26ntime%3D1415169712<br />DNT:1<br />Host:www.mmkao.com<br />User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.101 Safari/537.36<br />Response Headersview source<br /><br />//通过相同的包装,并调用Httpwrap发送请求时,却提示超时,是在不知道哪里出问题........<br /><br />针对这个网站写了一个过滤出图片链接的类:<br /><br /><?php  <br />class Parseimage<br />{<br />	private $responseBody=null;<br />	private $imgLink=null;<br />	private $pageNum=null;<br />	private header=null;<br />	private body=null;<br />	<br />	public function __construct($body)<br />	{<br />		$this->responseBody=$body;<br />	}<br />	//匹配图片src开始的链接地址<br />	public function feedImage()<br />	{<br />		$pat='#<img  src="/static/imghw/default1.png"  data-src="(.*?)(?="  class="lazy" (.*?))#i';<br / alt="自定义HTTP抓包跟过滤" >		if(preg_match_all($pat, $body, $match))<br />		{<br />			foreach($match[2] as $link)<br />			{<br />				$this->imgLink[]=$link;<br />			}<br />		}<br />		else<br />		{<br />			echo '匹配失败图片链接地址失败'."<br />";<br />		}<br />	}<br />	//提取head部分<br />	public function filterHeader($body)<br />	{<br />		$pat='#<head>[\s\S]+</head>#im';<br />		if(preg_match($pat, $body, $match))<br />		{<br />			$this->header=$match[0];<br />		}<br />		else<br />		{<br />			echo '匹配head部分失败'."<br />";<br />		}<br />	}<br />	//提取body部分<br />	public function filterBody($body)<br />	{<br />		$pat='#<body>[\s\S]+</body>#im';<br />		if(preg_match($pat, $body, $match))<br />		{<br />			$this->body=$match[0];<br />		}<br />		else<br />		{<br />			echo '匹配body部分失败'."<br />";<br />		}<br />	}<br />	//提取分页信息,这个只能针对性的匹配,不能通用<br />	public function rollPage($body)<br />	{<br />		$pat='#[\x{4e00}-\x{9fa5}]+\s*\d\s+?/\s+?\d+\s*[\x{4e00}-\x{9fa5}]*#ui';<br />		if(preg_match($pat, $body, $match))<br />		{<br />			$patNum='#/\s*(\d\d*)#';<br />			if(preg_match($patNum, $match[0], $num))<br />			{<br />				$this->pageNum=$num[1];<br />			}<br />			else<br />			{<br />				echo '提取分页具体值失败'."<br />";<br />			}<br />		}<br />		else<br />		{<br />			echo '提取分页统计失败'."<br />";<br />		}<br />	}<br /><br />?><br /><br /><br /><br />附注:  这两个类,,都通过了内网的测试,并成功过滤出图片的链接,但是给http://www.mmkao.com/Beautyleg/发送请求时,却提示超时,,不知道哪里出了问题。。。。。。<br /><br /><br /><br /><br />
Nach dem Login kopieren

------解决思路----------------------
$url = 'http://www.mmkao.com/Beautyleg/';<br />print_r(get_headers($url));
Nach dem Login kopieren
Array<br />(<br />    [0] => HTTP/1.1 200 OK<br />    [1] => Connection: close<br />    [2] => Date: Wed, 05 Nov 2014 08:53:09 GMT<br />    [3] => Content-Length: 13889<br />    [4] => Content-Type: text/html<br />    [5] => Content-Location: http://www.mmkao.com/Beautyleg/index.html<br />    [6] => Last-Modified: Wed, 05 Nov 2014 05:39:09 GMT<br />    [7] => Accept-Ranges: bytes<br />    [8] => ETag: "e8939ad2baf8cf1:693"<br />    [9] => Server: IIS<br />    [10] => X-Powered-By: WAF/2.0<br />    [11] => Set-Cookie: safedog-flow-item=8471BA510DA33350ED344AC374D3044A; expires=Sat, 12-Dec-2150 10:26:25 GMT; domain=mmkao.com; path=/<br />)<br /><br />
Nach dem Login kopieren

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Lösung: Ihre Organisation verlangt von Ihnen, dass Sie Ihre PIN ändern Lösung: Ihre Organisation verlangt von Ihnen, dass Sie Ihre PIN ändern Oct 04, 2023 pm 05:45 PM

Auf dem Anmeldebildschirm wird die Meldung „Ihre Organisation hat Sie gebeten, Ihre PIN zu ändern“ angezeigt. Dies geschieht, wenn das PIN-Ablauflimit auf einem Computer erreicht wird, der organisationsbasierte Kontoeinstellungen verwendet und die Kontrolle über persönliche Geräte hat. Wenn Sie Windows jedoch über ein persönliches Konto einrichten, sollte die Fehlermeldung im Idealfall nicht erscheinen. Obwohl dies nicht immer der Fall ist. Die meisten Benutzer, die auf Fehler stoßen, melden dies über ihre persönlichen Konten. Warum fordert mich meine Organisation auf, meine PIN unter Windows 11 zu ändern? Es ist möglich, dass Ihr Konto mit einer Organisation verknüpft ist. Ihr primärer Ansatz sollte darin bestehen, dies zu überprüfen. Die Kontaktaufnahme mit Ihrem Domain-Administrator kann hilfreich sein! Darüber hinaus können falsch konfigurierte lokale Richtlinieneinstellungen oder falsche Registrierungsschlüssel Fehler verursachen. Im Augenblick

Was sind die Unterschiede zwischen Huawei GT3 Pro und GT4? Was sind die Unterschiede zwischen Huawei GT3 Pro und GT4? Dec 29, 2023 pm 02:27 PM

Viele Benutzer werden sich bei der Auswahl von Smartwatches für die Marke Huawei entscheiden. Viele Benutzer sind neugierig auf den Unterschied zwischen Huawei GT3pro und GT4. Was sind die Unterschiede zwischen Huawei GT3pro und GT4? 1. Aussehen GT4: 46 mm und 41 mm, das Material ist Glasspiegel + Edelstahlgehäuse + hochauflösende Faserrückschale. GT3pro: 46,6 mm und 42,9 mm, das Material ist Saphirglas + Titangehäuse/Keramikgehäuse + Keramikrückschale 2. Gesundes GT4: Mit dem neuesten Huawei Truseen5.5+-Algorithmus werden die Ergebnisse genauer. GT3pro: EKG-Elektrokardiogramm sowie Blutgefäß und Sicherheit hinzugefügt

10 Möglichkeiten, die Helligkeit unter Windows 11 anzupassen 10 Möglichkeiten, die Helligkeit unter Windows 11 anzupassen Dec 18, 2023 pm 02:21 PM

Die Bildschirmhelligkeit ist ein wesentlicher Bestandteil der Nutzung moderner Computergeräte, insbesondere wenn Sie über einen längeren Zeitraum auf den Bildschirm schauen. Es hilft Ihnen, die Belastung Ihrer Augen zu reduzieren, die Lesbarkeit zu verbessern und Inhalte einfach und effizient anzuzeigen. Abhängig von Ihren Einstellungen kann es jedoch manchmal schwierig sein, die Helligkeit zu verwalten, insbesondere unter Windows 11 mit den neuen Änderungen an der Benutzeroberfläche. Wenn Sie Probleme beim Anpassen der Helligkeit haben, finden Sie hier alle Möglichkeiten, die Helligkeit unter Windows 11 zu verwalten. So ändern Sie die Helligkeit unter Windows 11 [10 Möglichkeiten erklärt] Benutzer eines einzelnen Monitors können die folgenden Methoden verwenden, um die Helligkeit unter Windows 11 anzupassen. Hierzu zählen sowohl Desktop-Systeme mit einem einzelnen Monitor als auch Laptops. Lasst uns beginnen. Methode 1: Verwenden Sie das Action Center. Das Action Center ist zugänglich

Was bedeutet der http-Statuscode 520? Was bedeutet der http-Statuscode 520? Oct 13, 2023 pm 03:11 PM

Der HTTP-Statuscode 520 bedeutet, dass der Server bei der Verarbeitung der Anfrage einen unbekannten Fehler festgestellt hat und keine genaueren Informationen bereitstellen kann. Wird verwendet, um darauf hinzuweisen, dass bei der Verarbeitung der Anforderung durch den Server ein unbekannter Fehler aufgetreten ist, der durch Serverkonfigurationsprobleme, Netzwerkprobleme oder andere unbekannte Gründe verursacht werden kann. Dies wird normalerweise durch Serverkonfigurationsprobleme, Netzwerkprobleme, Serverüberlastung oder Codierungsfehler verursacht. Wenn Sie auf einen Fehler mit dem Statuscode 520 stoßen, wenden Sie sich am besten an den Website-Administrator oder das technische Support-Team, um weitere Informationen und Unterstützung zu erhalten.

Wie deaktiviere ich die Authentifizierung beim privaten Surfen auf dem iPhone in Safari? Wie deaktiviere ich die Authentifizierung beim privaten Surfen auf dem iPhone in Safari? Nov 29, 2023 pm 11:21 PM

Mit iOS 17 hat Apple mehrere neue Datenschutz- und Sicherheitsfunktionen in sein mobiles Betriebssystem eingeführt, darunter die Möglichkeit, eine zweistufige Authentifizierung für private Browser-Tabs in Safari zu verlangen. Hier erfahren Sie, wie es funktioniert und wie Sie es ausschalten. Auf einem iPhone oder iPad mit iOS 17 oder iPadOS 17 erfordert der Browser von Apple jetzt eine Face ID/Touch ID-Authentifizierung oder einen Passcode, wenn Sie in Safari eine Registerkarte „Privates Surfen“ geöffnet haben und dann die Sitzung oder App verlassen, um erneut darauf zuzugreifen. Mit anderen Worten: Wenn jemand Ihr iPhone oder iPad in die Hände bekommt, während es entsperrt ist, kann er Ihre Privatsphäre trotzdem nicht einsehen, ohne Ihren Passcode zu kennen

Das digitale Aktivierungsskript für Win10/11 MAS Version 2.2 unterstützt erneut die digitale Aktivierung Das digitale Aktivierungsskript für Win10/11 MAS Version 2.2 unterstützt erneut die digitale Aktivierung Oct 16, 2023 am 08:13 AM

Das berühmte Aktivierungsskript MAS2.2 unterstützt wieder die digitale Aktivierung. Die Methode stammt von @asdcorp und der MAS-Autor nennt sie HWID2. Laden Sie „gatherosstate.exe“ (kein Original, geändert) von https://github.com/massgravel/Microsoft-Activation-Scripts herunter, führen Sie es mit Parametern aus und generieren Sie GenuineTicket.xml. Schauen Sie sich zunächst die ursprüngliche Methode an: Gatherosstate.exePfn=xxxxxxx;DownlevelGenuineState=1 und vergleichen Sie sie dann mit der neuesten Methode: Gatheros

Was ist der HTTP-Statuscode 403? Was ist der HTTP-Statuscode 403? Oct 07, 2023 pm 02:04 PM

Der HTTP-Statuscode 403 bedeutet, dass der Server die Anfrage des Clients abgelehnt hat. Die Lösung für den HTTP-Statuscode 403 ist: 1. Überprüfen Sie die Authentifizierungsdaten. Wenn der Server eine Authentifizierung erfordert, stellen Sie sicher, dass die richtigen Anmeldedaten angegeben werden. 2. Überprüfen Sie die IP-Adresseinschränkungen Die IP-Adresse des Clients ist eingeschränkt oder nicht auf der Blacklist. Wenn der Statuscode 403 mit den Berechtigungseinstellungen der Datei oder des Verzeichnisses zusammenhängt, stellen Sie sicher, dass der Client über ausreichende Berechtigungen zum Zugriff auf diese Dateien oder Verzeichnisse verfügt. usw.

Verstehen Sie gängige Anwendungsszenarien der Webseitenumleitung und verstehen Sie den HTTP-301-Statuscode Verstehen Sie gängige Anwendungsszenarien der Webseitenumleitung und verstehen Sie den HTTP-301-Statuscode Feb 18, 2024 pm 08:41 PM

Verstehen Sie die Bedeutung des HTTP 301-Statuscodes: Häufige Anwendungsszenarien der Webseitenumleitung. Mit der rasanten Entwicklung des Internets werden die Anforderungen der Menschen an die Webseiteninteraktion immer höher. Im Bereich Webdesign ist die Webseitenumleitung eine gängige und wichtige Technologie, die über den HTTP-301-Statuscode implementiert wird. In diesem Artikel werden die Bedeutung des HTTP 301-Statuscodes und häufige Anwendungsszenarien bei der Webseitenumleitung untersucht. Der HTTP-Statuscode 301 bezieht sich auf eine permanente Weiterleitung (PermanentRedirect). Wenn der Server die des Clients empfängt

See all articles