page_html/css_WEB-ITnose をクロールする POST に関する問題
あるサイトをpostメソッドでスパイダーが巡回し、常に自分自身に302を送信するという問題があると同級生から報告がありました。詳細は以下の通りです:
url: http://www.meituan.com /multiact/default/deal/25814805.html
投稿データ: "yui_3_16_0_1_1423700000_000:{"act":"deal/dynamiccomponent","args":25814805,"__referer":""}"Python 経由で通常クロールできます。クロールコードは次のとおりです:
import urllibimport urllib2values = { 'yui_3_16_0_1_1423700000_000':'{"act":"deal/dynamiccomponent","args":25814805,"__referer":""}',}header={ "X-Requested-With":"XMLHttpRequest",}url="http://www.meituan.com/multiact/default/deal/25814805.html"data = urllib.urlencode(values)print datareq = urllib2.Request(url, data,header)response = urllib2.urlopen(req)the_page = response.read()print the_page
しかし、私が構築したhttpリクエストパッケージは次のとおりです:
POST /multiact/default/deal/25814805.html HTTP/1.1^ M
ホスト: www.meituan.com^M
コンテンツの長さ: 126^M
接続: close^M
コンテンツ タイプ: application/x-www-form-urlencoded^M
ユーザー エージェント: Mozilla/5.0 ( Windows NT 5.1; rv:6.0.2) Gecko/20100101 Firefox/6.0 .2^M
Accept-Encoding: gzip^M
Accept: */*^M
x-www-form-urlencoded^M
Just詳細は次のとおりです:
POST /multiact/default/deal/25814805.html HTTP/1.1^M
ホスト: www.meituan.com^M
接続: close^ M
Content-Type: application/x-www-form-urlencoded^M User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:6.0.2) Gecko/ 20100101 Firefox/6.0.2^M
Accept-Encoding : gzip^M
Accept: */*^M
X-Requested-With: XMLHttpRequest^M
Content-Type: application/x-www-form-urlencoded^ M

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、HTML< Progress>について説明します。要素、その目的、スタイリング、および< meter>との違い要素。主な焦点は、< Progress>を使用することです。タスクの完了と< Meter> statiの場合

この記事では、HTML< Datalist>について説明します。オートコンプリートの提案を提供し、ユーザーエクスペリエンスの改善、エラーの削減によりフォームを強化する要素。

この記事では、html< meter>について説明します。要素は、範囲内でスカラーまたは分数値を表示するために使用され、Web開発におけるその一般的なアプリケーション。それは差別化< Meter> < Progress>およびex

記事では、HTML5クロスブラウザーの互換性を確保するためのベストプラクティスについて説明し、機能検出、プログレッシブエンハンスメント、およびテスト方法に焦点を当てています。

この記事では、ブラウザのユーザー入力を直接検証するために、必要、パターン、MIN、MAX、および長さの制限などのHTML5フォーム検証属性を使用して説明します。

この記事では、モバイルデバイスのレスポンシブWebデザインに不可欠なViewportメタタグについて説明します。適切な使用により、最適なコンテンツのスケーリングとユーザーの相互作用が保証され、誤用が設計とアクセシビリティの問題につながる可能性があることを説明しています。

この記事では、< iframe>外部コンテンツをWebページ、その一般的な用途、セキュリティリスク、およびオブジェクトタグやAPIなどの代替案に埋め込む際のタグの目的。

GiteEpages静的Webサイトの展開が失敗しました:404エラーのトラブルシューティングと解像度Giteeを使用する
