ホームページ > バックエンド開発 > PHPチュートリアル > Baidu の検索結果を解析する link?url=パラメータ分析 (完全)_PHP チュートリアル

Baidu の検索結果を解析する link?url=パラメータ分析 (完全)_PHP チュートリアル

WBOY
リリース: 2016-07-21 15:15:38
オリジナル
5087 人が閲覧しました

数日前、Baidu で検索した後、Baidu ジャンプ後の URL を取得する方法についての記事を書きましたが、Baidu link?url= についても勉強した人がいました。

大まかに次の結果が得られます:

1. 暗号化方法は、ランダム + 入力滞留時間 + 暗号化用のスナップショット アドレスに基づいています。
2. コード全体には 3 つの部分があります。検索語、 2. 検索時間のキーワード、 3. ランダムに生成された固有の識別コード。
3. どのような環境やブラウザの URL でも、最後に似たようなコードがある
上記の他の人の調査結果から、「最後に似たようなコードがある」方が使いやすいことがわかります。それで始めましょう。
「enenba」を検索したところ、最初の検索結果の URL に同じコードが含まれていることがわかりました。それは
http://www.baidu.com/link?url=…………ebac5573358cc3c0659257bfcf54763ec1c5ecff3b3fbd1d4c
すべての検索 結果はすべてコード ebac5573358cc3c0659257bfcf54 があります (N 回検索した後に見つかりました)
最後の 763ec1c5ecff3b3fbd1d4c は、検索結果の実際の URL のように見えます。 (本物の URL の暗号文であることが確認されています)
次のように確認しました:
1. まず、Baidu で www.php100.com を検索します
最初の結果リンク:
http://www.baidu.com /link?url= …………ebac5573358cc3c0659257bfcf546427d385fef6656de2404d6843da27
最初のいくつかを参照 6427d385fef6656de2404d6843da27
2. Baidu で www.hao123.com を検索
最初の結果リンク:
http://www.baidu.com/link?url=…… …… ebac5573358cc3c0659257bfcf54 6427d385e6ff7a6de0434d6843da
最初の数桁をご覧ください 6427d385e6ff7a6de0434d6843da
...
N 個の Web サイトを何度も検索した結果、ドメイン名の最初の数桁が「www」であることがわかりました。暗号文はすべて 6427d 385 です
そして www。は 4 文字、パスワードテキスト 6427d385 は 8 文字です。暗号文の 2 文字が URL の 1 文字に等しいことがわかります。
そこで、PHP フォームのクエリを作成し、後で簡単に閲覧できるように暗号文の部分を取得しました。
PHP ソース コードを出力します:

コードをコピーします コードは次のとおりです:



Baidu リンクのクエリ?ulr=Real link form


/*
getrealurl enenba.com によってリダイレクトされた URL 301、302 を取得します
@param str $url クエリ
$return str リダイレクトされた URL の実際の URL
*/
function getrealurl($url){
$header = get_headers($url,1) );
if (strpos($header[0],'301') || strpos($header[0],'302')) {
if(is_array($header['Location'])) {
return $header['場所'][count($header['場所'])-1];
}else{
return $header['Location']
}
}else {
return $url; }
$input = '
';
$url = isset($_GET['url'])?$_GET[' url']:'';
if(empty($url)) exit($input);
$urlreal = getrealurl($url);
echo '実際の URL は次のとおりです。'.$urlreal = ltrim ($urlreal,'http://');
$search = '/ebac5573358cc3c0659257bfcf54([0-9a-f]+)/i';
$url_encode = $r[1]; unset($r);
echo '
暗号文部分は: '.$url_encode.'
';
$urlreal_arr = str_split($urlreal);
$url_encode_arr = str_split($url_encode,2);
echo '
';
echo $input;


明日もう一度勉強してください。 。 。 。
このサイトは事前に宣言します: cnbeta の記事は私によって公開されたものではありません。私の分析は私自身の考えと研究に基づいているだけであり、結果があるかどうかについては私自身の結論を持っています。
前回の記事に引き続き、Baiduの結果URLのロングコードをよく見てみると、暗号文はa~fの数字と文字のみで構成されており、16進数の暗号であることがわかりました。
16 進数は 0->1->2->3->4->5->7->8->9->a->b->;c- >d->e->f
一連の URL を収集し、最初のコードを数えました。
ebac5573358cc3c0659257bfcf54XX...
XX コードに対応する URL は次のとおりです



コードをコピーします

コードは次のとおりです:

33 0 23 @ 13 P 03 ` 73 p 63
! 32 1 22 A 12 Q 02 a 72 q 62
" 31 2 21 B 11 R 01 b 71 r 61
# 30 3 20 C 10 S 00 c 70 s 60
$ 37 4 27 D 17 T 07 d 77 t 67
% 36 5 26 E 16 U 06 e 76 u 66
& 35 6 25 F 15 V 05 f 75 v 65
' 34 7 24 G 14 W 04 g 74 w 64
( 3b 8 2b H 1b [ 08 k 78 { 68
, 3f - 3e = 2e M 1e ] 0e m 7e } 6e
. 3d > 2d N 1d ^ 0d n 7d ~ 6d
/ 3c ? 2c O 1c _ 0c o 7c 6c


ASCII コード表の文字である必要があることがわかりましたが、順序が混同されているはずですが、これではすべてこのようになっています。単一塩基:
3->2->1->0->7->6->5->4->b->a->9->8- >f->e->d->c
4 桁は降順であり、全体的に減少傾向にあることがわかります
しかし、不可解なのは、対応する _ から ` です。 ASCII では 0c と 73 が隣接することはありません。2 番目のコード



に対応する URL を見てください。

70 0 60 @ 50 P 40 ` 30 p 20 ! 71 1 61 A 51 Q 41 a 31 q 21 " 72 2 62 B 52 R 42 b 32 r 22 # 73 3 63 C 53 S 43 c 33 s 23
$ 74 4 64 D 54 T 44 d 34 t 24
% 75 5 65 E 55 U 45 e 35 u 25
& 76 6 66 F 56 V 46 f 36 v 26
' 77 7 67 G 57 W 47 g 37 w 27
( 78 8 68 H 58 ; 6c L 5c 4c l 3c | 2c
- 7d = 6d M 5d ] 4d m 3d } 2d
. 7e > 6e N 5e ^ 4e n 3e ~ 2e
/ 7f ? 6f O 5f _ 4f o 3f 2f


2 番目のグループの秘密テキストは 16 進数の昇順に従います。
0->1->2->3->4->5->7->8->9->a->b->c->d ->e->f
全体的には減少傾向にあります。
もう一度 3 番目のグループを見てください
ebac5573358cc3c0659257bfcf54XXYYZZ。 。 。 。
ZZコードに対応するURLはこんな感じ



コードをコピー

コードは以下の通りです:


84 0 94 @ a4 P b4 ` c4 p d4
! 85 1 95 A a5 Q b5 a! c5 q d5
" 86 2 96 B a6 R b6 b c6 r d6
# 87 3 97 C a7 S b7 c c7 s d7
$ 80 4 90 D a0 T b0 d c0 t d0 % 81 5 91 E a1 U b1 e c1 u d1 & 82 6 92 F a2 V b2 f c2 v d2 ' 83 7 93 G a3 W b3 g c3 w d3 ( 8c 8 9c H ac X bc h cc x dc
) 8b 9 9b I ab Y bb i cd y dd
* 8e : 9e J ae Z be j ce z de
+ 8f ; 9f K af [ bf
, 88 8a > 9a N aa ^ ba n ca ~ da
/ 9b O ab _ bb o cb db

は上位の順序を説明しません:
4-> 5-> 6-> 7-> 0-> 1-> 2-> 3-> 4-> c-> b-> e-> f-> 8- >9- >a->b
全体的に増加しています
以下の数字は見ていませんが、おそらく 16 進数のグループであることがわかります。増加しているかどうかについては。判定にはある程度のデータが必要です。
判定にはURLデータを1000個集めてください。



http://www.bkjia.com/PHPjc/326056.html

www.bkjia.com
tru​​e

http://www.bkjia.com/PHPjc/326056.html

技術記事

数日前、Baidu で検索した後、Baidu ジャンプ後の URL を取得する方法についての記事を書きましたが、Baidu link?url= についても勉強した人がいました。 おおよそ次のような結果が得られます: 1. 暗号化方式は...

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート