java - 教务系统爬虫问题(尚未解决)
PHPz
PHPz 2017-04-17 17:28:47
0
3
775

最近在做一个查课表的网页,思路是用httpclient模拟用户登录,抓取课表页。现在遇见一个问题纠结了很久没有解决,望大神们给点帮助。

问题是:
青果的一类教务系统,我用F12查看网络请求,登录的post请求只提交了用户名,密码和验证码都是用MD5加密后提交的,于是我伪造了所有的请求参数(包括页面input里隐藏的参数,和MD5加密后的密码和验证码),并且对比了 “我伪造后的参数列表”和“浏览器登录成功的参数列表”完全一致,最后,却总是给我验证码错误的结果。

我测试过的没有问题的操作:

  1. 验证码获取正常(其他系统含验证码的能登录成功已经保证了是同一个回话,也用断点查看了获取验证码的httpClient和登录的是一个对象,并且登录时候用到了访问验证码返回的cookie)

  2. MD5加密的密码和验证码,我对比过相同验证码、用户名、密码在浏览器里面加密过后的密文和我自己程序生成的密文一致

用java的httpclient和php的curl都模拟过登录,java的一直都是返回验证码错误,php的返回的是下图的页面
也用chrome的插件advancedRequest,Firefox的插件httprequester尝试登录过,advancedRequest的结果跟php一样,httpRequester和java的结果一样

PHPz
PHPz

学习是最好的投资!

全員に返信(3)
大家讲道理

確認コードを使用してログインする場合は、まずログイン ページにアクセスして Cookie を取得し、次にその Cookie を使用して確認コードにアクセスする必要があります。最後に、Cookie を使用して投稿リクエストをサーバーに送信します。ログインは成功しました。

いいねを押す +0
Ty80

通常は、MD5 と塩を使用します

いいねを押す +0
刘奇

そうですね、Qingguo のシミュレートされたログインも実行しています。検証コード イメージを有効にするために、以前に取得したセッション ヘッダー ファイルを ValidateCode.aspx に送信する必要があります。それが同じセッション (セッション) であることを確認する必要があります。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート