java - 教务系统爬虫问题(尚未解决)
PHPz
PHPz 2017-04-17 17:28:47
0
3
770

最近在做一个查课表的网页,思路是用httpclient模拟用户登录,抓取课表页。现在遇见一个问题纠结了很久没有解决,望大神们给点帮助。

问题是:
青果的一类教务系统,我用F12查看网络请求,登录的post请求只提交了用户名,密码和验证码都是用MD5加密后提交的,于是我伪造了所有的请求参数(包括页面input里隐藏的参数,和MD5加密后的密码和验证码),并且对比了 “我伪造后的参数列表”和“浏览器登录成功的参数列表”完全一致,最后,却总是给我验证码错误的结果。

我测试过的没有问题的操作:

  1. 验证码获取正常(其他系统含验证码的能登录成功已经保证了是同一个回话,也用断点查看了获取验证码的httpClient和登录的是一个对象,并且登录时候用到了访问验证码返回的cookie)

  2. MD5加密的密码和验证码,我对比过相同验证码、用户名、密码在浏览器里面加密过后的密文和我自己程序生成的密文一致

用java的httpclient和php的curl都模拟过登录,java的一直都是返回验证码错误,php的返回的是下图的页面
也用chrome的插件advancedRequest,Firefox的插件httprequester尝试登录过,advancedRequest的结果跟php一样,httpRequester和java的结果一样

PHPz
PHPz

学习是最好的投资!

reply all(3)
大家讲道理

If you log in with a verification code, you must first visit the login page, get a cookie, and then use the cookie to access the verification code. Finally, send a post request to the server with the cookie. The login is successful.

Ty80

Usually use md5 with salt

刘奇

Well, I am also doing Qingguo's simulated login. You need to send the session header file obtained earlier to ValidateCode.aspx to get the verification code image to be valid. You must ensure the same session (session).

Latest Downloads
More>
Web Effects
Website Source Code
Website Materials
Front End Template