> 백엔드 개발 > PHP 튜토리얼 > 如何模拟抓取四六级查询成绩(99宿舍网)

如何模拟抓取四六级查询成绩(99宿舍网)

WBOY
풀어 주다: 2016-06-06 20:22:14
원래의
1528명이 탐색했습니다.

最近在做一个微信上查询四六级成绩的功能,学信网可以抓取,但是爬了1000左右后,就会出现验证码,只好放弃这个方法。有人可以从99宿舍网爬取,但他们不愿意告知,求大神告知具体方法。

回复内容:

最近在做一个微信上查询四六级成绩的功能,学信网可以抓取,但是爬了1000左右后,就会出现验证码,只好放弃这个方法。有人可以从99宿舍网爬取,但他们不愿意告知,求大神告知具体方法。

做了个DEMO:http://cet.zy62.com/

使用方法$rs = cet('姓名','准考证号'); var_dump($rs);

<code>function cet($name,$id){
    $name = urlencode(mb_convert_encoding($name, 'gb2312', 'utf-8'));
    $post = 'id=' . $id . '&name=' . $name;
    $url = "http://cet.99sushe.com/findscore";
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_REFERER, "http://cet.99sushe.com/");
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_NOBODY, false);
    $str = curl_exec($ch);
    curl_close($ch);
    $str = iconv("GB2312", "UTF-8", $str);
    if (strlen($str) </code>
로그인 후 복사

微信版本:

如何模拟抓取四六级查询成绩(99宿舍网)

遇到验证码,可能是你的爬虫没有换Ip。那就1000左右的时候更换IP继续爬就OK了。简单的验证码是可以破解的。

관련 라벨:
php
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿