小伙看你根骨奇佳,潜力无限,来学PHP伐。
用request库可以很方便这种任务,下面是我写的一个获取可用代理列表 + 用代理访问目标网站的Demo
var request = require("request"); var iconv = require('iconv-lite'); var Promise = require("bluebird"); function getProxyList() { var apiURL = 'http://www.66ip.cn/mo.php?sxb=&tqsl=100&port=&export=&ktip=&sxa=&submit=%CC%E1++%C8%A1&textarea=http%3A%2F%2Fwww.66ip.cn%2F%3Fsxb%3D%26tqsl%3D100%26ports%255B%255D2%3D%26ktip%3D%26sxa%3D%26radio%3Dradio%26submit%3D%25CC%25E1%2B%2B%25C8%25A1'; return new Promise((resolve, reject) => { var options = { method: 'GET', url: apiURL, gzip: true, encoding: null, headers: { 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8', 'Accept-Encoding': 'gzip, deflate', 'Accept-Language': 'zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4', 'User-Agent': 'Mozilla/8.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36', 'referer': 'http://www.66ip.cn/' }, }; request(options, function (error, response, body) { try { if (error) throw error; if (/meta.*charset=gb2312/.test(body)) { body = iconv.decode(body, 'gbk'); } var ret = body.match(/\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,4}/g); resolve(ret); } catch (e) { return reject(e); } }); }) } getProxyList().then(function (proxyList) { var targetOptions = { method: 'GET', url: 'http://ip.chinaz.com/getip.aspx', timeout: 8000, encoding: null, }; //这里修改一下,变成你要访问的目标网站 proxyList.forEach(function (proxyurl) { console.log(`testing ${proxyurl}`); targetOptions.proxy = 'http://' + proxyurl; request(targetOptions, function (error, response, body) { try { if (error) throw error; body = body.toString(); console.log(body); eval(`var ret = ${body}`); if (ret) { console.log(`验证成功==>> ${ret.address}`); } } catch (e) { // console.error(e); } }); }); }).catch(e => { console.log(e); })
那你首先得找到一堆代理啊,据我所知这种动态代理一般靠谱的都是收费的。具体思路就是请求代理提供商的接口获得代理服务器列表,然后每次请求都随机选一个作为代理
用request库可以很方便这种任务,下面是我写的一个获取可用代理列表 + 用代理访问目标网站的Demo
那你首先得找到一堆代理啊,据我所知这种动态代理一般靠谱的都是收费的。
具体思路就是请求代理提供商的接口获得代理服务器列表,然后每次请求都随机选一个作为代理