网页爬虫 - python爬虫翻页问题,请问各位大神我这段代码怎样翻页,还有价格要登陆后才能看到,应该怎么解决
黄舟
黄舟 2017-04-18 10:32:00
0
2
590
import urllib.request
import re
web=urllib.request.urlopen('https://www.gpyh.com/pricebuy/index?pageNum=1&hasStock=&goodsStandardId=1931&materialDictCode=&materialGroupCode=037001&diameter=&length=&brandId=&merchantId=')
neirong=web.read()
def getPage(self,pageIndex):
    url = self.siteURL + "?pageNum=" + str(pageIndex)
    request = urllib2.Request(url)
    response = urllib2.urlopen(request)
    return response.read().decode('gbk')
jiangrenhua=neirong.decode('UTF-8')
RegularExpression='<td>(.*)<\/td>'
Valuable=re.findall(RegularExpression,jiangrenhua)
information=[]
for i in range(173):
    print(Valuable[i]
黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

모든 응답(2)
黄舟

으아아아

이거 페이지 번호 관리 아닌가요?
로그인 후 보이면 쿠키나 사용자 이름과 비밀번호를 이용해 로그인을 시뮬레이션하고 받아보세요

迷茫

httplib2는 기본적으로 모든 http 요청의 종결자여야 합니다.

으아악
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿