import urllib.request
import re
web=urllib.request.urlopen('https://www.gpyh.com/pricebuy/index?pageNum=1&hasStock=&goodsStandardId=1931&materialDictCode=&materialGroupCode=037001&diameter=&length=&brandId=&merchantId=')
neirong=web.read()
def getPage(self,pageIndex):
url = self.siteURL + "?pageNum=" + str(pageIndex)
request = urllib2.Request(url)
response = urllib2.urlopen(request)
return response.read().decode('gbk')
jiangrenhua=neirong.decode('UTF-8')
RegularExpression='<td>(.*)<\/td>'
Valuable=re.findall(RegularExpression,jiangrenhua)
information=[]
for i in range(173):
print(Valuable[i]
N'est-ce pas votre contrôle du numéro de page ?
Si vous le voyez après vous être connecté, utilisez des cookies ou un nom d'utilisateur et un mot de passe pour simuler la connexion et obtenez-le
httplib2 devrait fondamentalement être le terminateur de toutes les requêtes http.