python实现带验证码网站的自动登陆实现代码
早听说用python做网络爬虫非常方便,正好这几天单位也有这样的需求,需要登陆XX网站下载部分文档,于是自己亲身试验了一番,效果还不错。
本例所登录的某网站需要提供用户名,密码和验证码,在此使用了python的urllib2直接登录网站并处理网站的Cookie。
Cookie的工作原理:
Cookie由服务端生成,然后发送给浏览器,浏览器会将Cookie保存在某个目录下的文本文件中。在下次请求同一网站时,会发送该Cookie给服务器,这样服务器就知道该用户是否合法以及是否需要重新登录。
Python提供了基本的cookielib库,在首次访问某页面时,cookie便会自动保存下来,之后访问其它页面便都会带有正常登录的Cookie了。
原理:
(1)激活cookie功能
(2)反“反盗链”,伪装成浏览器访问
(3)访问验证码链接,并将验证码图片下载到本地
(4)验证码的识别方案网上较多,python也有自己的图像处理库,此例调用了火车头采集器的OCR识别接口。
(5)表单的处理,可用fiddler等抓包工具获取需要提交的参数
(6)生成需要提交的数据,生成http请求并发送
(7)根据返回的js页面判断是否登陆成功
(8)登陆成功后下载其它页面
此例中使用多个账号轮询登陆,每个账号下载3个页面。
下载网址因为某些问题,就不透露了。
以下是部分代码:
#!usr/bin/env python #-*- coding: utf-8 -*- import os import urllib2 import urllib import cookielib import xml.etree.ElementTree as ET #----------------------------------------------------------------------------- # Login in www.***.com.cn def ChinaBiddingLogin(url, username, password): # Enable cookie support for urllib2 cookiejar=cookielib.CookieJar() urlopener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar)) urllib2.install_opener(urlopener) urlopener.addheaders.append(('Referer', 'http://www.chinabidding.com.cn/zbw/login/login.jsp')) urlopener.addheaders.append(('Accept-Language', 'zh-CN')) urlopener.addheaders.append(('Host', 'www.chinabidding.com.cn')) urlopener.addheaders.append(('User-Agent', 'Mozilla/5.0 (compatible; MISE 9.0; Windows NT 6.1); Trident/5.0')) urlopener.addheaders.append(('Connection', 'Keep-Alive')) print 'XXX Login......' imgurl=r'http://www.*****.com.cn/zbw/login/image.jsp' DownloadFile(imgurl, urlopener) authcode=raw_input('Please enter the authcode:') #authcode=VerifyingCodeRecognization(r"http://192.168.0.106/images/code.jpg") # Send login/password to the site and get the session cookie values={'login_id':username, 'opl':'op_login', 'login_passwd':password, 'login_check':authcode} urlcontent=urlopener.open(urllib2.Request(url, urllib.urlencode(values))) page=urlcontent.read(500000) # Make sure we are logged in, check the returned page content if page.find('login.jsp')!=-1: print 'Login failed with username=%s, password=%s and authcode=%s' \ % (username, password, authcode) return False else: print 'Login succeeded!' return True #----------------------------------------------------------------------------- # Download from fileUrl then save to fileToSave # Note: the fileUrl must be a valid file def DownloadFile(fileUrl, urlopener): isDownOk=False try: if fileUrl: outfile=open(r'/var/www/images/code.jpg', 'w') outfile.write(urlopener.open(urllib2.Request(fileUrl)).read()) outfile.close() isDownOK=True else: print 'ERROR: fileUrl is NULL!' except: isDownOK=False return isDownOK #------------------------------------------------------------------------------ # Verifying code recoginization def VerifyingCodeRecognization(imgurl): url=r'http://192.168.0.119:800/api?' user='admin' pwd='admin' model='ocr' ocrfile='cbi' values={'user':user, 'pwd':pwd, 'model':model, 'ocrfile':ocrfile, 'imgurl':imgurl} data=urllib.urlencode(values) try: url+=data urlcontent=urllib2.urlopen(url) except IOError: print '***ERROR: invalid URL (%s)' % url page=urlcontent.read(500000) # Parse the xml data and get the verifying code root=ET.fromstring(page) node_find=root.find('AddField') authcode=node_find.attrib['data'] return authcode #------------------------------------------------------------------------------ # Read users from configure file def ReadUsersFromFile(filename): users={} for eachLine in open(filename, 'r'): info=[w for w in eachLine.strip().split()] if len(info)==2: users[info[0]]=info[1] return users #------------------------------------------------------------------------------ def main(): login_page=r'http://www.***.com.cnlogin/login.jsp' download_page=r'http://www.***.com.cn***/***?record_id=' start_id=8593330 end_id=8595000 now_id=start_id Users=ReadUsersFromFile('users.conf') while True: for key in Users: if ChinaBiddingLogin(login_page, key, Users[key]): for i in range(3): pageUrl=download_page+'%d' % now_id urlcontent=urllib2.urlopen(pageUrl) filepath='./download/%s.html' % now_id f=open(filepath, 'w') f.write(urlcontent.read(500000)) f.close() now_id+=1 else: continue #------------------------------------------------------------------------------ if __name__=='__main__': main()

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Google 크롬에 인증 코드 이미지가 표시되지 않으면 어떻게 해야 하나요? Google Chrome을 사용하여 웹페이지에 로그인할 때 인증 코드가 필요한 경우가 있습니다. 일부 사용자는 이미지 인증 코드를 사용할 때 Chrome에서 이미지 내용을 제대로 표시할 수 없다는 사실을 발견합니다. 무엇을 해야 합니까? 아래 편집기에서 Chrome 인증 코드가 표시되지 않는 문제를 해결하는 방법을 소개하겠습니다. 모든 분들께 도움이 되길 바랍니다! 방법 소개: 1. 소프트웨어를 입력하고 오른쪽 상단 모서리에 있는 "추가" 버튼을 클릭한 다음 아래 옵션 목록에서 "설정"을 선택하여 들어갑니다. 2. 새 인터페이스에 들어간 후 왼쪽의 "개인정보 설정 및 보안" 옵션을 클릭하세요. 3. 오른쪽의 '웹사이트 설정'을 클릭하세요.

휴대폰으로 인증번호를 받지 못하는 경우는 네트워크 문제, 휴대폰 설정 문제, 이동통신사 문제, 개인 설정 문제 등으로 인해 발생합니다. 자세한 소개: 1. 네트워크 문제. 휴대폰이 위치한 네트워크 환경이 불안정하거나 신호가 약하여 인증 코드가 제때 전달되지 않을 수 있습니다. 2. 휴대폰 설정 문제. 휴대폰의 음성 기능이 실수로 꺼졌거나, 인증번호 발신번호가 블랙리스트에 추가되어 인증번호가 정상적으로 수신되지 않는 경우 3. 휴대폰 사업자의 문제일 수 있습니다. 오작동 또는 유지 관리로 인해 인증 코드가 제때에 전달되지 않는 경우 등

가상번호로 인증번호를 받으실 수 있습니다. 등록 시 기재한 휴대폰번호가 규정을 준수하고 휴대폰 번호가 정상적으로 연결될 수 있으면 SMS 인증번호를 받으실 수 있습니다. 다만, 가상휴대폰번호 이용시에는 주의가 필요합니다. 일부 웹사이트에서는 가상휴대폰번호 등록을 지원하지 않으므로 일반 가상휴대폰번호 서비스 제공업체를 선택하셔야 합니다.

PHP 이미지 처리 사례: 이미지의 인증 코드 기능을 구현하는 방법 인터넷의 급속한 발전과 함께 인증 코드는 웹 사이트 보안을 보호하는 중요한 수단 중 하나가 되었습니다. 인증코드는 영상인식 기술을 이용해 사용자가 실제 사용자인지 확인하는 인증 방식이다. 이 글에서는 PHP를 사용하여 이미지의 인증 코드 기능을 구현하는 방법과 코드 예제를 소개합니다. 소개 인증 코드는 임의의 문자가 포함된 사진입니다. 사용자는 인증을 통과하기 위해 사진에 있는 문자를 입력해야 합니다. 인증 코드를 구현하는 주요 프로세스에는 임의의 문자를 생성하고 문자를 그림으로 그리는 작업이 포함됩니다.

인터넷의 발달과 스마트폰의 대중화로 인해 인증코드 로그인 기능을 채택하는 웹사이트와 애플리케이션이 점점 더 많아지고 있습니다. 인증번호 로그인은 보안을 강화하고 악의적인 공격을 방지하기 위해 올바른 인증번호를 입력하여 사용자의 신원을 확인하는 로그인 방식입니다. PHP 개발 시 간단한 인증코드 로그인 기능 구현은 복잡하지 않으며 다음 단계를 통해 완료할 수 있습니다. 데이터베이스 테이블 생성 먼저, 인증 코드 정보를 저장할 데이터베이스에 테이블을 생성해야 합니다. 테이블 구조에는 다음 필드가 포함될 수 있습니다. id: 자동 증가 기본 키 전화

"가장 짜증나는 것은 웹사이트에 로그인할 때 온갖 종류의 이상한(심지어 왜곡된) 인증 코드가 있다는 것입니다. 이제 좋은 소식과 나쁜 소식이 있습니다." 좋은 소식은 AI가 당신을 대신해 이 일을 할 수 있다는 것입니다. 내 말을 믿을 수 없다면 인식 난이도가 증가하는 세 가지 실제 사례가 있습니다. 그리고 다음은 "Pix2Struct"라는 모델이 제공하는 답변입니다. 모두 정확하고 단어 그대로입니까? 일부 네티즌들은 “물론 정확도가 나보다 낫다”고 한탄했다. 그럼 브라우저 플러그인으로 만들 수 있을까요? ? 네, 일부 사람들은 이렇게 말했습니다. 비록 이러한 경우가 비교적 간단하더라도 미세 조정만 하면 그 효과가 얼마나 강력한지 상상할 수 없습니다. 따라서 나쁜 소식은 인증 코드가 곧 로봇을 막을 수 없다는 것입니다! (위험 위험 위험...) 어떻게 해야 할까요? Pix2St

PHP를 사용하여 인증 코드 이미지를 만드는 방법은 무엇입니까? CAPTCHA는 사용자가 기계가 아닌 사람인지 확인하기 위해 일반적으로 사용되는 방법입니다. 웹사이트에서는 사용자가 로그인, 등록, 댓글 달기 등의 작업을 완료하기 위해 이미지에 표시된 임의의 문자나 숫자를 입력해야 하는 인증 코드 이미지를 자주 볼 수 있습니다. 이 문서에서는 PHP를 사용하여 인증 코드 이미지를 만드는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. PHPGD 라이브러리 인증코드 이미지를 생성하려면 PHP의 GD 라이브러리를 사용해야 합니다. GD 라이브러리는 이미지 처리를 위한 확장입니다.

귀하의 휴대전화가 다양한 플랫폼에서 인증코드를 받는 것은 귀하의 개인정보가 도난당했거나, 휴대전화번호가 도용되었거나, 휴대전화번호가 부정확하게 기재되거나 오용되었기 때문일 수 있습니다. 자세한 소개: 1. 개인정보가 도난당했습니다. 해커나 범죄자는 다양한 채널을 통해 귀하의 개인정보를 입수한 후 이 정보를 사용하여 다양한 플랫폼에 계정을 등록할 수 있습니다. 2. 휴대폰 번호가 도용되었으며 일부 범죄자는 A를 사용합니다. 다양한 수단을 통해 다수의 휴대전화번호를 취득한 후 이를 이용하여 각종 사기행위를 하는 경우 3. 휴대전화번호를 부정확하게 기재하거나 오용하는 등의 행위
