백엔드 개발 파이썬 튜토리얼 python实现带验证码网站的自动登陆实现代码

python实现带验证码网站的自动登陆实现代码

Jun 06, 2016 am 11:20 AM
인증코드

早听说用python做网络爬虫非常方便,正好这几天单位也有这样的需求,需要登陆XX网站下载部分文档,于是自己亲身试验了一番,效果还不错。

本例所登录的某网站需要提供用户名,密码和验证码,在此使用了python的urllib2直接登录网站并处理网站的Cookie。

Cookie的工作原理:
Cookie由服务端生成,然后发送给浏览器,浏览器会将Cookie保存在某个目录下的文本文件中。在下次请求同一网站时,会发送该Cookie给服务器,这样服务器就知道该用户是否合法以及是否需要重新登录。

Python提供了基本的cookielib库,在首次访问某页面时,cookie便会自动保存下来,之后访问其它页面便都会带有正常登录的Cookie了。

原理:

(1)激活cookie功能
(2)反“反盗链”,伪装成浏览器访问
(3)访问验证码链接,并将验证码图片下载到本地
(4)验证码的识别方案网上较多,python也有自己的图像处理库,此例调用了火车头采集器的OCR识别接口。
(5)表单的处理,可用fiddler等抓包工具获取需要提交的参数
(6)生成需要提交的数据,生成http请求并发送
(7)根据返回的js页面判断是否登陆成功
(8)登陆成功后下载其它页面

此例中使用多个账号轮询登陆,每个账号下载3个页面。

下载网址因为某些问题,就不透露了。

以下是部分代码:

#!usr/bin/env python
#-*- coding: utf-8 -*-

import os
import urllib2
import urllib
import cookielib
import xml.etree.ElementTree as ET


#-----------------------------------------------------------------------------
# Login in www.***.com.cn
def ChinaBiddingLogin(url, username, password):
    # Enable cookie support for urllib2
    cookiejar=cookielib.CookieJar()
    urlopener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar))
    urllib2.install_opener(urlopener)
    
    urlopener.addheaders.append(('Referer', 'http://www.chinabidding.com.cn/zbw/login/login.jsp'))
    urlopener.addheaders.append(('Accept-Language', 'zh-CN'))
    urlopener.addheaders.append(('Host', 'www.chinabidding.com.cn'))
    urlopener.addheaders.append(('User-Agent', 'Mozilla/5.0 (compatible; MISE 9.0; Windows NT 6.1); Trident/5.0'))
    urlopener.addheaders.append(('Connection', 'Keep-Alive'))


    print 'XXX Login......'


    imgurl=r'http://www.*****.com.cn/zbw/login/image.jsp'
    DownloadFile(imgurl, urlopener)
    authcode=raw_input('Please enter the authcode:')
    #authcode=VerifyingCodeRecognization(r"http://192.168.0.106/images/code.jpg")


    # Send login/password to the site and get the session cookie
    values={'login_id':username, 'opl':'op_login', 'login_passwd':password, 'login_check':authcode}
    urlcontent=urlopener.open(urllib2.Request(url, urllib.urlencode(values)))
    page=urlcontent.read(500000)


    # Make sure we are logged in, check the returned page content
    if page.find('login.jsp')!=-1:
        print 'Login failed with username=%s, password=%s and authcode=%s' \
                % (username, password, authcode)
        return False
    else:
        print 'Login succeeded!'
        return True


#-----------------------------------------------------------------------------
# Download from fileUrl then save to fileToSave
# Note: the fileUrl must be a valid file
def DownloadFile(fileUrl, urlopener):
    isDownOk=False


    try:
        if fileUrl:
            outfile=open(r'/var/www/images/code.jpg', 'w')
            outfile.write(urlopener.open(urllib2.Request(fileUrl)).read())
            outfile.close()


            isDownOK=True
        else:
            print 'ERROR: fileUrl is NULL!'
    except:
        isDownOK=False


    return isDownOK


#------------------------------------------------------------------------------
# Verifying code recoginization
def VerifyingCodeRecognization(imgurl):
    url=r'http://192.168.0.119:800/api?'
    user='admin'
    pwd='admin'
    model='ocr'
    ocrfile='cbi'


    values={'user':user, 'pwd':pwd, 'model':model, 'ocrfile':ocrfile, 'imgurl':imgurl}
    data=urllib.urlencode(values)


    try:
        url+=data
        urlcontent=urllib2.urlopen(url)
    except IOError:
        print '***ERROR: invalid URL (%s)' % url


    page=urlcontent.read(500000)


    # Parse the xml data and get the verifying code
    root=ET.fromstring(page)
    node_find=root.find('AddField')
    authcode=node_find.attrib['data']


    return authcode


#------------------------------------------------------------------------------
# Read users from configure file
def ReadUsersFromFile(filename):
    users={}
    for eachLine in open(filename, 'r'):
        info=[w for w in eachLine.strip().split()]
        if len(info)==2:
            users[info[0]]=info[1]


    return users


#------------------------------------------------------------------------------
def main():
    login_page=r'http://www.***.com.cnlogin/login.jsp'
    download_page=r'http://www.***.com.cn***/***?record_id='


    start_id=8593330
    end_id=8595000


    now_id=start_id
    Users=ReadUsersFromFile('users.conf')
    while True:
        for key in Users:
            if ChinaBiddingLogin(login_page, key, Users[key]):
                for i in range(3):
                    pageUrl=download_page+'%d' % now_id
                    urlcontent=urllib2.urlopen(pageUrl)


                    filepath='./download/%s.html' % now_id
                    f=open(filepath, 'w')
                    f.write(urlcontent.read(500000))
                    f.close()


                    now_id+=1
            else:
                continue
#------------------------------------------------------------------------------


if __name__=='__main__':
    main()
로그인 후 복사

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Chrome에 인증코드 이미지가 표시되지 않으면 어떻게 해야 하나요? Chrome에 인증코드 이미지가 표시되지 않으면 어떻게 해야 하나요? Mar 13, 2024 pm 08:55 PM

Google 크롬에 인증 코드 이미지가 표시되지 않으면 어떻게 해야 하나요? Google Chrome을 사용하여 웹페이지에 로그인할 때 인증 코드가 필요한 경우가 있습니다. 일부 사용자는 이미지 인증 코드를 사용할 때 Chrome에서 이미지 내용을 제대로 표시할 수 없다는 사실을 발견합니다. 무엇을 해야 합니까? 아래 편집기에서 Chrome 인증 코드가 표시되지 않는 문제를 해결하는 방법을 소개하겠습니다. 모든 분들께 도움이 되길 바랍니다! 방법 소개: 1. 소프트웨어를 입력하고 오른쪽 상단 모서리에 있는 "추가" 버튼을 클릭한 다음 아래 옵션 목록에서 "설정"을 선택하여 들어갑니다. 2. 새 인터페이스에 들어간 후 왼쪽의 "개인정보 설정 및 보안" 옵션을 클릭하세요. 3. 오른쪽의 '웹사이트 설정'을 클릭하세요.

휴대폰으로 인증코드를 받을 수 없는 이유는 무엇입니까? 휴대폰으로 인증코드를 받을 수 없는 이유는 무엇입니까? Aug 17, 2023 pm 02:49 PM

휴대폰으로 인증번호를 받지 못하는 경우는 네트워크 문제, 휴대폰 설정 문제, 이동통신사 문제, 개인 설정 문제 등으로 인해 발생합니다. 자세한 소개: 1. 네트워크 문제. 휴대폰이 위치한 네트워크 환경이 불안정하거나 신호가 약하여 인증 코드가 제때 전달되지 않을 수 있습니다. 2. 휴대폰 설정 문제. 휴대폰의 음성 기능이 실수로 꺼졌거나, 인증번호 발신번호가 블랙리스트에 추가되어 인증번호가 정상적으로 수신되지 않는 경우 3. 휴대폰 사업자의 문제일 수 있습니다. 오작동 또는 유지 관리로 인해 인증 코드가 제때에 전달되지 않는 경우 등

가상번호로 인증코드를 받을 수 있나요? 가상번호로 인증코드를 받을 수 있나요? Jan 02, 2024 am 10:22 AM

가상번호로 인증번호를 받으실 수 있습니다. 등록 시 기재한 휴대폰번호가 규정을 준수하고 휴대폰 번호가 정상적으로 연결될 수 있으면 SMS 인증번호를 받으실 수 있습니다. 다만, 가상휴대폰번호 이용시에는 주의가 필요합니다. 일부 웹사이트에서는 가상휴대폰번호 등록을 지원하지 않으므로 일반 가상휴대폰번호 서비스 제공업체를 선택하셔야 합니다.

PHP 이미지 처리 사례: 이미지의 인증코드 기능 구현 방법 PHP 이미지 처리 사례: 이미지의 인증코드 기능 구현 방법 Aug 17, 2023 pm 12:09 PM

PHP 이미지 처리 사례: 이미지의 인증 코드 기능을 구현하는 방법 인터넷의 급속한 발전과 함께 인증 코드는 웹 사이트 보안을 보호하는 중요한 수단 중 하나가 되었습니다. 인증코드는 영상인식 기술을 이용해 사용자가 실제 사용자인지 확인하는 인증 방식이다. 이 글에서는 PHP를 사용하여 이미지의 인증 코드 기능을 구현하는 방법과 코드 예제를 소개합니다. 소개 인증 코드는 임의의 문자가 포함된 사진입니다. 사용자는 인증을 통과하기 위해 사진에 있는 문자를 입력해야 합니다. 인증 코드를 구현하는 주요 프로세스에는 임의의 문자를 생성하고 문자를 그림으로 그리는 작업이 포함됩니다.

PHP 개발 가이드: 인증 코드 로그인 구현 PHP 개발 가이드: 인증 코드 로그인 구현 Jul 01, 2023 am 09:27 AM

인터넷의 발달과 스마트폰의 대중화로 인해 인증코드 로그인 기능을 채택하는 웹사이트와 애플리케이션이 점점 더 많아지고 있습니다. 인증번호 로그인은 보안을 강화하고 악의적인 공격을 방지하기 위해 올바른 인증번호를 입력하여 사용자의 신원을 확인하는 로그인 방식입니다. PHP 개발 시 간단한 인증코드 로그인 기능 구현은 복잡하지 않으며 다음 단계를 통해 완료할 수 있습니다. 데이터베이스 테이블 생성 먼저, 인증 코드 정보를 저장할 데이터베이스에 테이블을 생성해야 합니다. 테이블 구조에는 다음 필드가 포함될 수 있습니다. id: 자동 증가 기본 키 전화

인증 코드는 로봇을 막을 수 없습니다! Google AI는 흐릿한 텍스트를 정확하게 식별할 수 있고, GPT-4는 시각 장애인 척하며 도움을 요청합니다. 인증 코드는 로봇을 막을 수 없습니다! Google AI는 흐릿한 텍스트를 정확하게 식별할 수 있고, GPT-4는 시각 장애인 척하며 도움을 요청합니다. Apr 12, 2023 am 09:46 AM

"가장 짜증나는 것은 웹사이트에 로그인할 때 온갖 종류의 이상한(심지어 왜곡된) 인증 코드가 있다는 것입니다. 이제 좋은 소식과 나쁜 소식이 있습니다." 좋은 소식은 AI가 당신을 대신해 이 일을 할 수 있다는 것입니다. 내 말을 믿을 수 없다면 인식 난이도가 증가하는 세 가지 실제 사례가 있습니다. 그리고 다음은 "Pix2Struct"라는 모델이 제공하는 답변입니다. 모두 정확하고 단어 그대로입니까? 일부 네티즌들은 “물론 정확도가 나보다 낫다”고 한탄했다. 그럼 브라우저 플러그인으로 만들 수 있을까요? ? 네, 일부 사람들은 이렇게 말했습니다. 비록 이러한 경우가 비교적 간단하더라도 미세 조정만 하면 그 효과가 얼마나 강력한지 상상할 수 없습니다. 따라서 나쁜 소식은 인증 코드가 곧 로봇을 막을 수 없다는 것입니다! (위험 위험 위험...) 어떻게 해야 할까요? Pix2St

PHP를 사용하여 인증 코드 이미지를 만드는 방법은 무엇입니까? PHP를 사용하여 인증 코드 이미지를 만드는 방법은 무엇입니까? Sep 13, 2023 am 11:40 AM

PHP를 사용하여 인증 코드 이미지를 만드는 방법은 무엇입니까? CAPTCHA는 사용자가 기계가 아닌 사람인지 확인하기 위해 일반적으로 사용되는 방법입니다. 웹사이트에서는 사용자가 로그인, 등록, 댓글 달기 등의 작업을 완료하기 위해 이미지에 표시된 임의의 문자나 숫자를 입력해야 하는 인증 코드 이미지를 자주 볼 수 있습니다. 이 문서에서는 PHP를 사용하여 인증 코드 이미지를 만드는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. PHPGD 라이브러리 인증코드 이미지를 생성하려면 PHP의 GD 라이브러리를 사용해야 합니다. GD 라이브러리는 이미지 처리를 위한 확장입니다.

내 휴대전화로 다양한 플랫폼에서 인증코드를 받는데 무슨 문제가 있나요? 내 휴대전화로 다양한 플랫폼에서 인증코드를 받는데 무슨 문제가 있나요? Sep 21, 2023 pm 03:31 PM

귀하의 휴대전화가 다양한 플랫폼에서 인증코드를 받는 것은 귀하의 개인정보가 도난당했거나, 휴대전화번호가 도용되었거나, 휴대전화번호가 부정확하게 기재되거나 오용되었기 때문일 수 있습니다. 자세한 소개: 1. 개인정보가 도난당했습니다. 해커나 범죄자는 다양한 채널을 통해 귀하의 개인정보를 입수한 후 이 정보를 사용하여 다양한 플랫폼에 계정을 등록할 수 있습니다. 2. 휴대폰 번호가 도용되었으며 일부 범죄자는 A를 사용합니다. 다양한 수단을 통해 다수의 휴대전화번호를 취득한 후 이를 이용하여 각종 사기행위를 하는 경우 3. 휴대전화번호를 부정확하게 기재하거나 오용하는 등의 행위

See all articles