


Python melaksanakan pengesahan log masuk halaman dan analisis fungsi pengecaman kod pengesahan untuk aplikasi pengumpulan pelayar tanpa kepala
Aug 08, 2023 am 10:49 AMPython melaksanakan pengesahan log masuk halaman dan analisis fungsi pengecaman kod pengesahan untuk aplikasi pemerolehan penyemak imbas tanpa kepala
Dengan pembangunan berterusan teknologi Internet, semakin banyak aplikasi menggunakan pengesahan log masuk halaman dan fungsi pengenalan kod pengesahan untuk meningkatkan Keselamatan. Apabila merangkak dan mengumpul data daripada aplikasi ini, kami juga perlu menyelesaikan masalah ini. Artikel ini akan memperkenalkan cara menggunakan Python untuk melaksanakan penyemak imbas tanpa kepala untuk mengendalikan pengesahan log masuk halaman dan pengenalan kod pengesahan untuk pengumpulan data yang lancar.
1. Pengenalan kepada penyemak imbas tanpa kepala
Pelayar tanpa kepala ialah penyemak imbas yang tidak mempunyai antara muka visual dan dikendalikan melalui pengaturcaraan. Ia boleh mensimulasikan tingkah laku pengendalian manusia, termasuk membuka halaman web, mengisi borang, mengklik butang, dsb., dengan itu merealisasikan operasi automatik pada halaman web. Pelayar tanpa kepala biasa termasuk Selenium dan Puppeteer.
2. Pemasangan dan konfigurasi perpustakaan Selenium
Selenium ialah perpustakaan yang biasa digunakan untuk ujian web automatik Kami boleh menggunakannya untuk melaksanakan fungsi pengesahan log masuk dan pengecaman kod pengesahan dalam perangkak. Pertama, anda perlu memasang perpustakaan Selenium, yang boleh dipasang menggunakan arahan pip.
pip pasang selenium
Seterusnya, anda perlu memuat turun pemacu penyemak imbas yang sepadan Selenium perlu berinteraksi dengan penyemak imbas melalui pemacu penyemak imbas. Anda boleh memilih pemacu yang sepadan mengikut penyemak imbas yang anda gunakan. Contohnya, pelayar Chrome memerlukan muat turun ChromeDriver.
3. Pemprosesan pengesahan log masuk halaman
- Import perpustakaan
daripada pemacu web import selenium
- Buat objek pelayar
browser = webdriver.Chrome()
- r.dapat( "https://example.com/login")
- username_input = browser.find_element_by_id("username")
nama_kunci"
your_username")
- login_button = browser.find_element_by_css_selector("input[type='submit']")
- Kod di atas menggunakan modul pemacu web perpustakaan Selenium untuk mencipta objek penyemak imbas Chrome, kemudian membuka halaman log masuk, memasukkan nama pengguna dan kata laluan, dan mengklik butang log masuk. Akhir sekali, kandungan halaman selepas log masuk diperoleh dan boleh dirangkak dan diproses lagi.
imej = imej.titik(lambda x: 0 jika x
Lakukan pengecaman kod pengesahan- kod = pytesseract.image_to_string(imej)
- Kod pytesseract di atas menggunakan perpustakaan pytesseract , yang merupakan alat OCR (Optical Character Recognition, optical character recognition) yang boleh mengecam teks dalam imej ke dalam rentetan. Sebelum pengecaman, kami perlu memuatkan imej kod pengesahan dan praproses imej, seperti menukar kepada skala kelabu, binarizing, dll., untuk meningkatkan ketepatan pengecaman.
5. Contoh kod lengkap
- 6. Ringkasan
from selenium import webdriver import pytesseract from PIL import Image # 创建浏览器对象 browser = webdriver.Chrome() # 打开登录页面 browser.get("https://example.com/login") # 输入用户名和密码 username_input = browser.find_element_by_id("username") password_input = browser.find_element_by_id("password") username_input.send_keys("your_username") password_input.send_keys("your_password") # 点击登录按钮 login_button = browser.find_element_by_css_selector("input[type='submit']") login_button.click() # 加载验证码图片 captcha_image = browser.find_element_by_css_selector(".captcha img") captcha_image.screenshot("captcha.png") # 预处理验证码图片 image = Image.open("captcha.png") image = image.convert('L') image = image.point(lambda x: 0 if x < 200 else 255) # 进行验证码识别 code = pytesseract.image_to_string(image) print("验证码识别结果:" + code) # 输入验证码 captcha_input = browser.find_element_by_id("captcha") captcha_input.send_keys(code) # 点击验证码提交按钮 submit_button = browser.find_element_by_css_selector("input[name='captcha_submit']") submit_button.click() # 获取登录后的页面内容 page_content = browser.page_source print(page_content) # 关闭浏览器 browser.quit()
Atas ialah kandungan terperinci Python melaksanakan pengesahan log masuk halaman dan analisis fungsi pengecaman kod pengesahan untuk aplikasi pengumpulan pelayar tanpa kepala. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Artikel Panas

Alat panas Tag

Artikel Panas

Tag artikel panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Apakah kelebihan dan kekurangan templat?

Google AI mengumumkan Gemini 1.5 Pro dan Gemma 2 untuk pembangun

Dengan hanya $250, pengarah teknikal Hugging Face mengajar anda cara memperhalusi Llama 3

Kongsi beberapa rangka kerja projek berkaitan AI dan LLM sumber terbuka .NET

Panduan lengkap untuk penyahpepijatan dan analisis fungsi golang

Bagaimana anda bertanya kepadanya Deepseek
