Python melaksanakan pengesahan log masuk halaman dan analisis fungsi pengecaman kod pengesahan untuk aplikasi pemerolehan penyemak imbas tanpa kepala
Dengan pembangunan berterusan teknologi Internet, semakin banyak aplikasi menggunakan pengesahan log masuk halaman dan fungsi pengenalan kod pengesahan untuk meningkatkan Keselamatan. Apabila merangkak dan mengumpul data daripada aplikasi ini, kami juga perlu menyelesaikan masalah ini. Artikel ini akan memperkenalkan cara menggunakan Python untuk melaksanakan penyemak imbas tanpa kepala untuk mengendalikan pengesahan log masuk halaman dan pengenalan kod pengesahan untuk pengumpulan data yang lancar.
1. Pengenalan kepada penyemak imbas tanpa kepala
Pelayar tanpa kepala ialah penyemak imbas yang tidak mempunyai antara muka visual dan dikendalikan melalui pengaturcaraan. Ia boleh mensimulasikan tingkah laku pengendalian manusia, termasuk membuka halaman web, mengisi borang, mengklik butang, dsb., dengan itu merealisasikan operasi automatik pada halaman web. Pelayar tanpa kepala biasa termasuk Selenium dan Puppeteer.
2. Pemasangan dan konfigurasi perpustakaan Selenium
Selenium ialah perpustakaan yang biasa digunakan untuk ujian web automatik Kami boleh menggunakannya untuk melaksanakan fungsi pengesahan log masuk dan pengecaman kod pengesahan dalam perangkak. Pertama, anda perlu memasang perpustakaan Selenium, yang boleh dipasang menggunakan arahan pip.
pip pasang selenium
Seterusnya, anda perlu memuat turun pemacu penyemak imbas yang sepadan Selenium perlu berinteraksi dengan penyemak imbas melalui pemacu penyemak imbas. Anda boleh memilih pemacu yang sepadan mengikut penyemak imbas yang anda gunakan. Contohnya, pelayar Chrome memerlukan muat turun ChromeDriver.
3. Pemprosesan pengesahan log masuk halaman
daripada pemacu web import selenium
browser = webdriver.Chrome()
nama_kunci"
your_username")
imej = imej.titik(lambda x: 0 jika x
Lakukan pengecaman kod pengesahan 5. Contoh kod lengkap
from selenium import webdriver import pytesseract from PIL import Image # 创建浏览器对象 browser = webdriver.Chrome() # 打开登录页面 browser.get("https://example.com/login") # 输入用户名和密码 username_input = browser.find_element_by_id("username") password_input = browser.find_element_by_id("password") username_input.send_keys("your_username") password_input.send_keys("your_password") # 点击登录按钮 login_button = browser.find_element_by_css_selector("input[type='submit']") login_button.click() # 加载验证码图片 captcha_image = browser.find_element_by_css_selector(".captcha img") captcha_image.screenshot("captcha.png") # 预处理验证码图片 image = Image.open("captcha.png") image = image.convert('L') image = image.point(lambda x: 0 if x < 200 else 255) # 进行验证码识别 code = pytesseract.image_to_string(image) print("验证码识别结果:" + code) # 输入验证码 captcha_input = browser.find_element_by_id("captcha") captcha_input.send_keys(code) # 点击验证码提交按钮 submit_button = browser.find_element_by_css_selector("input[name='captcha_submit']") submit_button.click() # 获取登录后的页面内容 page_content = browser.page_source print(page_content) # 关闭浏览器 browser.quit()
Atas ialah kandungan terperinci Python melaksanakan pengesahan log masuk halaman dan analisis fungsi pengecaman kod pengesahan untuk aplikasi pengumpulan pelayar tanpa kepala. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!