PHP는 Curl을 사용하여 시뮬레이션된 로그인 및 데이터 캡처 기능 예제를 구현합니다.

不言
풀어 주다: 2023-03-25 06:00:02
원래의
1616명이 탐색했습니다.

이 기사에서는 시뮬레이션된 로그인 및 데이터 캡처 기능을 구현하기 위한 PHP의 Curl 사용을 주로 소개합니다. 로그인, 확인, 쿠키 작업 및 데이터 캡처를 위한 PHP의 컬 사용 및 기타 관련 구현 기술을 예제 형식으로 분석합니다. to it

이 기사의 예에서는 PHP가 Curl을 사용하여 시뮬레이션된 로그인 및 데이터 캡처 기능을 구현하는 방법을 설명합니다. 참고할 수 있도록 모든 사람과 공유하세요. 세부 사항은 다음과 같습니다.

PHP의 Curl 확장 라이브러리를 사용하면 로그인을 시뮬레이션하고 사용자 계정으로 로그인한 후에만 볼 수 있는 일부 데이터를 캡처할 수 있습니다. 구체적인 구현 과정은 다음과 같습니다(개인 요약):

1. 먼저 해당 로그인 페이지의 HTML 소스 코드를 분석하여 몇 가지 필요한 정보를 얻어야 합니다.

(1) 로그인 페이지 주소

(2) 확인 코드 주소

(3) 로그인 양식에 제출해야 하는 각 필드의 이름 및 제출 방법

(4) 로그인 양식을 제출할 주소; 5) 또한, 캡쳐할 데이터의 주소를 알아야 합니다.

2. 쿠키를 받아 저장하세요(쿠키 파일을 사용하는 웹사이트의 경우):

$login_url = 'http://www.xxxxx';  //登录页面地址
$cookie_file = dirname(__FILE__)."/pic.cookie";  //cookie文件存放位置(自定义)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $login_url);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);
curl_exec($ch);
curl_close($ch);
로그인 후 복사

3 인증 코드를 받아 저장하세요(인증 코드를 사용하는 웹사이트의 경우):

$verify_url = "http://www.xxxx";   //验证码地址
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $verify_url);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$verify_img = curl_exec($ch);
curl_close($ch);
$fp = fopen("./verify/verifyCode.png",'w');  //把抓取到的图片文件写入本地图片文件保存
fwrite($fp, $verify_img);
fclose($fp);
로그인 후 복사

지침:

인증 코드를 인식할 수 없기 때문에 여기서 하는 일은 인증 코드 이미지를 캡처하여 로컬 파일에 저장한 다음 내 프로젝트의 HTML 페이지에 표시하고 사용자가 입력하도록 하는 것입니다. 사용자가 입력할 때까지 기다립니다. 계좌번호, 비밀번호, 인증번호를 입력하고 제출 버튼을 클릭한 후 다음 단계로 진행하세요.

4. 로그인 양식 제출 시뮬레이션:

$ post_url = 'http://www.xxxx';   //登录表单提交地址
$post = "username=$account&password=$password&seccodeverify=$verifyCode";//表单提交的数据(根据表单字段名和用户输入决定)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $ post_url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post);     //提交方式为post
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
curl_exec($ch);
curl_close($ch);
로그인 후 복사

5. 데이터 캡처:

$data_url = "http://www.xxxx";   //数据所在地址
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $data_url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,0);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
$data = curl_exec($ch);
curl_close($ch);
로그인 후 복사

지금까지 데이터가 있는 페이지가 캡처되어 문자열 변수 $data에 저장되었습니다. 에 있습니다.

캡처된 것은 웹페이지의 html 소스 코드라는 점에 유의해야 합니다. 이는 이 문자열에 원하는 데이터가 포함될 뿐만 아니라 많은 html 태그와 원하지 않는 기타 항목도 포함되어 있음을 의미합니다. 그래서 필요한 데이터를 추출하려면 데이터가 저장되어 있는 페이지의 HTML 코드를 분석한 뒤 문자열 조작 기능, 정규 매칭, 기타 방법을 결합해 원하는 데이터를 추출해야 한다.

위 방법은 http 프로토콜을 사용하는 일반 웹사이트에 효과적입니다. 하지만 https 프로토콜을 사용하는 웹사이트에 대한 로그인을 시뮬레이션하려면 다음 처리를 추가해야 합니다.

1. https 확인 건너뛰기:

curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
로그인 후 복사

2. 사용자 에이전트 사용:

$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);
로그인 후 복사

참고:

이러한 프로세스를 추가하지 않으면 시뮬레이션된 로그인이 성공하지 못합니다. 위 프로그램을 사용하여 웹 사이트 로그인을 시뮬레이션하는 것은 일반적으로 성공적이지만 실제로는 시뮬레이션되는 웹 사이트의 특정 조건을 기반으로 고려해야 합니다. 예를 들어 일부 웹사이트의 인코딩이 다르기 때문에 캡처한 페이지가 깨졌습니다. 이때 다음과 같은 인코딩 변환을 수행해야 합니다.

, gbk 인코딩을 utf8 인코딩으로 변환합니다. 인라인 프레임에 인증 코드를 삽입하는 온라인 뱅킹과 같이 상대적으로 보안 요구 사항이 높은 일부 웹사이트도 있습니다. 이 경우 먼저 인라인 프레임의 페이지를 크롤링한 다음 인증 주소를 추출해야 합니다. 가서 인증 코드를 다시 받아보세요. 또한 js 코드로 양식을 제출하는 일부 웹사이트(예: 온라인 뱅킹)도 있습니다. 양식을 제출하기 전에 암호화 등 일부 처리도 수행하므로 직접 제출하면 양식을 제출할 수 없습니다. 성공적으로 로그인을 하셔야 합니다. 비슷한 처리를 한 후에 제출해야 하는데, 이 경우 암호화 등 js 코드에서 수행되는 특정 작업이 무엇인지, 암호화 알고리즘이 무엇인지 알 수 있다면, 동일한 처리를 수행할 수 있습니다. , 그리고 데이터를 제출하면 성공할 수도 있습니다. 그러나 여기에 핵심이 있습니다. 예를 들어 암호화되어 있지만 특정 암호화 알고리즘을 모르는 경우 수행하는 작업을 전혀 모르는 경우 동일한 작업을 수행할 수 없습니다. , 성공적으로 시뮬레이션할 수 없습니다. 이와 관련된 일반적인 사례는 온라인 뱅킹 제어를 사용하여 js 코드로 양식을 제출하기 전에 사용자가 제출한 비밀번호 및 확인 코드에 대한 일부 처리를 수행하므로 어떤 작업을 수행하는지 알 수 없습니다. 우리는 그것을 시뮬레이션할 수 없습니다. 따라서 이 글을 읽고 나서 온라인 뱅킹 로그인을 시뮬레이션할 수 있다고 생각한다면, 은행 웹사이트 로그인을 그렇게 쉽게 시뮬레이션할 수 있습니까? 물론, 온라인 뱅킹 통제를 뚫을 수 있다면 그것은 또 다른 문제입니다. 그런데 왜 이 문제에 직면했는지, 말하지 않으면 너무 많이 말하면 눈물이 납니다. . .

$data = iconv("gb2312", "utf-8",$data);관련 권장 사항:

php는 작업 분배를 위해 gearman을 사용합니다

PHP가 zlib 확장을 사용하여 GZIP 압축 출력을 구현하는 방법

PHP는 Nginx를 사용하여 역방향 프록시를 구현합니다

위 내용은 PHP는 Curl을 사용하여 시뮬레이션된 로그인 및 데이터 캡처 기능 예제를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿