PHP의 컬 함수를 사용하여 시뮬레이션된 로그인을 구현하세요.
Googlesearch에서 일부 데이터를 추출하고 싶은데, Google이 소프트웨어가 데이터를 캡처하는 것을 잘 차단하는 것을 발견했습니다. 과거에는 USER-AGENT를 위조하여 데이터를 캡처할 수 있었지만 지금은 그렇지 않습니다. 일하지 마세요. 패킷 캡처 데이터를 사용하여 Google은 쿠키가 없는 경우 302 점프를 직접 반환하며 302 점프가 수십 개 연속되어 데이터를 전혀 캡처할 수 없다는 것을 Google에서 확인했습니다. 따라서 검색 명령을 보낼 때 먼저 쿠키를 추출하여 저장한 다음 저장된 쿠키를 사용하여 다시 검색 명령을 보내 데이터를 정상적으로 캡처해야 합니다. 이는 실제로 포럼의 시뮬레이션된 로그인과 동일합니다. 먼저 로그인하려면 POST를 수행하고 쿠키를 가져와 저장한 다음 쿠키를 사용하여 액세스해야 합니다. PHP 코드는 다음과 같습니다.
코드는 다음과 같습니다.
<?php header('Content-Type: text/html; charset=utf-8'); $cookie_file = dirname(FILE).'/cookie.txt'; //$cookie_file = tempnam("tmp","cookie"); //先获取cookies并保存 $url = "http://www.google.com.hk"; $ch = curl_init($url); //初始化 curl_setopt($ch, CURLOPT_HEADER, 0); //不返回header部分 curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); //返回字符串,而非直接输出 curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); //存储cookies curl_exec($ch); curl_close($ch); //使用上面保存的cookies再次访问 $url = "http://www.google.com.hk/search?oe=utf8&ie=utf8&source=uds&hl=zh-CN&q=qq"; $ch = curl_init($url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); //使用上面获取的cookies $response = curl_exec($ch); curl_close($ch); echo $response; ?>
위 내용은 PHP CURL은 로그인 방법 코드 예제를 시뮬레이션하기 위해 쿠키를 얻습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!