> 백엔드 개발 > PHP 문제 > PHP 웹 크롤링의 잘못된 문제를 해결하는 방법

PHP 웹 크롤링의 잘못된 문제를 해결하는 방법

藏色散人
풀어 주다: 2023-03-05 18:34:01
원래의
2969명이 탐색했습니다.

잘못된 PHP 웹 페이지 크롤링에 대한 해결 방법: 1. "mbconvertencoding"을 사용하여 인코딩을 변환합니다. 2. "curl_setopt($ch, CURLOPT_ENCODING, 'gzip')"을 설정하고 추가합니다. 맨 위.

PHP 웹 크롤링의 잘못된 문제를 해결하는 방법

권장: "PHP Video Tutorial"

php가 잘못된 문자로 페이지를 크롤링합니다

페이지를 크롤링할 때 �������와 같은 잘못된 문자가 나타납니다. 해결 방법은 다음과 같습니다.

1. 인코딩 변환

str=mbconvertencoding(str, “utf-8”, “GBK”);
로그인 후 복사

2. 데이터는 gzip으로 압축됩니다

curl이 데이터를 얻을 때 다음 옵션을 설정하고 추가합니다.

curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
로그인 후 복사

file_get_contents 함수를 사용하려면 zlib 라이브러리

$data = file_get_contents("compress.zlib://".$url);
로그인 후 복사

3를 설치해야 합니다. 데이터를 얻으면 잘못된 문자가 표시됩니다

상단에 다음을 추가하세요.

header("Content-type: text/html; charset=utf-8");
로그인 후 복사
코드

위 내용은 PHP 웹 크롤링의 잘못된 문제를 해결하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿