抓取源码 - php抓取网页源码的问题
抓取一般的页面没问题·。
但近期给一个网站个搞晕了·。请大神们帮帮忙看看是什么原因导致失败。谢谢
地址:http://183.36.249.82/
我们学校的图书馆。
我用的代码如下
<code><?php header ( "Content-type: text/html; charset=utf-8" ); $url = "http://183.36.249.82/"; $contents = file_get_contents($url); echo $contents; ?> </code>
但会出现这个错误:
Server Error in '/' Application.
Runtime Error
我用的服务器是SAE。也试过用SAE提供的fetch
功能。
但可惜也是报错。
错误是:string(3) "500" string(21) "Internal Server Error"
多天研究原因不解。求解答。谢谢
回复内容:
抓取一般的页面没问题·。
但近期给一个网站个搞晕了·。请大神们帮帮忙看看是什么原因导致失败。谢谢
地址:http://183.36.249.82/
我们学校的图书馆。
我用的代码如下
<code><?php header ( "Content-type: text/html; charset=utf-8" ); $url = "http://183.36.249.82/"; $contents = file_get_contents($url); echo $contents; ?> </code>
但会出现这个错误:
Server Error in '/' Application.
Runtime Error
我用的服务器是SAE。也试过用SAE提供的fetch
功能。
但可惜也是报错。
错误是:string(3) "500" string(21) "Internal Server Error"
多天研究原因不解。求解答。谢谢
用file_get_contents
抓取的时候,一般要设置一下HTTP context.抓取网页还是用cURL比较好.
<?php $header = <<<HEADER Connection: keep-alive Cache-Control: max-age=0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8 User-Agent: Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.116 Safari/537.36 DNT: 1 Referer: http://183.36.249.82/ Accept-Encoding: gzip,deflate,sdch Accept-Language: zh-CN,zh;q=0.8 HEADER; $context = stream_context_create(array( 'http' => array( 'method' => 'GET', 'header' => $header, 'timeout' => 10, 'protocol_version' => '1.1', ), )); $contents = file_get_contents('http://183.36.249.82/', false, $context); echo $contents;
你没发现网站要求重定向了吗?是刚学php呢吧?换用curl吧,file_get_contents抓不下来这个的吧(显然我错了,看别人的回答就知道是可以的,没文化真可怕啊)。
给你个参考连接吧,我不想写代码了
http://segmentfault.com/q/1010000000484804#a-1020000000484819
问问题的人虽然问得是ruby的问题,但是人家的php代码估计够你参考用了。

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PHP 8.4는 상당한 양의 기능 중단 및 제거를 통해 몇 가지 새로운 기능, 보안 개선 및 성능 개선을 제공합니다. 이 가이드에서는 Ubuntu, Debian 또는 해당 파생 제품에서 PHP 8.4를 설치하거나 PHP 8.4로 업그레이드하는 방법을 설명합니다.

CakePHP에서 데이터베이스 작업은 매우 쉽습니다. 이번 장에서는 CRUD(생성, 읽기, 업데이트, 삭제) 작업을 이해하겠습니다.

CakePHP는 PHP용 오픈 소스 프레임워크입니다. 이는 애플리케이션을 훨씬 쉽게 개발, 배포 및 유지 관리할 수 있도록 하기 위한 것입니다. CakePHP는 강력하고 이해하기 쉬운 MVC와 유사한 아키텍처를 기반으로 합니다. 모델, 뷰 및 컨트롤러 gu

CakePHP에 로그인하는 것은 매우 쉬운 작업입니다. 한 가지 기능만 사용하면 됩니다. cronjob과 같은 백그라운드 프로세스에 대해 오류, 예외, 사용자 활동, 사용자가 취한 조치를 기록할 수 있습니다. CakePHP에 데이터를 기록하는 것은 쉽습니다. log() 함수는 다음과 같습니다.
