이전에 WeChat 로그인 개발을 할 때 WeChat 아바타 사진에는 접미사 이름이 없다는 것을 알았습니다. 기존 이미지 캡처 방법이 작동하지 않고 특별한 캡처 처리가 필요했습니다. 따라서 나중에 다양한 상황을 결합하여 클래스로 캡슐화하고 공유했습니다.
프로젝트 만들기
시연으로 www 루트 디렉터리에 Grabimg 프로젝트를 만들고 GrabImage.php 클래스와 index.php를 만듭니다.
클래스 코드 작성
파일과 동일한 이름으로 클래스를 정의합니다: GrabImage
class GrabImage{}
속성
다음으로 필요한 몇 가지를 정의합니다. 재산으로 사용됩니다.
1. 먼저 캡처해야 할 이미지 주소를 정의합니다: $img_url
2. 그런 다음 파일 이름을 저장할 $file_name을 정의하되 확장자는 포함하지 마세요. 확장명 이름이 변경되었으므로 여기서는
3 정의를 풀고 확장자 이름 $extension
4을 푼 다음 이 함수를 정의합니다. 속성은 원격 이미지를 캡처하는 것입니다. 로컬에 저장된 디렉토리는 일반적으로 시작점인 PHP 항목 파일의 위치를 기준으로 합니다. 그러나 이 경로는 일반적으로 데이터베이스에 저장되지 않습니다.
5. 마지막으로 $save_dir을 정의합니다. 이름에서 알 수 있듯이 이 경로는 데이터베이스를 직접 저장하는 디렉터리입니다. 여기서 설명드리자면, 이는 일반적으로 나중에 시스템을 마이그레이션할 경우 경로를 변경하는 편의를 위해 파일 저장 경로를 데이터베이스에 직접 저장하지 않습니다. 여기서 $save_dir은 일반적으로 날짜 + 파일 이름입니다. 사용해야 하는 경우 이를 꺼내서 앞에 필수 경로를 입력하세요.
방법
속성이 완료되면 본격적으로 크롤링 작업을 시작합니다.
먼저 캡처된 이미지의 주소 및 로컬 저장 경로와 같은 일부 데이터를 얻기 위해 공개 메소드 getInstances를 정의합니다. 속성에도 넣어보세요.
public function getInstances($img_url , $base_dir) { $this->img_url = $img_url; $this->save_dir = date("Ym").'/'.date("d").'/'; // 比如:201610/19/ $this->file_dir = $base_dir.'/'.$this->save_dir.'/'; // 比如:./uploads/image/2016/10/19/ }
이미지 저장 경로가 쪼개졌습니다. 이제 디렉토리가 존재하는지에 주목해야 합니다. 날짜는 날마다 바뀌지만 디렉토리가 자동으로 생성되지는 않습니다. 따라서 이미지를 저장하기 전에 먼저 확인이 필요합니다. 현재 디렉터리가 존재하지 않으면 즉시 생성해야 합니다.
설정 디렉토리 메소드 setDir을 생성합니다. 속성을 비공개 및 안전으로 설정했습니다
/** * 检查图片需要保持的目录是否存在 * 如果不存在,则立即创建一个目录 * @return bool */ private function setDir() { if(!file_exists($this->file_dir)) { mkdir($this->file_dir,0777,TRUE); } $this->file_name = uniqid().rand(10000,99999);// 文件名,这里只是演示,实际项目中请使用自己的唯一文件名生成方法 return true; }
다음 단계는 핵심 코드를 캡처하는 것입니다
첫 번째 단계는 캡처해야 하는 이미지가 그렇지 않을 수도 있습니다. 접미사 이름이 있습니다. 기존 크롤링 방법에 따르면 이미지를 먼저 크롤링한 다음 접미사 이름을 가로채는 것은 불가능합니다.
다른 방법을 통해 이미지 유형을 가져와야 합니다. 방법은 파일 스트림 정보로부터 파일 헤더 정보를 얻어 파일 MIME 정보를 판단함으로써 파일 접미사 이름을 알 수 있다.
편의를 위해 먼저 MIME 및 파일 확장자 매핑을 정의합니다.
$mimes=array( 'image/bmp'=>'bmp', 'image/gif'=>'gif', 'image/jpeg'=>'jpg', 'image/png'=>'png', 'image/x-icon'=>'ico' );
이런 식으로 이미지/gif 유형을 얻으면 .gif 사진임을 알 수 있습니다.
파일 스트림 헤더 정보를 얻으려면 PHP 함수 get_headers를 사용하세요. 값이 false가 아닌 경우 $headers
변수에 할당하고 mime의 값인 Content-Type 값을 꺼냅니다.
if(($headers=get_headers($this->img_url, 1))!==false){ // 获取响应的类型 $type=$headers['Content-Type']; }
위에서 정의한 매핑 테이블을 사용하면 접미사 이름을 쉽게 얻을 수 있습니다.
$this->extension=$mimes[$type];
물론 위에서 얻은 $type이 매핑 테이블에 없을 수도 있습니다. 이는 해당 파일 형식이 우리가 원하는 파일이 아니라는 의미입니다. 그냥 버리고 무시하세요.
다음 단계는 기존 파일 가져오기와 동일합니다.
$file_path = $this->file_dir.$this->file_name.".".$this->extension; // 获取数据并保存 $contents=file_get_contents($this->img_url); if(file_put_contents($file_path , $contents)) { // 这里返回出去的值是直接保存到数据库的路径 + 文件名,形如:201610/19/57feefd7e2a7aY5p7LsPqaI-lY1BF.jpg return $this->save_dir.$this->file_name.".".$this->extension; }
먼저 로컬에 저장된 이미지 $file_path의 전체 경로를 가져온 다음 file_get_contents를 사용하여 데이터를 가져온 다음 file_put_contents를 사용하여 지금 막 파일 경로에 저장합니다.
마지막으로 파일 저장 경로 대신 데이터베이스에 직접 저장할 수 있는 경로를 반환합니다.
이 크롤링 방법의 전체 버전은 다음과 같습니다.
private function getRemoteImg() { // mime 和 扩展名 的映射 $mimes=array( 'image/bmp'=>'bmp', 'image/gif'=>'gif', 'image/jpeg'=>'jpg', 'image/png'=>'png', 'image/x-icon'=>'ico' ); // 获取响应头 if(($headers=get_headers($this->img_url, 1))!==false) { // 获取响应的类型 $type=$headers['Content-Type']; // 如果符合我们要的类型 if(isset($mimes[$type])) { $this->extension=$mimes[$type]; $file_path = $this->file_dir.$this->file_name.".".$this->extension; // 获取数据并保存 $contents=file_get_contents($this->img_url); if(file_put_contents($file_path , $contents)) { // 这里返回出去的值是直接保存到数据库的路径 + 文件名,形如:201610/19/57feefd7e2a7aY5p7LsPqaI-lY1BF.jpg return $this->save_dir.$this->file_name.".".$this->extension; } } } return false; }
最后,为了简单,我们想在其他地方只要调用其中一个方法就可以完成抓取。所以,我们将抓取动作直接放入到getInstances中,在配置完路径后,直接抓取,所以,在初始化配置方法getInstances里新增代码。
if($this->setDir()) { return $this->getRemoteImg(); } else { return false; }
测试
我们去刚刚创建的index.php文件内试试。
<?php require_once 'GrabImage.php'; $object = new GrabImage(); $img_url = "http://www.bidianer.com/img/icon_mugs.jpg"; // 需要抓取的远程图片 $base_dir = "./uploads/image"; // 本地保存的路径 echo $object->getInstances($img_url , $base_dir); ?>
惹,的确抓取过来了
完整代码
* @link bidianer.com */ class GrabImage{ /** * @var string 需要抓取的远程图片的地址 * 例如:http://www.bidianer.com/img/icon_mugs.jpg * 有一些远程文件路径可能不带拓展名 * 形如:http://www.xxx.com/img/icon_mugs/q/0 */ private $img_url; /** * @var string 需要保存的文件名称 * 抓取到本地的文件名会重新生成名称 * 但是,不带拓展名 * 例如:57feefd7e2a7aY5p7LsPqaI-lY1BF */ private $file_name; /** * @var string 文件的拓展名 * 这里直接使用远程图片拓展名 * 对于没有拓展名的远程图片,会从文件流中获取 * 例如:.jpg */ private $extension; /** * @var string 文件保存在本地的目录 * 这里的路径是PHP保存文件的路径 * 一般相对于入口文件保存的路径 * 比如:./uploads/image/201610/19/ * 但是该路径一般不直接存储到数据库 */ private $file_dir; /** * @var string 数据库保存的文件目录 * 这个路径是直接保存到数据库的图片路径 * 一般直接保存日期 + 文件名,需要使用的时候拼上前面路径 * 这样做的目的是为了迁移系统时候方便更换路径 * 例如:201610/19/ */ private $save_dir; /** * @param string $img_url 需要抓取的图片地址 * @param string $base_dir 本地保存的路径,比如:./uploads/image,最后不带斜杠"/" * @return bool|int */ public function getInstances($img_url , $base_dir) { $this->img_url = $img_url; $this->save_dir = date("Ym").'/'.date("d").'/'; // 比如:201610/19/ $this->file_dir = $base_dir.'/'.$this->save_dir.'/'; // 比如:./uploads/image/2016/10/19/ return $this->start(); } /** * 开始抓取图片 */ private function start() { if($this->setDir()) { return $this->getRemoteImg(); } else { return false; } } /** * 检查图片需要保持的目录是否存在 * 如果不存在,则立即创建一个目录 * @return bool */ private function setDir() { if(!file_exists($this->file_dir)) { mkdir($this->file_dir,0777,TRUE); } $this->file_name = uniqid().rand(10000,99999);// 文件名,这里只是演示,实际项目中请使用自己的唯一文件名生成方法 return true; } /** * 抓取远程图片核心方法,可以同时抓取有后缀名的图片和没有后缀名的图片 * * @return bool|int */ private function getRemoteImg() { // mime 和 扩展名 的映射 $mimes=array( 'image/bmp'=>'bmp', 'image/gif'=>'gif', 'image/jpeg'=>'jpg', 'image/png'=>'png', 'image/x-icon'=>'ico' ); // 获取响应头 if(($headers=get_headers($this->img_url, 1))!==false) { // 获取响应的类型 $type=$headers['Content-Type']; // 如果符合我们要的类型 if(isset($mimes[$type])) { $this->extension=$mimes[$type]; $file_path = $this->file_dir.$this->file_name.".".$this->extension; // 获取数据并保存 $contents=file_get_contents($this->img_url); if(file_put_contents($file_path , $contents)) { // 这里返回出去的值是直接保存到数据库的路径 + 文件名,形如:201610/19/57feefd7e2a7aY5p7LsPqaI-lY1BF.jpg return $this->save_dir.$this->file_name.".".$this->extension; } } } return false; } }