Imej mengikis dengan symfony ' s domcrawler
Saya tidak mahu melalui tekanan memuat turun imej secara individu, jadi saya menulis kelas PHP ini untuk mencari, memuat turun dan zip semua imej yang terdapat di laman web.
Takeaways Key
- Kelas PHP menggunakan komponen Domcrawler Symfony untuk mengikis imej dari laman web, memuat turun dan simpannya ke dalam folder, membuat arkib zip folder, dan kemudian memadam folder. Kelas ini direka untuk mengautomasikan proses memuat turun pelbagai imej dari laman web.
- Kelas termasuk lima sifat peribadi dan lapan kaedah awam. Properties menyimpan maklumat seperti nama folder, URL halaman web, kod dokumen HTML, nama fail zip, dan status operasi. Kaedah ini termasuk fungsi untuk menetapkan folder dan nama fail, instantiate domcrawler, muat turun dan simpan imej, buat fail zip, padamkan folder, dan dapatkan status operasi.
- Untuk menggunakan kelas, semua fail yang diperlukan mesti dimasukkan, sama ada melalui autoload atau secara eksplisit. Kaedah setfolder dan setFileName harus dipanggil dengan argumen masing -masing, dan kaedah proses kemudian dipanggil untuk meletakkan kelas berfungsi. Komponen Domcrawler dan fungsi create_zip mesti dimasukkan untuk kelas berfungsi.
Ia mencari URL untuk imej, muat turun dan menyimpan imej ke dalam folder, membuat arkib zip folder dan akhirnya memadamkan folder.
Kelas menggunakan komponen Domcrawler Symfony untuk mencari semua pautan imej yang terdapat di laman web dan fungsi zip tersuai yang membuat fail zip. Kredit kepada David Walsh untuk fungsi zip.
pengekodan kelas
Kelas terdiri daripada lima sifat swasta dan lapan kaedah awam termasuk kaedah sihir __construct.
di bawah adalah senarai sifat kelas dan peranan mereka.
2. $ Url: Menyimpan URL halaman web.
3. $ HTML: Menyimpan kod dokumen HTML laman web yang akan dikikis.
4. $ FileName: Menyimpan nama fail zip.
5. Status $: Menjimatkan status operasi. I.e jika kejayaan atau kegagalan.
mari kita mulakan membina kelas.
Buat zipimages kelas yang mengandungi lima sifat di atas.
Buat kaedah sihir __construct yang menerima URL sebagai hujah.
<span><span><?php </span></span><span><span>class ZipImages { </span></span><span> <span>private $folder; </span></span><span> <span>private $url; </span></span><span> <span>private $html; </span></span><span> <span>private $fileName; </span></span><span> <span>private $status;</span></span>
<span>public function __construct($url) { </span> <span>$this->url = $url; </span> <span>$this->html = file_get_contents($this->url); </span> <span>$this->setFolder(); </span><span>}</span>
Secara lalai, nama folder ditetapkan ke imej tetapi kaedah menyediakan pilihan untuk menukar nama folder dengan hanya lulus nama folder sebagai hujahnya.
<span><span><?php </span></span><span><span>class ZipImages { </span></span><span> <span>private $folder; </span></span><span> <span>private $url; </span></span><span> <span>private $html; </span></span><span> <span>private $fileName; </span></span><span> <span>private $status;</span></span>
setFileName menyediakan pilihan untuk menukar nama fail zip dengan nama lalai yang ditetapkan ke zipimages:
<span>public function __construct($url) { </span> <span>$this->url = $url; </span> <span>$this->html = file_get_contents($this->url); </span> <span>$this->setFolder(); </span><span>}</span>
Pada ketika ini, kami memberi contoh komponen perayap Symfony untuk mencari imej, kemudian muat turun dan simpan semua imej ke dalam folder.
<span>public function setFolder($folder="image") { </span> <span>// if folder doesn't exist, attempt to create one and store the folder name in property $folder </span> <span>if(!file_exists($folder)) { </span> <span>mkdir($folder); </span> <span>} </span> <span>$this->folder = $folder; </span><span>}</span>
Selepas muat turun selesai, kami memampatkan folder imej ke arkib zip menggunakan fungsi create_zip tersuai kami.
<span>public function setFileName($name = "zipImages") { </span> <span>$this->fileName = $name; </span><span>}</span>
Akhir sekali, kami memadam folder yang dibuat selepas fail zip telah dibuat.
<span>public function domCrawler() { </span> <span>//instantiate the symfony DomCrawler Component </span> <span>$crawler = new Crawler($this->html); </span> <span>// create an array of all scrapped image links </span> <span>$result = $crawler </span> <span>->filterXpath('//img') </span> <span>->extract(array('src')); </span> <span>// download and save the image to the folder </span> <span>foreach ($result as $image) { </span> <span>$path = $this->folder."/".basename($image); </span> <span>$file = file_get_contents($image); </span> <span>$insert = file_put_contents($path, $file); </span> <span>if (!$insert) { </span> <span>throw new <span>\Exception</span>('Failed to write image'); </span> <span>} </span> <span>} </span><span>}</span>
Dapatkan status operasi. I.e jika berjaya atau ralat berlaku.
<span>public function createZip() { </span> <span>$folderFiles = scandir($this->folder); </span> <span>if (!$folderFiles) { </span> <span>throw new <span>\Exception</span>('Failed to scan folder'); </span> <span>} </span> <span>$fileArray = array(); </span> <span>foreach($folderFiles as $file){ </span> <span>if (($file != ".") && ($file != "..")) { </span> <span>$fileArray[] = $this->folder."/".$file; </span> <span>} </span> <span>} </span> <span>if (create_zip($fileArray, $this->fileName.'.zip')) { </span> <span>$this->status = <span><span><<<HTML</span> </span></span><span>File successfully archived. <a href="<span><span>$this->fileName</span>.zip">Download it now</a> </span></span><span><span>HTML<span>;</span></span> </span> <span>} else { </span> <span>$this->status = "An error occurred"; </span> <span>} </span><span>}</span>
Proses semua kaedah di atas.
<span>public function deleteCreatedFolder() { </span> <span>$dp = opendir($this->folder) or die ('ERROR: Cannot open directory'); </span> <span>while ($file = readdir($dp)) { </span> <span>if ($file != '.' && $file != '..') { </span> <span>if (is_file("<span><span>$this->folder</span>/<span>$file</span>"</span>)) { </span> <span>unlink("<span><span>$this->folder</span>/<span>$file</span>"</span>); </span> <span>} </span> <span>} </span> <span>} </span> <span>rmdir($this->folder) or die ('could not delete folder'); </span><span>}</span>
anda boleh memuat turun kelas penuh dari github.
KEGIATAN KELAS Untuk kelas berfungsi, komponen Domcrawler dan fungsi create_zip perlu dimasukkan. Anda boleh memuat turun kod untuk fungsi ini di sini.
Muat turun dan pasang komponen Domcrawler melalui komposer hanya dengan menambahkan pernyataan berikut yang memerlukan ke fail komposer.json anda:
<span>public function getStatus() {
</span> <span>echo $this->status;
</span><span>}</span>
Salin selepas log masuk run $ php composer.phar Pasang untuk memuat turun perpustakaan dan menghasilkan fail autoloader vendor/autoload.php.
menggunakan kelas
Pastikan semua fail yang diperlukan dimasukkan, melalui autoload atau secara eksplisit. -
Panggil setFolder, dan setFileName kaedah dan lulus dalam argumen masing -masing. Hanya hubungi kaedah setFolder apabila anda perlu menukar nama folder. -
panggil kaedah proses untuk meletakkan kelas berfungsi. -
<span>public function process() {
</span> <span>$this->domCrawler();
</span> <span>$this->createZip();
</span> <span>$this->deleteCreatedFolder();
</span> <span>$this->getStatus();
</span><span>}</span>
Salin selepas log masuk
Ringkasan
Dalam artikel ini, kami belajar bagaimana untuk membuat pengikis imej PHP yang mudah yang secara automatik memampatkan imej yang dimuat turun ke dalam arkib zip. Sekiranya anda mempunyai penyelesaian alternatif atau cadangan untuk penambahbaikan, sila tinggalkannya dalam komen di bawah, semua maklum balas dialu -alukan!
Soalan Lazim (Soalan Lazim) Mengenai Imej Mengikis dengan Symfony's Domcrawler
Apakah komponen Domcrawler Symfony? Ia menyediakan API yang mudah digunakan dan difahami, menjadikannya pilihan yang popular untuk tugas mengikis web. Komponen Domcrawler boleh digunakan untuk memilih unsur -unsur tertentu pada halaman, mengekstrak data dari mereka, dan juga mengubah kandungan mereka. langsung. Anda boleh menggunakan komposer, alat pengurusan ketergantungan untuk PHP. Jalankan arahan berikut dalam direktori projek anda: Komposer memerlukan Symfony/Dom-Crawler. Ini akan memuat turun dan memasang komponen Domcrawler bersama -sama dengan kebergantungannya.
Bagaimana saya menggunakan komponen Domcrawler Symfony untuk mengikis imej? Kemudian, anda boleh menggunakan kaedah penapis untuk memilih elemen imej dan mengeluarkan atribut SRC mereka. Berikut adalah contoh asas:
$ crawler = crawler baru ($ html);
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) {
echo $ node-> attr ('src'); Ya, anda boleh menggunakan komponen Domcrawler Symfony dengan Laravel. Fungsi ujian HTTP Laravel sebenarnya menggunakan komponen Domcrawler di bawah tudung. Ini bermakna anda boleh menggunakan kaedah dan teknik yang sama untuk melintasi dan memanipulasi kandungan HTML dalam ujian laravel anda. Pilih Elemen, termasuk Filter, FilterXPath, dan SelectLink. Kaedah ini membolehkan anda memilih elemen berdasarkan nama tag mereka, ekspresi xpath, atau teks pautan. Ubah suai kandungan elemen menggunakan komponen Domcrawler Symfony. Kaedah setiap membolehkan anda melelehkan setiap elemen yang dipilih dan melaksanakan operasi di atasnya. Sebagai contoh, anda boleh menukar atribut src elemen imej seperti ini:
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) { $ node-> attr ('src', 'baru-image.jpg'); ); Komponen Domcrawler?
Apabila menggunakan komponen, kesilapan dan pengecualian Domcrawler Symfony boleh dikendalikan menggunakan blok percubaan. Sebagai contoh, jika kaedah penapis tidak menemui sebarang unsur yang sepadan, ia akan membuang InvalidargumentException. Anda boleh menangkap pengecualian ini dan mengendalikannya dengan sewajarnya. Walau bagaimanapun, ini memerlukan langkah -langkah tambahan, seperti menghantar permintaan pos dengan kelayakan log masuk dan menyimpan cookie sesi. Nilai menggunakan kaedah ATTR yang disediakan oleh komponen Domcrawler Symfony. Sebagai contoh, untuk mengekstrak atribut Src elemen imej, anda boleh melakukan perkara berikut:
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) { echo $ node-> attr ('src');
}); Bolehkah saya menggunakan komponen Domcrawler Symfony untuk mengikis kandungan yang dimuatkan oleh AJAX? Walau bagaimanapun, anda boleh menggunakan alat seperti Guzzle dan Goutte dalam kombinasi dengan komponen Domcrawler untuk menghantar permintaan HTTP dan mengendalikan kandungan yang dimuatkan oleh AJAX.
Muat turun dan pasang komponen Domcrawler melalui komposer hanya dengan menambahkan pernyataan berikut yang memerlukan ke fail komposer.json anda:
<span>public function getStatus() { </span> <span>echo $this->status; </span><span>}</span>
menggunakan kelas
- Pastikan semua fail yang diperlukan dimasukkan, melalui autoload atau secara eksplisit.
- Panggil setFolder, dan setFileName kaedah dan lulus dalam argumen masing -masing. Hanya hubungi kaedah setFolder apabila anda perlu menukar nama folder.
- panggil kaedah proses untuk meletakkan kelas berfungsi.
<span>public function process() { </span> <span>$this->domCrawler(); </span> <span>$this->createZip(); </span> <span>$this->deleteCreatedFolder(); </span> <span>$this->getStatus(); </span><span>}</span>
Ringkasan
Dalam artikel ini, kami belajar bagaimana untuk membuat pengikis imej PHP yang mudah yang secara automatik memampatkan imej yang dimuat turun ke dalam arkib zip. Sekiranya anda mempunyai penyelesaian alternatif atau cadangan untuk penambahbaikan, sila tinggalkannya dalam komen di bawah, semua maklum balas dialu -alukan!
Soalan Lazim (Soalan Lazim) Mengenai Imej Mengikis dengan Symfony's Domcrawler
Apakah komponen Domcrawler Symfony? Ia menyediakan API yang mudah digunakan dan difahami, menjadikannya pilihan yang popular untuk tugas mengikis web. Komponen Domcrawler boleh digunakan untuk memilih unsur -unsur tertentu pada halaman, mengekstrak data dari mereka, dan juga mengubah kandungan mereka. langsung. Anda boleh menggunakan komposer, alat pengurusan ketergantungan untuk PHP. Jalankan arahan berikut dalam direktori projek anda: Komposer memerlukan Symfony/Dom-Crawler. Ini akan memuat turun dan memasang komponen Domcrawler bersama -sama dengan kebergantungannya.
Bagaimana saya menggunakan komponen Domcrawler Symfony untuk mengikis imej? Kemudian, anda boleh menggunakan kaedah penapis untuk memilih elemen imej dan mengeluarkan atribut SRC mereka. Berikut adalah contoh asas:
$ crawler = crawler baru ($ html);
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) {
echo $ node-> attr ('src'); Ya, anda boleh menggunakan komponen Domcrawler Symfony dengan Laravel. Fungsi ujian HTTP Laravel sebenarnya menggunakan komponen Domcrawler di bawah tudung. Ini bermakna anda boleh menggunakan kaedah dan teknik yang sama untuk melintasi dan memanipulasi kandungan HTML dalam ujian laravel anda. Pilih Elemen, termasuk Filter, FilterXPath, dan SelectLink. Kaedah ini membolehkan anda memilih elemen berdasarkan nama tag mereka, ekspresi xpath, atau teks pautan. Ubah suai kandungan elemen menggunakan komponen Domcrawler Symfony. Kaedah setiap membolehkan anda melelehkan setiap elemen yang dipilih dan melaksanakan operasi di atasnya. Sebagai contoh, anda boleh menukar atribut src elemen imej seperti ini:
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) {
Apabila menggunakan komponen, kesilapan dan pengecualian Domcrawler Symfony boleh dikendalikan menggunakan blok percubaan. Sebagai contoh, jika kaedah penapis tidak menemui sebarang unsur yang sepadan, ia akan membuang InvalidargumentException. Anda boleh menangkap pengecualian ini dan mengendalikannya dengan sewajarnya. Walau bagaimanapun, ini memerlukan langkah -langkah tambahan, seperti menghantar permintaan pos dengan kelayakan log masuk dan menyimpan cookie sesi. Nilai menggunakan kaedah ATTR yang disediakan oleh komponen Domcrawler Symfony. Sebagai contoh, untuk mengekstrak atribut Src elemen imej, anda boleh melakukan perkara berikut:
$ crawler-> filter ('img')-> setiap (fungsi (crawler $ node) {
Bolehkah saya menggunakan komponen Domcrawler Symfony untuk mengikis kandungan yang dimuatkan oleh AJAX? Walau bagaimanapun, anda boleh menggunakan alat seperti Guzzle dan Goutte dalam kombinasi dengan komponen Domcrawler untuk menghantar permintaan HTTP dan mengendalikan kandungan yang dimuatkan oleh AJAX.
Atas ialah kandungan terperinci Imej mengikis dengan symfony ' s domcrawler. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Terdapat empat jenis kesilapan utama dalam PHP: 1.Notice: yang paling sedikit, tidak akan mengganggu program, seperti mengakses pembolehubah yang tidak ditentukan; 2. Amaran: Serius daripada notis, tidak akan menamatkan program, seperti tidak mengandungi fail; 3. FatalError: Yang paling serius, akan menamatkan program ini, seperti tidak memanggil fungsi; 4. ParseError: Kesalahan sintaks, akan menghalang program daripada dilaksanakan, seperti lupa untuk menambah tag akhir.

PHP dan Python masing -masing mempunyai kelebihan mereka sendiri, dan memilih mengikut keperluan projek. 1.PHP sesuai untuk pembangunan web, terutamanya untuk pembangunan pesat dan penyelenggaraan laman web. 2. Python sesuai untuk sains data, pembelajaran mesin dan kecerdasan buatan, dengan sintaks ringkas dan sesuai untuk pemula.

Dalam php, kata laluan_hash dan kata laluan 1) password_hash menjana hash yang mengandungi nilai garam untuk meningkatkan keselamatan. 2) Kata Laluan_verify Sahkan kata laluan dan pastikan keselamatan dengan membandingkan nilai hash. 3) MD5 dan SHA1 terdedah dan kekurangan nilai garam, dan tidak sesuai untuk keselamatan kata laluan moden.

PHP digunakan secara meluas dalam e-dagang, sistem pengurusan kandungan dan pembangunan API. 1) e-dagang: Digunakan untuk fungsi keranjang belanja dan pemprosesan pembayaran. 2) Sistem Pengurusan Kandungan: Digunakan untuk penjanaan kandungan dinamik dan pengurusan pengguna. 3) Pembangunan API: Digunakan untuk Pembangunan API RESTful dan Keselamatan API. Melalui pengoptimuman prestasi dan amalan terbaik, kecekapan dan pemeliharaan aplikasi PHP bertambah baik.

Kaedah permintaan HTTP termasuk GET, POST, PUT dan DELETE, yang digunakan untuk mendapatkan, menghantar, mengemas kini dan memadam sumber masing -masing. 1. Kaedah GET digunakan untuk mendapatkan sumber dan sesuai untuk operasi membaca. 2. Kaedah Pos digunakan untuk menyerahkan data dan sering digunakan untuk membuat sumber baru. 3. Kaedah Put digunakan untuk mengemas kini sumber dan sesuai untuk kemas kini lengkap. 4. Kaedah Padam digunakan untuk memadam sumber dan sesuai untuk operasi penghapusan.

PHP adalah bahasa skrip yang digunakan secara meluas di sisi pelayan, terutamanya sesuai untuk pembangunan web. 1.PHP boleh membenamkan HTML, memproses permintaan dan respons HTTP, dan menyokong pelbagai pangkalan data. 2.PHP digunakan untuk menjana kandungan web dinamik, data borang proses, pangkalan data akses, dan lain -lain, dengan sokongan komuniti yang kuat dan sumber sumber terbuka. 3. PHP adalah bahasa yang ditafsirkan, dan proses pelaksanaan termasuk analisis leksikal, analisis tatabahasa, penyusunan dan pelaksanaan. 4.Php boleh digabungkan dengan MySQL untuk aplikasi lanjutan seperti sistem pendaftaran pengguna. 5. Apabila debugging php, anda boleh menggunakan fungsi seperti error_reporting () dan var_dump (). 6. Mengoptimumkan kod PHP untuk menggunakan mekanisme caching, mengoptimumkan pertanyaan pangkalan data dan menggunakan fungsi terbina dalam. 7

PHP mengendalikan fail muat naik melalui pembolehubah fail $ \ _. Kaedah untuk memastikan keselamatan termasuk: 1. Semak kesilapan muat naik, 2. Sahkan jenis dan saiz fail, 3. Mencegah penindasan fail, 4. Pindahkan fail ke lokasi storan tetap.

Dalam phpoop, diri :: merujuk kepada kelas semasa, ibu bapa :: merujuk kepada kelas induk, statik :: digunakan untuk mengikat statik lewat. 1.Self :: digunakan untuk kaedah statik dan panggilan berterusan, tetapi tidak menyokong pengikatan statik lewat. 2.Parent :: digunakan untuk subkelas untuk memanggil kaedah kelas induk, dan kaedah peribadi tidak dapat diakses. 3.Static :: Menyokong pengikatan statik lewat, sesuai untuk warisan dan polimorfisme, tetapi boleh menjejaskan kebolehbacaan kod.
