


Bagaimana untuk mengekstrak hanya aksara Cina daripada rentetan php
Dua kaedah: 1. Gunakan preg_match_all() dengan rentetan penapis biasa, sintaksnya ialah "preg_match_all("/[x{4e00}-x{9fff}] /u","$str",$arr );"; 2. Gunakan preg_replace() dengan ungkapan biasa untuk mencari huruf bukan Cina dalam rentetan dan menggantikannya dengan aksara kosong. Sintaksnya ialah "preg_replace("/[^x{4E00}-x{9FFF}] /u" ,'',$str)".
Persekitaran pengendalian tutorial ini: sistem windows7, PHP versi 8.1, komputer DELL G3
Dalam php, anda boleh menggunakan dua yang berikut fungsi Untuk mengekstrak hanya aksara Cina bagi rentetan
fungsi preg_replace()
fungsi preg_match_all()
Kaedah 1: Gunakan fungsi preg_match_all()
fungsi preg_match_all() dengan ungkapan biasa "/[x{4e00}-x{9fff}] /u
" untuk menapis rentetan dan hanya mendapatkan aksara Cina.
akan menyimpan aksara Cina yang sepadan ke dalam tatasusunan satu demi satu (tatasusunan ditentukan oleh parameter ketiga).
<?php header("Content-type:text/html;charset=utf-8"); $str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^"; echo $str; preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr); var_dump($arr); ?>
Nilai hasil kemudiannya boleh disambungkan ke dalam rentetan menggunakan fungsi join().
join('',$arr[0])
Penjelasan:
1) fungsi preg_match_all()
fungsi preg_match_all() akan mencari Semua hasil dalam rentetan yang boleh sepadan dengan ungkapan biasa
preg_match_all(pattern,subject,matches,flags,offset)
Penerangan parameter adalah seperti berikut:
- corak: corak yang akan dicari, iaitu ungkapan biasa yang ditakrifkan ;
- subjek: rentetan yang hendak dicari;
- padanan: parameter pilihan (tatasusunan berbilang dimensi), digunakan untuk menyimpan semua hasil yang sepadan, pengisihan tatasusunan ditentukan oleh
- bendera: Parameter pilihan, boleh digunakan dalam kombinasi dengan bendera berikut (perhatikan bahawa PREG_PATTERN_ORDER dan PREG_SET_ORDER tidak boleh digunakan pada masa yang sama):
- PREG_PATTERN_ORDER: Keputusan diisih mengikut $matches[0] untuk simpan semua padanan corak lengkap, $matches[ 1] Simpan semua padanan subkumpulan pertama, dan seterusnya.
- PREG_SET_ORDER: Keputusan diisih sebagai $matches[0] mengandungi semua padanan (termasuk subkumpulan) yang diperoleh pada perlawanan pertama, $matches[1] mengandungi semua padanan (termasuk subkumpulan) yang diperolehi oleh perlawanan kedua ), dan seterusnya.
- PREG_OFFSET_CAPTURE: Jika bendera ini diluluskan, setiap padanan yang ditemui dikembalikan dengan mengimbanginya berbanding dengan rentetan sasaran dinaikkan. Ambil perhatian bahawa ini akan menukar setiap elemen rentetan padanan dalam $matches menjadi satu dengan elemen ke-0 ialah rentetan padanan dan elemen pertama ialah offset rentetan padanan dalam subjek.
- offset: Parameter pilihan, $offset digunakan untuk mula mencari dari kedudukan yang ditentukan dalam rentetan sasaran (unit ialah bait).
Fungsi preg_match_all() boleh mengembalikan bilangan padanan untuk corak (mungkin 0), atau FALSE jika ralat berlaku.
2) fungsi join()
fungsi join() mengembalikan rentetan yang terdiri daripada elemen tatasusunan.
fungsi join() ialah alias bagi fungsi implode().
join(separator,array)
pemisah: Pilihan. Menentukan apa yang diletakkan di antara elemen tatasusunan. Lalai ialah "" (rentetan kosong).
tatasusunan: diperlukan. Tatasusunan untuk digabungkan menjadi rentetan.
Nilai pulangan: Mengembalikan rentetan yang terdiri daripada elemen tatasusunan.
Kaedah 2: Gunakan fungsi preg_replace()
fungsi preg_match_all() untuk memadankan ungkapan biasa "/[^x{4E00}-x{9FFF}] /u
" dalam carian rentetan Huruf bukan Cina boleh digantikan dengan aksara kosong ''
.
<?php header("Content-type:text/html;charset=utf-8"); $str= 'php中文网!-=1548'; echo $str."<br>"; $pattern = "/[^\x{4E00}-\x{9FFF}]+/u"; $newstr=preg_replace($pattern,'', $str);preg_match_all("/[\x{4e00}-\x{9fff}]+/u","$str",$arr); var_dump($newstr); ?>
Penerangan: preg_replace()
Fungsi preg_replace() boleh melakukan carian dan penggantian ungkapan biasa, ya A fungsi pemprosesan penggantian rentetan yang berkuasa Format sintaks fungsi ini adalah seperti berikut:
preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])
Penerangan parameter adalah seperti berikut:
- $pattern: corak yang hendak dicari, yang boleh menjadi rentetan atau tatasusunan rentetan; Jika hujah ini ialah rentetan dan $pattern ialah tatasusunan, maka semua corak digantikan dengan rentetan ini. Jika $pattern dan $replacement adalah kedua-dua tatasusunan, setiap $pattern digantikan dengan elemen yang sepadan dalam $replacement. Jika terdapat kurang elemen dalam $replacement berbanding $pattern, $pattern tambahan digantikan dengan rentetan kosong.
- $subject: Tatasusunan rentetan atau rentetan yang akan dicari dan digantikan Jika $subject ialah tatasusunan, carian dan penggantian akan dilakukan pada setiap elemen $subjek, dan nilai pulangan juga akan menjadi satu tatasusunan. .
- $limit: Parameter pilihan, bilangan maksimum penggantian bagi setiap corak pada setiap $subjek. Lalai ialah -1 (tidak terhad).
- $count: parameter pilihan, jika dinyatakan, akan diisi dengan bilangan penggantian yang lengkap.
- Jika $subject ialah tatasusunan, fungsi preg_replace() akan mengembalikan tatasusunan, jika tidak ia akan mengembalikan rentetan.
Jika fungsi preg_replace() menemui padanan, ia akan mengembalikan $subjek yang diganti, jika tidak ia akan mengembalikan $subjek yang tidak berubah. Setiap parameter fungsi preg_replace() (kecuali parameter $limit) boleh menjadi tatasusunan. Jika parameter $pattern dan parameter $replacement adalah kedua-dua tatasusunan, fungsi akan memproses kekunci mengikut susunan ia muncul dalam tatasusunan. Jika ralat berlaku, NULL dikembalikan.
Parameter $replacement boleh mengandungi rujukan belakang \n atau $n, dengan yang terakhir diutamakan secara sintaksis. Setiap rujukan tersebut akan digantikan dengan teks yang ditangkap oleh subkumpulan penangkapan ke-n yang telah dipadankan. n boleh menjadi 0-99, dengan \0 dan $0 mewakili teks padanan corak yang lengkap.
Pembelajaran yang disyorkan: "
Tutorial Video PHPAtas ialah kandungan terperinci Bagaimana untuk mengekstrak hanya aksara Cina daripada rentetan php. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



PHP 8.4 membawa beberapa ciri baharu, peningkatan keselamatan dan peningkatan prestasi dengan jumlah penamatan dan penyingkiran ciri yang sihat. Panduan ini menerangkan cara memasang PHP 8.4 atau naik taraf kepada PHP 8.4 pada Ubuntu, Debian, atau terbitan mereka

Kod Visual Studio, juga dikenali sebagai Kod VS, ialah editor kod sumber percuma — atau persekitaran pembangunan bersepadu (IDE) — tersedia untuk semua sistem pengendalian utama. Dengan koleksi sambungan yang besar untuk banyak bahasa pengaturcaraan, Kod VS boleh menjadi c

Jika anda seorang pembangun PHP yang berpengalaman, anda mungkin merasakan bahawa anda telah berada di sana dan telah melakukannya. Anda telah membangunkan sejumlah besar aplikasi, menyahpenyahpepijat berjuta-juta baris kod dan mengubah suai sekumpulan skrip untuk mencapai op

Tutorial ini menunjukkan cara memproses dokumen XML dengan cekap menggunakan PHP. XML (bahasa markup extensible) adalah bahasa markup berasaskan teks yang serba boleh yang direka untuk pembacaan manusia dan parsing mesin. Ia biasanya digunakan untuk penyimpanan data

JWT adalah standard terbuka berdasarkan JSON, yang digunakan untuk menghantar maklumat secara selamat antara pihak, terutamanya untuk pengesahan identiti dan pertukaran maklumat. 1. JWT terdiri daripada tiga bahagian: header, muatan dan tandatangan. 2. Prinsip kerja JWT termasuk tiga langkah: menjana JWT, mengesahkan JWT dan muatan parsing. 3. Apabila menggunakan JWT untuk pengesahan di PHP, JWT boleh dijana dan disahkan, dan peranan pengguna dan maklumat kebenaran boleh dimasukkan dalam penggunaan lanjutan. 4. Kesilapan umum termasuk kegagalan pengesahan tandatangan, tamat tempoh, dan muatan besar. Kemahiran penyahpepijatan termasuk menggunakan alat debugging dan pembalakan. 5. Pengoptimuman prestasi dan amalan terbaik termasuk menggunakan algoritma tandatangan yang sesuai, menetapkan tempoh kesahihan dengan munasabah,

Rentetan adalah urutan aksara, termasuk huruf, nombor, dan simbol. Tutorial ini akan mempelajari cara mengira bilangan vokal dalam rentetan yang diberikan dalam PHP menggunakan kaedah yang berbeza. Vokal dalam bahasa Inggeris adalah a, e, i, o, u, dan mereka boleh menjadi huruf besar atau huruf kecil. Apa itu vokal? Vokal adalah watak abjad yang mewakili sebutan tertentu. Terdapat lima vokal dalam bahasa Inggeris, termasuk huruf besar dan huruf kecil: a, e, i, o, u Contoh 1 Input: String = "TutorialSpoint" Output: 6 menjelaskan Vokal dalam rentetan "TutorialSpoint" adalah u, o, i, a, o, i. Terdapat 6 yuan sebanyak 6

Mengikat statik (statik: :) Melaksanakan pengikatan statik lewat (LSB) dalam PHP, yang membolehkan kelas panggilan dirujuk dalam konteks statik dan bukannya menentukan kelas. 1) Proses parsing dilakukan pada masa runtime, 2) Cari kelas panggilan dalam hubungan warisan, 3) ia boleh membawa overhead prestasi.

Apakah kaedah sihir PHP? Kaedah sihir PHP termasuk: 1. \ _ \ _ Membina, digunakan untuk memulakan objek; 2. \ _ \ _ Destruct, digunakan untuk membersihkan sumber; 3. \ _ \ _ Call, mengendalikan panggilan kaedah yang tidak wujud; 4. \ _ \ _ Mendapatkan, melaksanakan akses atribut dinamik; 5. \ _ \ _ Set, melaksanakan tetapan atribut dinamik. Kaedah ini secara automatik dipanggil dalam situasi tertentu, meningkatkan fleksibiliti dan kecekapan kod.
