Bolehkah Regex Mengendalikan Kurung Bersarang? Meneroka Had dan Penyelesaian pyparsing.

DDD
Lepaskan: 2024-11-01 00:41:28
asal
332 orang telah melayarinya

Can Regex Handle Nested Parentheses? Exploring Limitations and pyparsing Solutions.

Pemadanan Kurung Bersarang dalam Python: Had Regex dan Penyelesaian Alternatif

Memadankan kurungan bersarang dalam rentetan boleh menjadi tugas yang mencabar, terutamanya menggunakan ungkapan biasa (regex). Pertimbangkan kod Python berikut:

<code class="python">import re

p = re.compile('\(.+\)')
str = '(((1+0)+1)+1)'
print(p.findall(str))</code>
Salin selepas log masuk

Kod ini cuba memadankan semua rentetan seperti ungkapan matematik dalam str pembolehubah menggunakan corak regex tunggal. Walau bagaimanapun, ia hanya sepadan dengan keseluruhan ungkapan secara keseluruhan, walaupun matlamatnya adalah untuk mengenal pasti kurungan bersarang individu.

Mengapa Regex Falls Short

Corak regex terhad dalam keupayaannya untuk mengendalikan binaan bersarang dengan berkesan. Ungkapan (. ) sepadan dengan mana-mana rentetan yang disertakan dalam kurungan, tetapi ia tidak dapat membezakan antara tahap sarang yang berbeza. Akibatnya, ia mengumpulkan segala-galanya dalam kurungan paling luar dan mengabaikan yang dalam.

Penyelesaian Komprehensif Menggunakan pyparsing

Untuk mengatasi batasan regex, kami boleh memanfaatkan perpustakaan yang lebih maju yang dipanggil pyparsing , yang menyediakan penghurai khusus untuk mengendalikan corak rentetan yang kompleks. Berikut ialah contoh menggunakan pyparsing:

<code class="python">import pyparsing

thecontent = pyparsing.Word(pyparsing.alphanums) | '+' | '-'
parens = pyparsing.nestedExpr('(', ')', content=thecontent)</code>
Salin selepas log masuk

Kod ini mentakrifkan dua elemen: kandungan, yang mewakili aksara individu atau operator aritmetik, dan kurungan, yang mentakrifkan struktur kurungan bersarang.

Penggunaan Praktikal

Mari kita tunjukkan penyelesaian ini dengan contoh:

<code class="python">res = parens.parseString("((12 + 2) + 3)")
print(res.asList())</code>
Salin selepas log masuk

Output:

[[['12', '+', '2'], '+', '3']]
Salin selepas log masuk

Kelebihan Utama

Menggunakan pyparsing untuk pemadanan kurungan bersarang menawarkan beberapa kelebihan over regex:

  • Fleksibiliti: pyparsing membenarkan peraturan padanan corak yang lebih kompleks dan rumit.
  • Pengendalian Bersarang: Ia mempertimbangkan secara jelas tahap bersarang dan menangkap struktur dalaman dengan berkesan.
  • Penyesuaian: pyparsing membolehkan anda menyesuaikan peraturan padanan dengan keperluan khusus anda.

Kesimpulan

Walaupun ungkapan biasa boleh berguna untuk pemadanan rentetan yang mudah, mereka bergelut dengan mengendalikan binaan bersarang seperti kurungan. Untuk senario sedemikian, perpustakaan penghuraian khusus seperti pyparsing menyediakan alternatif yang teguh dan fleksibel, memastikan hasil padanan yang tepat dan bermakna.

Atas ialah kandungan terperinci Bolehkah Regex Mengendalikan Kurung Bersarang? Meneroka Had dan Penyelesaian pyparsing.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!