xpath - python怎么用lxml处理
伊谢尔伦
伊谢尔伦 2017-04-18 10:19:05
0
3
1111

例如:

<p>
没
<em><!--red_beg-->aa<!--red_end--></em>
</p>
<p>
没
<em><!--red_beg-->aa<!--red_end--></em>
没
<em><!--red_beg-->aa<!--red_end--></em>
</p>
<p>
没
</p>

就是在p标签里可能会出现同样的em标签,而且数量不定,那我怎么获取p的内容,包括em里的内容。
例如第二个p获取输出是‘没aa没aa’

或者获取到p节点之后,怎么把里面的内容转换为字符串

伊谢尔伦
伊谢尔伦

小伙看你根骨奇佳,潜力无限,来学PHP伐。

membalas semua(3)
PHPzhong

Saya secara tidak sengaja belajar cara menangani masalah ini hari ini, dan saya sengaja mengubahnya untuk menjawab soalan ini. Penanya, anda boleh melihat paksi xpath Contohnya, jika anda ingin mendapatkan "no aa no aa" tag <p> kedua, anda sebenarnya ingin mendapatkan kandungan teks semua nod keturunannya . Anda boleh menggunakan
untuk mendapatkan, hasilnya ialah senarai seperti ini element_dom.xpath("//p[2]//descendant::text()"), dan kemudian anda boleh menyambungnya secara manual ke dalam rentetan, seperti ['没', 'aa', '没', 'aa']. Begitu juga, jika anda perlu melakukan operasi lain, anda juga boleh menggunakan kaedah yang serupa. "".join(list)

大家讲道理

Tukar kepada bs4, persamaan dan perbezaan antara rentetan dan teks ada di sini.

洪涛

Kaedah .text_content() lxml.html boleh mendapatkan kandungan teks nod semasa dan semua nod anak.

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!