xpath - python怎么用lxml处理

Question

例如： {代码...} 就是在p标签里可能会出现同样的em标签，而且数量不定，那我怎么获取p的内容，包括em里的内容。例如第二个p获取输出是‘没aa没aa’ 或者获取到p节点之后，怎么把里面的内容转换为字符串

PHPz · Answer

Saya secara tidak sengaja belajar cara menangani masalah ini hari ini, dan saya sengaja mengubahnya untuk menjawab soalan ini. Penanya, anda boleh melihat paksi xpath Contohnya, jika anda ingin mendapatkan "no aa no aa" tag

kedua, anda sebenarnya ingin mendapatkan kandungan teks semua nod keturunannya . Anda boleh menggunakan
untuk mendapatkan, hasilnya ialah senarai seperti ini element_dom.xpath("//p[2]//descendant::text()"), dan kemudian anda boleh menyambungnya secara manual ke dalam rentetan, seperti ['没', 'aa', '没', 'aa']. Begitu juga, jika anda perlu melakukan operasi lain, anda juga boleh menggunakan kaedah yang serupa. "".join(list)

大家讲道理 · Answer

Tukar kepada bs4, persamaan dan perbezaan antara rentetan dan teks ada di sini.

PHP中文网 · Answer

Kaedah .text_content() lxml.html boleh mendapatkan kandungan teks nod semasa dan semua nod anak.