ruby - nokogiri 怎麼取得一個 html 元素本身的 text 文字但不包含起子元素的 text 文字?
大家讲道理
大家讲道理 2017-04-24 09:12:35
0
1
747
<body>
    <p id='p1'>111</p>
    <p id='p2'>222
        <p id='p3'>333
            <p id='p4'>444</p>
        </p>
        <p id='p33'>bbb</p>
    </p>
</body>

例如:
p2元素本身的text為222.但使用nokogiri獲取p2的text文本時,會包含p2的各級子元素的文本,例如p3和p4的text文本也包含在內。
而我只想要p2自身的text文本,即只要222。

require 'nokogiri'
html = Nokogiri::HTML(open 'test.html')
p2_obj = html.xpath("//*[@id='p2']")
p2_text = p2_obj.to_s #这样会获取到p2各级子元素的文本

那麼怎麼樣才能只取得到p2自身的text文字(即只要222,不要333 444 bbb)呢?

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回覆(1)
洪涛

p2_obj.children[0].text就是p_obj自身的text文本,也就是222,不包含333 444 bbb

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!