java - 如何用正規提取html內容-PHP中文網路問答

java - 如何用正規提取html內容

習慣沉默 2017-05-17 10:06:13

484

雷雷

習慣沉默

全部回覆(2)

伊谢尔伦2017-05-17 10:08:13 2樓

可以使用jsoup和regex, 建議使用jsoup!
jsoup document:
https://jsoup.org/cookbook/in...
http://www.open-open.com/jsoup/


    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    public class Main {
    
        public static void main(String[] args) {
    
            // 方法１: jsoup
            String html = "<p class=\"info-detail-head-classify-subname\"><a id=\"info_detail_head_classify_type\" href=\"\" target=\"_blank\">财富</a></p>";
    
            Document doc = Jsoup.parse(html);
            Element element = doc.getElementById("info_detail_head_classify_type");
            System.out.println(element.text());
    
            // 方法2: regex
            Pattern r = Pattern.compile("<a.*>(.*)</a>");
            Matcher m = r.matcher(html);
            if (m.find()) {
                System.out.println(m.group(1));
            }
        }
    }

點贊 +0

新增回覆

淡淡烟草味2017-05-17 10:08:13 1樓

<a[^>]*>([^<]*)</a>

取<a></a>中的內容

點贊 +0

新增回覆

熱門專題

更多>