Jsoup을 사용하여 HTML에서 텍스트로 변환 시 줄 바꿈 유지
jsoup를 사용하여 HTML을 일반 텍스트로 변환할 때 줄 바꿈을 유지하는 것은 다음과 같습니다. 출력의 가독성과 구조를 유지하는 데 중요합니다. 기본적으로 jsoup의 text() 메소드는 HTML 코드에 있는 줄바꿈을 유지하지 않습니다.
해결책:
줄바꿈을 효과적으로 유지하려면 br2nl()을 활용하세요. 다음과 같은 개선 사항이 통합된 메서드입니다.
태그:
줄 바꿈은의 내용 앞에 nn이 추가됩니다. 새 단락을 나타내는 태그입니다.
사용법:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class LineBreakPreserver { public static String br2nl(String html) { if (html == null) { return html; } Document document = Jsoup.parse(html); document.outputSettings(new Document.OutputSettings().prettyPrint(false)); document.select("br").append("\n"); document.select("p").prepend("\n\n"); String s = document.html().replaceAll("\\n", "\n"); return Jsoup.clean(s, "", Whitelist.none(), new Document.OutputSettings().prettyPrint(false)); } public static void main(String[] args) { String html = "<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN \">" + "<HTML> <HEAD> <TITLE></TITLE> <style>body{ font-size: 12px;font-family: verdana, arial, helvetica, sans-serif;}</style> </HEAD> <BODY><p><b>hello world</b></p><p><br><b>yo</b> <a href=\"http://google.com\">googlez</a></p></BODY> </HTML> "; String result = br2nl(html); System.out.println(result); } }</code>
출력:
hello world yo googlez
위 내용은 Jsoup를 사용하여 HTML을 텍스트로 변환할 때 줄바꿈을 유지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!