Lösung zum Entfernen von HTML-Tags mithilfe regulärer Ausdrücke

高洛峰
Freigeben: 2017-03-28 11:54:51
Original
1735 Leute haben es durchsucht

使用正则表达式删除HTML标签。 

import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
public class HTMLSpirit{ 
   public static String delHTMLTag(String htmlStr){ 
       String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式 
       String regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式 
       String regEx_html="<[^>]+>"; //定义HTML标签的正则表达式 
       Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); 
       Matcher m_script=p_script.matcher(htmlStr); 
       htmlStr=m_script.replaceAll(""); //过滤script标签 
       Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); 
       Matcher m_style=p_style.matcher(htmlStr); 
       htmlStr=m_style.replaceAll(""); //过滤style标签 
       Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); 
       Matcher m_html=p_html.matcher(htmlStr); 
       htmlStr=m_html.replaceAll(""); //过滤html标签 
       return htmlStr.trim(); //返回文本字符串 
   } 
}
Nach dem Login kopieren

Java中去掉网页HTML标记的方法
Java里面去掉网页里的HTML标记的方法:

/** 
* 去掉字符串里面的html代码。<br> 
* 要求数据要规范,比如大于小于号要配套,否则会被集体误杀。 
* 
* @param content 
* 内容 
* @return 去掉后的内容 
*/ 
public static String stripHtml(String content) { 
// <p>段落替换为换行 
content = content.replaceAll("<p .*?>", "\r\n"); 
// <br><br/>替换为换行 
content = content.replaceAll("<br\\s*/?>", "\r\n"); 
// 去掉其它的<>之间的东西 
content = content.replaceAll("\\<.*?>", ""); 
// 还原HTML 
// content = HTMLDecoder.decode(content); 
return content; 
}
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonLösung zum Entfernen von HTML-Tags mithilfe regulärer Ausdrücke. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage