Maison Java javaDidacticiel Java utilise une expression régulière pour filtrer les balises HTML

Java utilise une expression régulière pour filtrer les balises HTML

Jan 22, 2017 am 11:54 AM

前段时间开发的时候要读取一篇文章的简介内容(也就是前200个字符),使用了隐藏字段,可能有人就要问了,那后台也是可以截取字符的啊,那是因为编辑器里面包含了html标签,所以后台就需要处理html标签的正则表达式,前些天上网搜了下,发现有人写好的一个类,给大家共享下

import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
  
/** 
 * <p> 
 * Title: HTML相关的正则表达式工具类 
 * </p> 
 * <p> 
 * Description: 包括过滤HTML标记,转换HTML标记,替换特定HTML标记 
 * </p> 
 * <p> 
 * Copyright: Copyright (c) 2006 
 * </p> 
 * 
 * @author hejian 
 * @version 1.0 
 * @createtime 2006-10-16 
 */
  
public class HtmlRegexpUtil { 
 private final static String regxpForHtml = "<([^>]*)>"; // 过滤所有以<开头以>结尾的标签 
  
 private final static String regxpForImgTag = "<\\s*img\\s+([^>]*)\\s*>"; // 找出IMG标签 
  
 private final static String regxpForImaTagSrcAttrib = "src=\"([^\"]+)\""; // 找出IMG标签的SRC属性 
  
 /** 
  * 
  */
 public HtmlRegexpUtil() { 
  // TODO Auto-generated constructor stub 
 } 
  
 /** 
  * 
  * 基本功能:替换标记以正常显示 
  * <p> 
  * 
  * @param input 
  * @return String 
  */
 public String replaceTag(String input) { 
  if (!hasSpecialChars(input)) { 
   return input; 
  } 
  StringBuffer filtered = new StringBuffer(input.length()); 
  char c; 
  for (int i = 0; i <= input.length() - 1; i++) { 
   c = input.charAt(i); 
   switch (c) { 
   case &#39;<&#39;: 
    filtered.append("<"); 
    break; 
   case &#39;>&#39;: 
    filtered.append(">"); 
    break; 
   case &#39;"&#39;: 
    filtered.append("""); 
    break; 
   case &#39;&&#39;: 
    filtered.append("&"); 
    break; 
   default: 
    filtered.append(c); 
   } 
  
  } 
  return (filtered.toString()); 
 } 
  
 /** 
  * 
  * 基本功能:判断标记是否存在 
  * <p> 
  * 
  * @param input 
  * @return boolean 
  */
 public boolean hasSpecialChars(String input) { 
  boolean flag = false; 
  if ((input != null) && (input.length() > 0)) { 
   char c; 
   for (int i = 0; i <= input.length() - 1; i++) { 
    c = input.charAt(i); 
    switch (c) { 
    case &#39;>&#39;: 
     flag = true; 
     break; 
    case &#39;<&#39;: 
     flag = true; 
     break; 
    case &#39;"&#39;: 
     flag = true; 
     break; 
    case &#39;&&#39;: 
     flag = true; 
     break; 
    } 
   } 
  } 
  return flag; 
 } 
  
 /** 
  * 
  * 基本功能:过滤所有以"<"开头以">"结尾的标签 
  * <p> 
  * 
  * @param str 
  * @return String 
  */
 public static String filterHtml(String str) { 
  Pattern pattern = Pattern.compile(regxpForHtml); 
  Matcher matcher = pattern.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  boolean result1 = matcher.find(); 
  while (result1) { 
   matcher.appendReplacement(sb, ""); 
   result1 = matcher.find(); 
  } 
  matcher.appendTail(sb); 
  return sb.toString(); 
 } 
  
 /** 
  * 
  * 基本功能:过滤指定标签 
  * <p> 
  * 
  * @param str 
  * @param tag 
  *   指定标签 
  * @return String 
  */
 public static String fiterHtmlTag(String str, String tag) { 
  String regxp = "<\\s*" + tag + "\\s+([^>]*)\\s*>"; 
  Pattern pattern = Pattern.compile(regxp); 
  Matcher matcher = pattern.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  boolean result1 = matcher.find(); 
  while (result1) { 
   matcher.appendReplacement(sb, ""); 
   result1 = matcher.find(); 
  } 
  matcher.appendTail(sb); 
  return sb.toString(); 
 } 
  
 /** 
  * 
  * 基本功能:替换指定的标签 
  * <p> 
  * 
  * @param str 
  * @param beforeTag 
  *   要替换的标签 
  * @param tagAttrib 
  *   要替换的标签属性值 
  * @param startTag 
  *   新标签开始标记 
  * @param endTag 
  *   新标签结束标记 
  * @return String 
  * @如:替换img标签的src属性值为[img]属性值[/img] 
  */
 public static String replaceHtmlTag(String str, String beforeTag, 
   String tagAttrib, String startTag, String endTag) { 
  String regxpForTag = "<\\s*" + beforeTag + "\\s+([^>]*)\\s*>"; 
  String regxpForTagAttrib = tagAttrib + "=\"([^\"]+)\""; 
  Pattern patternForTag = Pattern.compile(regxpForTag); 
  Pattern patternForAttrib = Pattern.compile(regxpForTagAttrib); 
  Matcher matcherForTag = patternForTag.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  boolean result = matcherForTag.find(); 
  while (result) { 
   StringBuffer sbreplace = new StringBuffer(); 
   Matcher matcherForAttrib = patternForAttrib.matcher(matcherForTag 
     .group(1)); 
   if (matcherForAttrib.find()) { 
    matcherForAttrib.appendReplacement(sbreplace, startTag 
      + matcherForAttrib.group(1) + endTag); 
   } 
   matcherForTag.appendReplacement(sb, sbreplace.toString()); 
   result = matcherForTag.find(); 
  } 
  matcherForTag.appendTail(sb); 
  return sb.toString(); 
 } 
}
Copier après la connexion

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持PHP中文网。

更多java使用正则表达式过滤html标签相关文章请关注PHP中文网!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment fonctionne le mécanisme de chargement de classe de Java, y compris différents chargeurs de classe et leurs modèles de délégation? Comment fonctionne le mécanisme de chargement de classe de Java, y compris différents chargeurs de classe et leurs modèles de délégation? Mar 17, 2025 pm 05:35 PM

Le chargement de classe de Java implique le chargement, la liaison et l'initialisation des classes à l'aide d'un système hiérarchique avec Bootstrap, Extension et Application Classloaders. Le modèle de délégation parent garantit que les classes de base sont chargées en premier, affectant la classe de classe personnalisée LOA

Comment implémenter la mise en cache à plusieurs niveaux dans les applications Java à l'aide de bibliothèques comme la caféine ou le cache de goyave? Comment implémenter la mise en cache à plusieurs niveaux dans les applications Java à l'aide de bibliothèques comme la caféine ou le cache de goyave? Mar 17, 2025 pm 05:44 PM

L'article examine la mise en œuvre de la mise en cache à plusieurs niveaux en Java à l'aide de la caféine et du cache de goyave pour améliorer les performances de l'application. Il couvre les avantages de configuration, d'intégration et de performance, ainsi que la gestion de la politique de configuration et d'expulsion le meilleur PRA

Comment puis-je utiliser JPA (Java Persistance API) pour la cartographie relationnelle des objets avec des fonctionnalités avancées comme la mise en cache et le chargement paresseux? Comment puis-je utiliser JPA (Java Persistance API) pour la cartographie relationnelle des objets avec des fonctionnalités avancées comme la mise en cache et le chargement paresseux? Mar 17, 2025 pm 05:43 PM

L'article discute de l'utilisation de JPA pour la cartographie relationnelle des objets avec des fonctionnalités avancées comme la mise en cache et le chargement paresseux. Il couvre la configuration, la cartographie des entités et les meilleures pratiques pour optimiser les performances tout en mettant en évidence les pièges potentiels. [159 caractères]

Comment utiliser Maven ou Gradle pour la gestion avancée de projet Java, la création d'automatisation et la résolution de dépendance? Comment utiliser Maven ou Gradle pour la gestion avancée de projet Java, la création d'automatisation et la résolution de dépendance? Mar 17, 2025 pm 05:46 PM

L'article discute de l'utilisation de Maven et Gradle pour la gestion de projet Java, la construction de l'automatisation et la résolution de dépendance, en comparant leurs approches et leurs stratégies d'optimisation.

Mar 17, 2025 pm 05:45 PM

L'article discute de la création et de l'utilisation de bibliothèques Java personnalisées (fichiers JAR) avec un versioning approprié et une gestion des dépendances, à l'aide d'outils comme Maven et Gradle.

See all articles