我想用UEStudio批量删除一个HTML文件中的超链接,想写一个正则表达式,不知道应该书写正则表达式?
表达式的规则:(我能看得懂,就是不知道该怎么用……)
正则表达式 (UltraEdit 语法):
符号
功能
%
匹配行首 ? 表示搜索字符串必须在行首,但不包括任何选定的结果字符中的行终止字符。
$
匹配行尾 ? 表示搜索字符串必须在行尾,但不包括任何选定的结果字符中的行终止字符。
?
匹配任何除换行符的字符。
*
匹配任何除换行符外所出现的任意数量的字符。
+
匹配一个或多个前面的字符/表达式。必须找到至少一个出现的字符。不匹配重复的换行符。
++
0 次或多次匹配前面的字符/表达式。不匹配重复的换行符。
^b
匹配一个分页符。
^p
匹配一个换行符 (CR/LF) (段落) (DOS 文件)
^r
匹配一个换行符 (仅 CR) (段落) (MAC 文件)
^n
匹配一个换行符 (仅 LF) (段落) (UNIX 文件)
^t
匹配一个制表符
[ ]
匹配任何括号中的单个字符或范围
^{A^}^{B^}
匹配表达式 A 或 B
^
忽略其后的正则表达式字符
^(*^)
在表达式加上括号或标签在替换命令中使用。正则表达式中可以有 9 个表达式标签,数字根据它们在正则表达式中的次序确定数字。
相应的替换表达式是 ^x,x 的范围是 1-9。例如: 如果 ^(h*o^) ^(f*s^) 匹配“hello folks”,那么^2 ^1 表示将用“folks hello”替换它。
注意 ? ^ 这里涉及的字符“^”不是控制键 + 值。
例如:
m?n 匹配“man”、“men”、“min”,但不匹配“moon”。
t*t 匹配“test”、“tonight”和“tea time”中的“tea t”部分,但不匹配“tea
time” (“tea ”和“time”之间有换行)。
Te+st 匹配“test”、“teest”、“teeeest”等,但不匹配“tst”。
[aeiou] 匹配每个元音小写字母
[,.?] 匹配文字“,”、“.”或“?”。
[0-9a-z] 匹配任何数字或小写字母
[~0-9] 匹配除数字外的任何字符 (~ 表示不匹配其后的内容)
?a[^>]*>
试下上面的,删除链接标签的
删除元素的话貌似可以用removeChild试试
Pattern p = Pattern.compile("?a[^>]*>");
Matcher m = p.matcher(allContent);
allContent = m.replaceAll("");