UEStudio を使用して HTML ファイル内のハイパーリンクを一括削除したいのですが、正規表現の書き方がわかりません。
式のルール: (理解はできるけど、使い方がわからない...)
正規表現 (UltraEdit 構文):
シンボル
関数
%
行頭と一致することを示します。検索文字列は行の先頭にある必要があります。 行終了文字は行の先頭にありますが、選択された結果文字は含まれません。
$
行末に一致 ? は、検索文字列が行末にある必要がありますが、選択された結果文字に行終了文字が含まれないことを意味します。
?
改行を除く任意の文字と一致します。
*
改行を除く、出現する任意の数の文字と一致します。
+
先行する 1 つ以上の文字/式と一致します。少なくとも 1 つの文字が見つかる必要があります。繰り返される改行には一致しません。
++
前の文字/式と 0 回以上一致します。繰り返される改行には一致しません。
^b
改ページに一致します。
^p
改行文字 (CR/LF) と一致します (段落) (DOS ファイル)
^r
改行文字と一致します (CR のみ) (段落) (MAC ファイル)
^n
改行文字と一致します(LF のみ) (段落) (UNIX ファイル)
^t
タブ文字と一致します
[ ]
任意の 1 文字または括弧内の範囲と一致します
^{A^}^{B^}
式と一致します 式A または B
^
次の正規表現文字を無視します
^(*^)
式に括弧またはラベルを追加し、置換コマンドで使用します。正規表現には 9 つの式タグを含めることができ、その数は正規表現内の順序に基づいて決定されます。
対応する置換式は ^x で、x の範囲は 1 ~ 9 です。例: ^(h*o^) ^(f*s^) が「hello folks」と一致する場合、^2 ^1 は「folks hello」に置き換えられることを意味します。
注 ? ^ ここで使用される文字「^」は、コントロール キー + 値ではありません。
例:
m?n は、「man」、「men」、「min」に一致しますが、「moon」には一致しません。
t*t は、「test」、「tonight」、「tea time」の「tea t」の部分と一致しますが、「tea
time」とは一致しません(「tea」と「time」の間に改行があります) 。
Te+st は、「test」、「teest」、「teeeest」などに一致しますが、「tst」には一致しません。
[aeiou] はすべての小文字の母音に一致します
[,.?] はテキスト「,」、「.」、または「?」に一致します。
[0-9a-z] は任意の数字または小文字と一致します
[~0-9] は数字以外の任意の文字と一致します (~ はその後の内容と一致しないことを意味します)
?a[^>]*>
上記を試して、リンクタグを削除してください
要素を削除したい場合は、removeChild を試してください
Pattern p = Pattern.compile( " ?a[^>]*>");
マッチャー m = p.matcher(allContent)
allContent = m.replaceAll("");