Java での印刷不可能な Unicode 文字の置換
Java では、提供された正規表現パターンで ASCII 制御文字と印刷不可能な文字を置き換えることができます。ただし、Unicode 文字列を効果的に処理できません。
Unicode 用の拡張正規表現パターン
この制限に対処するために、Unicode をターゲットとする変更されたパターンを使用できます。カテゴリ「その他」:
<code class="java">my_string.replaceAll("\p{C}", "?");</code>
カテゴリ「その他」(\p{C}) には、制御文字、フォーマット文字、サロゲート コード ポイントなど、幅広い印刷不可能な文字が含まれます。このパターンは、これらの文字を Unicode 文字列から効果的に削除します。
追加情報
より包括的な理解のために、Java で使用可能な Unicode 正規表現を調べることをお勧めします。 util.regexPattern/String.replaceAll のサポート。これらの式は、Unicode 文字列を操作および変更するための堅牢なメカニズムを提供します。
以上がJava で印刷できない Unicode 文字を置き換える方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。