Java 文字列内の印刷不可能な Unicode 文字を効果的に置き換える方法は?

Linda Hamilton
リリース: 2024-10-31 10:18:02
オリジナル
1010 人が閲覧しました

How to Effectively Replace Non-Printable Unicode Characters in Java Strings?

Java での印刷不可能な Unicode 文字の置換: 包括的なアプローチ

当面の問題は、Java 内の印刷不可能な Unicode 文字を効果的に置き換えることに関するものです。文字列。 ASCII 制御文字は、次の正規表現を使用して効率的に処理できます:

my_string.replaceAll("\p{Cntrl}", "?");
ログイン後にコピー

さらに、アクセント付き文字を含む ASCII の印刷不可能文字は、

my_string.replaceAll("[^\p{Print}]", "?");
ログイン後にコピー

で置き換えることができます。ただし、両方ともUnicode 文字列を扱う場合、このアプローチでは不十分です。この課題に対処するには、堅牢なソリューションが必要です。

解決策: "p{C}" の利用

Unicode の印刷不可能な文字を処理する鍵は、正規表現:

my_string.replaceAll("\p{C}", "?");
ログイン後にコピー

この正規表現は、印刷できないすべての Unicode 文字を効果的に識別し、置き換えます。

Unicode 正規表現について

Java の java. util.regexPattern/String.replaceAll クラスは、Unicode 正規表現を完全にサポートします。短縮形「p{C}」は Unicode 制御文字を表します。

このアプローチを利用すると、Unicode 文字列内の印刷不可能な文字を効率的に置き換えることができ、一貫した文字列操作が保証されます。

以上がJava 文字列内の印刷不可能な Unicode 文字を効果的に置き換える方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート