在保留分隔符的情况下拆分字符串
使用多行字符串时,通常需要使用分隔符将它们拆分为各个组成部分。但是, String.split() 的默认行为会丢弃分隔符,只留下提取的文本。
问题:
考虑以下字符串:
(Text1)(DelimiterA)(Text2)(DelimiterC)(Text3)(DelimiterB)(Text4)
使用 String.split() 分割此字符串会产生:
期望的输出:
要保留分隔符并相应地分割字符串,我们需要一种保留分隔符的方法。
解决方案:
JDK 提供了一种使用前向和后向正则表达式 (regex) 功能来实现此目的的方法。它的工作原理如下:
<code class="java">System.out.println(Arrays.toString("a;b;c;d".split("(?<=;)"))); System.out.println(Arrays.toString("a;b;c;d".split("(?=;)"))); System.out.println(Arrays.toString("a;b;c;d".split("((?<;=;)|(?=;))")));</code>
这会产生以下输出:
最后的输出与所需的格式对齐,其中每个分隔符都被保留,字符串被分成单独的部分。
正则表达式解释:
通过组合这些模式,我们可以在每个分隔符处有效地分割字符串同时保留分隔符本身作为输出的一部分。
可读性增强:
为了提高可读性,请考虑使用命名正则表达式,如下所示:
<code class="java">static public final String WITH_DELIMITER = "((?<=%1$s)|(?=%1$s))"; public void someMethod() { final String[] aEach = "a;b;c;d".split(String.format(WITH_DELIMITER, ";")); ... }</code>
这使得正则表达式更加不言自明并且更易于维护。
以上是如何拆分字符串并保留分隔符?的详细内容。更多信息请关注PHP中文网其他相关文章!