使用嵌入引号拆分分隔文本
解析采用逗号分隔格式的文本时,处理嵌入的引号可能会带来挑战。本文解决了这个问题,提供了一种解决方案,可以用逗号分割字符串,同时保留引号内文本的完整性。
考虑以下文本:
123,test,444,"don't split, this",more test,1
使用基本字符串。 split(",") 方法将产生以下结果:
123 test 444 "don't split this" more test 1
但是,目标是将引用的文本保留为单个实体:
123 test 444 "don't split, this" more test 1
为了实现这一点,我们采用基于正则表达式的解决方案:
str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)");
此表达式根据逗号分割字符串,后跟偶数个 double引号。这可确保引用文本中的逗号被忽略为分隔符。
理解正则表达式:
替代语法:
为了便于阅读,您还可以使用 (?x) 修饰符将正则表达式分成多行:
String[] arr = str.split("(?x) " + ", " + // Split on comma "(?= " + // Followed by " (?: " + // Start a non-capture group " [^\"]* " + // 0 or more non-quote characters " \" " + // 1 quote " [^\"]* " + // 0 or more non-quote characters " \" " + // 1 quote " )* " + // 0 or more repetition of non-capture group (multiple of 2 quotes will be even) " [^\"]* " + // Finally 0 or more non-quotes " $ " + // Till the end (This is necessary, else every comma will satisfy the condition) ") " // End look-ahead );
考虑到逗号和嵌入的引号,这种方法可确保准确分割分隔文本。
以上是如何使用嵌入的引号拆分逗号分隔的字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!