따옴표 세그먼트를 제외하고 공백으로 문자열 분할
정규식 영역에서 인용 세그먼트를 유지하면서 공백으로 문자열을 분할하는 작업 초보 사용자에게는 어려울 수 있습니다. 이 문제를 해결하기 위해 우리는 입력 문자열을 구성 요소로 정확하게 분리하는 강력한 솔루션을 찾고 있습니다.
제공된 예제 문자열은 공백이 단어를 구분하지만 작은따옴표나 큰따옴표로 묶인 세그먼트 내에 있지 않은 특정 사례를 보여줍니다. 원하는 출력은 이렇게 인용된 세그먼트를 유지하여 "will be" 또는 '정규 표현식'과 같은 문구가 그대로 유지되도록 합니다.
이 작업에 적합한 정규 표현식은 놀라울 정도로 간단합니다.
[^\s"']+|"([^"]*)"|'([^']*)'
이 표현식을 분석하면 다음과 같습니다.
Java에서 이 표현식을 활용하려면 다음을 사용할 수 있습니다. 코드:
List<String> matchList = new ArrayList<>(); Pattern regex = Pattern.compile("[^\s\"']+|\"([^\"]*)\"|'([^']*)'"); Matcher regexMatcher = regex.matcher(subjectString); while (regexMatcher.find()) { if (regexMatcher.group(1) != null) { // Add double-quoted string without the quotes matchList.add(regexMatcher.group(1)); } else if (regexMatcher.group(2) != null) { // Add single-quoted string without the quotes matchList.add(regexMatcher.group(2)); } else { // Add unquoted word matchList.add(regexMatcher.group()); } }
이 코드는 입력 문자열을 반복하여 인용된 세그먼트와 인용되지 않은 세그먼트를 캡처하여 분할 요소 목록을 생성합니다. 또는 더 간단한 버전을 사용할 수 있습니다.
List<String> matchList = new ArrayList<>(); Pattern regex = Pattern.compile("[^\s\"']+|\"[^\"]*\"|'[^']*'"); Matcher regexMatcher = regex.matcher(subjectString); while (regexMatcher.find()) { matchList.add(regexMatcher.group()); }
이 단순화된 버전에는 목록에 인용된 요소와 인용되지 않은 요소가 모두 포함됩니다.
위 내용은 정규 표현식을 사용하여 따옴표 붙은 세그먼트를 유지하면서 문자열을 공백으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!