> Java > java지도 시간 > 정규식을 사용하여 구분 기호를 유지하면서 문자열을 분할하는 방법은 무엇입니까?

정규식을 사용하여 구분 기호를 유지하면서 문자열을 분할하는 방법은 무엇입니까?

Susan Sarandon
풀어 주다: 2024-10-24 15:59:01
원래의
946명이 탐색했습니다.

How to Split Strings Preserving Delimiters Using Regular Expressions?

구분 기호를 보존한 문자열 분할

여러 구분 기호가 포함된 문자열로 작업할 때는 문자열을 구성 부분으로 분할하는 것이 중요합니다. 구분 기호 정보를 보존합니다. String.split() 메서드는 문자열을 분할하기 위한 간단한 메커니즘을 제공하지만 구분 기호를 유지하지 않고 하위 문자열만 추출합니다.

문자열을 분할하고 구분 기호를 유지하는 원하는 결과를 얻으려면 정규식을 사용할 수 있습니다. Lookahead 및 LookBehind 어설션이 있는 표현식입니다. Lookahead(?=) 및 Lookbehind(?<=)는 입력 문자열의 문자를 사용하지 않고 일치를 허용하는 특수 구문입니다.

다음 예를 고려하세요.

<code class="java">String input = "(Text1)(DelimiterA)(Text2)(DelimiterC)(Text3)(DelimiterB)(Text4)";

String[] parts = input.split("((?=;)|(?<=;))");</code>
로그인 후 복사

여기서 코드:

  • 정규식(?=;)은 세미콜론(;) 바로 앞의 위치와 일치합니다.
  • 정규식(?<=;)은 세미콜론(;) 바로 앞의 위치와 일치합니다. 세미콜론(;) 뒤에
  • | 연산자는 (?=;) 또는 (?<=;)에 대해 일치가 발생할 수 있음을 지정합니다.
  • 가장 바깥쪽 괄호는 전체 표현식을 묶고 캡처 괄호 역할을 합니다.

split() 메소드와 함께 사용하면 이 정규식은 각 구분 문자(;)를 식별하고 이에 대한 빈 일치 항목을 만듭니다. 따라서 결과 배열 부분에는 다음 요소가 포함됩니다.

[Text1, ;, Text2, ;, Text3, ;, Text4]
로그인 후 복사

이 접근 방식을 사용하면 문자열을 개별 구성 요소로 나누면서 문자열의 원래 구조를 유지할 수 있습니다. 이는 무결성을 유지하는 방식으로 복잡한 문자열을 구문 분석하는 강력한 기술입니다.

위 내용은 정규식을 사용하여 구분 기호를 유지하면서 문자열을 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿