먼저 정규식이란 무엇일까요?
정규 표현식은 정의된 규칙과 일치하는 문자열을 일치시키는 데 사용되는 사용자 정의 규칙의 표현식입니다. 무슨 뜻인가요? 예를 들어 다음은 정규식입니다. /d/, d는 임의의 숫자를 의미하므로 이 정규식의 의미는 임의의 숫자와 일치한다는 것입니다. 아마 이해하실 겁니다!
정규 표현식이 무엇으로 구성되어 있는지 살펴보겠습니다.
1. 직접 문자
2. 범위 클래스
무슨 뜻인가요? 예: /[a-z]3{1,3}5+/ 이 표현식은 영어 문자가 한 번 나타나고 숫자 3이 1~3번 나타나고 숫자 5가 적어도 한 번 나타나는 것을 의미합니다.
Chrome 디버깅 도구의 test() 메서드를 사용하여 시도해 보겠습니다.
참고: test() 메서드는 문자열이 특정 정규 표현식과 일치하는지 테스트하고 하나의 매개변수를 받는 데 사용됩니다. . 즉, 대상 문자열이 일치하면 true를 반환하고 그렇지 않으면 false를 반환합니다. 아기는 이것을 이해할 수 없습니다! 예를 살펴보겠습니다: /[abc]wd{2}/, 이 표현식은 abc 중 하나와 일치하고 그 뒤에 단어([a-zA-Z0-9]) 또는 밑줄이 온 다음 두 개의 숫자가 일치함을 의미합니다. 사진을보세요!
4. 앵커 문자
여기서 ^에 대해 이야기해 보겠습니다. 즉, ...로 시작한다는 의미입니다. 예를 보세요:
비교를 위해 여기 표현에는 ^
$가 없습니다. ^와 동일하며 여기서는 반복되지 않습니다. 주의할 점은 $를 표현식 끝에 써야 한다는 것입니다.
5. 수정자
g 수정자가 없으면 첫 번째 항목과 일치하면 정규식 일치가 중지됩니다. , 모든 일치 항목을 찾았습니다. 새로운 정규식 메서드인 replacement()를 배웁니다.
참고: replacement() 메서드는 문자열에서 지정된 문자를 바꾸는 것이며 첫 번째 매개 변수는 정규식임을 나타냅니다. 두 번째 매개변수는 바꾸려는 콘텐츠를 나타내는 문자열입니다. 아래 예를 참조하세요!g 수정자를 사용하여 상황을 살펴보겠습니다.
이제 모든 숫자가 대체되었습니다. 이제 g가 수행하는 작업을 이해했습니다.
i에 대해 이야기해 보겠습니다. i 수정자는 매우 간단하여 대소문자를 구분하지 않음을 나타냅니다.
추가 i뒤에는 대문자, 소문자 모두 교체됩니다! 마지막 m은 여러 줄 검색을 나타냅니다. 예를 들어 문자 a로 시작하는 문자열을 일치시키려는 경우 m 수정자가 있는 경우 a로 시작하는 줄은 다음과 같습니다. 줄바꿈 이후에도 일치합니다. 공간 제한으로 인해 여기에는 사진이 포함되어 있지 않습니다.
6. 그룹화
정규식에서 괄호()는 그룹을 나타내고, 각 ()은 그룹을 나타냅니다. 그룹의 콘텐츠는 $1, $2...로 표시됩니다. 예를 살펴보세요.
예를 들어 날짜에는 월-일-년 및 연/월/일이라는 두 가지 표현이 있습니다. 월-일 변경 - 연도를 연/월/일로 변환하면 어떻게 되나요?
을 살펴보겠습니다. 이 예에서는 월, 일, 연도를 그룹화한 다음 $backreference를 사용하여 날짜 형식 변환을 수행합니다.
7. 메소드
정규식에 대한 기본 설명은 마쳤으니 이제 정규식에 사용되는 메소드를 배워봅시다! 두 가지 범주가 있는데, 하나는 정규식 개체 방법이고 다른 하나는 문자열 개체 방법입니다.
1. 정규 표현식 객체 메소드
test()와 exec() 두 가지 메소드가 있습니다. 지금까지 test() 메소드를 배웠으니 이제 exec() 메소드에 대해 알아보겠습니다.
exec() 메서드는 배열을 반환합니다. 배열의 첫 번째 요소는 일치하는 텍스트이고, 두 번째 요소는 일치하는 텍스트의 첫 번째 하위 텍스트이며, 세 번째 요소는 일치하는 텍스트의 두 번째 하위 텍스트입니다. .텍스트... 등등. 이것은 매우 추상적입니다. 이해하려면 아래 예를 살펴보십시오!
Exec() 호출은 비전역 호출과 전역 호출의 두 가지 상황으로 구분됩니다.
비 전역 호출 상황:
아래 예를 보세요
여기서 "a12b"가 첫 번째로 일치하는 것을 볼 수 있습니다 time, 다음 두 요소는 첫 번째 그룹 "1"과 두 번째 그룹 "2"입니다. 그러나 exec() 메서드가 두 번째로 실행될 때 일치 항목은 여전히 "a12b"로 예상치 못한 결과입니다. 두 번째 일치 항목이 "c56d"여야 하는 것은 당연하지만 왜 여전히 "a12b"입니까? 그 이유는 lastIndex 속성에 있습니다. lastIndex 속성은 마지막으로 일치하는 결과의 마지막 문자의 다음 문자를 나타내지만 이 속성은 전역적으로 호출되는 경우(즉, g 수정자가 표현식에 추가되는 경우)에만 적용되며, 전역적으로 호출되지 않는 경우에는 항상 0입니다. . 비교를 위해 글로벌 콜 상황을 살펴보겠습니다!
전역 호출 상황:
보시다시피 exec()의 첫 번째 실행은 "a12b"를 반환하고 lastIndex는 4입니다. 문자열 str에서 숫자 3의 위치가 두 번째로 반환되고 lastIndex는 문자열 str에서 숫자 7의 위치인 10입니다. 이때 lastIndex가 적용되므로 두 실행의 결과는 예상대로입니다.
2. 문자열 개체 메서드
문자열 개체 메서드에는 검색(), 교체(), 일치(), 분할()이 포함됩니다.
1. Search() 메서드
search() 메서드는 문자열에서 지정된 하위 문자열을 검색하거나 정규식과 일치하는 하위 문자열을 검색하는 데 사용됩니다. 일치하는 항목이 있으면 첫 번째 일치하는 결과의 인덱스가 반환됩니다. 일치하는 항목이 없으면 -1이 반환됩니다. 문자열이나 정규식일 수 있는 매개변수를 받습니다. 이 방법은 매번 문자열의 처음부터 일치를 시작합니다. 다음 예를 살펴보겠습니다.
숫자 2를 두 번 검색하여 반환된 인덱스는 1이고, 두 번째 숫자 2의 인덱스 5가 아닙니다. 세 번째와 네 번째 검색은 정규식으로 전달되었으며 둘 다 해당 인덱스를 반환했습니다.
2.replace() 메소드
이 방법은 이전에 배웠으니 여기서 계속하세요. 여러 가지 형식이 있습니다: 교체(str,replaceStr), 교체(RegExp,replaceStr), 교체(RegExp,function). 처음 두 개는 비교적 간단합니다. 예를 보면 이해할 수 있습니다.
처음 문자열을 전달할 때 숫자 2를 X로 바꾸고, 두 번째는 정규식 수식을 전달할 때 모든 숫자를 X로 바꿉니다.
replace(RegExp,function) 메소드의 두 번째 매개변수는 함수입니다. 이 메소드는 보다 복잡한 문자 대체에 적합합니다. 관심이 있는 경우 직접 학습 자료를 찾아볼 수 있습니다. 여기.
3. Match() 메서드
match() 메서드는 정규식 매개변수를 전달합니다. 이 매개변수는 전달된 정규식과 일치하는 문자열에서 텍스트를 찾는 데 사용됩니다. 발견되지 않으면 null이 반환됩니다. 발견되면 배열이 반환됩니다. 이 배열은 비전역 호출과 전역 호출에서 서로 다르며 이에 대해서는 아래에서 별도로 설명합니다.
비 전역 호출:
비 전역 호출 시 반환되는 배열은 다음과 같습니다. 첫 번째 요소는 일치하는 텍스트이고 두 번째 요소는 일치하는 텍스트의 첫 번째 하위 요소입니다. 텍스트인 경우 세 번째 요소는 일치하는 텍스트의 두 번째 하위 텍스트입니다. 등등. 데자뷰 같은 느낌이랄까? 예, 이것은 exec() 메소드와 정확히 동일합니다.
비글로벌 호출 시 각 검색은 여전히 문자열의 시작 부분부터 시작됩니다. 글로벌 호출을 살펴보겠습니다.
전역 호출:
전역적으로 호출할 때(즉, 정규식에 g 수정자가 있음) 반환되는 배열은 다음과 같습니다. 배열의 각 항목은 일치하는 텍스트입니다. 텍스트와 다시 일치하는 하위 텍스트가 있습니다.
정규식과 일치하는 "a12b"와 "c56d"가 모두 배열에 나타납니다. 실제로 match() 메서드와 exec() 메서드는 하나가 문자열에 의해 호출되고 다른 하나가 정규 표현식에 의해 호출된다는 점을 제외하면 동일한 기능을 갖습니다.
4. 분할() 메서드
분할() 메서드는 문자열을 배열로 분할하는 데 사용됩니다. 다음 예를 살펴보십시오.
split() 메소드에서 수신한 매개변수는 문자열 또는 정규식일 수 있습니다. 예제에서 볼 수 있듯이 전달된 매개변수는 무엇이든 문자열에서 제거된 다음 배열로 분할됩니다.