단일 라인 모드란 무엇입니까? JavaScript 일반 한 줄 모드에 대한 자세한 설명

零下一度
풀어 주다: 2017-04-21 10:20:35
원래의
1387명이 탐색했습니다.

이 글에서는 한 줄 모드도 지원하는 JavaScript 정규식을 주로 소개합니다. 필요한 친구들은 참고하면 됩니다.

정규식은 1970년 Ken Thompson이 개선한 QED 편집기에서 처음 구현했습니다. 정규식의 가장 간단한 메타 문자 "."는 줄 바꿈을 제외한 모든 문자와 일치합니다.

"."는 을 제외한 모든 문자와 일치하는 정규식입니다.

위 문장은 QED의 1970년 공식 문서로, 역사상 최초의 정규 문서가 될 수 있습니다.

왜 그런 규정이 있는 걸까요? QED는 파일을 라인 단위로 편집하는데, 라인 끝의 줄 바꿈 문자도 이 라인의 내용에 포함되기 때문입니다. 예를 들어, 코드 조각에서 모든 한 줄 주석을 삭제하려면 QED에서 다음 명령을 사용할 수 있습니다.

1,$s#//.*##
로그인 후 복사

"."가 개행 문자와 일치할 수 있으면 개행 문자가 삭제됩니다. 이 줄은 일반적으로 우리가 원하는 것이 아닌 다음 줄과 병합됩니다. 따라서 "."은 원래 개발되었을 때 개행 문자와 일치하지 않도록 설계되었습니다. 현재 운영 체제에는 테스트할 QED 명령이 없지만 여전히 VIM이 있으며 같은 이유로 VIM의 "."는 줄 바꿈 문자와 일치할 수 없습니다.

파일을 읽으면 일반적으로 한 번에 전체 파일을 읽는 Node와 달리 Perl은 다음과 같이 파일을 한 줄씩 읽는 많은 Linux 명령의 전통을 이어받습니다.

while (<>) {print $_}
로그인 후 복사

_ at 끝 개행 문자도 있으므로 Perl은 "."이 개행 문자와 일치하지 않는다는 QED의 규칙을 자연스럽게 상속받습니다. 그러나 Perl은 결국 프로그래밍 언어이지 편집기가 아닙니다. 정규식이 일치해야 하는 개체는 한 줄의 텍스트일 뿐만 아니라 여러 줄의 텍스트일 수도 있습니다. 따라서 Perl은 "."도 개행 문자와 일치시킬 수 있는 일반 단일 행 모드 /s를 발명했습니다.

한 줄 모드를 켜는 데 사용되는 Perl의 /s 수정자에 대한 공식적인 설명은 "문자열을 한 줄로 처리"입니다. 이 "한 줄"은 다음과 같이 이해해야 합니다. "." 일반 모드에서는 인라인 문자가 여러 줄에 걸쳐 있을 수 없습니다. 단일 행 모드에서 Perl은 여러 줄의 문자열을 한 줄로 처리하고 개행 문자를 인라인 문자로 처리하므로 "."이 일치할 수 있습니다. 좀 더 명확하게 말하면, 다음 세 줄의

1
2
3
로그인 후 복사

는 "1n2n3n" 한 줄의 텍스트로 간주됩니다. 이것이 바로 한 줄 모드를 의미합니다.

그러나 끔찍한 점은 같은 이유로(문자열 변수에는 여러 줄의 텍스트가 포함될 수 있음) Perl도 여러 줄 모드인 /m 수정자를 발명했다는 것입니다. 공식 설명은 "문자열 처리"입니다. 여러 줄 "로 이 패턴은 고대부터 일반 JavaScript 규칙에 포함되었습니다. 여기서 "다중 줄"은 다음을 의미합니다. ^ 및 $ 메타 문자는 다음과 같이 문자열 중간에 있는 개행 문자 앞뒤의 위치와 일치하지 않습니다. 기본값은 문자열에 항상 한 줄만 있음을 의미합니다. 여러 줄 모드를 켠 후에 일치시킬 수 있습니다.

즉, 한 줄 모드와 여러 줄 모드는 서로 다른 메타 문자를 위한 것입니다. 정규식을 처음 접하는 사람들은 겉보기에 해당하는 "한 줄 모드"와 "다중 줄 모드"로 인해 혼란을 겪을 것입니다. 모드". 개념이지만 실제로는 관련 없는 용어와 혼동됩니다.

나중에 Ruby 작성자는 "한 줄 모드"라는 정규 용어가 잘 사용되지 않는다고 느꼈을 수도 있으므로 줄 바꿈 문자와 일치하는 "."의 모드를 "다중 줄 모드"라고 불렀습니다. is, let . * 및 기타 정규 표현식은 여러 줄과 일치할 수 있으므로 수정자도 /m을 사용합니다(Ruby는 기본적으로 Perl에서 "여러 줄 모드"를 활성화하므로 /m이 사용되지 않습니다). 정말 설상가상으로 더 혼란스럽습니다.

나중에 Python 작성자도 "한 줄 모드"라는 용어를 피해야 한다고 느낄 수도 있으므로 도트가 모든 문자와 일치할 수 있다는 의미로 "dotall"이라는 새 이름을 붙였습니다. 아주 좋은 이름입니다. 나중에 Java에서도 이 이름을 사용했습니다.

위에서는 역사를 검토하고 단선 모드의 유래에 대해 설명했으며 단선 모드의 이름이 잘 선택되지 않았다는 점을 설명했습니다. V8은 최근 github.com/mathiasbynens/es-regexp-dotall-flag 단계의 ES 제안을 구현했습니다. 이 제안은 Python 및 Java에서 dotAll 속성을 학습하기 위해 /s 수정자와 dotAll 속성을 도입했습니다. 수정자는 Perl에서 상속되며 /d와 같은 새로운 수정자를 만들 필요가 없습니다. 이는 상황을 더 복잡하게 만들 뿐입니다. JavaScript에서 /s의 구체적인 효과는 "."이 이전에 일치할 수 없었던 4개의 줄 종결자(n(줄 바꿈), r(캐리지 리턴), u2028(줄 구분 기호), u2029(단락 구분 기호))과 일치하도록 허용하는 것입니다.


/foo/s.dotAll // true
/^.{4}$/s.test("\n\r\u2028\u2029") // true
로그인 후 복사

사실 아주 간단한 일이지만 JavaScript 이외의 정규식을 접해본 적이 없는 일부 학생들은 이 새로운 모드를 배울 때 혼란스러워할 수도 있습니다. 다시 한 번 명확히 하자면, 다중 라인 모드는 ^와 $의 성능을 제어하고, 단일 라인 모드는 "."의 성능을 제어합니다. 둘 사이에는 직접적인 관계가 없습니다.

그러나 원래 단일 행 모드와 다중 행 모드의 혼란스러운 개념을 도입한 Perl 언어는 Perl 6에서 이 두 모드를 완전히 삭제했습니다. "."는 기본적으로 개행 문자와 일치합니다. 및 N은 줄 바꿈을 제외한 모든 문자와 일치합니다. ^ 및 $는 항상 문자열의 시작과 끝과 일치하며, 두 개의 새로운 메타 문자 ^ 및 $$는 줄의 시작과 끝과 일치합니다.

과거에 사용했던 단일 행 모드 [^] 또는 [sS]에 대한 대안이 완전히 쓸모가 있는 것은 아닙니다. 예를 들어 JavaScript 규칙성을 사용하는 일부 편집기(VS Code, Atom)에서는 이를 제공할 가능성이 없습니다. 단일 라인 모드 인터페이스를 활성화하는 옵션이 있습니다. 그러나 편집기의 일반 기능에 대해 말하면 JavaScript로 구현된 편집기의 일반 기능은 여전히 ​​너무 약합니다. 예를 들어 Sublime에 있는 경우 특정 모드를 켤 수 없습니다. Python 일반 코드), 일반 코드 내에서 (?s)를 사용하여 도트 모드를 활성화합니다. 예를 들어 (?s)/*.+?*/를 사용하면 모든 여러 줄 주석과 일치시킬 수 있습니다.

위 내용은 단일 라인 모드란 무엇입니까? JavaScript 일반 한 줄 모드에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!