웹 프론트엔드 JS 튜토리얼 js에서 정규식 역추적을 올바르게 이해하는 방법

js에서 정규식 역추적을 올바르게 이해하는 방법

Mar 30, 2018 pm 01:56 PM
javascript 표현

이번에는 js에서 정규식역추적을 올바르게 이해하는 방법을 알려드리겠습니다. js에서 정규식 역추적을 올바르게 사용하기 위한 주의사항은 무엇인지 살펴보겠습니다.

정규식 구현에서 역추적은 일치 프로세스의 기본 부분이며 정규식이 그토록 유용하고 강력한 이유입니다. 그러나 역추적은 계산 비용이 많이 들고 설계가 잘못된 경우 제어력 상실로 이어질 수 있습니다. 역추적은 전체 성능에 영향을 미치는 유일한 요소로, 어떻게 동작하는지 이해하고, 사용빈도를 줄이는 것이 효율적인 정규식 작성의 핵심이 될 수 있습니다

정규식은 대상 문자열을 왼쪽부터 하나씩 스캔할 때 오른쪽으로 정규식의 구성 요소를 검사하여 각 위치에서 일치하는 항목을 찾을 수 있는지 테스트합니다. 각 수량자와 분기에 대해 진행 방법을 결정해야 합니다. 수량자(예: *, +? 또는 {2,})인 경우 정규식은 분기를 발견하면(| 연산자를 통해) 언제 더 많은 문자를 일치시키려고 할지 결정해야 합니다. 다음 중에서 시작하세요. 시도해 볼 옵션 중 하나를 선택하세요.

정규식이 이와 같은 결정을 내릴 때 필요한 경우 나중에 사용할 수 있도록 다른 옵션을 기억합니다. 선택한 구성표가 성공적으로 일치하면 정규식은 계속해서 정규식 템플릿을 검색하고, 나머지 일치도 성공하면 일치가 종료됩니다. 그러나 선택한 옵션이 일치 항목을 찾지 못하거나 후속 일치 항목이 실패하는 경우 정규식은 마지막 결정 지점으로 돌아가 나머지 옵션 중 하나를 선택합니다. 일치하는 항목이 발견되거나 수량자 및 분기 옵션의 가능한 모든 순열이 시도될 때까지 이 과정을 계속한 다음 프로세스를 중단하고 프로세스 시작 부분에서 다음 문자로 이동하고 프로세스를 반복합니다.

예를 들어 아래 코드는 이 프로세스가 역추적을 통해 분기를 처리하는 방법을 보여줍니다.

/h(ello|appy) hippo/.test("hello there, happy hippo");
로그인 후 복사

위의 정규 표현식 줄은 "hello hippo”或“happy hippo"과 일치하는 데 사용됩니다. 테스트 초반에 우리는 h를 찾고 있었는데, 우연히 대상 문자열의 첫 글자가 h였는데, 바로 찾았습니다. 다음으로 하위 표현식(ello|appy)은 두 가지 처리 옵션을 제공합니다. 정규식은 가장 왼쪽 옵션을 선택하고(분기 선택은 항상 왼쪽에서 오른쪽으로 진행됨) ello가 문자열의 다음 문자와 일치하는지 확인한 후 정규식은 다음 공백과 일치합니다.

그러나 hippo의 h는 문자열의 다음 문자 t와 일치할 수 없기 때문에 정규 표현식은 다음 일치에서 "막다른 골목에 도달합니다". 정규식은 아직 모든 옵션을 시도하지 않았기 때문에 이 시점에서 포기할 수 없으므로 마지막 체크포인트(초기 h와 일치한 후)로 역추적하여 두 번째 분기 옵션과 일치하려고 시도합니다. 하지만 일치에 실패하고 더 이상 옵션이 없기 때문에 정규식은 문자열의 첫 번째 문자부터 시작하는 일치는 성공하지 못할 것이라고 판단하여 두 번째 문자부터 다시 검색을 시작했습니다. 정규식은 h를 찾지 못했기 때문에 행복한 h와 일치하는 14번째 문자를 찾을 때까지 계속해서 거꾸로 검색했습니다. 그런 다음 정규식이 다시 분기되고 이번에는 ello가 일치에 실패하지만 역추적 후 두 번째 분기에서는 전체 문자열 "happy hippo"와 일치하고 일치가 성공합니다.

또 다른 예인 다음 코드는 반복 수량자를 사용한 역추적을 보여줍니다.

var str = "<p>Para 1.</p>" +"<img src=&#39;smiley.jpg&#39;>" +"<p>Para 2.</p>" +"<p>p.</p>";
/<p>.*<\/p>/i.test(str);
로그인 후 복사

정규식은 먼저 문자열 시작 부분의 세 글자

를 일치시킨 다음 .*를 찾습니다. 점은 개행 문자를 제외한 모든 문자와 일치한다는 의미이며, "탐욕스러운" 수량자인 별표는 가능한 한 많이 일치시키기 위해 0회 이상 반복한다는 의미입니다. 대상 문자열에 개행 문자가 없기 때문에 정규식은 나머지 문자열 전체와 일치합니다! 그러나 정규식 템플릿에는 일치시킬 콘텐츠가 더 많기 때문에 정규식은 <와 일치하려고 시도합니다. 문자열 끝의 일치가 실패하므로 한 번에 한 문자씩 역추적하고 정규식이

태그의 < 위치로 돌아올 때까지 < 다음으로 성공적으로 일치하는 /(백슬래시 이스케이프 처리)를 시도하고 p를 시도하지만 일치하지 않습니다. 정규 표현식은 두 번째 단락의 끝에서

와 일치할 때까지 계속 역추적하고 이 프로세스를 반복합니다. 성공적인 일치 항목을 반환하려면 첫 번째 단락의 시작부터 마지막 ​​단락의 끝까지 스캔해야 하는데, 이는 우리가 원하는 결과가 아닐 수 있습니다.

단일 단락과 일치하도록 정규 표현식의 "탐욕스러운" 수량자 *를 "게으른"(일명 "욕심 없음") 수량자 *로 변경하시겠습니까? "게으른" 수량자에 대한 역추적은 반대 방식으로 작동합니다. 정규식 /

.*?

/가 .*?로 발전하면 먼저 모두 건너뛰려고 시도한 다음

와 계속 일치합니다.

这样做是因为*?匹配零次或多次,尽可能少重复,尽可能少意味着可以重复零次。但是,当随后的<在字符串的这一点上匹配失败时,正则表达式回溯并尝试下一个最小的字符数:1个。正则表达式继续像这样向前回溯到第一段的末尾,在那里量词后面的<\/p>得到完全匹配。

如果目标字符串只有一个段落,那么此正则表达式的“贪婪”版本和“懒惰”版本是等价的,但尝试匹配的过程不同。

当一个正则表达式占用浏览器几秒甚至更长时间时,问题原因很可能是回溯失控。为说明此问题,给出下面的正则表达式,它的目标是匹配整个HTML文件。此表达式被拆分成多行是为了适合页面显示。与其他正则表达式不同,JavaScript在没有选项时可使点号匹配任意字符,包括换行符,所以此例中以[\s\S]匹配任意字符。

/<html>[\s\S]*?<head>[\s\S]*?<title>[\s\S]*?<\/title>[\s\S]*?<\/head>
[\s\S]*?<body>[\s\S]*?<\/body>[\s\S]*?<\/html>/
로그인 후 복사

此正则表达式匹配在正常HTML 字符串时工作良好,但当目标字符串缺少一个或多个标签时,就会变得十分糟糕。例如标签缺失,最后一个[\s\S]*?将扩展到字符串的末尾,因为在那里没有发现标签,然后正则表达式将查看此前的[\s\S]*?队列记录的回溯位置,使它们进一步扩大。正则表达式尝试扩展倒数第二个[\s\S]*?—用它匹配标签,就是此前匹配过正则表达式模板<\/body>的那个标签,然后继续查找第二个标签,直到字符串的末尾。当所有这些步骤都失败时,倒数第三个[\s\S]*?将被扩展,直至字符串的末尾,依此类推。

此类问题的解决办法在于尽可能具体地指出分隔符之间的字符匹配形式,如模板“.*?”用于匹配双引号包围的一个字符串。用更具体的[^"\rn]*取代过于宽泛的.*?就去除了回溯时可能发生的几种情况,如尝试用点号匹配引号,或者扩展搜索超出预期范围。

在HTML 的例子中解决办法不是那么简单。不能使用否定字符类型,如用[^<]替代[\s\S],因为在搜索过程中可能会遇到其他类型的标签。但是,可以通过重复一个非捕获组来达到同样效果,它包含一个回溯(阻塞下一个所需的标签)和[\s\S](任意字符)元序列。这样可以确保中间位置上查找的每个标签都会失败。然后,更重要的是,[\s\S]模板在回溯过程中阻塞的标签在被发现之前不能被扩展。应用此方法后对正则表达式的最终修改如下:

/<html>(?:(?!<head>)[\s\S])*<head>(?:(?!<title>)[\s\S])*<title>
(?:(?!<\/title>)[\s\S])*<\/title>(?:(?!<\/head>)[\s\S])*<\/head>
(?:(?!<body>)[\s\S])*<body>(?:(?!<\/body>)[\s\S])*<\/body>
(?:(?!<\/html>)[\s\S])*<\/html>/
로그인 후 복사

虽然这样做消除了潜在的回溯失控,并允许正则表达式在匹配不完整HTML字符串失败时的使用时间与文本长度呈线性关系,但是正则表达式的效率并没有提高。像这样为每个匹配字符进行多次前瞻,缺乏效率,而且成功匹配过程也相当慢。匹配较短字符串时使用此方法相当不错,而匹配一个HTML 文件可能需要前瞻并测试上千次。

相信看了本文案例你已经掌握了方法,更多精彩请关注php中文网其它相关文章!

推荐阅读:

正则全局匹配模式g修饰符的使用详解

正则表达式小结(实战归纳)

위 내용은 js에서 정규식 역추적을 올바르게 이해하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

WebSocket과 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법 WebSocket과 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법 Dec 17, 2023 pm 02:54 PM

WebSocket 및 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법 소개: 지속적인 기술 개발로 음성 인식 기술은 인공 지능 분야의 중요한 부분이 되었습니다. WebSocket과 JavaScript를 기반으로 한 온라인 음성 인식 시스템은 낮은 대기 시간, 실시간, 크로스 플랫폼이라는 특징을 갖고 있으며 널리 사용되는 솔루션이 되었습니다. 이 기사에서는 WebSocket과 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법을 소개합니다.

WebSocket 및 JavaScript: 실시간 모니터링 시스템 구현을 위한 핵심 기술 WebSocket 및 JavaScript: 실시간 모니터링 시스템 구현을 위한 핵심 기술 Dec 17, 2023 pm 05:30 PM

WebSocket과 JavaScript: 실시간 모니터링 시스템 구현을 위한 핵심 기술 서론: 인터넷 기술의 급속한 발전과 함께 실시간 모니터링 시스템이 다양한 분야에서 널리 활용되고 있다. 실시간 모니터링을 구현하는 핵심 기술 중 하나는 WebSocket과 JavaScript의 조합입니다. 이 기사에서는 실시간 모니터링 시스템에서 WebSocket 및 JavaScript의 적용을 소개하고 코드 예제를 제공하며 구현 원칙을 자세히 설명합니다. 1. 웹소켓 기술

WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법 WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법 Dec 17, 2023 am 09:39 AM

WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법 오늘날의 디지털 시대에는 점점 더 많은 기업과 서비스에서 온라인 예약 기능을 제공해야 합니다. 효율적인 실시간 온라인 예약 시스템을 구현하는 것이 중요합니다. 이 기사에서는 WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. WebSocket이란 무엇입니까? WebSocket은 단일 TCP 연결의 전이중 방식입니다.

JavaScript 및 WebSocket을 사용하여 실시간 온라인 주문 시스템을 구현하는 방법 JavaScript 및 WebSocket을 사용하여 실시간 온라인 주문 시스템을 구현하는 방법 Dec 17, 2023 pm 12:09 PM

JavaScript 및 WebSocket을 사용하여 실시간 온라인 주문 시스템을 구현하는 방법 소개: 인터넷의 대중화와 기술의 발전으로 점점 더 많은 레스토랑에서 온라인 주문 서비스를 제공하기 시작했습니다. 실시간 온라인 주문 시스템을 구현하기 위해 JavaScript 및 WebSocket 기술을 사용할 수 있습니다. WebSocket은 TCP 프로토콜을 기반으로 하는 전이중 통신 프로토콜로 클라이언트와 서버 간의 실시간 양방향 통신을 실현할 수 있습니다. 실시간 온라인 주문 시스템에서는 사용자가 요리를 선택하고 주문을 하면

JavaScript와 WebSocket: 효율적인 실시간 일기예보 시스템 구축 JavaScript와 WebSocket: 효율적인 실시간 일기예보 시스템 구축 Dec 17, 2023 pm 05:13 PM

JavaScript 및 WebSocket: 효율적인 실시간 일기 예보 시스템 구축 소개: 오늘날 일기 예보의 정확성은 일상 생활과 의사 결정에 매우 중요합니다. 기술이 발전함에 따라 우리는 날씨 데이터를 실시간으로 획득함으로써 보다 정확하고 신뢰할 수 있는 일기예보를 제공할 수 있습니다. 이 기사에서는 JavaScript 및 WebSocket 기술을 사용하여 효율적인 실시간 일기 예보 시스템을 구축하는 방법을 알아봅니다. 이 문서에서는 특정 코드 예제를 통해 구현 프로세스를 보여줍니다. 우리

간단한 JavaScript 튜토리얼: HTTP 상태 코드를 얻는 방법 간단한 JavaScript 튜토리얼: HTTP 상태 코드를 얻는 방법 Jan 05, 2024 pm 06:08 PM

JavaScript 튜토리얼: HTTP 상태 코드를 얻는 방법, 특정 코드 예제가 필요합니다. 서문: 웹 개발에서는 서버와의 데이터 상호 작용이 종종 포함됩니다. 서버와 통신할 때 반환된 HTTP 상태 코드를 가져와서 작업의 성공 여부를 확인하고 다양한 상태 코드에 따라 해당 처리를 수행해야 하는 경우가 많습니다. 이 기사에서는 JavaScript를 사용하여 HTTP 상태 코드를 얻는 방법과 몇 가지 실용적인 코드 예제를 제공합니다. XMLHttpRequest 사용

자바스크립트에서 insertBefore를 사용하는 방법 자바스크립트에서 insertBefore를 사용하는 방법 Nov 24, 2023 am 11:56 AM

사용법: JavaScript에서 insertBefore() 메서드는 DOM 트리에 새 노드를 삽입하는 데 사용됩니다. 이 방법에는 삽입할 새 노드와 참조 노드(즉, 새 노드가 삽입될 노드)라는 두 가지 매개 변수가 필요합니다.

JavaScript에서 HTTP 상태 코드를 쉽게 얻는 방법 JavaScript에서 HTTP 상태 코드를 쉽게 얻는 방법 Jan 05, 2024 pm 01:37 PM

JavaScript에서 HTTP 상태 코드를 얻는 방법 소개: 프런트 엔드 개발에서 우리는 종종 백엔드 인터페이스와의 상호 작용을 처리해야 하며 HTTP 상태 코드는 매우 중요한 부분입니다. HTTP 상태 코드를 이해하고 얻는 것은 인터페이스에서 반환된 데이터를 더 잘 처리하는 데 도움이 됩니다. 이 기사에서는 JavaScript를 사용하여 HTTP 상태 코드를 얻는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. HTTP 상태 코드란 무엇입니까? HTTP 상태 코드는 브라우저가 서버에 요청을 시작할 때 서비스가

See all articles