일반적으로 일반적인 작성 방법은 다음과 같습니다.
]
빅데이터가 발생하는 경우 문자열의 길이를 변경하면 매우 리소스 집약적이라는 것을 알 수 있습니다. 그다지 효율적이지 않으며 때로는 참을 수 없을 때도 있습니다.
외부 J를 도입해야 하는 경우 실행하려면 새로 고쳐야 합니다.
]
이전에 마스터 정규 표현식에서 언급한 것을 본 기억이 나는 이유를 설명합니다. NFA와 DFA의 엔진에는 차이가 있습니다. js/perl/php/java/.net은 모두 NFA 엔진입니다.
DFA와 NFA의 메커니즘 차이는 다음과 같이 5가지 영향을 미칩니다.
1. DFA는 텍스트 문자열의 각 문자를 한 번만 스캔하면 되므로 속도는 더 빠르지만 NFA가 문자를 계속해서 처리해야 합니다. 음성 문자는 느리지만 기능이 풍부하여 널리 사용됩니다. Perl, Ruby, Python의 re 모듈, Java 및 .NET의 regex 라이브러리 등이 모두 NFA입니다.
2. NFA만 게으른 및 역참조와 같은 기능을 지원합니다.
3. NFA는 가장 왼쪽의 하위 정규식이 먼저 일치하므로 가끔 가장 일치하는 결과가 누락됩니다. 가장 긴 왼쪽 하위 정규 표현식이 먼저 일치합니다."
4. NFA는 기본적으로 탐욕 수량자를 사용합니다. 즉, /.*/ 및 /w /와 같이 "n"번 반복되는 패턴의 경우 탐욕 방식으로 수행되며 최대한 많은 문자와 일치합니다. 더 이상 포기할 수 없을 때까지) NFA는 수량자를 먼저 일치시킵니다.
5. NFA는 재귀 호출의 함정에 빠져 성능이 극도로 저하될 수 있습니다.
역추적
NFA는 너무 많이 먹었음을 발견하면 하나씩 뱉어내며 일치하는 항목을 찾는 과정을 역추적이라고 합니다. 이러한 프로세스의 존재로 인해 NFA 매칭 과정 중, 특히 불합리한 정규식 매칭을 작성할 경우 텍스트를 반복적으로 스캔하게 되어 효율성 손실이 상당합니다. 이 원리를 이해하는 것은 효율적인 정규식을 작성하는 데 매우 도움이 됩니다.
이유를 찾아 분석해보세요
위의 트림 프로토타입 방법을 설명할 때. 테스트 후 결과가 올바른지 여부에 관계없이 JS NFA 엔진의 에코 수를 해결할 수 있는 방법은 여러 가지가 있습니다
a. 제한 수량자를 제거합니다. 즉,
코드 복사
코드는 다음과 같습니다.
String.prototype.trim = function() {
이것을 반환합니다. replacement(/^[st] | [st ]$/g, '');
}
b. 문자열 끝 일치를 제거합니다. 즉, 다음과 같이 변경합니다.
코드는 다음과 같습니다.
String .prototype.trim = function ( ) {
return this.replace(/^[st ] /g, '')
}
c. 즉, 다음과 같이 변경합니다.
코드는 다음과 같습니다.
String .prototype.trim = function ( ) {
return this.replace(/^[st ] |[st ] $/mg, '');
从以上三种改法结合文中开头的NFA资料,我们可以大概的知道trim性能出现问题的原因
量词限定将优先匹配。
量词限定在结尾可能会使JS的正则引擎不停的回朔,出现递归的一个陷阱,这个递归的深度太深。如果字符串更大一点应该会出现栈溢出了。
多行既然能够匹配,而且性能消耗不大。性能上没有任何问题,从一个写这个正则程序的人角度上去看,多行明显比单行要替换的空串多得多。所以第二点的结论应该是对的
改良
首先确定匹配字符串的开始正则是没有任何效率问题的。而匹配结束的时候会出现性能问题,那可以采用正则与传统相结合来改善这个trim性能问题。
例如: