本文講述了javascript正規表示式定義(語法)。分享給大家參考,具體如下:
正規表示式的2種定義方法:一種是直接呼叫RegExp(),第二種是直接用字面量來定義,即var re = /正規規則/;
2種定義方法本質都是呼叫RegExp()方法
在呼叫同一段正規程式碼的時候,ECMAScript3和ECMAScript5中表現完全不一樣
function reg(){ var re = /\sjavascript/; return re; }
分別在ECMAScript3和ECMAScript5中呼叫reg()方法多次
在ECMAScript3中,調用的是同一個RegExp對象,在ECMAScript5中,調用的是不同的RegExp對象 因為在EXCMAScript5中每執行一次,就生成一個新的RegExp對象
所以在ECMAScript3中會造成程式的隱患,因為只要在一個地方對這個物件進行修改的話,所有呼叫到這個物件的地方都會改變。
1.直接量字
在正規中一般都會直接匹配字符,如
/javascript/
會直接匹配字符javascript
也支援非字母的字元匹配,如:
o NUL字元(u0000)
t 製表符(u0009)
n 換行符號(u000A)
v 垂直製表符(u000B)
f 換頁符(u000C)
r 回車符(u000D)
xnn 由十六進制數nn指定的拉丁字符,例如,x0A等價於
uxxxx 由十六進位數xxxx指定的Unicode字符,例如u0009等價於
cX 控製字元^X,例如,cJ等價於換行符n
在正規表示式中,還有一些有特殊意義的標點符號,他們需要''來轉義
^$.*+?=!:|/()[]{}
2.字元類別
[...] 方括號內的任一字元
[^...] 不在方括號內的任一字元
. 任一字元
w 任何ASCII字元組成的單字,等價於[a-zA-Z0-9]
W 任何不適ASCII字元組成的單詞,等價於[^a-zA-Z0-9]
s 任何Unicode空白符
S 任何非Unicode空白符的字符,並注意w和S不一樣
d 任何ASCII數值,等價於[0-9]
D 除了ASCII數字之外的任何字符,等價於[^0-9]
[b] 退格直接量(特例)
3.重複(次數)
? 0或1次
+ 1次或多次
* 任次
{n} n次
{m,n} 最少m次,最多n次
{n,} n次或n次以上
正規預設是貪婪匹配的
如[a+b+] 若要符合aaabb,且它不會符合ab和aab等,只會符合aaabb
[a+?b+?] 這個會符合aaab 為什麼會產生這個差異呢?
答:+?是讓正則非貪婪匹配,那麼b這裡只會匹配一個b,那為什麼a會匹配3個呢?這是因為正規表示式的模式比對總是會尋找字串中第一個可能符合的位置。
4.選項|分組|引用
| 用於分隔可供選擇的字符,如[ab|cd],他既可以匹配ab也可以匹配cd,注意:選擇項的嘗試匹配次序是左→右,因此[a|ab],當a匹配通過了之後,就不匹配ab了,就算ab是更好的匹配
() 1.單獨的項當成子表達式 /java(script)?/ 可將javascript與java 即圓括號部分形成子的表達式,可對子表達式執行| * ?
2.完整的模式中定義子模式 後面的可以引用前面圓括號起來的表達式 /(['"])[a-z]1/ 1引用的是第一個圓括號裡的表達式,因此引用了['"]3.後部引用前面的子表達式
注意: /['"][a-z]['"]/這個正規的意思是 單引號或雙引號加上一個小寫字母加則加上一個單引號或雙引號,前後的單雙引號不是匹配的如果你要匹配可以這麼寫[(['"])[a-z]1]
加數字 可以引用前面圓括號中的表達式
5.制定匹配位置(錨點)
^ 符合字串的開頭,在多行檢索中,符合一行的開頭$ 符合字串的結尾,在多行檢索中,符合一行的結尾
b 符合一個單字的邊界,簡言之,就是位於字元w和W之間的位置,或位於字元w和字串的開頭或結尾之間的位置
B 符合非單字邊界的位置
(?=p) 零寬正向先行斷言,要求接下來的字元都與p匹配,但不能包括那些匹配p的字元
(?!p) 零寬負向先行斷言,要求接下來的字元不與p匹配
6.修飾符
寫在正規表示式字面量//右邊的
i 執行不區分大小寫的符合
g 執行一個全域匹配,簡言之,即找到所有的匹配,而不是在找到第一個之後就停止
m 多行配對模式,^符合一行的開頭與字串的開頭,$相符行的結束與字串的結束 /java$/m 可以符合 javanfunc
注意:當正規表示式是全域的時候,每次exec() 和test()的時候都會把目前設定的lastIndex設為目前的位置,再次執行的時候就會從lastIndex的位置開始執行,因此最好每次執行的時候lastIndex設定為0
希望本文所述對大家JavaScript程式設計有所幫助。