今天看了第5章幾個(gè)例子,有點(diǎn)收獲,記錄下來當(dāng)作回顧也當(dāng)作分享。
關(guān)于匹配字符串問題,有很多種類型,今天討論 js 代碼里的字符串匹配。(因?yàn)槲蚁雽W(xué)完之后寫個(gè)語(yǔ)法高亮練手,所以用js代碼當(dāng)作例子)
比如這樣一個(gè)字符串,匹配起來很簡(jiǎn)單 /”[^”]*”/g 即可。
![]() |
PS: 白色截圖是 chrome 34 控制臺(tái)中運(yùn)行的結(jié)果,深灰色是 sublime text 結(jié)果。
很容易就取到內(nèi)容了,可是親,你有沒有想過,js字符串里允許轉(zhuǎn)義。
![]() |
這不是我們想要的結(jié)果,所以我們要處理下轉(zhuǎn)義問題。
轉(zhuǎn)義的規(guī)則是 后面跟著一個(gè)字符,所以我們用 \. 去匹配它,就有了這樣的正則 /”(?:\.|[^”])*”/g
![]() |
||
|
可能對(duì)于正則不熟悉的朋友,一下子從 /”[^”]*”/g 變到 /”(?:\.|[^”])*”/g 后理解不了,我簡(jiǎn)單說明下。
(?:) 是非捕獲組,就是不會(huì)把內(nèi)容抓取保存到內(nèi)存里的。
\. 用于匹配 ” ‘ a 之類的轉(zhuǎn)義字符,匹配成功的話消耗2個(gè)字符。
[^”] 匹配除了 ” 以外的所有字符,匹配成功的話消耗1個(gè)字符。
所以這個(gè)表達(dá)式的意思是,先匹配 . 這樣轉(zhuǎn)義,如果成功會(huì)消耗掉正確的轉(zhuǎn)義,如果不成功就用 [^”] 匹配。
消耗掉正確的轉(zhuǎn)義的意思是,比如 “aa\aa”aaufffaa” 都會(huì)被正常匹配,因?yàn)檫@些都在正常的轉(zhuǎn)義。
形如 “aa\aa”aaufff\”aa” 這里的 \” 其中 \ 會(huì)被匹配,而 ” 既不滿足 \. 也不滿足 [^”]
所以這個(gè)匹配結(jié)果會(huì)是 “aa\aa”aaufff\” 后面的 aa” 無法匹配到。
所以現(xiàn)在我們得到了比較強(qiáng)力的正則,可以有效的匹配 js 代碼中的字符串了。
騷等,好像還有哪里不對(duì)。
js 字符串允許折行,形如這樣:
我是js”;
但是這樣的字符串用剛才的正則能匹配么?答案是能。
因?yàn)? 不能被 \. 匹配,但是可以被 [^”] 匹配到, 后面一個(gè)字符是 r, n 或 rn (具體是什么換行符要看系統(tǒng)了) 都能被 [^”] 匹配到,所以我們無意間寫了個(gè)強(qiáng)力的表達(dá)式。
現(xiàn)在剩下最后一個(gè)問題了,就是 ‘ 的匹配。
我們修改下表達(dá)式 /”(?:\.|[^”])*”|'(?:\.|[^’])*’/g 就好了。
來測(cè)試一下:
“快把我取走””, str2 = ‘我是字符串2哦,
‘快把我取走”;
匹配成功。