什么是正則表達式

簡單來說，正則表達式是一些用來匹配和處理文本的字符串。它主要有兩種使用場景：一種是查找特定的信息（搜索），另一種是查找并編輯特定的信息（替換）。
參考正則表達式30分鐘入門：(https://deerchao.cn/tutorials/regex/regex.htm)

匹配單個字符

匹配特定純文本
普通字符可作為正則表達式，匹配該字符本身。
匹配任意字符
正則表達式中，.可以匹配任何一個單個的字符，除了換行符外，類似于DOS中的?字符和SQL中的_（下劃線）字符。
匹配特殊字符
正則表達式中，\是一個元字符（metacharacter），表示這個字符有特殊含義，而不是字符本身的含義。\后面跟著一個特殊字符，可對該特殊字符轉(zhuǎn)義。要匹配一個特殊字符時，應(yīng)該由\跟著特殊字符去匹配。比如\.表示匹配一個.。

匹配一組字符

元字符[和]用來定義一個字符集合，其含義是必須匹配該集合中的一個字符。定義一個字符集合具體做法有兩種：一是把所有的字符都列舉出來，該做法通常用于要列舉的字符較少時，例如[abc]；二是利用元字符-以字符區(qū)間的方式給出，例如[0-9]將匹配0-9中的任意一個。注意在定義一個字符區(qū)間的時候，一定要避免讓這個區(qū)間的尾字符小于它的首字符，如[3-1]，這種區(qū)間是無意義的，而且往往會讓整個模式失效。-（連字符）是一個特殊的元字符，作為元字符它只能用在[和]之間。在字符集合外，-只是一個普通字符，只能匹配-自身，因此-字符不需要轉(zhuǎn)義。
此外，字符集合可以用元字符^來求非：這將把給定集合里的字符強行排除在匹配操作之外。例如[^a-b]將匹配除了a，b以外的字符。

使用元字符

對特殊字符轉(zhuǎn)義
要匹配特殊字符，必須使用\進行轉(zhuǎn)義
要轉(zhuǎn)義個字符：

$
()
*
+
.
[]
?
\
^
{}
|
'
"

匹配空白字符
元字符大致分為兩種：一種是用來匹配文本的（比如.），另一種是正則表達式語法要求的（比如[和]）。匹配非打印空白字符的元字符如下：

\b  Backspace鍵，匹配一個單詞的頭尾
\f  換頁符
\n  換行符
\r  回車符
\t  制表符
\v  垂直制表符

Windows結(jié)束行：\r\n，Unix/Linux結(jié)束行：\n，匹配一個空白行可以用\r\n\r\n或者\n\n。

匹配特定的字符類別（字符類）

\d  任何一個數(shù)字字符（等價于[0-9]）
\D  任何一個非數(shù)字字符（等價于[^0-9]）
\w  等價于[a-zA-Z0-9]
\W  等價于[^a-zA-Z0-9]
\s  任何一個空白字符（等價于[\f\n\r\t\v]）
\S  任何一個非空白字符（等價于[^\f\n\r\t\v]）

重復(fù)匹配

有多少個匹配

+: 匹配一個或者多個字符（字.符集合）。[0-9]+會匹配一個或多個數(shù)字。+是元字符，要匹配+必須轉(zhuǎn)義：\+。
一般來說，當在字符集合里使用像.、+這樣的元字符的時候，元字符會被解釋為普通字符，不需要被轉(zhuǎn)義，但轉(zhuǎn)義了也是可以的。
[\w.]的使用效果和[\w\.]是一樣的。
*: 匹配零個或者多個字符（字符集合）。*也是一個元字符，要匹配*本身必須使用\*
?: 匹配零個或者一個字符（字符集合）。\?匹配?本身。[\r]?\n匹配Windows或者Unix/Linux下的換行符。

匹配的重復(fù)次數(shù)
在字符或者字符集合后面跟著元字符{和}可以設(shè)置要匹配的重復(fù)次數(shù)。如果要匹配{和}本身，必須使用轉(zhuǎn)義{和}。

[[:xdigit:]]{6}: 匹配336633和FFFFFF等
a{2,4}：匹配2-4個連續(xù)的a
a{2,}: 匹配至少連續(xù)兩個a

防止過度匹配
貪婪模式與懶惰模式

*   *?
+   +?
{n, }   {n, }?

位置匹配

單詞邊界（boundary）
邊界限定符
\b用來匹配單詞的邊界，\b匹配這樣的一個位置，它位于一個\w和一個\W之間。
\B用來這樣一個位置，它前后都是\w，或者前后都不是\w。
\b匹配且只匹配一個位置，不匹配任何字符，即不消耗字符。用\bcat\b匹配到的字符串的長度是3，而不是5。
字符串邊界
^匹配字符串的開頭， $匹配字符串的結(jié)尾。注意^只有出現(xiàn)在一個字符集合里[]并且緊跟在[之后才能發(fā)揮取非的作用。
分行匹配模式
啟用分行匹配模式后，^不僅匹配正常的字符串開頭，還將匹配行分隔符（分行符）后面的開始位置（這個位置是不可見的）；類似的， $不僅匹配正常的字符串結(jié)尾，還將匹配行分隔符（換行符）后面的結(jié)束位置。

使用子表達式

子表達式
子表達式是一個更大的表達式的一部分，用(和)括起來，當做一個獨立元素來使用。(和)是元字符，要匹配(和)自身，必須使用轉(zhuǎn)義序列$和$。
|是正則表達式里面的或操作符，(19|20)\d{2}匹配年份
匹配IP地址。一個合法IP地址的各組數(shù)字必須且只能符合以下規(guī)則：

任何一個1位或者2位數(shù)字（0-99）
任何一個以1開頭的3位數(shù)字（100-199）
任何一個以2開頭、第二位數(shù)字在0-4之間的3位數(shù)字（200-249）
任何一個以25開頭、第3位數(shù)字在0-5之間的3位數(shù)字。（250-255）
所以可以寫出匹配IP地址的正則表達式：

(((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))\.){3}((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))

回溯應(yīng)用：前后一致匹配

回溯引用指的是模式的后半部分引用在前半部分中定義的子表達式。回溯引用只能用來引用模式里的子表達式（用(和)括起來的正則表達式片段）?；厮菀闷ヅ渫ǔ?開始計數(shù)（\1、\2等），第0個匹配用來替代整個表達式。
比如[ ]+(\w+)[ ]+\1用來匹配連續(xù)兩個重復(fù)單詞。

前后查找（只匹配不消費）

向前查找（lookahead）

文本
http://www.forta.com/
https://mail.forta.com/
ftp://ftp.forta.com/
正則表達式
.+(?=:)

只匹配:，不消費它，提取協(xié)議。向前查找（和向后查找）匹配本身是有返回結(jié)果的，只是這個結(jié)果的字節(jié)長度永遠是0而已。因此，前后查找操作也被成為零寬度匹配操作（zero-width）。

向后查找（lookbehind）
提取價格

文本
ABC01:  $23.45
HGG42:  $5.31
Total items found: 4
正則表達式
(?<=\$)[0-9.]+

前后查找取非

操作符      說明
(?=exp)           正向前查找，匹配exp前面的位置
(?!exp)            負向前查找，匹配后面跟的不是exp的位置
(?<=exp)        正向后查找，匹配exp后面的位置
(?<!exp)         負向后查找，匹配前面不是exp的位置

文本
I paid $30 for 100 apples, 50 oranges.
正則表達式
\b(?<!\$)[0-9.]+\b

嵌入條件

在正則表達式里可以嵌入條件，只有當條件得到（或者沒有得到滿足時），相應(yīng)的表達式才會被執(zhí)行。這種條件可以是一個回溯引用（含義是檢查回溯引用是否存在），也可以是一個前后檢查操作。

回溯引用條件

文本
<! -- Nav bar -->
<TD>
<A HREF="/home"><IMG SRC ="/imges/hom.gif"></A>
<IMG SRC="/images/spacer.gif">
<A HREF="/search"><IMG SRC="/images/search.gif"></A>
<IMG SRC="/images/spacer.gif">
<A HREF="/help"><IMG SRC="/images/help.gif"></A>
</TD>
正則表達式
(<[Aa]\s+[^>]+>\s*)?<[Ii][Mm][Gg]\s+[^>]+>(?(1)\s*</[Aa]>)

語法：(?(backreference)true-regex)，注意?(1)檢查第一個回溯引用是否存在，回溯引用編號不用被轉(zhuǎn)義。
(?(backreference)true-regex|false-regex)

文本
123-456-7890
(123)456-7890
(123)-456-7890
1234567890
123 456 7890
正則表達式
(\()?\d{3}(?(1)\)|-)\d{3}-\d{4}

前后查找條件

文本
11111
22222
33333
44444-4444
正則表達式
\d{5}(?(?=-)-\d{4})

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

正則表達式（正則表達式必知必會）

正則表達式（正則表達式必知必會）

什么是正則表達式

匹配單個字符

匹配一組字符

使用元字符

重復(fù)匹配

位置匹配

使用子表達式

回溯應(yīng)用：前后一致匹配

前后查找（只匹配不消費）

嵌入條件

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

正則表達式（正則表達式必知必會）

什么是正則表達式

匹配單個字符

匹配一組字符

使用元字符

重復(fù)匹配

位置匹配

使用子表達式

回溯應(yīng)用：前后一致匹配

前后查找（只匹配不消費）

嵌入條件

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av