2018-10-23正則表達式

正則表達式的語法

用處:
1.判斷某個字符串是否符合某個條件
---判斷輸入的字符串是否是郵箱/手機號碼,是否是ip地址(判斷某個字符串是否符合某個規(guī)則)
2.提取滿足條件的字符串
3.字符串的替換
python中是通過re模塊中相應的方法支持正則表達式的匹配,查找和替換功能
正則表達式包含兩個部分,一個是正則語法對應的字符,一個是普通字符

正則表達式的特殊符號

1 . (匹配任意字符)
一個 . 只匹配一個任意字符

from re import fullmatch
re_str = r'a.b' #匹配一個長度為三,第一個為a,第二個為任意字符,最后一個是b 的字符串

result = fullmatch(re_str,'acv')
print(result) 

2 \w(匹配數字字母下劃線)
一個\w匹配一個字符

re_str = r'\w...' #匹配一個第一個是字母數字下劃線,后面三個為任意字符的長度為四的字符串

result = fullmatch(re_str,'accb')
print(result)  #<_sre.SRE_Match object; span=(0, 4), match='accb'>

3 \s(匹配任意一個空白字符)
一個\s 匹配一個空白字符

re_str = r'\w..\s.'  
result = fullmatch(re_str,'_qw r')
print(result) #<_sre.SRE_Match object; span=(0, 5), match='_qw r'>

4 \d(匹配數字字符)

re_str = r'\w\s..\d'
result = fullmatch(re_str,'1 er2')
print(result) #<_sre.SRE_Match object; span=(0, 5), match='1 er2'>

5 \b (檢測邊界)
一個\b不會去匹配一個字符,而是單純檢測\b出現的位置是否是單詞邊界
單詞邊界:字符串的開始和結尾、空格、換行、標點符號等可以將兩個單詞隔開的字符都是單詞邊界

re_str = r'\b\w\s\b\d.'
result = fullmatch(re_str,'r 34')
print(result) #<_sre.SRE_Match object; span=(0, 4), match='r 34'>

6 ^(檢測是否是字符串開頭)

re_str = r'^\w\s\b.\d'
result = fullmatch(re_str,'r l5')
print(result) #<_sre.SRE_Match object; span=(0, 4), match='r l5'>

7 $(檢測是否以字符串結尾)

re_str = r'^\w.\d\s\b.$'
result = fullmatch(re_str,'wu3 r')
print(result) #<_sre.SRE_Match object; span=(0, 5), match='wu3 r'>

8 \W ----匹配非字母數字下劃線字符
\S --- 匹配非空格字符
\d ---- 匹配非數字字符

9 [] (匹配中括號中出現的任意一個字符)
[字符集] -- 匹配字符集中的任意一個字符
[字符1-字符2] --- 匹配字符1到字符2范圍內的字符
注意: - 在中括號中,如果放在兩個字符之間,表示范圍。字符1的編碼值要小于字符2的編碼值


# 匹配一個第一個字符是a或者b或者c,后面是三個a
re_str = r'[abc]aaa'
result = fullmatch(re_str,'aaaa')
print(result)
result = fullmatch(re_str,'baaa')
print(result)

re_str = r'[1-4]\d\d\d'
result = fullmatch(re_str,'1456')
print(result)
# <_sre.SRE_Match object; span=(0, 4), match='aaaa'>
# <_sre.SRE_Match object; span=(0, 4), match='baaa'>
# <_sre.SRE_Match object; span=(0, 4), match='1456'>

10 [^字符集] --- 匹配一個非中括號中字符的字符

11 * (匹配0次或者多次)

re_str = r'[1-9]*'
result = fullmatch(re_str,'12123124141124')
print(result)
result = fullmatch(re_str,'')
print(result)
# <_sre.SRE_Match object; span=(0, 14), match='12123124141124'>
# <_sre.SRE_Match object; span=(0, 0), match=''>

12 + (匹配一次或者多次)

re_str = r'[a-zA-Z_]+'
result = fullmatch(re_str,'aW_weq')
print(result)
# <_sre.SRE_Match object; span=(0, 6), match='aW_weq'>

13 ?(匹配0次或者1次)

#練習: 寫一個正則表達式,匹配所有的整數
re_str = r'[-+]?[-1-9]+\b'
result = fullmatch(re_str,'1234')
print(result)
#<_sre.SRE_Match object; span=(0, 4), match='1234'>

14 {} (匹配指定次數)
{n} ---- 匹配n次
{m,n} ---- 匹配m到n次
{m,} ---- 至少匹配m次
{,n} ---- 最多匹配n次

# 判斷密碼是否符合要求;密碼是由數字和字母組成,并且6-16位
re_str = r'[1-9a-zA-Z]{6,16}'
result = fullmatch(re_str,'qwe123456')
print(result)
# <_sre.SRE_Match object; span=(0, 9), match='qwe123456'>

正則表達式的分之和分組

1 | (分之)
條件1 | 條件2 --- 先用條件1區(qū)匹配,如果匹配成功,就匹配成功。
如果條件1匹配失敗,就用條件2匹配。
注意: 如果條件1匹配成功就不會再用條件2再去匹配

  1. ()(分組)
    a.組合(將括號中的內容作為一個整體進行操作)
    b。捕獲 --- 使用帶括號的正則表達式匹配成功后,只獲取括號中的內容
    c.重復--- 在正則表達式中,可以通過 \數字 來重復前面括號中來匹配到的結果.數字代表前面第幾個分組
a.組合,重復
re_str = r'(\d{3})op\1'
result = re.fullmatch(re_str,'123op123')
print(result)
# <_sre.SRE_Match object; span=(0, 8), match='123op123'>

b.捕獲

re_str = r'(\d{3})'
print(re.findall(re_str,'2131sadasda123asdas123xzx'))

['213', '123', '123']

####正則表達式re相關的方法
1.compile

compile(正則表達式字符串)   ---  將正則表達式字符串轉換成正則表達式對象

?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 林蕾 宜昌 焦點網絡初級七期 堅持分享第91天 學習焦點后,越來越發(fā)現,很多焦點理念都是蘊含著人生哲理。它不緊緊能...
    壹凡心理閱讀 231評論 0 0
  • 根據市場分析,從數據倉庫到外包服務,有近50%的IT項目都遭遇了失敗。所以,中止有失敗先兆的IT項目是CIO重要且...
    小名一峰閱讀 1,290評論 0 0
  • 渴望自己變的更好,這是正常人都有的心理??释约鹤儙洠释约焊?,渴望自己更有力量。這是一個好念頭,正所謂人往...
    管坤閱讀 416評論 0 2
  • 航拍的雪中校園,教學樓樓頂的純白引人向往。李聞 供圖 ?
    小欣吖閱讀 179評論 0 0

友情鏈接更多精彩內容