基于多種分隔符進行字符串的分割

首先來說,字符串尾部的不叫分隔符,字符串中間的才叫分隔符。
例如 Hello World, My name is Python. 中的點號就不是分隔符

將下面這個字符串切分成單個的單詞。
Hello World, My name@ is Python

從上面這個例子中可以看出分隔符有逗號,多個空格,@這三種。下面給出兩種解決辦法。

方法1 String模塊的spilt()
思路: 將除了空格以外的其他分隔符全部替換為空格,然后按照空格符進行分割。
str.replace('a', 'b') 表示用 b 替換掉 str 中的 a
str.split() 默認按照空格進行分割字符串str
str.split(',') 表示按照 , 進行分割字符串 str

>>> str = 'Hello World,   My name is Python.'
>>> str.replace(',','').replace('@','').split()
['Hello', 'World', 'My', 'name', 'is', 'Python']

方法2 re模塊的spilt()

>>> import re
>>> str = 'Hello World,   My name@ is Python'
>>> re.split(r'[,@\s]\s*', str)
['Hello', 'World', 'My', 'name', 'is', 'Python']

正則表達式符號復習
- ? 匹配零次或一次前面的分組
- * 匹配零次或多次前面的分組
- + 匹配一次或多次前面的分組
- {n} 匹配 n 次前面的分組
- {n,} 匹配 n 次或更多次前面的分組
- {,m} 匹配零次到 m 次前面的分組
- {n,m} 匹配至少 n 次,至多 m 次前面的分組
- {n,m}?{n,m}*? 、{n,m}+? 對前面的分組進行非貪心匹配
- ^spam 表示字符串必須以 spam 開始
- spam$ 表示字符串必須以 spam 結(jié)束
- . 匹配所有字符,換行符除外
- \d 、\w 、\s 分別匹配數(shù)字、單詞、空格
- \D 、\W 、\S 分別匹配除數(shù)字、單詞、空格外的所有字符
- [abc] 表示匹配方括號內(nèi)的任意字符(例如上面例子中的,, @,
- [^abc] 表示匹配不在方括號內(nèi)的任意字符

總結(jié)
顯然 String 對象的 split() 方法只適用于非常簡單的字符串分割的場景,它并不允許有多個分隔符或者是分隔符周圍不確定的空格(本例中的逗號后面有若干空格)。當需要更加靈活的切割字符串的時候,最好使用 re.split() 方法。



該文章于2017年8月31日于CSDN上首次發(fā)表,2017年12月24日搬家至此!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本節(jié)要介紹的是Python里面常用的幾種數(shù)據(jù)結(jié)構(gòu)。通常情況下,聲明一個變量只保存一個值是遠遠不夠的,我們需要將一組...
    小黑y99閱讀 65,640評論 0 9
  • 第5章 引用類型(返回首頁) 本章內(nèi)容 使用對象 創(chuàng)建并操作數(shù)組 理解基本的JavaScript類型 使用基本類型...
    大學一百閱讀 3,692評論 0 4
  • 正則表達式到底是什么東西?字符是計算機軟件處理文字時最基本的單位,可能是字母,數(shù)字,標點符號,空格,換行符,漢字等...
    獅子挽歌閱讀 2,300評論 0 9
  • 自己成為老師之后就對老師這個職業(yè)肅然起敬。教師會上老師們一起討論,有哪些老師是你非常尊敬的,他們的哪些品質(zhì)讓你尊敬...
    忠爽生活教育閱讀 574評論 5 4
  • (寫于2016年4月 在大學) 最近幾天早上都是四五點的樣子,窗外清脆的鳥鳴聲就會此起彼伏的傳進寢室里來。都說早起...
    邦德姑娘閱讀 899評論 0 1

友情鏈接更多精彩內(nèi)容