js正則匹配總結(jié)

前言

js匹配是js中比較重要的一個概念,我們在工作中經(jīng)常用到,但是往往都是記得不是很清楚,或者有些遺忘,這次記錄總結(jié)一下,讓自己加深一下印象,同時也會小伙伴們提供查閱資料的地方

正則表達式語法

1:字面量形式

let reg = /\bis\b/; 
let string = 'it is a cat';
console.log(string.replace(reg, 'vvv'));

2:構(gòu)造函數(shù)實例化

let reg = new RegExp('\\bis\\b', 'g'); // 反斜線需要轉(zhuǎn)義,所以是兩個\\ (轉(zhuǎn)義問題在研究)
let string = 'it is a cat';
console.log(string.replace(reg, 'vvv'));

正則表達式常見語法

1:修飾符

// 全局搜索
let reg = /\bis\b/g; 
let string = 'it is a cat, he is a boy';
console.log(string.replace(reg, 'vvv'));

// 忽略大小寫
let reg = /\bis\b/gi; 
let string = 'it is a cat, he IS a boy';
console.log(string.replace(reg, 'vvv'));

// 換行匹配
// 換行匹配意思就是讓每一行做為開頭或者結(jié)尾來匹配,所以必須要用^,$來一起用
let string = `aaan
tttt`;
let reg = /an/;
string .match(reg);

2:元字符

2.1:表示非打印字符

正則 描述
\n 匹配一個換行符
\r 匹配一個回車符
\t 匹配一個制表符
\v 匹配一個垂直制表符
\f 匹配一個換頁符
\b 匹配一個單詞邊界
\B 匹配一個非單詞邊界

2.2:表示集合和范圍

正則 描述
. 匹配任意一個非換行符
表示或者的意思
[] 同樣表示或者的意思[abc],匹配a, b ,c中任意一個
\d 匹配任意一個數(shù)字即[0-9]
\D 匹配任意一個非數(shù)字字符即[^0-9]
\s 匹配任意一個空白字符即[\f\t\r\v\n]
\S 匹配任意一個非空白字符即[^\f\t\r\n\v]
\w 匹配任意一個數(shù)字,字母,下劃線即[0-9a-zA-Z_]
\W 匹配任意一個非數(shù)字,字母,下劃線即[^0-9a-zA-Z_]

2.3:表示量詞

正則 描述
* 表示匹配0次,1次,或者多次
+ 表示匹配一次或者多次
? 表示匹配0次或者1次
{n} 表示匹配n次
{n,} 表示匹配n次,或者n次以上
{n, m} 表示匹配最少n次最多m次

2.4:表示邊界控制和模式單元

正則 描述
^ 表示以什么什么開頭
$ 表示以什么什么結(jié)尾
[^] 括號里面^表示非,[^0-9]表示匹配不是0-9的字符
() 模式匹配單元,把()內(nèi)的整體當作一個字符

正則匹配模式

正則匹配模式分為兩種,一種是貪婪模式,另一種是非貪婪模式
貪婪模式:在遇到歧義時候盡可能的多的匹配符合的結(jié)果
非貪婪匹配:在遇到歧義時候匹配到一次符合的結(jié)果就不匹配了
js默認是貪婪匹配模式,貪婪模式變成非貪婪模式只需要在貪婪量詞({n, }, {n, m}, + , ?, *)后面加一個?就行了
附加:正則匹配中?的幾種用法

let reg = /\d??/;
let string = '123456';
console.log(string.replace(reg, 'haha'));

正則匹配前瞻后顧的概念

正則匹配的前瞻就是給正則匹配的選項定義一個斷言,或者說是一個條件比如:我要匹配一個字母,但是我的需求是字母后面必須是跟著一個數(shù)字的情況,那么這種場景是怎么實現(xiàn)了,就是用到前瞻的概念,那么我想要他的前面也要是一個數(shù)字怎么辦了,這就是后顧。
前瞻后顧的描述

正則 描述
(?=pattern) 正向肯定查找(前瞻),后面必須跟著什么
(?!pattern) 正向否定查找(前瞻),后面不能跟著什么
(?:pattern) 非捕獲分組,即該分組不寫入$1,$2,....中
(?<=pattern) 反向肯定條件查找(后顧),不捕獲
(?<!pattern) 反向否定條件查找(后顧)
(?<name>) 給分組起一個名字

正則匹配新特性

let string = 'a1dvb';
let reg = /\w(?=\d)/;
console.log(string.replace(reg, '---'));

特點

以上的三個匹配形式都是不被捕獲的,其中前兩個是不匹配的,他只是用來當作條件來用,第三個是要被匹配的

//  分組被匹配并且捕獲
let string = 'a1b3c4';
let reg = /(\w)(\d).+/;  //去掉加號就不同
string = string.replace(reg, '$1$2');
console.log(string);  //a1

// 分組被匹配但是不被捕獲
let string = 'a1b3c4';
let reg = /(?:\w)(\d).+/;  // 去掉加號就不同
string = string.replace(reg, '$1$2');
console.log(string);  // 1$2

// 分組不被匹配也不被捕獲,僅作為條件
let string = 'a1b3c49tt';
let reg = /(\d)(?=\d).+/;  // 去掉加號就不同
string = string.replace(reg, '$1$2');
console.log(string);  // 4$2

匹配原則----個人總結(jié)

1:任何元字符在沒有寫量詞的情況下,只匹配一次
2:寫了量詞,默認是貪婪匹配
3:正則匹配一旦全部找到就不會在繼續(xù)去匹配,除非你設(shè)置了全局g
4:正則匹配按照匹配規(guī)如果中間中斷沒有匹配到,并且字符串沒有匹配完,會繼續(xù)按照匹配規(guī)則重新匹配
5:(pattern)如果匹配到了很多結(jié)果,只捕獲最后一次匹配到的結(jié)果
6:任何量詞都只作用于前面的元字符

正則匹配相關(guān)的四個函數(shù)

正則對象的五個屬性

1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex

屬性 描述
global 是一個只讀一個布爾值,用來描述是否帶有全局的修飾符
ingoreCase 是一個只讀一個布爾值,用來描述是否帶有忽略大小寫的修飾符
multiline 是一個只讀一個布爾值,用來描述是否帶有換行的修飾符
source 就是匹配規(guī)則的文本本身
lastIndex 是一個可以讀寫的整數(shù),如果是全局搜索,這個屬性的值是匹配到的字符的下一個字符的索引所對應(yīng)的值, 直到?jīng)]有匹配為止,才會變成0,如果不是全局始終為0
let reg = /\d/gmi;
console.log(reg.source);  // \d
console.log(reg.global); // true
console.log(reg.ignoreCase);  // true
console.log(reg.multiline);  // true
console.log(reg.lastIndex); 0

函數(shù)1:test

字符串滿足正則匹配規(guī)則就會返回true,但是如果正則匹配里面含有全局的話,那么多運行幾遍會報錯,因為正則每次匹配開始都是看lastIndex的,全局情況下lastIndex每次執(zhí)行都會被改變

let reg = /\d/g;
let string = '1234';
console.log(reg.test(string));

// 全局情況
et reg = /\d/g;
let string = '12';
console.log(reg.test(string));  // true
console.log(reg.test(string)); // true
console.log(reg.test(string)); // false

函數(shù)2:exec

如果沒有找到任何匹配就返回null,如果找到了則返回一個數(shù)組,exec方法返回的數(shù)組的第 0 個元素是與正則表達式相匹配的文本

第 1 個元素是 正則匹配到 的第 1 個子表達式相匹配的文本(如果有的話)

第 2 個元素是正則匹配到 的第 2 個子表達式相匹配的文本(如果有的話)

...

以此類推。
其中還有三個參數(shù)
index:表示匹配到的文本的第一個字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分組
在全局下也是一樣因為exec永遠只返回第一個匹配。

let reg = /(\w)(\d)(\d)/;
let string = 'a11a233';
reg.exec(string); //  ["a11", "a", "1", "1", index: 0, input: "a11a233", groups: undefined]

let reg = /(?<json>\w)(?<tiantian>\d)(?<jianwu>\d)/;
let string = 'a11a233';
reg.exec(string);

函數(shù)3:match

如果沒有找到任何匹配就返回null,如果找到了則返回一個數(shù)組,match方法返回的數(shù)組的第 0 個元素是與正則表達式相匹配的文本

第 1 個元素是 正則匹配到 的第 1 個子表達式相匹配的文本(如果有的話)

第 2 個元素是正則匹配到 的第 2 個子表達式相匹配的文本(如果有的話)

...

以此類推。
其中還有三個參數(shù)
index:表示匹配到的文本的第一個字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分組
在非全局的情況下,這個方法和exec一模一樣,但是在全局的情況下,差別很大,在全局的情況下,只會返回匹配到的結(jié)果,并且lastIndex始終為0, 如果沒匹配到就返回null

let reg = /(\w)(\d)(\d)/g;
let string = 'a11a233';
string.match(reg); // ["a11", "a23"]

函數(shù)4:replace

該方法用來替換字符串,第一個參數(shù)是正則表達式,第二個參數(shù)可以是字符串也可以是函數(shù)

let string = '1a2a';
let reg = /\d+/;
string.replace(reg, '--'); // "--a2a"

// 捕獲分組形式
let string = '1a2a';
let reg = /(\d).+/;
string.replace(reg, '$1');  // 1

// 函數(shù)形式
let string = 'a11ab22b';
let reg = /(\w)(\d)(\d)/;
string.replace(reg, (match, firstP, secondP, thirdP, index, string) => {
console.log(match);
console.log(firstP);
console.log(secondP);
console.log(thirdP);
console.log(index);
console.log(string);
return 22
}) 
// a11 a 1 2 0 a11ab22b
其中對函數(shù)來說的話,第一個是匹配到的文本 
后面幾個參數(shù)是對應(yīng)分組的匹配文本(如果有的話)
倒數(shù)第二個是,匹配到的文本的第一個字符的索引
倒數(shù)第一個是,被匹配的文本

附加

正則匹配測試工具

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容