问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

JavaScript正则之零宽断言详解

发布网友 发布时间:2024-09-29 10:36

我来回答

1个回答

热心网友 时间:2024-09-29 13:22

1、定义1.1什么是断言?

断言用于查找某些内容或内容所在的位置,该内容或内容所在位置应满足一定的条件。

那么什么叫零宽断言呢?零宽又是什么意思?

1.2零宽断言

通俗的讲,零宽断言的字面意思是匹配宽度为零的断言。

所谓匹配的宽度为零,就是说这种断言在工作时:

只作为匹配的判断条件

实际不匹配任何的结果

也不捕获任何的内容

这三个点,既展示了零宽断言的定义,也说明了零宽断言的两个特性:非捕获性和不吃字符

这两个特性我放在下个章节来讲。

2、零宽断言表达式与案例

因为后面有一些案例代码,为了能让大家更清楚的理解代码,所以这个章节先讲一下零宽断言表达式

2.1表达式表达式名称描述(?=exp)正向(正预测)先行断言匹配某个位置,该位置的后面的内容应匹配表达式exp(?!exp)负向(负预测)先行断言匹配某个位置,该位置的后面的内容不匹配表达式exp(?<=exp)正向(正回顾)后发断言匹配某个位置,该位置的前面的内容应匹配表达式exp(JS不支持)(?<!exp)负向(负回顾)后发断言匹配某个位置,该位置的前面的内容不匹配表达式exp(JS不支持)

相信你看这个表格就能理解十之八九了,我这里举个小例子

2.2案例解析

现在有一个需求是这样的:

在字符串'北京市(朝阳区)(西城区)(海淀区)'中,取出没有被()包裹的字符北京市

这怎么做呢?

要求是取出没有被()包裹的字段,那这个字段的后面紧跟着的一定是(,就是这么简单。

那我可以写一个零宽断言表达式varreg=/.*?(?=\()/来看看能不能满足需求:

console.log(reg.exec('北京市(朝阳区)(西城区)(海淀区)'))//["北京市",index:0,input:"北京市(朝阳区)(西城区)(海淀区)",groups:undefined]console.log('北京市(朝阳区)(西城区)(海淀区)'.match(reg))//["北京市",index:0,input:"北京市(朝阳区)(西城区)(海淀区)",groups:undefined]

简单做个解释,这个reg可以看作两部分,分别是.*?和(?=\()

假设你已经知道了在正则表达式当中:

.代表匹配除了换行和行结束符的任意字符

*代表匹配任意次数,保证我们得到的是北京市而不是市这个单字

?代表对多个连续的值,要么匹配0次,要么匹配1次,最多匹配一次

那么前一部分就可以匹配给定字符中包含的所有字符,而后一部分零宽断言则给匹配添加了条件,要求匹配的内容后面跟着(,于是我们就能得到想要的结果

2.3贪婪模式与非贪婪模式

你可能有疑问,如果我正则写成这个样子/.*(?=\()/,为什么结果就不对?

console.log('北京市(朝阳区)(西城区)(海淀区)'.match(/.*(?=\()/))//["北京市(朝阳区)(西城区)",index:0,input:"北京市(朝阳区)(西城区)(海淀区)",groups:undefined]

我首先说明,这所以在这里加入贪婪模式与非贪婪模式,是因为上面的案例是正向(正预测)先行断言的案例而网上有些人说正向零宽断言是从右向左执行的,我就不批判了,只希望大家能够擦亮眼睛。

那么为什么少了一个问号,得出了全然不同的结果呢?

上面说了,?在这个表达式里,表示要么不匹配,要么最多匹配一次,这就是非贪婪模式

而不添加?,表达式以贪婪模式运行。什么是贪婪模式?就是尽可能多的去匹配,匹配到了还去匹配,贪得无厌,一直匹配到字符串的末尾

因为字符串中有三个(,贪婪模式下会一直匹配到字符串结尾,就会得到北京市(朝阳区)(西城区)这个结果

3、零宽断言的特性

第一章已经说了零宽断言定义和它的特性,这里来详细讲讲它的这两个特性:非捕获特性和不吃字符特性

3.1非捕获特性

这是零宽断言的一个基本特性,非捕获特性

我假设你知道在正则表达式中可以使用()来进行分组取值,一个()就是一个分组。所以我这里举一个使用分组取值替换字符的例子:

varstr='Hello,Wrld!';varreg=/(W)/g;console.log(str.replace(reg,"$1o"))//Hello,world!

上面的代码,我使用分组来获取W并将它成功替换成正确的字符Hello,world!现在改一下代码,看看会怎样:

varstr='Hello,Wrld!';varreg=/W(?=r)/g;console.log(str.match(reg))//["W"]//注意看使用match方法返回了正确的结果,那么我能替换成功吗console.log(str.replace(reg,"$1o"))//Hello,$1orld!

很显然,虽然str.match方法返回了正确的结果,但是替换并没有实现想要的效果并且这个结果和使用非捕获性分组是一致的:

varstr='Hello,Wrld!';varreg=/(?:W)/g;console.log(str.replace(reg,"$1o"))//Hello,$1orld!

所以我们得出结论:

虽然第二个代码片段也使用了()进行分组,但因为这个分组使用的是零宽断言的表达式,正则并没有返回针对$1的引用,所以替换是不能成功的。

由此,这个例子很好的证明了零宽断言具有非捕获的特性。

3.2不吃字符特性

零宽断言的另一个特性,是不吃字符。

这里的不吃字符不是寻常意义上的吃,而是说零宽断言本身不占据查找位置,它不算是要被查找的内容,因此,正则表达式并不匹配零宽断言本身。

这里我们先引申一个概念。

这个概念,是正则对象的一个属性,叫做lastIndex。它规定了正则表达式下一次匹配的起始位置。

如果我们使用正则的方法如test,exec等方法,就能清楚的看到lastIndex的影响:

varreg=/([a-z])/g;vararr=["a","b","c","d","e"];for(vari=0;i<arr.length;i++){console.log(reg.exec(arr[i]))}

这段代码的返回结果,相信很多人都会判断错误,我直接把结果放在下面

["a","a",index:0,input:"a",groups:undefined]

null["c","c",index:0,input:"c",groups:undefined]null["e","e",index:0,input:"e",groups:undefined]

是不是惊掉了一地下巴?

这就是lastIndex在搞怪,简单的说,当正则全局匹配成功时,lastIndex就指向了匹配成功的字符索引,再次匹配时,则从lastIndex位置继续向后匹配

注意数组中每一项的长度都是1,如果lastIndex的值大于等于1,自然匹配的结果就是null;没有匹配到结果,lastIndex的值就成了默认值0,下一次的匹配就是非null的结果了。

所以我们得出结论,lastIndex随着匹配结果的变化而变化

下面我们使用零宽断言的方式来试试。

varreg=/(?=[a-z])/g;vararr=["a","b","c","d","e"];for(vari=0;i<arr.length;i++){console.log(reg.exec(arr[i]))}

这个结果不知道你能猜出来吗?

["",index:0,input:"a",groups:undefined]

["",index:0,input:"b",groups:undefined]["",index:0,input:"c",groups:undefined]["",index:0,input:"d",groups:undefined]["",index:0,input:"e",groups:undefined]

而因为正则表达式不匹配零宽断言本身,因此零宽断言不会改变lastIndex的值,所以它返回了空值“”,却没有完全返回空(null)。

如果你依然不能理解,尝试看看下面这段代码:

varstr='hello,thisishierry,andthatishi,thereishandsome'varreg=/h(?!i)e/console.log(str.match(reg))

这段代码十分简单,结果只会匹配一项

["he",index:0,input:"hello,thisishierry,andthatishi,thereishandsome",groups:undefined]

很明显,reg匹配的时候越过了表达式中间的i,只匹配了h和e,这能更明显的体现不吃字符的特性。

4、零宽断言的四种类型

通常,零宽断言依据断言的方式被分为四类,分别是:

零宽度正向先行断言(也叫正预测先行断言)

零宽度负向先行断言(也叫负预测先行断言)

零宽度正向后发断言(也叫正回顾后发断言)

零宽度负向后发断言(也叫负回顾后发断言)

在javascript这门语言中,只支持先行断言,不支持后发断言

4.1正向断言和负向断言有什么区别呢?

正向断言是当某个位置前面或者后面的内容要匹配表达式exp,才会返回非空的结果

负向断言是当某个位置前面或者后面的内容不匹配表达式exp,才会返回非空的结果

4.2先行断言和后发断言的区别?

先行断言是用某个位置后面的内容与表达式exp进行匹配

后发断言是用某个位置前面的内容与表达式exp进行匹配

4.3零宽度正向先行断言

例子一,是我在面试题里找到的

衣服38元、鞋子62元、剪发15元、吃饭45元、打车30元、冰激凌10元,对花费的金钱求和?

答案:/\d.?\d(?=[元块])/g

vars='衣服38元、鞋子62元、剪发15元、吃饭45块、打车30元、冰激凌10元'varr=/\d.?\d(?=[元块])/gvarsum=s.match(r).reduce(function(prev,cur){returnprev*1+cur*1;})console.log(sum);//200

例子二

'ilikeeating、sleeping、seemoviesand'中拿到以ing结尾的动作单词

答案:/\w+(?=ing)/g

vars='ilikeeating、sleeping、seemoviesand'varr=/\w+(?=ing)/gconsole.log(s.match(r))//["eat","sleep"]

这两个例子比较简单,就不坐过多解释了。

4.4零宽度负向先行断言

举个例子,也是我在面试题中找到的

测试一个文件是否是.css后缀,但又不能是.min.css,如:

test('a.min.css');//falsetest('b.css');//truetest('c.mining.css');//true

答案:/^(?!.*\.min\.css$).+\.css$

这里先对以任意字符开头结尾为.min.css的文件名做了排除,在剩余的文件名中查找以.css为结尾的文件名

console.log('北京市(朝阳区)(西城区)(海淀区)'.match(/.*(?=\()/))//["北京市(朝阳区)(西城区)",index:0,input:"北京市(朝阳区)(西城区)(海淀区)",groups:undefined]05、结尾

创作不易,如果这篇文章帮助到了你,请动动手指点个赞再走吧~

作者:晴天同学

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
家里鱼缸摆放什么最旺财 鱼缸放什么最旺盛 鱼缸放什么聚财最旺 宝宝脸红涂什么能好 怎么在电脑上查询淘宝订单? 宝宝睡觉脸红怎么回事 超声波探伤仪斜探头k2.5前沿长度大概多少 我下的红警地图 是不是应该放在这个文件夹里?可是没用啊 打开游戏地图... 夜游武宁西海湾景区能看到怎样的景色? 贷款用什么app软件最好 求问1+1+1/2!+1/3!+……的极限是e应该怎么证 this绑定的基本原则(一) 孩子嗓子红还有白点吃一早一晚嗓子哑怎么? 儿童嗓子红有白点没发烧是什么情况 2岁宝宝嗓子红有白点 牙龈红是怎么回事 怎样治疗 嗓子红有白点怎么回事 taxable year的意思 佛慈逍遥丸只有女性可以吃吗? 加味逍遥丸佛慈 逍遥丸佛慈 哈利波特魔法觉醒守南瓜打地精怎么玩-守南瓜打地精玩法攻略 哈利波特魔法觉醒保护南瓜卡组及打法分享 劲舞团闹钟徽章与什么互顶 一岁小儿拉肚子吃什么药 一岁宝宝拉肚子怎么吃什么药? 一岁拉肚子吃什么药 我和老公女儿都在外地 老公在包工程 我昨晚做了个梦 梦见好多黑色的猪... 放在室内驱蚊的植物 碳纤维电暖器的优缺点是什么 碳纤维电暖器的省电效率有多高? 小学数学的教法有哪些 求星海镖师可以弄到手机上看的,其他漫画也可以 专门看偷星和星海镖师之类的免费看漫画网站?求高人 求可以看星海镖师 斗破苍穹等的漫画app 跪求星海镖师的漫画在线观看!!! 英雄联盟蛮王攻略(英雄联盟蛮族之王攻略)介绍_英雄联盟蛮王攻略(英雄... 英雄联盟蛮王攻略 s6英雄联盟蛮王技能介绍 网友都惊呆了!黄晓明《戴假发的人》造型路线让人惊讶,所谓何事? 雪里蕻怎么种植 雪里见种植方法 设计一简单电路判别电压器的同名端 手机桌面图标的大小如何设置 八字看什么最旺夫 女生八字旺夫,旺夫相的女人特征 女人什么命最好最旺夫 微信登录不了,是被封了吗? 门窗五性性能检测? 篮球服三号有什么特别意义吗? 如何找回永久删除的照片-一文详解 阅读《魂》回答问题