您现在的位置是:网站首页> 编程资料编程资料
正则表达式学习教程之回溯引用backreference详解_正则表达式_
2023-05-25
433人已围观
简介 正则表达式学习教程之回溯引用backreference详解_正则表达式_
本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:
在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。
一、问题引入
一个在HTML页面中匹配标题标签(H1—H6)的问题:
文本:
Welcome to my page
Content is divided into twosections:Introduction
Information about me.Hobby
Information about my hobby.This is invalid HTML
正则表达式:<[hH][1-6]>.*?[hH][1-6]>
结果:
【
Welcome to my page
】Content is divided into twosections:
【
Introduction
】Information about me.
【
Hobby
】Information about my hobby.
【
This is invalid HTML】
分析:模式<[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了
、,[hH][1-6]>匹配到了
、、;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。
二、回溯引用匹配
回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:
文本:
Welcome to my page
Content is divided into twosections:Introduction
Information about me.Hobby
Information about my hobby.This is invalid HTML
正则表达式:<[hH]([1-6])>.*?[hH]\1>
结果:
【
Welcome to my page
】Content is divided into twosections:
【
Introduction
】Information about me.
【
Hobby
】Information about my hobby.
This is invalid HTML
分析:首先匹配开始标题标签的模式<[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为[hH]\1>,其中\1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg
更多关于JavaScript相关内容感兴趣的读者可查看本站专题:《JavaScript正则表达式技巧大全》、《JavaScript替换操作技巧总结》、《JavaScript查找算法技巧总结》、《JavaScript数据结构与算法技巧总结》、《JavaScript遍历算法与技巧总结》、《JavaScript中json操作技巧总结》、《JavaScript错误与调试技巧总结》及《JavaScript数学运算用法总结》
希望本文所述对大家JavaScript程序设计有所帮助。
相关内容
- JS基础教程——正则表达式示例(推荐)_正则表达式_
- IOS正则表达式判断输入类型(整理)_正则表达式_
- 详解基于Linux下正则表达式(基本正则和扩展正则命令使用实例)_正则表达式_
- PHP 正则表达式效率 贪婪、非贪婪与回溯分析(推荐)_正则表达式_
- jQuery正则表达式的使用方法步骤详解_正则表达式_
- javascript将字符串中的多个空格替换为一个空格的正则实例_正则表达式_
- js正则表达式实现数字每隔四位用空格分隔代码_正则表达式_
- Java 正则表达式匹配模式(贪婪型、勉强型、占有型)_正则表达式_
- 正则表达式小脚本(对输入内容进行处理)_正则表达式_
- 正则表达式惰性匹配模式(?)_正则表达式_
