正则匹配html标签(常用正则表达式汇总整理)

1、匹配HTML开始标签及结束标签

这段正则,为什么比网上搜索的复杂一些呢?主要是加了匹配特测情况的问题,避免BUG。

举例:<div debug=”>” ></div>

const reg_tags = /<((["'])+.*?2|[^>])+>/g;
正则匹配html标签(常用正则表达式汇总整理)

开始和结束

2、匹配HTML开始标签

const reg_tag_start = /<[^\/]((["'])+.*?2|[^>])+>/
正则匹配html标签(常用正则表达式汇总整理)

开始

3、匹配HTML结束标签

const reg_tag_end = /<[\/]+[^<>]*>*/
正则匹配html标签(常用正则表达式汇总整理)

结束

4、匹配HTML标签属性

const reg_tag_attrs = /(?<=s)[w:-]+(=(["']).*?2)*/g;
正则匹配html标签(常用正则表达式汇总整理)

标签属性

5、获取HTML标签属性名与值

const reg_tag_attr_info = /(^[^=]+|(?<=(['"])).*?(?=2))/g;
正则匹配html标签(常用正则表达式汇总整理)

属性名与值

6、获取HTML标签的名称

const reg_tag_name = /(?<=<[/s]*)w+(?=(s+(?![s=])|>))/;
正则匹配html标签(常用正则表达式汇总整理)

标签名称

7、匹配HTML文档类型声明

const reg_doctype = /<!doctype[^<>]*>*/i
正则匹配html标签(常用正则表达式汇总整理)

声明

8、匹配HTML文档注释

const reg_tag_note = /<!.*?>/
正则匹配html标签(常用正则表达式汇总整理)

注释

9、匹配HTML文本内容

const reg_text = /(?<=<[w]+.*?>)[sS]*?(?=</[w]*?>)/
正则匹配html标签(常用正则表达式汇总整理)

文本

10、其它

//g 正则表达式后面加g,表示全局匹配。

//i 正则表达式后面加i,表示不区分大小写。

[u4e00-u9fa5],表示匹配中文。

正则匹配html标签(常用正则表达式汇总整理)

中文

[^x00-xffu4e00-u9fa5],表示匹配中文符号

正则匹配html标签(常用正则表达式汇总整理)

中文符号

以上正则表达式,是在写一个生成HTML抽象语法树的工具时,不断摸索出来。如果您有更好的写法,欢迎交流。

人人为我,我为人人,欢迎您的浏览,我们一起加油吧。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件举报,一经查实,本站将立刻删除。

(0)
星百科SEO专员的头像星百科SEO专员管理团队

相关推荐

  • 图文详解tplink路由器如何设置网址

    要设置TP-Link路由器,正常情况下可以按照以下步骤进行操作: 1. 将路由器的电源适配器插入电源插座,并将其连接到路由器上。 2. 使用网线将路由器的WAN口(通常标有“Internet”或“WAN”的端口)与您的光猫连接起来。确保连接牢固。 3. 将另一根网线连接到路由器的LAN口(通常有4个标有“LAN”的端口之一)和您的计算机之间。这将用于进行初始…

    2024年1月16日 网站建设
  • DDoS攻击的原理(防止DDOS攻击的7个技巧)

    DDoS攻击是一种利用大量受控制的计算机或设备,向目标服务器发起海量请求或数据包的分布式拒绝服务攻击,它会使目标服务器无法正常运行或崩溃。 它的目标是耗尽目标服务器的网络带宽、内存、CPU等资源,阻止合法用户的请求得到响应。 如果想要判断自己是否遭受了DDoS攻击,可以从以下几个方面进行对比: 一、网站无法正常访问或访问速度变慢: 这种情况可能是由于网络带宽…

    2024年1月16日
  • 502 Bad Gateway 错误的原因及解决方法

    502 Bad Gateway 错误的原因及解决方法 一、502 Bad Gateway 错误原因分析 当我们访问一个网站时,如果服务器从上游代理接收到的响应超出了其处理范围,就会返回502错误。简单来说,502错误是服务器作为网关或代理时,服务器从上游服务器接收到一个无效的响应。具体原因可能包括: 上游服务器(例如:CDN、负载均衡器)宕机或不稳定。 服务…

    2024年1月16日
  • 抓包工具Http Debugger使用详解

    httpdebugger这个工具网上也没有什么介绍,我就去官网看了看介绍,英文版翻译过来,再加上自己的理解和截图,供大家参考。。 虽然介绍中描述得很强大的亚子,但是我用了一下觉得比较鸡肋(对我来说),抓包还是fiddler最强大,修改请求头请求内容方便是挺方便的,但我还是习惯用postman,再就是提及的别的功能我也没用到。 版权声明:本文为CSDN博主「测…

    2024年1月15日 网站建设
  • 499状态码是什么意思,怎么解决网站499状态码

    499状态码是一种非标准的HTTP状态码,表示服务器成功处理了请求,但在返回响应之前,客户端主动关闭了连接。这个状态码通常出现在Nginx服务器中,当客户端在等待服务器响应时关闭连接,Nginx会将此情况记录为499状态码。 要解决网站499状态码的问题,可以尝试以下几种方法: 调整Nginx配置:使用“client_header_timeout”、“cli…

    2024年1月14日
  • 如何抗ddos:美国CloudFlare公司CDN节点

    前文纪要:最近使用ddos工具测试发包某网站时,发现该网站的ip是美国CloudFlare公司CDN节点,ddos工具直接提示“攻击失败:目标无法攻击!” 最近网站也一直被ddos攻击,那么我就在思考,如何也给自己的网站添加cdn节点,让普通的ddos工具甚至无法攻击我呢? 于是我百度查询到了下面的文章: 美国CloudFlare公司CDN到底怎么样? 近期…

    2024年1月11日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

在线咨询: QQ交谈

邮件:9519141@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

分享本页
返回顶部