正则匹配html标签（常用正则表达式汇总整理)

星百科SEO专员 • 2023年6月16日上午10:16 • 网站建设 • 阅读 1

1、匹配HTML开始标签及结束标签

这段正则，为什么比网上搜索的复杂一些呢？主要是加了匹配特测情况的问题，避免BUG。

举例：<div debug=”>” ></div>

const reg_tags = /<((["'])+.*?2|[^>])+>/g;

正则匹配html标签（常用正则表达式汇总整理)

开始和结束

2、匹配HTML开始标签

const reg_tag_start = /<[^\/]((["'])+.*?2|[^>])+>/

正则匹配html标签（常用正则表达式汇总整理)

开始

3、匹配HTML结束标签

const reg_tag_end = /<[\/]+[^<>]*>*/

正则匹配html标签（常用正则表达式汇总整理)

结束

4、匹配HTML标签属性

const reg_tag_attrs = /(?<=s)[w:-]+(=(["']).*?2)*/g;

正则匹配html标签（常用正则表达式汇总整理)

标签属性

5、获取HTML标签属性名与值

const reg_tag_attr_info = /(^[^=]+|(?<=(['"])).*?(?=2))/g;

正则匹配html标签（常用正则表达式汇总整理)

属性名与值

6、获取HTML标签的名称

const reg_tag_name = /(?<=<[/s]*)w+(?=(s+(?![s=])|>))/;

正则匹配html标签（常用正则表达式汇总整理)

标签名称

7、匹配HTML文档类型声明

const reg_doctype = /<!doctype[^<>]*>*/i

正则匹配html标签（常用正则表达式汇总整理)

声明

8、匹配HTML文档注释

const reg_tag_note = /<!.*?>/

正则匹配html标签（常用正则表达式汇总整理)

注释

9、匹配HTML文本内容

const reg_text = /(?<=<[w]+.*?>)[sS]*?(?=</[w]*?>)/

正则匹配html标签（常用正则表达式汇总整理)

文本

10、其它

//g 正则表达式后面加g，表示全局匹配。

//i 正则表达式后面加i，表示不区分大小写。

[u4e00-u9fa5]，表示匹配中文。

正则匹配html标签（常用正则表达式汇总整理)

中文

[^x00-xffu4e00-u9fa5]，表示匹配中文符号

正则匹配html标签（常用正则表达式汇总整理)

中文符号

以上正则表达式，是在写一个生成HTML抽象语法树的工具时，不断摸索出来。如果您有更好的写法，欢迎交流。

人人为我，我为人人，欢迎您的浏览，我们一起加油吧。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件举报，一经查实，本站将立刻删除。

html标签正则表达式

赞 (0)

星百科SEO专员管理团队

0 0

图文详解tplink路由器如何设置网址

要设置TP-Link路由器，正常情况下可以按照以下步骤进行操作： 1. 将路由器的电源适配器插入电源插座，并将其连接到路由器上。 2. 使用网线将路由器的WAN口（通常标有“Internet”或“WAN”的端口）与您的光猫连接起来。确保连接牢固。 3. 将另一根网线连接到路由器的LAN口（通常有4个标有“LAN”的端口之一）和您的计算机之间。这将用于进行初始…

星百科SEO专员
2024年1月16日 • 网站建设
网站建设

DDoS攻击的原理（防止DDOS攻击的7个技巧）

DDoS攻击是一种利用大量受控制的计算机或设备，向目标服务器发起海量请求或数据包的分布式拒绝服务攻击，它会使目标服务器无法正常运行或崩溃。它的目标是耗尽目标服务器的网络带宽、内存、CPU等资源，阻止合法用户的请求得到响应。如果想要判断自己是否遭受了DDoS攻击，可以从以下几个方面进行对比：一、网站无法正常访问或访问速度变慢：这种情况可能是由于网络带宽…

星百科
2024年1月16日
网站建设

502 Bad Gateway 错误的原因及解决方法

502 Bad Gateway 错误的原因及解决方法一、502 Bad Gateway 错误原因分析当我们访问一个网站时，如果服务器从上游代理接收到的响应超出了其处理范围，就会返回502错误。简单来说，502错误是服务器作为网关或代理时，服务器从上游服务器接收到一个无效的响应。具体原因可能包括：上游服务器（例如：CDN、负载均衡器）宕机或不稳定。服务…

星百科
2024年1月16日
抓包工具Http Debugger使用详解

httpdebugger这个工具网上也没有什么介绍，我就去官网看了看介绍，英文版翻译过来，再加上自己的理解和截图，供大家参考。。虽然介绍中描述得很强大的亚子，但是我用了一下觉得比较鸡肋（对我来说），抓包还是fiddler最强大，修改请求头请求内容方便是挺方便的，但我还是习惯用postman，再就是提及的别的功能我也没用到。版权声明：本文为CSDN博主「测…

星百科SEO专员
2024年1月15日 • 网站建设
网站建设

499状态码是什么意思，怎么解决网站499状态码

499状态码是一种非标准的HTTP状态码，表示服务器成功处理了请求，但在返回响应之前，客户端主动关闭了连接。这个状态码通常出现在Nginx服务器中，当客户端在等待服务器响应时关闭连接，Nginx会将此情况记录为499状态码。要解决网站499状态码的问题，可以尝试以下几种方法：调整Nginx配置：使用“client_header_timeout”、“cli…

星百科SEO专员
2024年1月14日
网站建设

如何抗ddos：美国CloudFlare公司CDN节点

前文纪要：最近使用ddos工具测试发包某网站时，发现该网站的ip是美国CloudFlare公司CDN节点，ddos工具直接提示“攻击失败：目标无法攻击!” 最近网站也一直被ddos攻击，那么我就在思考，如何也给自己的网站添加cdn节点，让普通的ddos工具甚至无法攻击我呢？于是我百度查询到了下面的文章：美国CloudFlare公司CDN到底怎么样？近期…

星百科SEO专员
2024年1月11日

发表回复

联系我们

联系我们

在线咨询： QQ交谈

邮件：9519141@qq.com

工作时间：周一至周五，9:30-18:30，节假日休息

返回顶部