提取网页源代码中的所有js或css链接

nZone 2023年10月28日更新于9 月前 共520字 5行代码 预计3分钟 评论 35
阿里云折扣】服务器活动对比【腾讯云秒杀

最近访问闹着玩下网有点卡,可能是 js 和 css 文件太多了,加上深色模式插件很影响加载速度,想研究下手动合并,在开发者工具可以看到所有的 js 链接,不过我还是习惯用 Notepad3 来整理出来,也记录一下思路,以js链接为例。

1、先格式化为整行

把源代码全选复制到 Notepad3 后,全部改成行,全选或用快捷键:Ctrl+A,点击菜单:编辑-行-拼接行,带不带空格都可以,也可以用快捷键:Ctrl+J。

2、链接前后换行

快捷键 Ctrl+H 调出替换框,勾选“转义反斜杠”,把 https 替换为 \nhttps(注:为方便阅读,本文写法都不包含空格和全角逗号或句号),把 .js 替换为 .js\n。

Notepad3 替换窗口

3、删除不包含js的行

还是在替换框,直接勾选“使用正则表达式”:

^(?!.*\.js).*

先查找看对不对,替换内容置空,然后全部替换。还可以加上别的后缀。

^(?!.*\.(js|css)).*

再删除不是本站链接,如限定网址或本站域名:

^(?!.*https).*
^(?!.*(https|nzonex)).*

4、删除空格字段

剩下一般有空格都是一些乱码之类的,不是正确的链接,可以直接删除。改为使用通配符搜索:

* *

中间一个空格,前后都是星号。

5、删除空行

在菜单:编辑-行-删除空行,或者直接快捷键:Alt+R。

最后得到了所有干净的 js 链接了。这个思路几乎适合所有其它后缀的链接,如css、jpg等文件,也就是把js换成其它后缀即可,也可以一次性多选,正则表达式如下:

如果要省略步骤也可以,但容易出错。

weinxin
公众号
闹着玩下网
avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: