您现在的位置是:网站首页> 编程资料编程资料

最全的用正则批量去除Teleport Pro整站下载文件冗余代码_正则表达式_

2023-05-25 311人已围观

简介 最全的用正则批量去除Teleport Pro整站下载文件冗余代码_正则表达式_

tppabs 

html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。

如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。



方法如下:

使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:\btppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可




匹配javascript代码:


方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if\(confirm\('htt[^"]*"
替换:href=www.xxx.com
勾选:使用正则表达式
点替换全部按钮

注:如果该表达式中含有不同的网址,可使用if\(confirm\('htt[^"]*\)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。


css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码

方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:\/\*tpa=http://[^\s]*\/
替换:空
勾选:使用正则表达式
点替换全部按钮

字符匹配示例
^输入或行的起始部分。^T 匹配“This good earth”中的“T”,但不匹配“Uncle Tom's Cabin”中的“T”。
$输入或行的结尾部分。h$ 匹配“teach”中的“h”,但是不匹配“teacher”中的“h”
*0 个或多个前置字符。um* 匹配“rum”中的“um”、“yummy”中的“umm”以及“huge”中的“u”
+1 个或多个前置字符。um+ 匹配“rum”中的“um”和“yummy”中的“umm”,但在“huge”中没有任何匹配项
?前置字符最多出现一次(即,指示前置字符是可选的)。st?on 匹配“Johnson”中的“son”和“Johnston”中的“ston”,但在“Appleton”和“tension”中没有任何匹配项
.除换行符外的任何单字符。.an 匹配短语“bran muffins can be tasty”中的“ran”和“can”
x|yx 或 y。FF0000|0000FF 匹配 bgcolor=”#FF0000” 中的“FF0000”和 font color=”#0000FF” 中的“0000FF”
{n}恰好 n 个前置字符。o{2} 匹配“loom”中的“oo”和“mooooo”中的前两个“o”,但在“money”中没有任何匹配项