LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1021|回复: 3

想把网页中的含有 <script src="http://www.google-analytics.com

[复制链接]
发表于 2007-3-25 13:03:03 | 显示全部楼层 |阅读模式
今天用wget把www.cplusplus.com     上面的C++学习文档都下载下来了。但是
每个网面都含有类似<script src="http://www.google-analytics.com/urchin.js" type="text/javascript">
</script>

的广告信息,这样查起来,还是很慢,网慢(当然离线查看,就没这问题了)。
想问一下,怎么写SHELL能将一整个目录,包括其子目录的所有文件中,所有含有
类似<script src="http://www.google-analytics.com/urchin.js" type="text/javascript">
</script>     的行都去掉。。。。
谢谢。。
发表于 2007-3-25 13:15:30 | 显示全部楼层
试试 tr 吧
回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-3-25 13:26:31 | 显示全部楼层
能不能具体点???
回复 支持 反对

使用道具 举报

发表于 2007-3-25 14:13:08 | 显示全部楼层
试试perl的正则表达式。

我这儿有个PHP的正则:preg_replace('/<script[^>]*?>(.*?)<\/script>/si', '', $strSource);

递归读取目录下的文件,读入一个字符串中,然后用上面那条命令去掉特殊内容,再将替换后的内容重新写入文件
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表