php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
如何使用动态共享对象的模式来安装PHP
Oct 09 PHP
PHP的中问验证码
Nov 25 PHP
检测png图片是否完整的php代码
Sep 06 PHP
php和mysql中uft-8中文编码乱码的几种解决办法
Apr 19 PHP
解析php中两种缩放图片的函数,为图片添加水印
Jun 14 PHP
php上传文件问题汇总
Jan 30 PHP
WordPress中Gravatar头像缓存到本地及相关优化的技巧
Dec 19 PHP
thinkPHP框架对接支付宝即时到账接口回调操作示例
Nov 14 PHP
php 5.4 全新的代码复用Trait详解
Jan 05 PHP
PHP 实现页面静态化的几种方法
Jul 23 PHP
PHP PDOStatement::errorCode讲解
Jan 31 PHP
PHP常量define和const的区别详解
May 18 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
供参考的 php 学习提高路线分享
2011/10/23 PHP
给大家分享几个常用的PHP函数
2017/01/15 PHP
基于php中echo用逗号和用点号的区别详解
2018/01/23 PHP
PHP5.5基于mysqli连接MySQL数据库和读取数据操作实例详解
2019/02/16 PHP
Yii框架数据库查询、增加、删除操作示例
2019/10/14 PHP
PHP程序员简单的开展服务治理架构操作详解(三)
2020/05/14 PHP
jQuery formValidator表单验证插件开源了 含API帮助、源码、示例
2008/08/14 Javascript
关于query Javascript CSS Selector engine
2013/04/12 Javascript
Backbone中View之间传值的学习心得
2016/08/09 Javascript
jQuery 特性操作详解及实例代码
2016/09/29 Javascript
Angular2学习教程之组件中的DOM操作详解
2017/05/28 Javascript
angularJS实现动态添加,删除div方法
2018/02/27 Javascript
JavaScript学习笔记之DOM操作实例分析
2019/01/08 Javascript
koa router 多文件引入的方法示例
2019/05/22 Javascript
vue实现搜索过滤效果
2019/05/28 Javascript
新手简单了解vue
2019/05/29 Javascript
JS实现的tab切换并显示相应内容模块功能示例
2019/08/03 Javascript
layui表格内容溢出的解决方法
2019/09/06 Javascript
Python中统计函数运行耗时的方法
2015/05/05 Python
怎样使用Python脚本日志功能
2016/08/14 Python
python 3.5实现检测路由器流量并写入txt的方法实例
2017/12/17 Python
对Django的restful用法详解(自带的增删改查)
2019/08/28 Python
Django --Xadmin 判断登录者身份实例
2020/07/03 Python
python实现AHP算法的方法实例(层次分析法)
2020/09/09 Python
python实现人工蜂群算法
2020/09/18 Python
高清安全摄像头系统:Lorex Technology
2018/07/20 全球购物
求职简历中个人的自我评价
2013/12/25 职场文书
运动会800米加油稿
2014/02/22 职场文书
《美丽的公鸡》教学反思
2014/02/25 职场文书
人力资源经理的岗位职责范本
2014/02/28 职场文书
承诺书怎么写
2014/03/26 职场文书
大学生精神文明先进个人事迹材料
2014/05/02 职场文书
法定代表人授权委托书范文
2014/08/02 职场文书
汽车修理厂管理制度
2015/08/05 职场文书
go select编译期的优化处理逻辑使用场景分析
2021/06/28 Golang
Python TypeError: ‘float‘ object is not subscriptable错误解决
2022/12/24 Python