php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
PHP中Session的概念
Oct 09 PHP
PHP防注入安全代码
Apr 09 PHP
php UTF-8、Unicode和BOM问题
May 18 PHP
基于php-fpm 参数的深入理解
Jun 03 PHP
ThinkPHP中I(),U(),$this-&gt;post()等函数用法
Nov 22 PHP
PHP通过API获取手机号码归属地
May 28 PHP
使用PHP编写发红包程序
Jul 22 PHP
PHP中addcslashes与stripcslashes函数用法分析
Jan 07 PHP
php ci 获取表单中多个同名input元素值的代码
Mar 25 PHP
Thinkphp自定义代码生成工具及用法说明(附下载地址)
May 27 PHP
无需数据库在线投票调查php代码
Jul 20 PHP
PHP下载文件函数与用法示例
Sep 27 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
PHP函数nl2br()与自定义函数nl2p()换行用法分析
2016/04/02 PHP
Nginx环境下PHP flush失效的解决方法
2016/10/19 PHP
读jQuery之十三 添加事件和删除事件的核心方法
2011/08/23 Javascript
JavaScript获取鼠标移动时的坐标(兼容IE8、chome谷歌、Firefox)
2014/09/13 Javascript
js+html5实现canvas绘制圆形图案的方法
2015/06/05 Javascript
javascript中html字符串转化为jquery dom对象的方法
2015/08/27 Javascript
jquery实现点击页面回到顶部
2016/11/23 Javascript
微信小程序开发之实现选项卡(窗口顶部TabBar)页面切换
2016/11/25 Javascript
three.js快速入门【推荐】
2017/01/21 Javascript
Mui使用jquery并且使用点击跳转新窗口的实例
2017/08/19 jQuery
vue中设置height:100%无效的问题及解决方法
2018/07/27 Javascript
vue+axios+mock.js环境搭建的方法步骤
2018/08/28 Javascript
微信小程序搜索功能(附:小程序前端+PHP后端)
2019/02/28 Javascript
基于elementUI使用v-model实现经纬度输入的vue组件
2019/05/12 Javascript
Vue3.0结合bootstrap创建多页面应用
2019/05/28 Javascript
Python操作列表之List.insert()方法的使用
2015/05/20 Python
Python编程实现二叉树及七种遍历方法详解
2017/06/02 Python
Jupyter中直接显示Matplotlib的图形方法
2018/05/24 Python
在Pandas中给多层索引降级的方法
2018/11/16 Python
python使用xlrd模块读取xlsx文件中的ip方法
2019/01/11 Python
Python numpy中矩阵的基本用法汇总
2019/02/12 Python
python求最大值最小值方法总结
2019/06/25 Python
如何在Django项目中引入静态文件
2019/07/26 Python
python中的split()函数和os.path.split()函数使用详解
2019/12/21 Python
python IDLE添加行号显示教程
2020/04/25 Python
PyQt5的QWebEngineView使用示例
2020/10/20 Python
Python3使用Selenium获取session和token方法详解
2021/02/16 Python
HTML5的hidden属性兼容老浏览器的方法
2014/04/23 HTML / CSS
普天C++笔试题
2016/03/20 面试题
自荐信不宜过于夸大
2013/11/06 职场文书
大学社团招新的通讯稿
2014/09/10 职场文书
2014教师个人自我评价范文
2014/09/13 职场文书
工程主管竞聘书
2015/09/15 职场文书
小学一年级数学教学反思
2016/02/16 职场文书
Nginx如何配置Http、Https、WS、WSS的方法步骤
2021/05/11 Servers