php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
十天学会php(3)
Oct 09 PHP
建立动态的WML站点(一)
Oct 09 PHP
用PHP实现将GB编码转换为UTF8
Nov 25 PHP
PHP获取当前文件所在目录 getcwd()函数
May 13 PHP
openPNE常用方法分享
Nov 29 PHP
Window 7/XP 安装Apache 2.4与PHP 5.4 的过程详解
Jun 02 PHP
PHP将字符分解为多个字符串的方法
Nov 22 PHP
php自动获取关键字的方法
Jan 06 PHP
PHP中static关键字以及与self关键字的区别
Jul 01 PHP
PHP命名空间namespace用法实例分析
Sep 27 PHP
Laravel 中创建 Zip 压缩文件并提供下载的实现方法
Apr 02 PHP
CentOS7编译安装php7.1的教程详解
Apr 18 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
php 远程图片保存到本地的函数类
2008/12/08 PHP
PHP setcookie设置Cookie用法(及设置无效的问题)
2011/07/13 PHP
PHP fgetcsv 定义和用法(附windows与linux下兼容问题)
2012/05/29 PHP
在PHP模板引擎smarty生成随机数的方法和math函数详解
2014/04/24 PHP
PHP call_user_func和call_user_func_array函数的简单理解与应用分析
2019/11/25 PHP
Dojo 学习笔记入门篇 First Dojo Example
2009/11/15 Javascript
javascript dom 基本操作小结
2010/04/11 Javascript
jQuery实现切换页面布局使用介绍
2011/10/09 Javascript
JS随机生成不重复数据的实例方法
2013/07/17 Javascript
jquery实现网页查找功能示例分享
2014/02/12 Javascript
将HTML格式的String转化为HTMLElement的实现方法
2014/08/07 Javascript
基于javascript实现tab切换特效
2016/03/29 Javascript
Node.js+Express配置入门教程
2016/05/19 Javascript
vue实现全选和反选功能
2017/08/31 Javascript
Vue 实例事件简单示例
2019/09/19 Javascript
Vue v-for循环之@click点击事件获取元素示例
2019/11/09 Javascript
React 实现车牌键盘的示例代码
2019/12/20 Javascript
JavaScript数组去重实现方法小结
2020/01/17 Javascript
解决vux 中popup 组件Mask 遮罩在最上层的问题
2020/11/03 Javascript
Map与WeakMap类型在JavaScript中的使用详解
2020/11/18 Javascript
python访问系统环境变量的方法
2015/04/29 Python
使用pyecharts无法import Bar的解决方案
2020/04/23 Python
python 连接sqlite及简单操作
2017/06/30 Python
详解用python实现简单的遗传算法
2018/01/02 Python
详解Python中where()函数的用法
2018/03/27 Python
python中多个装饰器的调用顺序详解
2019/07/16 Python
python + selenium 刷B站播放量的实例代码
2020/06/12 Python
加拿大快时尚零售商:Ardene
2018/02/14 全球购物
施华洛世奇新加坡官网:SWAROVSKI新加坡
2020/10/06 全球购物
程序员岗位职责
2013/11/11 职场文书
英文简历自荐信范文
2013/12/11 职场文书
2014年人民调解工作总结
2014/12/08 职场文书
老人节主持词
2015/07/04 职场文书
css3实现的加载动画效果
2021/04/07 HTML / CSS
德生2P3收音机开箱评测
2022/04/30 无线电
python获取带有返回值的多线程
2022/05/02 Python