php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
用Zend Encode编写开发PHP程序
Oct 09 PHP
基于PHP的cURL快速入门教程 (小偷采集程序)
Jun 02 PHP
对象失去焦点时自己动提交数据的实现代码
Nov 06 PHP
PHP小技巧之JS和CSS优化工具Minify的使用方法
May 19 PHP
PHP fastcgi模式上传大文件(大约有300多K)报错
Sep 28 PHP
PHP中imagick函数的中文解释
Jan 21 PHP
CentOS安装php v8js教程
Feb 26 PHP
微信公众平台开发之配置与请求
Aug 26 PHP
WordPress中用于获取搜索表单的PHP函数使用解析
Jan 05 PHP
PHP实现针对日期,月数,天数,周数,小时,分,秒等的加减运算示例【基于strtotime】
Apr 19 PHP
Laravel5.1 框架路由基础详解
Jan 04 PHP
php输出形式实例整理
May 05 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
解析PHP的session过期设置
2013/06/29 PHP
浅谈PHP定义命令空间的几个注意点(推荐)
2016/10/29 PHP
php获取客户端IP及URL的方法示例
2017/02/03 PHP
PHP判断访客是否手机端(移动端浏览器)访问的方法总结【4种方法】
2019/03/27 PHP
JS 控制非法字符的输入代码
2009/12/04 Javascript
Package.js  现代化的JavaScript项目make工具
2012/05/23 Javascript
JQuery中form验证出错信息的查看方法
2013/10/08 Javascript
父元素与子iframe相互获取变量和元素对象的具体实现
2013/10/15 Javascript
JavaScript将数字转换成大写中文的方法
2015/03/23 Javascript
JavaScript实现对下拉列表值进行排序的方法
2015/07/15 Javascript
jQuery Easyui 验证两次密码输入是否相等
2016/05/13 Javascript
jQuery使用中可能被XSS攻击的一些危险环节提醒
2016/05/24 Javascript
React中ES5与ES6写法的区别总结
2017/04/21 Javascript
bootstrap-table组合表头的实现方法
2017/09/07 Javascript
基于vue.js的分页插件详解
2017/11/27 Javascript
实例学习JavaScript读取和写入cookie
2018/01/29 Javascript
React+Webpack快速上手指南(小结)
2018/08/15 Javascript
vue如何实现自定义底部菜单栏
2019/07/01 Javascript
详解解决小程序中webview页面多层history返回问题
2019/08/20 Javascript
JavaScript 几种循环方式以及模块化的总结
2020/09/03 Javascript
Python求出0~100以内的所有素数
2018/01/23 Python
Python button选取本地图片并显示的实例
2019/06/13 Python
如何基于Python制作有道翻译小工具
2019/12/16 Python
Python生成器常见问题及解决方案
2020/03/21 Python
使用keras内置的模型进行图片预测实例
2020/06/17 Python
阿根廷首家户外用品制造商和经销商:Montagne
2018/02/12 全球购物
意大利辅助药品、药物和补品在线销售:FarmaEurope
2020/04/29 全球购物
店长岗位职责
2013/11/21 职场文书
槐乡的孩子教学反思
2014/04/27 职场文书
社区优秀志愿者先进事迹
2014/05/09 职场文书
我的中国心演讲稿
2014/09/04 职场文书
兵马俑导游词
2015/02/02 职场文书
2015年女生节活动总结
2015/02/27 职场文书
2016年综治和平安建设宣传月活动总结
2016/04/01 职场文书
工作简历的自我评价
2019/05/16 职场文书
关于CSS浮动与取消浮动的问题
2021/06/28 HTML / CSS