php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
php中截取中文字符串的代码小结
Jul 17 PHP
php通过COM类调用组件的实现代码
Jan 11 PHP
解析strtr函数的效率问题
Jun 26 PHP
PHP判断是否有Get参数的方法
May 05 PHP
基于php的CMS中展示文章类实例分析
Jun 18 PHP
PHP list() 将数组中的值赋给变量的简单实例
Jun 13 PHP
php面试中关于面向对象的相关问题
Feb 13 PHP
浅谈PHPANALYSIS提取关键字
Mar 08 PHP
laravel多条件查询方法(and,or嵌套查询)
Oct 09 PHP
解决在laravel中auth建立时候遇到的问题
Oct 15 PHP
PHP实现文件上传操作和封装
Mar 04 PHP
PHP如何获取Cookie并实现模拟登录
Jul 16 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
PHP使用Face++接口开发微信公众平台人脸识别系统的方法
2015/04/17 PHP
ZF框架实现发送邮件的方法
2015/12/03 PHP
Laravel 5.3 学习笔记之 错误&amp;日志
2016/08/28 PHP
详谈php中 strtr 和 str_replace 的效率问题
2017/05/14 PHP
关于laravel 子查询 &amp; join的使用
2019/10/16 PHP
PHP8.0新功能之Match表达式的使用
2020/07/19 PHP
jquery 单引号和双引号的区别及使用注意
2013/07/31 Javascript
javascript实现的字符串与十六进制表示字符串相互转换方法
2015/07/17 Javascript
jquery实现仿新浪微博评论滚动效果
2015/08/06 Javascript
利用HTML5的画布Canvas实现刮刮卡效果
2015/09/06 Javascript
JS实现可拖曳、可关闭的弹窗效果
2015/09/26 Javascript
JS获取元素多层嵌套思路详解
2016/05/16 Javascript
webpack 2.x配置reactjs基本开发环境详解
2017/08/08 Javascript
Angular 5.0 来了! 有这些大变化
2017/11/15 Javascript
初识 Vue.js 中的 *.Vue文件
2017/11/22 Javascript
Bootstrap实现的表格合并单元格示例
2018/02/06 Javascript
webpack-dev-server自动更新页面方法
2018/02/22 Javascript
jQuery实现百度图片移入移出内容提示框上下左右移动的效果
2018/06/05 jQuery
AngularJS与后端php的数据交互方法
2018/08/13 Javascript
对Vue table 动态表格td可编辑的方法详解
2018/08/28 Javascript
js console.log打印对象时属性缺失的解决方法
2019/05/23 Javascript
微信小程序网络请求实现过程解析
2019/11/06 Javascript
Javascript柯里化实现原理及作用解析
2020/10/22 Javascript
Element el-button 按钮组件的使用详解
2021/02/01 Javascript
[01:06:39]DOTA2上海特级锦标赛主赛事日 - 1 胜者组第一轮#1Liquid VS Alliance第三局
2016/03/02 DOTA
python实现批量转换文件编码(批转换编码示例)
2014/01/23 Python
Python 搭建Web站点之Web服务器网关接口
2016/11/06 Python
利用aardio给python编写图形界面
2017/08/21 Python
Django获取应用下的所有models的例子
2019/08/30 Python
python线程定时器Timer实现原理解析
2019/11/30 Python
JDK安装目录下有哪些内容
2014/08/25 面试题
深圳-东方伟业笔试部分
2015/02/11 面试题
2014班子成员自我剖析材料思想汇报
2014/10/01 职场文书
2014年稽查工作总结
2014/12/20 职场文书
Html5生成验证码的示例代码
2021/05/10 Javascript
Python 正则模块详情
2021/11/02 Python