php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
十天学会php(3)
Oct 09 PHP
用PHP伪造referer突破网盘禁止外连的代码
Jun 15 PHP
基于asp+ajax和数据库驱动的二级联动菜单
May 06 PHP
PHP中全局变量global和$GLOBALS[]的区别分析
Aug 06 PHP
基于PHP字符串的比较函数strcmp()与strcasecmp()的使用详解
May 15 PHP
深入解析yii权限分级式访问控制的实现(非RBAC法)
Jun 13 PHP
PHP中字符安全过滤函数使用小结
Feb 25 PHP
Codeigniter实现发送带附件的邮件
Mar 19 PHP
PHP中file_get_contents函数抓取https地址出错的解决方法(两种方法)
Sep 22 PHP
Yii框架函数简单用法分析
Sep 09 PHP
Laravel框架基础语法与知识点整理【模板变量、输出、include引入子视图等】
Dec 03 PHP
Mac M1安装mnmp (Mac+Nginx+MySQL+PHP) 开发环境
Mar 29 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
PHP写的加密函数,支持私人密钥(详细介绍)
2013/06/09 PHP
用Zend Studio+PHPnow+Zend Debugger搭建PHP服务器调试环境步骤
2014/01/19 PHP
PHP的Socket网络编程入门指引
2015/08/11 PHP
Thinkphp和Bootstrap结合打造个性的分页样式(推荐)
2016/08/01 PHP
php rsa 加密,解密,签名,验签详解
2016/12/06 PHP
PHP检查URL包含特定字符串实例方法
2019/02/11 PHP
jQuery 开发者应该注意的9个错误
2012/05/03 Javascript
MultiSelect左右选择控件的设计与实现介绍
2013/06/08 Javascript
简单的邮箱登陆的提示效果类似于yahoo邮箱
2014/02/26 Javascript
jQuery学习笔记之jQuery.extend(),jQuery.fn.extend()分析
2014/06/09 Javascript
javascript设置连续两次点击按钮时间间隔的方法
2014/10/28 Javascript
简介JavaScript中Boolean.toSource()方法的使用
2015/06/05 Javascript
jQuery中设置form表单中action值的实现方法
2016/05/25 Javascript
JavaScript基础重点(必看)
2016/07/09 Javascript
javascript实现将数字转成千分位的方法小结【5种方式】
2016/12/11 Javascript
node.js express中app.param的用法详解
2017/07/16 Javascript
ES6新增的math,Number方法
2017/08/06 Javascript
mui 打开新窗口的方式总结及注意事项
2017/08/20 Javascript
JavaScript判断日期时间差的实例代码
2018/03/01 Javascript
vue写一个组件
2018/04/09 Javascript
10行代码实现微信小程序滑动tab切换
2018/12/28 Javascript
浅谈vue3中effect与computed的亲密关系
2019/10/10 Javascript
《javascript设计模式》学习笔记四:Javascript面向对象程序设计链式调用实例分析
2020/04/07 Javascript
python套接字流重定向实例汇总
2016/03/03 Python
Python OpenCV处理图像之图像像素点操作
2018/07/10 Python
pyqt5 lineEdit设置密码隐藏,删除lineEdit已输入的内容等属性方法
2019/06/24 Python
python里dict变成list实例方法
2019/06/26 Python
Html5 Geolocation获取地理位置信息实例
2016/12/09 HTML / CSS
Carmen Sol官网:购买果冻鞋、手袋和配件
2021/01/01 全球购物
关于.NET, HTML的五个问题
2012/08/29 面试题
MYSQL支持事务吗
2013/08/09 面试题
告诉你怎样写创业计划书
2014/01/27 职场文书
优良学风班申请材料
2014/02/13 职场文书
建党伟业观后感
2015/06/01 职场文书
MySQL基础快速入门知识总结(附思维导图)
2021/09/25 MySQL
MySQL提取JSON字段数据实现查询
2022/04/22 MySQL