php正则去除网页中所有的html,js,css,注释的实现方法


Posted in PHP onNovember 03, 2016

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<style[^>]*?>.*?</style>'si",  // 去掉 css
 "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记
 "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记
 "'([rn])[s]+'",  // 去掉空白字符
 "'&(quot|#34);'i",  // 替换 HTML 实体

 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(d+);'e");   // 作为 PHP 代码运行
 
$replace = array ("",
 "",
 "",
 "",
 "\1",
 "\"",
 "&",
 "<", 
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\1)");
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持三水点靠木~

PHP 相关文章推荐
PHP 和 XML: 使用expat函数(三)
Oct 09 PHP
php中大括号作用介绍
Mar 22 PHP
PHP笔记之:日期函数的使用介绍
Apr 24 PHP
简单分析ucenter 会员同步登录通信原理
Aug 25 PHP
php实现压缩多个CSS与JS文件的方法
Nov 11 PHP
PHP使用递归方式列出当前目录下所有文件的方法
Jun 02 PHP
PHP中Http协议post请求参数
Nov 02 PHP
php强制下载文件函数
Aug 24 PHP
PHP基于单例模式编写PDO类的方法
Sep 13 PHP
Ubuntu 16.04中Laravel5.4升级到5.6的步骤
Dec 07 PHP
php实现获取近几日、月时间示例
Jul 06 PHP
基于PHP+Mysql简单实现了图书购物车系统的实例详解
Aug 06 PHP
PHP 微信扫码支付源代码(推荐)
Nov 03 #PHP
php使用正则表达式去掉html中的注释方法
Nov 03 #PHP
使用正则去除php代码中的注释方法
Nov 03 #PHP
php cookie 详解使用实例
Nov 03 #PHP
PHP使用curl制作简易百度搜索
Nov 03 #PHP
php 防止表单重复提交两种实现方法
Nov 03 #PHP
PHP HTTP 认证实例详解
Nov 03 #PHP
You might like
轻松入门: 煮好咖啡的七个诀窍
2021/03/03 冲泡冲煮
用PHP调用Oracle存储过程
2006/10/09 PHP
php批量删除数据
2007/01/18 PHP
php获取目标函数执行时间示例
2014/03/04 PHP
php使用指定字符列表生成随机字符串的方法
2015/04/18 PHP
php实现word转html的方法
2016/01/22 PHP
jQuery textarea的长度进行验证
2009/05/06 Javascript
Exjs 入门篇
2010/04/07 Javascript
jquery nth-child()选择器的简单应用
2010/07/10 Javascript
jquery uploadify 在FF下无效的解决办法
2014/09/26 Javascript
js实现两点之间画线的方法
2015/05/12 Javascript
javascript中Date()函数在各浏览器中的显示效果
2015/06/18 Javascript
JS实现的在线调色板实例(附demo源码下载)
2016/03/01 Javascript
微信小程序 教程之wxapp 视图容器 view
2016/10/19 Javascript
jquery实现瀑布流效果 jquery下拉加载新数据
2016/12/12 Javascript
javascript中闭包概念与用法深入理解
2016/12/15 Javascript
JS实现根据密码长度显示安全条功能
2017/03/08 Javascript
jQuery实现动态添加、删除按钮及input输入框的方法
2017/04/27 jQuery
vue2.0 axios前后端数据处理实例代码
2017/06/30 Javascript
Angular通过angular-cli来搭建web前端项目的方法
2017/07/27 Javascript
基于Vue实例生命周期(全面解析)
2017/08/16 Javascript
详解cordova打包成webapp的方法
2017/10/18 Javascript
解决Element中el-date-picker组件不回填的情况
2020/11/07 Javascript
[36:41]完美世界DOTA2联赛循环赛FTD vs Magma第一场 10月30日
2020/10/31 DOTA
python中while循环语句用法简单实例
2015/05/07 Python
Python实现多进程共享数据的方法分析
2017/12/04 Python
CentOS7下python3.7.0安装教程
2018/07/30 Python
Python3实现爬虫爬取赶集网列表功能【基于request和BeautifulSoup模块】
2018/12/05 Python
解决python 3 urllib 没有 urlencode 属性的问题
2019/08/22 Python
解决django后台管理界面添加中文内容乱码问题
2019/11/15 Python
python实现的Iou与Giou代码
2020/01/18 Python
你应该知道的Python3.6、3.7、3.8新特性小结
2020/05/12 Python
秋季运动会表扬稿
2014/01/16 职场文书
师德师风个人整改措施
2014/10/27 职场文书
2015元旦文艺汇演主持稿(开场白+结束语)
2014/12/14 职场文书
预防职务犯罪警示教育心得体会
2016/01/15 职场文书