PHP将HTML转换成文本的实现代码


Posted in PHP onJanuary 21, 2015

核心代码:

<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
         "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>
PHP 相关文章推荐
使用网络地址转换实现多服务器负载均衡
Oct 09 PHP
针对初学PHP者的疑难问答(1)
Oct 09 PHP
main.php
Dec 09 PHP
关于session在PHP5的配置文件中的详细设置参数说明
Apr 20 PHP
几种有用的变型 PHP中循环语句的用法介绍
Jan 30 PHP
PHP图片处理类 phpThumb参数用法介绍
Mar 11 PHP
Laravel框架学习笔记(二)项目实战之模型(Models)
Oct 15 PHP
Symfony2框架创建项目与模板设置实例详解
Mar 17 PHP
php使用变量动态创建类的对象用法示例
Feb 06 PHP
workerman结合laravel开发在线聊天应用的示例代码
Oct 30 PHP
laravel框架数据库配置及操作数据库示例
Oct 10 PHP
PHP网页缓存技术优点及代码实例
Jul 29 PHP
php使用Cookie控制访问授权的方法
Jan 21 #PHP
PHP+MySQL修改记录的方法
Jan 21 #PHP
PHP+MySQL删除操作实例
Jan 21 #PHP
PHP+MySQL插入操作实例
Jan 21 #PHP
php+mysql数据库查询实例
Jan 21 #PHP
php使用Cookie实现和用户会话的方法
Jan 21 #PHP
php实现遍历目录并删除指定文件中指定内容
Jan 21 #PHP
You might like
php disk_free_space 返回目录可用空间
2010/05/10 PHP
php和数据库结合的一个简单的web实例 代码分析 (php初学者)
2011/07/28 PHP
PHP获取MAC地址的函数代码
2011/09/11 PHP
php getcwd与dirname(__FILE__)区别详解
2016/09/24 PHP
laravel实现登录时监听事件,添加登录用户的记录方法
2019/09/30 PHP
phpstudy隐藏index.php的方法
2020/09/21 PHP
仿迅雷焦点广告效果(JQuery版)
2008/11/19 Javascript
分享20款好玩的jQuery游戏
2011/04/17 Javascript
探讨jQuery的ajax使用场景(c#)
2013/12/03 Javascript
兼容Firefox的Javascript XSLT 处理XML文件
2014/12/31 Javascript
jQuery validate验证插件使用详解
2016/05/11 Javascript
jQuery 实现ajax传入参数含有特殊字符的方法总结
2016/10/17 Javascript
原生js实现可拖动的登录框效果
2017/01/21 Javascript
详解如何在Angular中快速定位DOM元素
2017/05/17 Javascript
JavaScript判断输入是否为数字类型的方法总结
2017/09/28 Javascript
js判断节假日实例代码
2017/12/27 Javascript
webpack 静态资源集中输出的方法示例
2018/11/09 Javascript
AJAX在JQuery中的应用详解
2019/01/30 jQuery
vue history 模式打包部署在域名的二级目录的配置指南
2019/07/02 Javascript
layui 上传文件_批量导入数据UI的方法
2019/09/23 Javascript
利用React高阶组件实现一个面包屑导航的示例
2020/08/23 Javascript
Python的函数的一些高阶特性
2015/04/27 Python
python调用fortran模块
2016/04/08 Python
Python使用正则表达式抓取网页图片的方法示例
2017/04/21 Python
python 实现让字典的value 成为列表
2019/12/16 Python
Python实现不规则图形填充的思路
2020/02/02 Python
python在不同条件下的输入与输出
2020/02/13 Python
python 两个一样的字符串用==结果为false问题的解决
2020/03/12 Python
keras 解决加载lstm+crf模型出错的问题
2020/06/10 Python
pytorch判断是否cuda 判断变量类型方式
2020/06/23 Python
大四毕业生学习总结的自我评价
2013/10/31 职场文书
加强机关作风建设心得体会
2014/10/22 职场文书
2014年仓管员工作总结
2014/11/18 职场文书
工作期间打牌检讨书范文
2014/11/20 职场文书
Golang并发工具Singleflight
2022/05/06 Golang
mysql中关键词exists的用法实例详解
2022/06/10 MySQL